Hikari连接池故障
前两天生产环境上触发了触发了CPU飙升的预警短信,查看日志发现出现如下数据库连接池的报错,通过网上查阅资料发现HikariCP连接泄露时就会抛出此异常。
故障分析
Hikari的相关配置
leak-detection-threshold:用来设置连接被占用的超时时间,也就是连接泄露检测的最大时间,默认是 0,0表示的是不开启泄露检测;最小值 为2000 毫秒,设置的值如果小于 2000 毫秒,默认关闭泄露检测,最大值不能超过连接的最大存活时间,也就是maxLifetime配置,超过的话也会自动禁用泄露检测。
源码分析
通过Hikari源码分析定位出抛出该异常的原因
- 下图所示,Spring从hikari数据源中获取数据库连接,在org.springframework.jdbc.datasource.DataSourceUtils中可以找到该方法
- com.zaxxer.hikari.HikariDataSource找到HikariDataSource类,进入获取连接的方法
- 这时我们可以看到有一个创建代理连接的方法,看到这里我们可以知道创建连接的同时也会开启一个泄露检测的定时任务,继续走进schedule方法
- 进入到schedule后可以看到调用了scheduleNewTask方法,点进去该方法,可以清楚了解到ProxyLeakTask实现了Runnable接口,是一个多线程的定时任务实现,方法第二个参数明显就是Hikari的配置leak-detection-threshold,然后再进入到task.schedule()方法
- executorService.schedule()是启动泄露检测的定时任务的方法,当连接被占用的时间 > 配置leak-detection-threshold,就会执行回调,也就是下面的run()方法,该方法主要是构造异常,并抛出
总结
如果Hikari开启了连接泄露,获取数据库连接同时也会创建一个定时任务,当连接被占用的时间超出了leakDetectionThreshold毫秒,就抛出检测到连接泄露的异常。结合业务发现此处因为有慢sql的执行才导致连接泄露。
来源地址:https://blog.csdn.net/qq_40782372/article/details/129317729