文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

如何通过zabbix获取数据库连接的信息及部分扩展

2023-06-20 13:07

关注

本篇内容介绍了“如何通过zabbix获取数据库连接的信息及部分扩展”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

背景

随着应用系统的不断增加,原本不告警的active threads,开始频繁告警(一天2次左右)。虽然告警次数不多,而且该监控项舍得阈值不高(不超过50),但对于运维来说数据库的threads-running是一个必须要重视的点。

一般告警出现在半夜,不可能靠人工去记录threads-running过线后,到底哪些连接正在处理。市面上也没好的工具能自动记录这些数据,所以这时候就需要zabbix的action功能了。

zabbix配置

定义监控项

这里偷个懒,直接使用了percona模板中Threads Running监控项:

如何通过zabbix获取数据库连接的信息及部分扩展

定义触发器

同样适用percona的触发器设置:

如何通过zabbix获取数据库连接的信息及部分扩展

创建action

按照下图的顺序创建action:

如何通过zabbix获取数据库连接的信息及部分扩展

action条件

如何通过zabbix获取数据库连接的信息及部分扩展

A、B、C、D条件都满足,才会触发动作,这里尽量筛选的详细点,免得出现zabbix错误调用的情况。

完善操作内容

如何通过zabbix获取数据库连接的信息及部分扩展

这里适用ssh方式,当然你也可以在类型栏使用自定义脚本选项,就是要多给zabbix客户端赋sudo权限。

命令栏填的是/bin/sh /opt/connect.sh命令,这个很好理解,直接调用connect.sh脚本,具体脚本附在后文中。

修改zabbix-agent配置

进入被监控服务器

vim /etc/zabbix/zabbix_agentd.conf        EnableRemoteCommands=1  #增加这项参数,意思是允许zabbix server远程命令    service zabbix-agent restart

至此,zabbix相关的配置均已完成,接下来只需要将写好的处理脚本放入/opt目录即可。

功能脚本

这次要实现的是,在连接超过50个时,输出到底是哪个账号、哪个ip、在执行哪个sql等信息。脚本如下:

#!/bin/sh    export PATH=$PATH:/usr/bin    da=`date +%Y%m%d`    dc=`date +%Y-%m-%d" "%H:%M:%S`        echo $dc"-------------------------------我是分割线------------------------------------" >> /tmp/ok_$da.log        /usr/local/mysql/bin/mysql -uroot -pXXX -e "select * from information_schema.PROCESSLIST where COMMAND != 'Sleep' order by TIME DESC;" >> /tmp/ok_$da.log

扩展

既然zabbix在报警时可以调用脚本,那是不是可以让zabbix处理点更为复杂的工作?

数据库连接、锁、存储引擎等信息

#!/bin/shexport PATH=$PATH:/usr/binda=`date +%Y%m%d`dc=`date +%Y-%m-%d" "%H:%M:%S`echo $dc"-------------------------------我是分割线------------------------------------" >> /home/zabbix/engine_log/engine_log_$da.log/usr/bin/mysql -hlocalhost -uroot -pXXX -e "show engine innodb status \G;" >> /home/zabbix/engine_log/engine_log_$da.logecho -e "\n\n\n" >> /home/zabbix/engine_log/engine_log_$da.logecho $dc"-------------------------------我是分割线------------------------------------" >> /home/zabbix/processlist/processlist_$da.log/usr/bin/mysql -hlocalhost -uroot -pXXX -e "select * from information_schema.processlist where time>=0 and command !='sleep' order by time desc \G;" >> /home/zabbix/processlist/processlist_$da.logecho -e "\n\n\n" >> /home/zabbix/processlist/processlist_$da.logecho $dc"-------------------------------我是分割线------------------------------------" >> /home/zabbix/lock/lock_$da.log/usr/bin/mysql -hlocalhost -uroot -pXXX -e "select 'Blocker' role, p.id, p.user, left(p.host, locate(':', p.host) - 1) host, tx.trx_id, tx.trx_state, tx.trx_started, timestampdiff(second, tx.trx_started, now()) duration, lo.lock_mode, lo.lock_type, lo.lock_table, lo.lock_index, tx.trx_query, tx.trx_tables_in_use, tx.trx_tables_locked, tx.trx_rows_locked from information_schema.innodb_trx tx, information_schema.innodb_lock_waits lw, information_schema.innodb_locks lo, information_schema.processlist p where lw.blocking_trx_id = tx.trx_id and p.id = tx.trx_mysql_thread_id and lo.lock_trx_id = tx.trx_id union all select 'Blockee' role, p.id, p.user, left(p.host, locate(':', p.host) - 1) host, tx.trx_id, tx.trx_state, tx.trx_started, timestampdiff(second, tx.trx_started, now()) duration, lo.lock_mode, lo.lock_type, lo.lock_table, lo.lock_index, tx.trx_query, tx.trx_tables_in_use, tx.trx_tables_locked, tx.trx_rows_locked from information_schema.innodb_trx tx, information_schema.innodb_lock_waits lw, information_schema.innodb_locks lo, information_schema.processlist p where lw.requesting_trx_id = tx.trx_id and p.id = tx.trx_mysql_thread_id and lo.lock_trx_id = tx.trx_id \G;" >> /home/zabbix/lock/lock_$da.logecho -e "\n\n\n" >> /home/zabbix/lock/lock_$da.logval=`/usr/bin/mysql -hlocalhost -uroot -pXXX -N -e "show variables like 'general_log'" |awk '{print $2}'`if [ $val = 'OFF' ];then        /usr/bin/mysql -hlocalhost -uroot -pXXX -e "set global general_log=0;"else        exit 0;fi

在数据库压力大的时候,可以记录哥哥锁信息、连接信息还有存储引擎信息。所谓压力大,我们可以将触发项定以下几个:

这些都可以作为触发条件。

杀死长sql

#!/bin/shexport PATH=$PATH:/usr/binda=`date +%Y%m%d`dc=`date +%Y-%m-%d" "%H:%M:%S`user="root"password="XXX"val=`mysql -u$user -p$password -N -e "select count(*) from information_schema.processlist where time>=180 and command ='Query' and user in ('job_name','report')" | awk '{print $1}'`if [ $val -gt 0 ];then        echo $dc"-------------------------------我是分割线------------------------------------" >> /home/zabbix/kill_log/long_query_$da.log        mysql -u$user -p$password -e "select * from information_schema.processlist where time>=180 and command ='Query' and user in ('job_name','report') order by time desc \G;" >> /home/zabbix/kill_log/long_query_$da.log        echo -e "\n\n\n" >> /home/zabbix/kill_log/long_query_$da.log        count=`mysql -u$user -p$password -N -e "select id from information_schema.processlist where time>=180 and command ='Query' and user in ('job_name','report')"`        for id in $count;        do           mysql -u$user -p$password -e "kill $id"        doneelse        exit 0;fi

有时候一些job或者报表sql会长时间在那里执行,导致影响到其他业务,我们可以简单做下判断,当数据库连接激增,多数是由于有大sql夯在那里,这时候可以让zabbix调用这个脚本去杀死特殊账号发起的超过180秒的sql。至于kill sql的条件可以在脚本中自定义。

当然了,像这种明知需要很长时间才能处理完的sql,应该放在从库中去执行。

删除无用日志

#!/bin/shlogdir='/mysql/logs'binlog='/mysql/binlog'var_percent=`df -h |grep var|grep dev/sda|awk '{print $5}'|awk -F% '{print $1}'`if [ -z $var_percent ] || [ $var_percent -lt 90 ];then        echo "never mind"        exit 0fidate >>$binlog/del_list.txtlist=`ls -l --time-style='+%Y-%m-%d %H:%M:%S' $binlog/mysql-bin.0?????|awk '{print $6","$7","$8}'`for i in $listdo        filetime=`echo $i|awk -F "," '{print $1,$2}'`        filetimestamp=`date -d "$filetime" +%s`        cur_time=`date +%s`        if [ $(($cur_time - $filetimestamp)) -gt $((3*24*3600)) ];then                filename=`echo $i|awk -F, '{print $3}'`                echo "$filename will delete">>$binlog/del_list.txt                /bin/rm $filename        fidoneif [ -f $logdir/mysql-slow.log ];then        slow_log_size=`stat $logdir/mysql-slow.log|grep 'Size:'|awk -F ':' '{print $2}'|awk '{print $1}'`        if [ $slow_log_size -gt $((2*1024*1024*1024)) ];then                echo "$logdir/mysql-slow.log">>$logdir/del_list.txt                /bin/rm $logdir/mysql-slow.log        fifi

有些时候binlog和slowlog没设置自动删除,时间长了会把磁盘空间占满。这时候我们可以关联Free disk space on /mysql监控项,查过阈值后,调用上面的脚本去清理无用的binlog和slowlog。

在有些依赖binlog的情况下,比如主从中断,之后还需要恢复的情况下,需要谨慎使用。

参考链接 :

通过zabbix获取数据库连接的信息及部分扩展 :https://www.yisu.com/article/207412.htm

“如何通过zabbix获取数据库连接的信息及部分扩展”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯