利用系统错误日志监控磁盘健康状况
生活随笔
收集整理的這篇文章主要介紹了
利用系统错误日志监控磁盘健康状况
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
一、故障現象
? ? ?這個星期出現了兩塊磁盤不能讀寫,后面通過系統日志查看,關鍵字“EXT4-fs error對應某個磁盤”,因此利用zabbix,把系統日志抓取出來,作告警!
二、步聚
1.機器太多,用到ansible的playbook,進行一次性推送
2.定義key值,在/etc/zabbix/zabbix_agentd.conf.d/agentd.conf?
| 1 2 | ###kernel_error?of?disk??from?/var/log/messsage UserParameter=disk_health,awk?-v?kernel_error=`sudo?tail?/var/log/messages?|?grep?"EXT4-fs?error"?|?wc?-l`?'BEGIN{if(kernel_erro?>?0){print?1}?else?{print?0}}' |
3.zabbix用戶的sudo權限
| 1 2 3 | vim?/etc/sudoers.d/zabbix? zabbix?ALL=(root)?NOPASSWD:/bin/bash,/bin/netstat,/usr/bin/nmap,/bin/grep,/bin/awk,/usr/local/mysql/bin/mysql,/usr/bin/tail,/bin/cat |
playbook
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 | --- ?-?hosts:?"`hosts`" ???gather_facts:?false ???tasks: ???-?name:?Add?include?path ?????lineinfile: ????????dest:?"{{?item.dest?}}" ????????regexp:?"{{?item.regexp?}}" ????????line:?"{{?item.line?}}" ?????with_items: ?????-?{ ???????dest:?"/etc/zabbix/zabbix_agentd.conf", ???????regexp:?"^Include", ???????line:?"\n\n###Add?include\nInclude=/etc/zabbix/zabbix_agentd.conf.d/*.conf"?} ?????-?{ ???????dest:?"/etc/sudoers", ???????regexp:?"^Defaults????requiretty", ???????line:?"?#Defaults????requiretty"?} ???-?name:?Copy?configuration?file ?????copy: ????????src:?"{{?item.src?}}" ????????dest:?"{{?item.dest?}}" ?????with_items: ?????-?{ ???????src:?"/etc/sudoers.d/zabbix", ???????dest:?"/etc/sudoers.d/"?} ?????-?{ ???????src:?"/etc/zabbix/zabbix_agentd.conf.d/agentd.conf", ???????dest:?"/etc/zabbix/zabbix_agentd.conf.d/"?} ???-?name:?Rresart?zabbix?service ?????service:?name=zabbix_agentd?state=restarted |
4、執行
| 1 | ansible-playbook?copyfile.yml?-e?"hosts=all" |
本文轉自 zouqingyun 51CTO博客,原文鏈接:http://blog.51cto.com/zouqingyun/1740998,如需轉載請自行聯系原作者
總結
以上是生活随笔為你收集整理的利用系统错误日志监控磁盘健康状况的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MySQL数据库的优化(下)MySQL数
- 下一篇: java信息管理系统总结_java实现科