php调取 zabbix实时数据_Linux运维必知的Zabbix故障排错实战
從0開始解決線上Zabbix監(jiān)控平臺故障
(1)學(xué)習(xí)Linux技術(shù),后期從事Linux運(yùn)維方面的工作,作為運(yùn)維人員最主要的工作職責(zé)之一:保障企業(yè)門戶網(wǎng)站、業(yè)務(wù)系統(tǒng)、數(shù)據(jù)庫、服務(wù)器高效穩(wěn)定的運(yùn)行,一旦有異常或者故障能夠第一時(shí)間去解決。
(2)作為運(yùn)維人員是如何第一時(shí)間去獲取門戶網(wǎng)站、業(yè)務(wù)系統(tǒng)、數(shù)據(jù)庫、服務(wù)器等運(yùn)行狀態(tài)呢?是通過手工7x24x365去刷新和訪問嗎?可以通過開源的監(jiān)控軟件平臺7x24x365實(shí)時(shí)自動的去檢測其運(yùn)行的狀態(tài)。
(3)互聯(lián)網(wǎng)IT企業(yè)中,主流的開源監(jiān)控軟件有哪些種類呢?
MRTG;
Cacti;
Nagios;
Ganglia;
Zabbix;
Prometheus;
(4)通過線上云服務(wù)器構(gòu)建了一套Zabbix監(jiān)控平臺,發(fā)現(xiàn)監(jiān)控平臺無法運(yùn)行了,而且報(bào)錯信息如圖所示:
Zabbix server is running No localhost:10051
#根據(jù)上圖的提示,表示Zabbix Server的運(yùn)行狀態(tài)是:No,沒有監(jiān)聽本地localhost主機(jī)地址+10051端口,解決方法:
檢測一下Zabbix Server服務(wù)進(jìn)程和端口是否存在;
ps -ef|grep zabbix_server
netstat -tnlp|grep -w 10051
通過手工方式啟動一下Zabbix server獨(dú)立服務(wù)即可;
/etc/init.d/zabbix_server start
(5)啟動Zabbix Server服務(wù)時(shí),報(bào)錯信息二如下所示:
Can't find file /usr/local/sbin/zabbix_server.
Zabbix server NOT started.
#根據(jù)如上的錯誤提示,表示啟動Zabbix Server服務(wù)時(shí),啟動腳本文件會讀取Zabbix Server主程序文件:/usr/local/sbin/zabbix_server,該文件提示不能找到,所以Zabbix Server服務(wù)不能啟動。
解決方法:
檢測Zabbix Server主程序文件/usr/local/sbin/zabbix_server是否存在;
if [ -f /usr/local/sbin/zabbix_server ];then echo ok ;fi
ls -l /usr/local/sbin/zabbix_server
可以通過find|locate工具查找zabbix_server主程序文件的路徑;
find / -name "zabbix_server"
find / -name "zabbix_server"|grep -vE "init|bak"
ln -s /usr/local/zabbix/sbin/zabbix_server /usr/local/sbin/
find / -name "zabbix_server"|grep -vE "init|bak" -exec ln -s {} /usr/local/sbin/ ;
(6)啟動Zabbix Server服務(wù)時(shí),報(bào)錯信息三如下所示:
Zabbix_server [10775]: user zabbix does not exist
Zabbix_server [10775]: cannot run as root!
#根據(jù)如上的錯誤提示,表示啟動Zabbix Server服務(wù)時(shí),需要使用zabbix用戶去啟動,而Linux系統(tǒng)沒有檢測到該用戶,該用戶是不存在的,不能使用root用戶直接啟動。
解決方法:
檢測一下Linux系統(tǒng)是否存在zabbix用戶;
id zabbix
grep -w zabbix /etc/passwd
通過手工useradd命令創(chuàng)建zabbix用戶即可;
useradd -s /sbin/nologin zabbix -M
(7)啟動Zabbix Server服務(wù)時(shí),報(bào)錯信息四如下所示:
Connection to database 'zabbix' failed: [1045] Access denied for user 'zabbix'@'localhost' (using password: NO)
#根據(jù)如上的錯誤提示,表示啟動Zabbix Server服務(wù)時(shí),Zabbix Sever服務(wù)組件需要連接后端MYSQL數(shù)據(jù)庫服務(wù),要往數(shù)據(jù)庫中持久化存儲客戶端監(jiān)控?cái)?shù)據(jù),錯誤提示使用zabbix用戶和空密碼,通過localhost登陸數(shù)據(jù)庫服務(wù),訪問zabbix庫被拒絕。
解決方法:
檢測一下后端MYSQL數(shù)據(jù)庫是否授權(quán)&創(chuàng)建zabbix庫;
show databases;
select user,host,password from mysql.user;
檢測zabbix server配置文件,數(shù)據(jù)庫連接信息是否填寫密碼或者密碼是否正確;
基于Zabbix監(jiān)控線上阿里云服務(wù)器
(1)根據(jù)如上的Zabbix故障排錯,Zabbix監(jiān)控平臺可以正常使用了,作為運(yùn)維人員能夠利用Zabbix監(jiān)控平臺去監(jiān)控哪些數(shù)據(jù)呢?監(jiān)控哪些指標(biāo)呢?能夠給企業(yè)帶來哪些好處呢?
(2)在企業(yè)中,可以使用Zabbix來監(jiān)控四個層面的數(shù)據(jù)指標(biāo),哪四個層面呢?
硬件層面
Zabbix可以監(jiān)控硬件服務(wù)器設(shè)備,例如監(jiān)控硬件設(shè)備的CPU溫度、硬盤異常情況、風(fēng)扇轉(zhuǎn)速、電源異常情況、機(jī)箱是否被黑客入侵等。
軟件層面
Zabbix可以監(jiān)控軟件服務(wù),例如監(jiān)控Nginx、Tomcat、MQ、ZK、ELK、Redis、MYSQL、LVS、Keepalived等服務(wù)的運(yùn)行狀態(tài)、PID、端口號,可以監(jiān)控服務(wù)的返回值、狀態(tài)碼等。
系統(tǒng)層面
Zabbix可以監(jiān)控Windows/Linux操作系統(tǒng),監(jiān)控指標(biāo):CPU、MEM、DISK、NET、I/O、Open files、Process、User、Port等。
網(wǎng)絡(luò)層面
Zabbix可以監(jiān)控網(wǎng)絡(luò)設(shè)備,例如監(jiān)控交換機(jī)、路由器、防火墻設(shè)備,監(jiān)控其出口和入口的帶寬,監(jiān)控設(shè)備之間的網(wǎng)絡(luò)連通性等。
往期文章精選:
官方調(diào)研重磅發(fā)布,Pandas或?qū)⒅貥?gòu)?
想學(xué)python看這里!送給小白的六個建議
歡迎大家關(guān)注我的頭條號,私信“python",學(xué)習(xí)資料包免費(fèi)分享給需要的朋友,另有python學(xué)習(xí)交流群,可以交流學(xué)習(xí)拓展人脈。
總結(jié)
以上是生活随笔為你收集整理的php调取 zabbix实时数据_Linux运维必知的Zabbix故障排错实战的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mc服务器村民交易修改,【原创】【教程】
- 下一篇: linux 其他常用命令