日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > linux >内容正文

linux

Linux实战教学笔记35:企业级监控Nagios实践(下)

發布時間:2023/12/18 linux 27 如意码农
生活随笔 收集整理的這篇文章主要介紹了 Linux实战教学笔记35:企业级监控Nagios实践(下) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

七,服務器端Nagios圖形監控顯示和管理

前面搭建的Nagios服務雖然能顯示信息,能報警。但是在企業工作中還會需要一個歷史趨勢圖,跟蹤每一個業務的長期趨勢,并且能以圖形的方式展示,例如:根據磁盤的剩余趨勢,確定是否需要提前購買磁盤。

7.1 服務器端安裝PNP生成圖形監控曲線

PNP是一款配合Nagios出圖的軟件,官方站點為:http://www.pnp4nagios.org

7.1.1 PNP出圖基礎依賴軟件安裝

[root@Nagios 6]# yum -y install cairo pango zlib zlib-devel freetype freetype-devel gd gd-devel
[root@Nagios 6]# rpm -qa cairo pango zlib zlib-devel freetype freetype-devel gd gd-devel
freetype-2.3.11-17.el6.x86_64
zlib-1.2.3-29.el6.x86_64
zlib-devel-1.2.3-29.el6.x86_64
freetype-devel-2.3.11-17.el6.x86_64
gd-2.0.35-11.el6.x86_64
gd-devel-2.0.35-11.el6.x86_64
cairo-1.8.8-6.el6_6.x86_64
pango-1.28.1-11.el6.x86_64 #然后安裝rrdtool依賴的libart_lgpl相關軟件包,這個軟件包要優先于rrdtool安裝
[root@Nagios 6]# yum -y install libart_lgpl libart_lgpl-devel
[root@Nagios 6]# rpm -qa libart_lgpl libart_lgpl-devel
libart_lgpl-2.3.20-5.1.el6.x86_64
libart_lgpl-devel-2.3.20-5.1.el6.x86_64 #PNP工具最終是通過rrdtool實現的畫圖,因此需要提前安裝rrdtool
[root@Nagios 6]# yum -y install rrdtool rrdtool-devel
[root@Nagios 6]# rpm -qa rrdtool rrdtool-devel
rrdtool-1.3.8-10.el6.x86_64
rrdtool-devel-1.3.8-10.el6.x86_64
[root@Nagios 6]# which rrdtool
/usr/bin/rrdtool

7.1.2 安裝出圖web界面展示軟件PNP

此處選擇0.4.14的PNP版本,如果選擇高版本在出圖方面可能會有坑,正常情況下,選04版本已經足夠了,因此,如果沒有特殊需求,建議最好完全按照書本測試步驟,在弄清楚之后再變通版本。

PNP軟件無法yum安裝,可通過編譯的方式進行安裝,操作過程如下:

[root@Nagios ~]# yum -y install perl-Time-HiRes
[root@Nagios ~]# cd nagios/
[root@Nagios nagios]# ll pnp-0.4.14.tar.gz
-rw-r--r--. 1 root root 455593 Aug 12 12:22 pnp-0.4.14.tar.gz
[root@Nagios nagios]# tar xf pnp-0.4.14.tar.gz -C /usr/src/
[root@Nagios nagios]# cd /usr/src/pnp-0.4.14/
[root@Nagios pnp-0.4.14]# ./configure \ > --with-rrdtool \
> --with-perfdata-dir=/usr/local/nagios/share/perfdata/
[root@Nagios pnp-0.4.14]# make all
[root@Nagios pnp-0.4.14]# make install
[root@Nagios pnp-0.4.14]# make install-config
[root@Nagios pnp-0.4.14]# make install-init
[root@Nagios pnp-0.4.14]# ll /usr/local/nagios/libexec/ | grep process
-rwxr-xr-x 1 nagios nagios 31813 Aug 19 23:04 process_perfdata.pl

如果configure后出現如下警告信息,請忽略:

#################

# WARNING:The RRDs Perl Modules are not found on your System

# Using RRDs will speedup things in larg

##################

PNP提供了一個獲取數據出圖的Perl腳本,可以用如下命令查到:

[root@Nagios pnp-0.4.14]# ll /usr/local/nagios/libexec/ | grep process
-rwxr-xr-x 1 nagios nagios 31813 Aug 19 23:04 process_perfdata.pl

7.1.3 Nagios出圖相關配置

1)執行編輯命令vi,需要改nagios.cfg主配置文件833行,將如下參數對應的值從0改為1,表示記錄數據。

[root@Nagios nagios]# sed -n '833p' /usr/local/nagios/etc/nagios.cfg
process_performance_data=0 #默認0,改為1 #然后繼續向下大概在845,846行的位置,找到如下兩項,取消參數開頭的注釋。
[root@Nagios nagios]# sed -n '845,846p' /usr/local/nagios/etc/nagios.cfg
#host_perfdata_command=process-host-perfdata #取消注釋
#service_perfdata_command=process-service-perfdata #取消注釋

2)執行編輯命令vi,需要修改commands.cfg配置文件,定義出圖獲取數據的命令。

[root@Nagios nagios]# sed -n '227,238p' /usr/local/nagios/etc/objects/commands.cfg
# 'process-host-perfdata' command definition
define command{
command_name process-host-perfdata
command_line /usr/bin/printf "%b" "$LASTHOSTCHECK$\t$HOSTNAME$\t$HOSTSTATE$\t$HOSTATTEMPT$\t$HOSTSTATETYPE$\t$HOSTEXECUTIONTIME$\t$HOSTOUTPUT$\t$HOSTPERFDATA$\n" >>/usr/local/nagios/var/host-perfdata.out
}
# 'process-service-perfdata' command definition
define command{
command_name process-service-perfdata
command_line /usr/bin/printf "%b" "$LASTSERVICECHECK$\t$HOSTNAME$\t$SERVICEDESC$\t$SERVICESTATE$\t$SERVICEATTEMPT$\t$SERVICESTATETYPE$\t$SERVICEEXECUTIONTIME$\t$SERVICELATENCY$\t$SERVICEOUTPUT$\t$SERVICEPERFDATA$\n" >>/usr/local/nagios/var/service-perfdata.out
}

現在刪除上述的默認配置,然后將其修改為如下的配置內容:

[root@Nagios nagios]# sed -n '227,238p' /usr/local/nagios/etc/objects/commands.cfg
# 'process-host-perfdata' command definition
define command{
command_name process-host-perfdata
command_line /usr/local/nagios/libexec/process_perfdata.pl
}
# 'process-service-perfdata' command definition
define command{
command_name process-service-perfdata
command_line /usr/local/nagios/libexec/process_perfdata.pl
}

3)執行檢查語法命令

[root@Nagios nagios]# /etc/init.d/nagios checkconfig
#..以上省略若干...
Total Warnings: 0
Total Errors: 0
Things look okay - No serious problems were detected during the pre-flight check
OK

4)執行命令使Nagios配置文件生效。

[root@Nagios nagios]# /etc/init.d/nagios reload
Running configuration check...done.
Reloading nagios configuration...done

5)此時打開瀏覽器訪問“http://192.168.0.200/nagios/pnp/”,應該會出現如下圖所示的圖形界面,但是沒有業務數據顯示。

如果同學們打開出現如下錯誤:

如果出現上圖中的錯誤,先別著急,可能過一會兒重新訪問上述地址就會恢復正常。

如果過了很長時間重新訪問上述地址還不正常,可以執行如下命令看看,然后再訪問試試:

yum -y install php-gd gd gd-devel

7.2 配置主機及服務獲取狀態數據出圖

7.1結尾的圖形是沒有具體的業務數據圖形趨勢的,因為那時還沒有為Nagios的各個主機和具體要監控的服務配置獲取數據信息,下面是讓各個主機或服務獲取數據的配置。

7.2.1 設置讓被監控的主機記錄數據

如果要讓所有的主機獲取數據并出趨勢圖,則需編輯Nagios的主機hosts.cfg文件,不過,只要在每一個被監控主機的配置下面增加同一個參數項“process_perf_data 1”即可。操作步驟如下:

[root@Nagios nagios]# cd /usr/local/nagios/etc/objects/
[root@Nagios objects]# cat hosts.cfg # Define a host for the local machine
define host{
use linux-server
host_name web01
alias web01
address 192.168.0.223
process_perf_data 1 #為web01增加1此行,表示記錄web01主機狀態數據
}
define host{
use linux-server
host_name web02
alias web02
address 192.168.0.224
process_perf_data 1 #為Web02增加此行,表示記錄web02主機狀態數據
} define hostgroup{
hostgroup_name linux-servers
alias Linux Servers
members web01,web02

7.2.2 設置讓被監控主機對應的服務記錄數據

如果需要所有的主機對應的服務獲取數據并出趨勢圖,則要編輯Nagios的服務配置文件services.cfg,當然,也只需要在每一個對應服務下面增加同一個參數項即可,即“process_perf_data 1”,配置步驟如下:

[root@Nagios objects]# cat /usr/local/nagios/etc/objects/services.cfg 

define service {
use generic-service
host_name web01,web02
service_description Disk Partition
check_command check_nrpe!check_disk
process_perf_data 1 #為每個service添加此行
}
define service {
use generic-service
host_name web01,web02
service_description Swap Useage
check_command check_nrpe!check_swap
process_perf_data 1 #為每個service添加此行
}
define service {
use generic-service
host_name web01,web02
service_description MEM Useage
check_command check_nrpe!check_mem
process_perf_data 1 #為每個service添加此行
}
define service {
use generic-service
host_name web01,web02
service_description Current Load
check_command check_nrpe!check_load
process_perf_data 1 #為每個service添加此行
}
define service {
use generic-service
host_name web01,web02
service_description Disk lostat
check_command check_nrpe!check_iostat!5!11
process_perf_data 1 #為每個service添加此行
}
define service {
use generic-service
host_name web01,web02
service_description PING
check_command check_ping!100.0,20%!500.0,60%
process_perf_data 1 #為每個service添加此行
} #url examples http://www.yunjisuan.com define service { use generic-service
host_name web01
service_description www_url
check_command check_weburl! -H www.yunjisuan.com
process_perf_data 1 #為每個service添加此行 } define service { use generic-service
host_name web01
service_description www_url
check_command check_http
process_perf_data 1 #為每個service添加此行 } define service { use generic-service
host_name web01
ervice_description www_static_url
check_command check_weburl! -H www.yunjisuan.com -u /static/test.html
process_perf_data 1 #為每個service添加此行 } define service { use generic-service
host_name web01
service_description www_yunjisuan_url
check_command check_weburl! -H www.yunjisuan.com -u "/article/index.phpm=article&a=list&id=670"
process_perf_data 1 #為每個service添加此行 } #tcp examples
define service { use generic-service
host_name web01
service_description ssh_22
check_command check_tcp! 22
process_perf_data 1 #為每個service添加此行 } define service { use generic-service
host_name web01
service_description http_80
check_command check_tcp! 80
process_perf_data 1 #為每個service添加此行 }

由于每個主機對應的服務內容太多了,因此可以采取在所有服務對應的統一模板里添加配置參數的方式,這樣可使所有的服務都可以生效。這里每個服務使用的模板就是由服務里的“use generic-service”這個選項確定的,查看與模板文件里服務模板generic-service名對應的服務參數:

[root@Nagios objects]# sed -n '154,177p' /usr/local/nagios/etc/objects/templates.cfg | awk -F ";" '{print $1}'
name generic-service
active_checks_enabled 1
passive_checks_enabled 1
parallelize_check 1
obsess_over_service 1
check_freshness 0
notifications_enabled 1
event_handler_enabled 1
flap_detection_enabled 1
failure_prediction_enabled 1
process_perf_data 1
retain_status_information 1
retain_nonstatus_information 1
is_volatile 0
check_period 24x7
max_check_attempts 3
normal_check_interval 10
retry_check_interval 2
contact_groups admins
notification_options w,u,c,r
notification_interval 60
notification_period 24x7
register 0
}

提示:

為了看的清晰,這里去掉了所有注釋,服務的模板里默認已經配置了“process_perf_data 1”,即凡是使用templates.cfg模板文件里名字為generic-service的模板,均作為服務的模板,這樣就相當于所有服務都執行generic-service模板里的配置了。

配置完畢重啟Nagios服務:

[root@Nagios objects]# /etc/init.d/nagios reload
Running configuration check...done.
Reloading nagios configuration...done

到此,如果等一段時間,然后查看PNP URL就可以發現生成了圖形數據,有些數據需要壓力測試或者真實環境才能看到,例如主機負載等。趨勢圖如下圖所示:

7.3 整合PNP URL超鏈接到Nagios Web界面

在整合PNP URL超鏈接到Nagios Web界面后,會在所有的主機或主機對應服務的前面,出現一個閃電樣的超鏈接1圖標,單擊超鏈接,就可以查看到對應的主機或服務實際的監控狀態趨勢圖。

7.3.1 給被監控的所有主機添加超鏈接圖標

默認情況PNP的URL為http://192.168.0.200/nagios/pnp/index.php和Nagios不在一個界面里,所以查看主機或服務對應的趨勢圖很費勁。那么如何完善呢?

我們可以直接在host.cfg里在希望出圖的主機里配置如下一行參數:

action_url  /nagios/pnp/index.php?host=$HOSTNAME$    #實際上就是給URL傳個主機參數

然后編輯host.cfg,增加上述配置。配置結果如下:

[root@Nagios objects]# cat /usr/local/nagios/etc/objects/hosts.cfg

# Define a host for the local machine
define host{
use linux-server
host_name web01
alias web01
address 192.168.0.223
process_perf_data 1
action_url /nagios/pnp/index.php?host=$HOSTNAME$ #添加超鏈接圖標
}
define host{
use linux-server
host_name web02
alias web02
address 192.168.0.224
process_perf_data 1
action_url /nagios/pnp/index.php?host=$HOSTNAME$ #添加超鏈接圖標
} define hostgroup{
hostgroup_name linux-servers
alias Linux Servers
members web01,web02
}

接著,檢查語法重新加載Nagios

[root@Nagios objects]# /etc/init.d/nagios reload
Running configuration check...done.
Reloading nagios configuration...done

如果配置過程都正確,打開瀏覽器訪問Nagios界面,最終可以看到如下圖所示的圖形。圖中,右邊方框里標記的白色方格里,中間帶波浪線的就是超鏈接圖標。單擊進去即可看到一個主機所有的服務圖。

7.3.2 給被監控主機指定的服務添加超鏈接圖標

和上述主機添加超鏈接圖標的配置幾乎一樣,執行“vi /usr/local/nagios/etc/objects/services.cfg”,添加如下內容:

action_url /nagios/pnp/index.php?host=$HOSTNAME$&srv=$SERVICEDESC$

#實際上就是給URL傳了一個主機的參數和一個主機對應服務的參數

給具體服務增加超鏈接配置方法是,直接在define service {}大括號中增加參數即可,具體配置的內容如下“action_url參數部分”:

[root@Nagios objects]# cat /usr/local/nagios/etc/objects/services.cfg

define service {
use generic-service
host_name web01,web02
service_description Disk Partition
check_command check_nrpe!check_disk
process_perf_data 1
action_url /nagios/pnp/index.php?host=$HOSTNAME$&srv=$SERVICEDESC$
#給具體服務增加超鏈接配置
}
define service {
use generic-service
host_name web01,web02
service_description Swap Useage
check_command check_nrpe!check_swap
process_perf_data 1
action_url /nagios/pnp/index.php?host=$HOSTNAME$&srv=$SERVICEDESC$
#給具體服務增加超鏈接配置
}
define service {
use generic-service
host_name web01,web02
service_description MEM Useage
check_command check_nrpe!check_mem
process_perf_data 1
action_url /nagios/pnp/index.php?host=$HOSTNAME$&srv=$SERVICEDESC$
#給具體服務增加超鏈接配置
}
define service {
use generic-service
host_name web01,web02
service_description Current Load
check_command check_nrpe!check_load
process_perf_data 1
}
define service {
use generic-service
host_name web01,web02
service_description Disk lostat
check_command check_nrpe!check_iostat!5!11
process_perf_data 1
}
define service {
use generic-service
host_name web01,web02
service_description PING
check_command check_ping!100.0,20%!500.0,60%
process_perf_data 1
} #url examples http://www.yunjisuan.com define service { use generic-service
host_name web01
service_description www_url
check_command check_weburl! -H www.yunjisuan.com
process_perf_data 1 } define service { use generic-service
host_name web01
service_description www_url
check_command check_http
process_perf_data 1 } define service { use generic-service
host_name web01
service_description www_static_url
check_command check_weburl! -H www.yunjisuan.com -u /static/test.html
process_perf_data 1 } define service { use generic-service
host_name web01
service_description www_yunjisuan_url
check_command check_weburl! -H www.yunjisuan.com -u "/article/index.phpm=article&a=list&id=670"
process_perf_data 1 } #tcp examples
define service { use generic-service
host_name web01
service_description ssh_22
check_command check_tcp! 22
process_perf_data 1 } define service { use generic-service
host_name web01
service_description http_80
check_command check_tcp! 80
process_perf_data 1 }

配置完成后的效果圖如下:

也可以快速設置讓全部的服務出圖,找到templates.cfg模板文件,找到默認的服務名generic-service,在這個服務名大括號的內部結尾增加“action_url /nagios/pnp/index.php?host=$HOSTNAME$&srv=$SERVICEDESC$ ”一行即可。

[root@Nagios objects]# sed -n '153,178p' /usr/local/nagios/etc/objects/templates.cfg | awk -F ";" '{print $1}'
define service{
name generic-service
active_checks_enabled 1
passive_checks_enabled 1
parallelize_check 1
obsess_over_service 1
check_freshness 0
notifications_enabled 1
event_handler_enabled 1
flap_detection_enabled 1
failure_prediction_enabled 1
process_perf_data 1
retain_status_information 1
retain_nonstatus_information 1
is_volatile 0
check_period 24x7
max_check_attempts 3
normal_check_interval 10
retry_check_interval 2
contact_groups admins
notification_options w,u,c,r
notification_interval 60
notification_period 24x7
register 0
action_url /nagios/pnp/index.php?host=$HOSTNAME$&srv=$SERVICEDESC$
#在最后添加此行
}

這樣所有主機的所有服務都將增加出圖的超鏈接圖標了。

現在,人要檢查語法并重新加載Nagios

[root@Nagios objects]# /etc/init.d/nagios reload
Running configuration check...done.
Reloading nagios configuration...done

全部主機和服務的監控圖最終結果如下圖所示:

此時,單擊任意一個超鏈接圖標,就可以查看對應的主機或服務的業務趨勢圖了,到此,Nagios的主機和服務出圖的配置就完成了,是不是很簡單?

7.3.3 Nagios出圖獲取的數據存放路徑

想真正繪制出業務的趨勢圖全靠下面命令生成的數據。這些歷史數據要備份好。

[root@Nagios objects]# ll /usr/local/nagios/share/perfdata/
total 8
drwxr-xr-x 2 nagios nagios 4096 Aug 20 02:10 web01
drwxr-xr-x 2 nagios nagios 4096 Aug 20 02:03 web02
[root@Nagios objects]# tree /usr/local/nagios/share/perfdata/
/usr/local/nagios/share/perfdata/
|-- web01
| |-- Current_Load.rrd
| |-- Current_Load.xml
| |-- Disk_Partition.rrd
| |-- Disk_Partition.xml
| |-- Disk_lostat.rrd
| |-- Disk_lostat.xml
| |-- MEM_Useage.rrd
| |-- MEM_Useage.xml
| |-- PING.rrd
| |-- PING.xml
| |-- Swap_Useage.rrd
| |-- Swap_Useage.xml
| |-- http_80.rrd
| |-- http_80.xml
| |-- ssh_22.rrd
| |-- ssh_22.xml
| |-- www_static_url.rrd
| |-- www_static_url.xml
| |-- www_url.rrd
| |-- www_url.xml
| |-- www_yunjisuan_url.rrd
| `-- www_yunjisuan_url.xml
`-- web02
|-- PING.rrd
`-- PING.xml 2 directories, 24 files

八,實現將Nagios故障報警給管理員

要將Nagios故障報警給管理員時,常用的方式包括郵件報警和手機報警,下面分別介紹

8.1 郵件報警

  • 普通郵件報警就是在故障發生或恢復時,將報警信息發到系統管理員或相關維護人員的信箱中,一般來說最好使用公司內部信箱作為報警信箱。同學們回家學習測試時如果用QQ,126等信箱可能會有收不到郵件的情況或者被當作垃圾郵件了。
  • 一般白天上班時,郵件報警還算比較及時,但是如果人不在計算機旁,郵件報警就不行了,因此,郵件報警只適合不是特別重要的業務,或者作為發送大量報警信息中的一個輔助方式,如硬盤,內存,及日志相關等不需要及時解決的服務報警。故而,在生產環境中,郵件報警一般會結合其他報警方式一起使用。
  • 那么,下面就來看一下郵件報警的基本配置方法。

首先,添加監控報警的接收Email地址

[root@Nagios objects]# sed -n '35p' /usr/local/nagios/etc/objects/contacts.cfg | awk -F ";" '{print $1}'
email 215379068@qq.com #將本行內容改成你的QQ郵箱

打開postfix服務

[root@Nagios objects]# /etc/init.d/postfix start
Starting postfix: [ OK ]
[root@Nagios objects]# echo "/etc/init.d/postfix start" >> /etc/rc.local
[root@Nagios objects]# tail -3 /etc/rc.local
touch /var/lock/subsys/local
/etc/init.d/nagios start
/etc/init.d/postfix start

用命令測試發郵件:

[root@Nagios objects]# echo "this is test email" | mail -s "yunjisuan" 215379068@qq.com

#將郵件從QQ攔截名單取出,然后添加白名單

特別警示!

同學們在家玩Nagios一定要用自己的QQ玩,誰給我發,我和誰急-_-!

8.2 關于郵件相關的配置文件的大概解釋(喜歡的同學自己百度含義)

templates.cfg系統定義模板

#模板:generic-service
[root@Nagios objects]# sed -n '153,178p' /usr/local/nagios/etc/objects/templates.cfg | awk -F ";" '{print $1}'
define service{
name generic-service
active_checks_enabled 1
passive_checks_enabled 1
parallelize_check 1
obsess_over_service 1
check_freshness 0
notifications_enabled 1
event_handler_enabled 1
flap_detection_enabled 1
failure_prediction_enabled 1
process_perf_data 1
retain_status_information 1
retain_nonstatus_information 1
is_volatile 0
check_period 24x7 #告訴Nagios檢查服務的時間段
max_check_attempts 3 #對Nagios服務的最大檢查次數
normal_check_interval 10 #兩次檢查的時間間隔
retry_check_interval 2 #重新檢查時間間隔
contact_groups admins #指定聯系人主
notification_options w,u,c,r #定義何種異??梢员煌ㄖ╡mail),w即warn表示警告狀態,r即recover,表示恢復狀態
notification_interval 60 #服務出現異常,故障一直沒解決,Nagios再次對聯系人發出通知的時間間隔
notification_period 24x7 #指定email的時間段
register 0
action_url /nagios/pnp/index.php?host=$HOSTNAME$&srv=$SERVICEDESC$
} #模板:generic-contact
[root@Nagios objects]# sed -n '28,37p' /usr/local/nagios/etc/objects/templates.cfg | awk -F ";" '{print $1}'
define contact{
name generic-contact #聯系人名稱
service_notification_period 24x7 #服務異常,發送通知時間段
host_notification_period 24x7 #主機異常,發送通知時間段
service_notification_options w,u,c,r,f,s #何種異常進行通知
host_notification_options d,u,r,f,s #何種異常進行通知
service_notification_commands notify-service-by-email #定義服務異常發送郵件命令,commands.cfg文件里定義
host_notification_commands notify-host-by-email #定義主機異常發送郵件命令,commands.cfg文件里定義
register 0
}

commands.cfg命令定義模板

#定義發送郵件命令
[root@Nagios objects]# sed -n '27,37p' commands.cfg
# 'notify-host-by-email' command definition
define command{
command_name notify-host-by-email #主機異常發送郵件命令的定義
command_line /usr/bin/printf "%b" "***** Nagios *****\n\nNotification Type: $NOTIFICATIONTYPE$\nHost: $HOSTNAME$\nState: $HOSTSTATE$\nAddress: $HOSTADDRESS$\nInfo: $HOSTOUTPUT$\n\nDate/Time: $LONGDATETIME$\n" | /bin/mail -s "** $NOTIFICATIONTYPE$ Host Alert: $HOSTNAME$ is $HOSTSTATE$ **" $CONTACTEMAIL$
} # 'notify-service-by-email' command definition
define command{
command_name notify-service-by-email #服務異常發送郵件命令的定義
command_line /usr/bin/printf "%b" "***** Nagios *****\n\nNotification Type: $NOTIFICATIONTYPE$\n\nService: $SERVICEDESC$\nHost: $HOSTALIAS$\nAddress: $HOSTADDRESS$\nState: $SERVICESTATE$\n\nDate/Time: $LONGDATETIME$\n\nAdditional Info:\n\n$SERVICEOUTPUT$\n" | /bin/mail -s "** $NOTIFICATIONTYPE$ Service Alert: $HOSTALIAS$/$SERVICEDESC$ is $SERVICESTATE$ **" $CONTACTEMAIL$
}

contacts.cfg聯系人定義模板

[root@Nagios objects]# cat contacts.cfg | egrep -v "#|^$" | awk -F ";" '{print $1}'
define contact{
contact_name nagiosadmin #定義成員
use generic-contact
alias Nagios Admin #成員別名
email 215379068@qq.com #成員郵箱
}
define contactgroup{
contactgroup_name admins #聯系人組名
alias Nagios Administrators #別名
members nagiosadmin #組員名單定義
}

8.3 Nagios各個配置文件的相互間關系圖

九,Nagios插件開發

9.1 概述

9.1.1 什么是Nagios插件

前文在部署Nagios服務時已經安裝了nagios-plugins-1.4.16.tar.gz,這個軟件包就是Nagios的插件安裝包,安裝后,執行ls -l /usr/local/nagios/libexec可以看到如下插件內容:

[root@Nagios objects]# ls -l /usr/local/nagios/libexec/
total 5288
lrwxrwxrwx 1 root root 27 Aug 18 08:29 check_111 -> /service/scripts/check_test
-rwxr-xr-x. 1 nagios nagios 376524 Aug 14 10:11 check_apt
-rwxr-xr-x. 1 nagios nagios 2245 Aug 14 10:11 check_breeze
-rwxr-xr-x. 1 nagios nagios 128296 Aug 14 10:11 check_by_ssh
lrwxrwxrwx. 1 root root 9 Aug 14 10:11 check_clamd -> check_tcp
-rwxr-xr-x. 1 nagios nagios 85694 Aug 14 10:11 check_cluster
-r-sr-xr-x. 1 root nagios 123603 Aug 14 10:11 check_dhcp
-rwxr-xr-x. 1 nagios nagios 417895 Aug 14 10:11 check_disk
-rwxr-xr-x. 1 nagios nagios 9148 Aug 14 10:11 check_disk_smb
-rwxr-xr-x. 1 nagios nagios 80689 Aug 14 10:11 check_dummy
-rwxr-xr-x. 1 nagios nagios 3056 Aug 14 10:11 check_file_age
-rwxr-xr-x. 1 nagios nagios 6318 Aug 14 10:11 check_flexlm
lrwxrwxrwx. 1 root root 9 Aug 14 10:11 check_ftp -> check_tcp
-rwxr-xr-x. 1 nagios nagios 520614 Aug 14 10:11 check_http
-r-sr-xr-x. 1 root nagios 133689 Aug 14 10:11 check_icmp
-rwxr-xr-x. 1 nagios nagios 93416 Aug 14 10:11 check_ide_smart
-rwxr-xr-x. 1 nagios nagios 15137 Aug 14 10:11 check_ifoperstatus
-rwxr-xr-x. 1 nagios nagios 12601 Aug 14 10:11 check_ifstatus
lrwxrwxrwx. 1 root root 9 Aug 14 10:11 check_imap -> check_tcp
-rwxr-xr-x. 1 nagios nagios 6890 Aug 14 10:11 check_ircd
lrwxrwxrwx. 1 root root 9 Aug 14 10:11 check_jabber -> check_tcp
-rwxr-xr-x. 1 nagios nagios 106573 Aug 14 10:11 check_load
-rwxr-xr-x. 1 nagios nagios 6020 Aug 14 10:11 check_log
-rwxr-xr-x. 1 nagios nagios 20287 Aug 14 10:11 check_mailq
-rwxr-xr-x. 1 nagios nagios 93142 Aug 14 10:11 check_mrtg
-rwxr-xr-x. 1 nagios nagios 92487 Aug 14 10:11 check_mrtgtraf
-rwxr-xr-x. 1 nagios nagios 105606 Aug 14 10:11 check_nagios
lrwxrwxrwx. 1 root root 9 Aug 14 10:11 check_nntp -> check_tcp
lrwxrwxrwx. 1 root root 9 Aug 14 10:11 check_nntps -> check_tcp
-rwxrwxr-x. 1 nagios nagios 76744 Aug 14 10:32 check_nrpe
-rwxr-xr-x. 1 nagios nagios 127679 Aug 14 10:11 check_nt
-rwxr-xr-x. 1 nagios nagios 130078 Aug 14 10:11 check_ntp
-rwxr-xr-x. 1 nagios nagios 119167 Aug 14 10:11 check_ntp_peer
-rwxr-xr-x. 1 nagios nagios 117728 Aug 14 10:11 check_ntp_time
-rwxr-xr-x. 1 nagios nagios 159372 Aug 14 10:11 check_nwstat
-rwxr-xr-x. 1 nagios nagios 8324 Aug 14 10:11 check_oracle
-rwxr-xr-x. 1 nagios nagios 108934 Aug 14 10:11 check_overcr
-rwxr-xr-x. 1 nagios nagios 132691 Aug 14 10:11 check_ping
-rwxr-xr-x 1 nagios nagios 6184 Aug 19 23:04 check_pnp_rrds.pl
lrwxrwxrwx. 1 root root 9 Aug 14 10:11 check_pop -> check_tcp
-rwxr-xr-x. 1 nagios nagios 396833 Aug 14 10:11 check_procs
-rwxr-xr-x. 1 nagios nagios 106492 Aug 14 10:11 check_real
-rwxr-xr-x. 1 nagios nagios 9584 Aug 14 10:11 check_rpc
-rwxr-xr-x. 1 nagios nagios 1412 Aug 14 10:11 check_sensors
lrwxrwxrwx. 1 root root 9 Aug 14 10:11 check_simap -> check_tcp
-rwxr-xr-x. 1 nagios nagios 446511 Aug 14 10:11 check_smtp
lrwxrwxrwx. 1 root root 9 Aug 14 10:11 check_spop -> check_tcp
-rwxr-xr-x. 1 nagios nagios 103000 Aug 14 10:11 check_ssh
lrwxrwxrwx. 1 root root 9 Aug 14 10:11 check_ssmtp -> check_tcp
-rwxr-xr-x. 1 nagios nagios 108233 Aug 14 10:11 check_swap
-rwxr-xr-x. 1 nagios nagios 160386 Aug 14 10:11 check_tcp
-rwxr-xr-x. 1 nagios nagios 105022 Aug 14 10:11 check_time
lrwxrwxrwx. 1 root root 9 Aug 14 10:11 check_udp -> check_tcp
-rwxr-xr-x. 1 nagios nagios 117534 Aug 14 10:11 check_ups
-rwxr-xr-x. 1 nagios nagios 83434 Aug 14 10:11 check_users
-rwxr-xr-x. 1 nagios nagios 2939 Aug 14 10:11 check_wave
-rwxr-xr-x. 1 nagios nagios 109723 Aug 14 10:11 negate
-rwxr-xr-x 1 nagios nagios 31813 Aug 19 23:04 process_perfdata.pl
-rwxr-xr-x. 1 nagios nagios 103242 Aug 14 10:11 urlize
-rwxr-xr-x. 1 nagios nagios 1904 Aug 14 10:11 utils.pm
-rwxr-xr-x. 1 nagios nagios 2728 Aug 14 10:11 utils.sh

提示:

默認安裝后大概有60個左右的插件,數量比較多,這里只介紹幾個常見的。

以上結果內容都是Nagios插件,現在大家應該對Nagios插件有一個基本的了解了。其實,Nagios軟件本身僅僅是一個監控的平臺,如果要監控具體的主機及服務的狀態和數據信息,還必須配置或調用插件或程序文件才能完成任務,因此,如果沒有Nagios插件,Nagios就是一個空殼,啥都做不了。

9.1.2 為什么要開發Nagios插件

  • 既然已經安裝了Nagios的插件軟件包,為什么還要開發Nagios插件呢?
  • 首先想說明的是,在生產場景中常用的大部分服務都是不需要編寫插件就可以完成監控的,check_http,check_tcp,check_nrpe等這些自帶的插件已經很強大了。但是,仍然有部分我們想要監控的服務,是Nagios未自帶插件的,如:監控LVS RS的lo網卡的VIP,監控NFS狀態,又或是監控iostat,mem,sar系統指標及相關APP應用(MQ隊列)等。這個時候我們有兩個選擇,一個是去網上搜索,看看有沒有別人寫過的腳本,拿來使用或修改后使用;另外就是自己開發編寫腳本。這里建議大家學會手工編寫插件,如果開始不會寫,可以把網上別人分享的插件拿來改,改著改著就會寫了。
  • 如果要開發插件,最好掌握一門開發語言,例如:Shell,Python。

9.2 編寫Nagios插件的規則

9.2.1 編寫Nagios插件說明

  • Nagios插件是Nagios提供的一種通過可擴展的方式部署的程序組件,該插件可通過Shell,Java,C/C++,PHP等多種語言開發,運維或者系統架構人員只要通過修改Nagios配置文件和相應參數,就能很方便的將該插件集成到Nagios中,實現對目標系統的監控。
  • Nagios服務為1插件程序提供了兩個返回值接口和插件交互:一個是插件執行后的退出狀態碼,另一個是插件執行過程中在控制臺打印的1第一行數據。退出狀態碼可以被Nagios主程序作為判斷被監控系統服務狀態的依據,控制臺打印的第一行數據可以被Nagios主程序作為被監控系統服務狀態的補充說明,會顯示在Web管理頁面,如下圖所示:

為了管理Nagios插件,Nagios每查詢一個服務的狀態時,就會產生一個子進程,并使用來自該命令的輸出和退出代碼來確定其具體的狀態。Nagios主程序可識別的插件的退出狀態碼和說明如下:

  • OK:退出代碼,0表示服務工作正常。
  • WARNING:退出代碼,1表示服務處于警告狀態
  • CRITICAL:退出代碼,2表示服務處于緊急,嚴重狀態。
  • UNKNOWN:退出代碼,3表示服務處于未知狀態。

注意:

此處數字代碼的含義曾經有公司面試時考過。

最后一種狀態通常表示該插件無法確定服務的狀態。例如,可能出現了網絡或內部錯誤。相關狀態可以從如下文件中看到:

[root@Nagios objects]# head -7 /usr/local/nagios/libexec/utils.sh
#! /bin/sh STATE_OK=0
STATE_WARNING=1
STATE_CRITICAL=2
STATE_UNKNOWN=3
STATE_DEPENDENT=4 #提示:結尾處比列舉的還多個狀態,但不常用

9.2.2 Nagios插件開發原理

Nagios插件程序中需要調用監控服務規定的操作序列,并根據預先定義的規則,對返回結果進行分析,判斷服務的當前狀態,然后以指定的狀態碼退出程序,同時將對該狀態的說明不換行輸出到控制臺。

9.2.3 Nagios插件開發語言

Nagios的插件開發不限制任何開發語言,只要該插件能被Nagios調用,并獲取到相應業務數據就OK,如能在命令行執行輸出結果也可以,常用的插件語言有Shell,Perl,Python,PHP, C/C++。

9.3 使用Shell開發Nagios插件

9.3.1 編寫檢查WebURL地址的插件

以下腳本只是針對訪問客戶端192.168.0.223的IP的

[root@Nagios libexec]# cat check_url.sh
#!/bin/bash
# anthor:Mr.chen by 2017-8-20 wget -T 10 --spider 192.168.0.223 >/dev/null 2>&1 #用wget檢查192.168.0.223是不是可以訪問,-T超時時間 --spider不下載網頁 if [ $? -eq 0 ];then #判斷上述wget命令返回值,0成功非0失敗
echo "URL 192.168.0.223 OK"
exit 0
else
echo "URL 192.168.0.223 CRITICAL"
exit 2
fi

下面利用傳參把腳本改進為通用的WebURL插件

[root@Nagios libexec]# cat check_url.sh
#!/bin/bash
# anthor:Mr.chen by 2017-8-20 PROGNAME=`basename $0` #取腳本名
PROGPATH=`dirname $0` #取腳本路徑 usage(){ #打印幫助 echo "Usage: /bin/sh ${PROGPATH}/${PROGNAME} url"
exit 1 } [ $# -ne 1 ] && usage #參數個數不是1,打印幫助 wget -T 10 --spider $1 >/dev/null 2>&1 #URL地址改成傳參 if [ $? -eq 0 ];then
echo "URL $1 OK"
exit 0
else
echo "URL $1 CRITICAL"
exit 2
fi

以下是監控WebURL的插件腳本專業型寫法

[root@Nagios libexec]# cat check_url.sh
#!/bin/bash
# anthor:Mr.chen by 2017-8-20 PROGNAME=`basename $0`
PROGPATH=`dirname $0` usage(){ echo "Usage: /bin/sh ${PROGPATH}/${PROGNAME} url"
exit 1 } [ $# -ne 1 ] && usage . $PROGPATH/utils.sh if wget -T 20 --spider $1 >/dev/null 2>&1;then
echo "URL $1 OK"
exit $STATE_OK
else
echo "URL $1 NO"
exit $STATE_CRITICAL
fi

最后手工測試以下改進的WebURL插件腳本

[root@Nagios libexec]# sh /usr/local/nagios/libexec/check_url.sh www.yunjisuan.com
URL www.yunjisuan.com OK
[root@Nagios libexec]# echo $?
0
[root@Nagios libexec]# sh /usr/local/nagios/libexec/check_url.sh bbs.yunjisuan.com
URL bbs.yunjisuan.com OK
[root@Nagios libexec]# echo $?
0
[root@Nagios libexec]# sh /usr/local/nagios/libexec/check_url.sh blog.yunjisuan.com
URL blog.yunjisuan.com NO
[root@Nagios libexec]# echo $?
2

9.3.2 WebURL插件腳本的部署過程(主動監控方式)

Nagios主動模式監控和Nagios客戶端的nrpe進程沒有關系。

主動模式的所有操作完全在Nagios主服務器上進行。部署步驟如下:

(1)開發check_url.sh,放到/usr/local/nagios/libexec中,授權為可執行

root@Nagios libexec]# cd /usr/local/nagios/libexec/
[root@Nagios libexec]# chmod +x check_url.sh
[root@Nagios libexec]# ll check_url.sh
-rwxr-xr-x 1 root root 337 Aug 20 06:38 check_url.sh
[root@Nagios libexec]# cat check_url.sh
#!/bin/bash
# anthor:Mr.chen by 2017-8-20 PROGNAME=`basename $0`
PROGPATH=`dirname $0` usage(){ echo "Usage: /bin/sh ${PROGPATH}/${PROGNAME} url"
exit 1 } [ $# -ne 1 ] && usage . $PROGPATH/utils.sh if wget -T 20 --spider $1 >/dev/null 2>&1;then
echo "URL $1 OK"
exit $STATE_OK
else
echo "URL $1 NO"
exit $STATE_CRITICAL
fi

(2)在commands.cfg中建立check_url命令:

[root@Nagios objects]# cd /usr/local/nagios/etc/objects/
[root@Nagios objects]# tail -7 commands.cfg
# 'check_url' command definition by Mr.chen
define command { command_name check_url
command_line $USER1$/check_url.sh 192.168.0.223 #加載腳本并傳參數 }
#提示:$USER1$是Nagios默認變量,為/usr/local/nagios/libexec

(3)在services.cfg里添加監控上述URL地址的服務

可以將服務直接添加進services里也可以,寫一個子服務的配置文件,寫在/usr/local/nagios/etc/objects/services目錄里

#創建需要監控的子服務配置文件
[root@Nagios objects]# pwd
/usr/local/nagios/etc/objects
[root@Nagios objects]# cd services
[root@Nagios services]# pwd
/usr/local/nagios/etc/objects/services
[root@Nagios services]# vim check_url.cfg
[root@Nagios services]# cat check_url.cfg
define service { use generic-service
host_name web01
service_description http_zhudong_url
check_command check_url }

由于/usr/local/nagios/etc/objects/services/*已經被nagios.cfg主配置文件引用,因此無需在include進service.cfg配置文件。

[root@Nagios etc]# cat nagios.cfg | grep "/usr/local/nagios/etc/objects/services"
cfg_file=/usr/local/nagios/etc/objects/services.cfg
cfg_dir=/usr/local/nagios/etc/objects/services

各個配置文件與Nagios.cfg主配置文件的關系如下圖所示:

(4)重新加載Nagios,查看結果

[root@Nagios etc]# /etc/init.d/nagios reload
Running configuration check...done.
Reloading nagios configuration...done

(5)查看Nagios服務頁面監控結果,如下圖所示:

備注:

Web01服務器需要能夠提供http協議的web訪問。

等待刷新....

9.3.3 利用被動模式的nrpe方式監控/etc/passwd文件是否變化

Nagios被動模式下的所有插件都需要部署在被監控的Nagios客戶端。部署步驟如下。

1)在Nagios客戶端web01上取/etc/passwd的文件指紋,即md5值。

[root@web01 ~]# md5sum /etc/passwd >/opt/ps.md5
[root@web01 ~]# cat /opt/ps.md5
3660c548ce618df6c066f0db6bedd2af /etc/passwd #記住這個校驗碼

2)在Nagios客戶端web01上開發插件腳本,并測試

#請注意這是在web01客戶端的操作
[root@web01 ~]# cd /usr/local/nagios/libexec/
[root@web01 libexec]# vim check_passwd
[root@web01 libexec]# vim check_passwd
[root@web01 libexec]# cat check_passwd
#!/bin/bash
# author:Mr.chen by 2017-8-20 OriMd5="3660c548ce618df6c066f0db6bedd2af" #之前記錄的校驗碼
CurrMd5=`md5sum /etc/passwd | cut -c 1-32` #每次都重新生成校驗碼
if [ "$OriMd5" == "$CurrMd5" ];then
echo "/etc/passwd:OK"
exit 0
else
echo "/etc/passwd:FAILED"
exit 2
fi
[root@web01 libexec]# sh check_passwd
/etc/passwd:OK
[root@web01 libexec]# chmod +x check_passwd #提示:還可以用md5sum -c /opt/ps.md5的方法比較

3)在Nagios客戶端web01上編輯nrpe.cfg,插入如下的內容后保存

root@web01 libexec]# cd /usr/local/nagios/etc/
[root@web01 etc]# vim nrpe.cfg
[root@web01 etc]# tail -1 nrpe.cfg #在文件末尾加入如下內容
command[check_passwd]=/usr/local/nagios/libexec/check_passwd

4)在Nagios客戶端web01上重啟nrpe,并檢查是否重啟成功(check_nrpe檢驗)

[root@web01 etc]# ps -ef | grep nrpe | grep -v grep
nagios 1027 1 0 Aug18 ? 00:00:05 /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
[root@web01 etc]# pkill nrpe
[root@web01 etc]# ps -ef | grep nrpe | grep -v grep
[root@web01 etc]# /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
[root@web01 etc]# ps -ef | grep nrpe | grep -v grep
nagios 4362 1 0 06:33 ? 00:00:00 /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d

5)在Nagios服務器端nagios-server上進入service目錄,創建配置文件check_passwd_web01.cfg

#請注意這里是Nagios服務器端的操作
[root@Nagios ~]# cd /usr/local/nagios/etc/objects/services
[root@Nagios services]# vim check_passwd_web01.cfg
[root@Nagios services]# cat check_passwd_web01.cfg
define service { use generic-service
service_description check_passwd
check_command check_nrpe!check_passwd
#這里的check_passwd就是Nagios客戶端nrpe.cfg里command[check_passwd]=/usr/local/nagios/libexec/check_passwd配置的中括號命令名check_passwd
}

6)在Nagios服務器端檢查語法

[root@Nagios services]# /etc/init.d/nagios checkconfig
#以上省略若干....
Total Warnings: 0
Total Errors: 0 Things look okay - No serious problems were detected during the pre-flight check
OK.

7)在Nagios服務器端加載Nagios配置,然后打開Nagios頁面查看

[root@Nagios services]# /etc/init.d/nagios reload
Running configuration check...done.
Reloading nagios configuration...done

等待刷新....

十,本節重點回顧

  1. Nagios監控系統家族成員功能介紹
  2. Nagios監控系統完整框架圖解說明
  3. Nagios服務器端核心配置文件之間的關系原理
  4. Nagios服務器端及客戶端安裝,配置細節。
  5. Nagios利用check_nrpe插件進行監控的原理
  6. Nagios圖形監控顯示和數據管理
  7. Nagios報警方式選擇及報警實施細節
  8. Nagios自定義插件開發原理及開發實踐
  9. Nagios插件主動和被動方式工作原理及實施部署細節。

總結

以上是生活随笔為你收集整理的Linux实战教学笔记35:企业级监控Nagios实践(下)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 日韩一区视频在线 | jzjzjz欧美丰满少妇 | 91视频亚洲 | 无码熟妇αⅴ人妻又粗又大 | 欧美精品乱码久久久久久按摩 | 色九月婷婷 | 欧美性xxxxxxxxx | 男人天堂伊人 | 亚色av | 中出av在线 | 在线播放亚洲 | 成人国产一区二区三区精品麻豆 | 无码人妻精品一区二区中文 | 91插插视频 | 夜夜嗨一区二区三区 | 亚洲自偷自偷偷色无码中文 | 岛国大片在线免费观看 | 天天操天天看 | 丰满人妻一区二区三区性色 | 精品一区二区三区蜜桃 | 全部孕妇毛片丰满孕妇孕交 | 精品成人在线 | 亚洲人成亚洲人成在线观看 | 国产麻豆网 | 中日韩黄色大片 | 男男野外做爰全过程69 | 天天色天天搞 | 黑人操白妞 | 艳母在线视频 | 日本女v片| 插插插av | 最新中文在线视频 | 欧美人交a欧美精品 | www.国产一区二区 | 在线观看wwww| 中文字幕色片 | 免费裸体视频女性 | 婷婷五综合| 成人av毛片 | 国产伦精品一区二区三区免费视频 | 欧美高清一区二区 | 五月天视频网站 | 亚洲AV成人无码网站天堂久久 | 亚洲成年人在线观看 | 哪里有毛片看 | 婷婷天堂网 | 超碰国产一区二区三区 | 先锋影音资源av | 美女高潮网站 | 久操这里只有精品 | av青草 | 成人综合区一区 | 国产精品久久久网站 | 美国黄色网址 | 成人免费午夜视频 | 成人交配视频 | 国产福利小视频 | 天天操天天添 | 久久高清免费 | www.白白色 | 91播放在线 | 欧美色视 | 色播在线播放 | 男人天堂a | 国产免费一区视频观看免费 | 91精品久久久久久久99蜜桃 | 日韩精品视频一区二区三区 | 人人看超碰 | 性开放耄耋老妇hd | 午夜精品久久久久久毛片 | 小视频在线播放 | 亚洲wwww | 在线免费观看黄色片 | 波多野结衣在线观看一区二区三区 | 欧美韩国日本在线 | 日本猛少妇色xxxxx | 韩国精品视频 | 亚洲精品一区三区三区在线观看 | 香蕉视频链接 | 日韩视频免费观看高清完整版 | 久久久久久电影 | 偷偷操不一样的久久 | 蜜桃av在线 | 国内精品毛片 | av网站一区 | 小视频在线免费观看 | 成都电影免费大全 | 综合网在线视频 | 色91视频| av噜噜 | 国产69久久精品成人看 | 香蕉视频黄色在线观看 | 久草视频免费在线 | 中文字幕激情小说 | 亚洲色图一区二区三区 | 国产精品99精品无码视亚 | 国产对白在线 | 男男受被啪到高潮自述 | 在线观看免费视频a |