服务器的智能监控管理结束,通过服务器监控告警进行异常排障
告警是服務監控應用及時發現、主動提醒用戶異常的功能,保證了用戶在任何情況下都能及時發現異常信息,提升 IT 人員運維的效率。
本教程介紹如何使用告警功能實現服務器的異常排障。
在目標監控機器上安裝 logkit-pro
使用智能日志平臺的服務監控應用,首先需要確保您的機器已經安裝 logkit-pro,并開啟機器監控。
1.登錄 logkit-pro,進入機器管理頁面,點擊添加機器。
2.手動安裝:根據您機器的操作系統版本選擇對應的命令,復制到命令行工具即可,如圖所示:
3.進入機器列表頁,開啟機器監控。
在服務監控應用監控機器
這樣,您就可以在服務監控應用監控機器資源與性能指標。
進入智能日志平臺應用平臺,找到服務監控應用,點擊進入應用。
進入服務監控應用即可看到目標服務器監控視圖。
創建報警通知對像
進入報警管理頁面,在通知管理新建通知對象,下一步配置告警規則需要填寫這個通知對象。
配置報警規則
在報警規則 tab,創建指定監控項的報警規則,系統每隔 5 分鐘聚合監控項指標,一旦監控項指標滿足所配置的閾值,您將接收到報警信息。這里配置的報警規則是 CPU 使用率大于 40% 即報警。
運維人員接收告警信息
進入報警管理頁面,可以發現新增了一條報警事件,狀態為未恢復。
觀察服務器概覽定位異常時間點,排查異常原因
接收到報警信息后,進入智能日志平臺服務監控應用。
1.去服務器概覽查看目標機器的 CPU 使用率時序監控視圖,找出最近異常發生的時間節點。
2.分析異常發生原因,及時處理異常。
異常處理完畢報警事件置為已恢復
異常處理完畢,您會收到一條異常回復信息。
進入報警管理頁面,查看對應的報警事件,狀態未已恢復代表異常已經處理完畢。
總結
以上是生活随笔為你收集整理的服务器的智能监控管理结束,通过服务器监控告警进行异常排障的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 测试显卡风扇的软件,让噪音远离,显卡风扇
- 下一篇: 网页上的文本不让你复制下载?老司机教你几