日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

net start zabbix agent 服务没有相应控制功能_一步到位,服务器监控就是这么简单...

發(fā)布時間:2023/12/10 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 net start zabbix agent 服务没有相应控制功能_一步到位,服务器监控就是这么简单... 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

對于運維的日常工作來說,服務(wù)器監(jiān)控是必須且最基礎(chǔ)的一項內(nèi)容。在企業(yè)基礎(chǔ)設(shè)施運維過程中,管理員必須能夠掌握所有服務(wù)器的運行狀況,以便及時發(fā)現(xiàn)問題,盡可能減少故障的發(fā)生。通常我們會借助一些監(jiān)控的軟件來獲取每個服務(wù)器的基礎(chǔ)指標(biāo)并進行集中的查看、分析、監(jiān)控。

市面上開源、收費的服務(wù)器監(jiān)控系統(tǒng)非常多,例如老牌的zabbix、nagios、NewRelic、CollectD等,近期開始流行的Telegraf、Prometheus。各類系統(tǒng)都有其出彩的點,例如Zabbix強大的生態(tài)、NewRelic的服務(wù)、Prometheus的云原生友好等。服務(wù)器監(jiān)控相對中間件、業(yè)務(wù)監(jiān)控更加基礎(chǔ),關(guān)注點主要集中在監(jiān)控的易用性、穩(wěn)定性、實時性、報警豐富度、報表使用便捷度等。

本期為大家介紹如何使用阿里云SLS來快速構(gòu)建一套完整的服務(wù)器/主機基礎(chǔ)指標(biāo)實時監(jiān)控方案。

SLS時序存儲簡介

SLS的日志存儲引擎在2016年對外發(fā)布,目前承接阿里內(nèi)部以及眾多企業(yè)的日志數(shù)據(jù)存儲,每天有數(shù)十PB的日志類數(shù)據(jù)寫入。其中有很大一部分屬于時序類數(shù)據(jù)或者用來計算時序指標(biāo),為了讓用戶能夠一站式完成整個DevOps生命周期的數(shù)據(jù)接入、清洗、加工、提取、存儲、可視化、監(jiān)控、問題分析等過程,我們專門推出了時序存儲的功能,與日志存儲一道為大家解決各類機器數(shù)據(jù)的存儲問題。

SLS時序存儲從設(shè)計之初就是為了解決阿里內(nèi)部與眾多頭部企業(yè)客戶的時序存儲需求,并借助于阿里內(nèi)部多年的技術(shù)積累,使之可以適應(yīng)絕大部分企業(yè)級時序監(jiān)控/分析訴求。SLS時序存儲的特點主要有:

  • 豐富上下游:數(shù)據(jù)接入上SLS支持眾多采集方式,包括各類開源Agent以及阿里云內(nèi)部的監(jiān)控數(shù)據(jù)通道;同時存儲的時序數(shù)據(jù)支持對接各類的流計算、離線計算引擎,數(shù)據(jù)完全開放;
  • 高性能:SLS存儲計算分離架構(gòu)充分發(fā)揮集群能力,尤其在大量數(shù)據(jù)下端對端的速度提升顯著;
  • 免運維:SLS的時序存儲完全是服務(wù)化,無需用戶自己去運維實例,而且所有數(shù)據(jù)都是3副本高可靠存儲,不用擔(dān)心數(shù)據(jù)的可靠性問題;
  • 開源友好:SLS的時序存儲原生支持Prometheus的寫入和查詢,并支持SQL92的分析方法,可以原生對接Grafana等可視化方案;
  • 智能:SLS提供了各種AIOps算法,例如多周期估算、預(yù)測、異常檢測、時序分類等各類時序算法,可以基于這些算法快速構(gòu)建適應(yīng)于公司業(yè)務(wù)的智能報警、診斷平臺。
  • 服務(wù)器監(jiān)控方案概述

    SLS的主機監(jiān)控方案非常簡單,只需要安裝一個Logtail就可以采集各個主機的基礎(chǔ)指標(biāo),服務(wù)端都是云化,無需運維,默認(rèn)SLS提供了可視化的儀表盤,也可以通過Grafana來進行更加專業(yè)的可視化。

    目前Logtail采集了主機常用的基礎(chǔ)指標(biāo),包括CPU、內(nèi)存、網(wǎng)絡(luò)、磁盤等,其中對較為關(guān)鍵的指標(biāo)都做了可視化,便于直接查看。

    數(shù)據(jù)接入

    數(shù)據(jù)接入的流程非常簡單,只需要在SLS控制臺上操作即可完成(對于非阿里云的服務(wù)器,需要在服務(wù)器上額外執(zhí)行2條命令),具體接入的方法可參見:采集主機監(jiān)控數(shù)據(jù)。

    接入過程中最核心的就是給每臺主機的Logtail增加一個采集配置,Logtail的采集配置可以完全云化管理,無需登錄每臺服務(wù)器手動配置。

    { "inputs": [ { "detail": { "IntervalMs": 30000 }, "type": "metric_system_v2" } ]}

    可視化

    在運維可視化領(lǐng)域Grafana是當(dāng)前大家接受度最高的可視化方案,SLS為主機監(jiān)控專門增加了2個Dashboard模板,包括一張集群級別的監(jiān)控大盤和單機的詳細指標(biāo)大盤。這些大盤可以一鍵導(dǎo)入到Grafana中。

    Grafana的配置流程如下:

  • 在Grafana中把SLS的時序庫作為Prometheus的數(shù)據(jù)源,設(shè)置方式可參考:Grafana可視化配置。
  • 導(dǎo)入Grafana模板市場中的SLS模板:主機監(jiān)控集群指標(biāo)、主機監(jiān)控單機指標(biāo)。
  • 監(jiān)控數(shù)據(jù)分析與告警配置

    作為一個合格的運維人員,僅僅配置完炫酷的監(jiān)控儀表盤還不夠,還需要對集群設(shè)置好足夠的告警項并能在需要排查問題的時候利用監(jiān)控數(shù)據(jù)分析的語法快速定位問題。這些本質(zhì)上都是對集群的指標(biāo)進行一些計算和統(tǒng)計。

    SLS時序數(shù)據(jù)支持SQL、PromQL以及SQL+PromQL等多種查詢方式,PromQL查詢語言相對更加簡潔,SQL能夠?qū)崿F(xiàn)的語義更加強大。而主機的監(jiān)控數(shù)據(jù)相對比較簡單,建議使用PromQL或SQL+PromQL的方式。

    下面介紹幾個在告警、分析中經(jīng)常會用到的幾個統(tǒng)計方式:

  • 計算所有機器的某個指標(biāo)平均值,例如平均CPU
  • 查找某個指標(biāo)最高的N臺機器,比如查找內(nèi)存占用最高的5臺機器
  • 查找某個指標(biāo)超過X的機器,比如找到1分鐘網(wǎng)絡(luò)流量超過10M的機器
  • 計算某臺機器的某個指標(biāo)相對某個時間點的變化,比如計算某臺機器磁盤使用率相比1天前的變化
  • 這些用PromQL實現(xiàn)起來非常容易,可以在Grafana的Explore頁面直接調(diào)試:

  • 平均CPU: avg(cpu_util)
  • 查找內(nèi)存占用最高的5臺機器:topk(5, mem_util)
  • 找出1分鐘網(wǎng)絡(luò)流量超過10M的機器:(sum_over_time(net_in[1m]) + sum_over_time(net_out[1m])) > (10*1024*1024)
  • 計算某臺機器磁盤使用率相比1天前的變化:disk_util{hostname="iZ2ze06ibdlxtgebgtu4xdZ"} - disk_util{hostname="iZ2ze06ibdlxtgebgtu4xdZ"} offset 1d
  • 而告警也可以直接在Grafana上配置,可以在集群監(jiān)控的Dashboard上直接配置告警,例如下面是配置CPU集群平均CPU超限的告警,告警規(guī)則是:每分鐘計算最近5分鐘內(nèi)的集群CPU平均利用率,如果連續(xù)5分鐘超過80%則觸發(fā)告警。

    總結(jié)

    服務(wù)的基礎(chǔ)指標(biāo)監(jiān)控是我們監(jiān)控運維領(lǐng)域最基礎(chǔ)的工作之一,構(gòu)造公司IT的全方位監(jiān)控還有很多工作要做,例如中間件監(jiān)控、云產(chǎn)品監(jiān)控、應(yīng)用監(jiān)控、業(yè)務(wù)監(jiān)控等,而這些利用SLS的日志和時序存儲功能都可以很容易的實現(xiàn),其他相關(guān)的實現(xiàn)我們會在后續(xù)文章中給大家呈現(xiàn)。

    大家在使用SLS中遇到的任何問題,請加釘釘群,我們有專門的日志女仆24小時在線答疑,還有火鍋哥和燒烤哥專業(yè)支持!~ SLS微信公眾號定期會發(fā)布各類日志、監(jiān)控領(lǐng)域的技術(shù)分享文章并定期舉行抽獎,歡迎小伙伴們關(guān)注~

    另外歡迎對大數(shù)據(jù)、分布式、機器學(xué)習(xí)等有興趣的同學(xué)加入,轉(zhuǎn)崗、內(nèi)推,來者不拒,請用簡歷狠狠的砸我,聯(lián)系郵箱 davidzhang.zc@alibaba-inc.com !~

    總結(jié)

    以上是生活随笔為你收集整理的net start zabbix agent 服务没有相应控制功能_一步到位,服务器监控就是这么简单...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。