日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > 数据库 >内容正文

数据库

SQL老司机,居然是这样智能挖掘异常日志

發布時間:2024/8/23 数据库 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 SQL老司机,居然是这样智能挖掘异常日志 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

摘要:?提取異常日志是個大難題 面對海量的日志(TB乃至PB級別),如何從日志中挖掘出異常信息對于大部分的開發者而言是一個大難題。例如,判斷機器的延時是否正常,部分request是否正常。通常,我們對于異常的數據,要及時的報警,以盡快的處理。

提取異常日志是個大難題

面對海量的日志(TB乃至PB級別),如何從日志中挖掘出異常信息對于大部分的開發者而言是一個大難題。例如,判斷機器的延時是否正常,部分request是否正常。通常,我們對于異常的數據,要及時的報警,以盡快的處理。

通常我們是怎么搞得呢? 在以前,依賴于開發者的經驗,來根據某些特定的特征,判斷是否達到了閾值,例如根據延時是否達到了某個特定的值,或者http 響應碼5xx的比例達到了某個閾值。這個閾值,依賴于資深的開發者的豐富的經驗。

AI dev/ops

AI算法的迅猛發展,給異常日志挖掘提供了新的方向。大名鼎鼎的AI領域專家吳恩達(Andrew NG),在他所教授的Machine Learning課程中提供了一種Abnormal Detection算法。算法通過訓練數據集,獲得一個正態分布。然后檢測目標數據是否落在了正態分布的邊緣位置,如果落在了邊緣位置,則認為是一個異常數據。

算法步驟:

  • 確定要訓練的feature,可以是單個指標,比如latency,也可以是復合指標,例如CPU/NetFlow
  • 在訓練數據集上,求得均值μ和方差σ^2
  • 對新數據求方程P(x)= ?

  • 接下來,我們介紹如何在SQL中使用該算法來檢測異常。

    日志服務提供的異常檢測算法

    以延時為例,我們來看哪些延時是異常的。 延時的分布一般是這樣的:

    不滿足正太的需求,要把上述圖形轉化成正太分布,對latency 求對數:log(latency)


    • 值μ和方差σ^2:
    * | select numeric_histogram(10,latency), stddev_pop(ln(latency)) as stddev,var_pop(ln(latency)) as variance ,avg(ln(latency)) as avg_ln, avg(latency) as avglatency


    stddev即標準差
    variance即方差
    avg_ln即ln(latency)的均值
    avglatency即latency的均值

    • 提取異常數據
    | select latency where pow(e(), - pow((ln(latency) - 8.223) ,2)/2/0.3975) /sqrt(2*pi()) / 0.53 < 0.01 order by latency desc

    把方差標準差和均值帶入公式,使用where篩選出來小于0.01的結果,即異常值。可以看到,獲得的結果,明顯大于軍latency的均值。


    原文鏈接

    干貨好文,請關注掃描以下二維碼:



    總結

    以上是生活随笔為你收集整理的SQL老司机,居然是这样智能挖掘异常日志的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。