日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

统计学---极端异常值的检测

發布時間:2025/3/20 编程问答 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 统计学---极端异常值的检测 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

你在整理統計公司人的收入情況,手一抖,不小心把某個人的月薪26249變成262490了,某個人的月薪16895變成1689.5了。于是變成了如下的情況:

incomes=[25590, 23306, 26780, 29463, 22485, 262490, 24985, 1689.5, 17700, 18257, 24132, 21479, 19304, 16511, 18573, 26606, 20917, 19394, 24322, 28383, 16478, 29062, 23232, 17580, 26804, 28500, 25018, 24001, 27530, 27459, 22776, 19835, 16475, 15201, 28801, 19509, 19098, 17993, 15131, 26187, 25022, 27430, 19114, 18295, 25365, 23550, 20413, 19335, 21286, 22911]

有時候數據集中會包含一個或多個數值異常大或異常小的值,這樣的極端值稱為異常極端值(outlier)。這在現實數據集中是很有可能發生的,如數據錄入錯誤、測量錯誤、試驗錯誤、數據處理錯誤等。異常值的存在當然對數據統計產生很多不良的影響,例如降低數據統計的說服力和可信度。

因此,我們首先想到的是把異常值檢測出來。這里就需要用到排序,利用排序,將數據從小到大進行排列。然后將數據進行等分。如果分成2部分,那這個數就是中位數。如果分為4部分,那這個數就叫四分位數。注意,這不是美式足球(橄欖球)中的四分位;四分位數不止一個,是3個,即通過3個四分位數將數據分為了4個數量上相等的部分。

這3個四分位數分別用Q1,Q2,Q3表示。你可能并不陌生,股票市場中,經常有Q1財報,Q2財報,Q3財報,Q4財報的說法,指的是四個季度的財報情況,一年4個季度,也是四等分。

那么,對于上面的數據,怎樣計算Q1,Q2,Q3呢?可以利用pandas的describe函數。

import pandas as pd four = pd.Series(data).describe() print(four) print('Q1= {0}, Q2= {1}, Q3={2}'.format(four['25%'],four['50%'],four['75%']))

輸出結果:

count 50.000000 mean 26835.150000 std 34372.619505 min 1689.500000 25% 19102.000000 50% 22843.500000 75% 26037.750000 max 262490.000000 dtype: float64 Q1= 19102.0, Q2= 22843.5, Q3= 26037.75

可以看出,pandas的describe函數不僅能得出數據集的樣本數量,均值,標準差,最小值、最大值,以及3個四分位數,即在數據25%,50%,75%位置的數。我們通常把Q3-Q1的差值稱為四分位距(interquartile range,IQR),或四分差

那什么是異常極端值呢,用如下計算公式:

Q1 = four['25%'] Q3 = four['75%'] IQR = Q3 - Q1upper = Q3 + 1.5 * IQR lower = Q1 - 1.5 * IQRprint(upper, lower)

輸出結果:

36441.375 8698.375

高于upper或者低于lower的值都屬于異常極端值。

畫出圖像如下:

incomes = pd.DataFrame(incomes) import seaborn as sns import matplotlib.pyplot as pltsns.boxplot(data=incomes, palette="Set1") plt.show()


很容易發現標為黑色菱形的這2個極端值。那這個計算極端值的1.5是怎么得來的呢,這是統計學中經過大量分析和經驗積累得出的標準,一般情況不做調整。

總結

以上是生活随笔為你收集整理的统计学---极端异常值的检测的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 欧美丰满少妇人妻精品 | 国产精品50页 | aaa亚洲| 日美毛片 | 美女福利视频在线观看 | 超碰97在线免费观看 | 欧美高清成人 | 第一页在线| 欧美 日韩 国产 激情 | 久久综合欧美 | 男人的天堂在线播放 | 激情网络| 日韩综合一区 | 亚洲av毛片| 久久怡红院 | 二级黄色大片 | 国产又黄又大又爽 | 亚洲偷| 特级西西444www大精品视频 | 特黄特色特刺激免费播放 | 性久久久久久久久久久久 | 久久性网 | 欧美三级午夜理伦三级中视频 | 无码免费一区二区三区 | 日韩精品av一区二区三区 | 2021天天干 | 国产99久一区二区三区a片 | 蜜美杏av | 精品人妻一区二区三区四区五区 | 另类专区亚洲 | 无码国产精品一区二区免费16 | 女人十八岁毛片 | 成人午夜免费福利视频 | 少妇一晚三次一区二区三区 | 日韩激情四射 | 水果视频污 | 99久久99久久精品国产片果冻 | 一本色道久久综合亚洲精品 | 免费看黄在线 | 97在线免费 | 麻豆传媒在线观看视频 | 欧美一区在线观看视频 | 性色av一区二区三区四区 | 黑人玩弄人妻一区二 | 男人天堂综合 | 夜夜艹天天干 | 日本一区二区三区成人 | 亚洲三级小视频 | 二区免费视频 | 911精品国产一区二区在线 | 日本午夜免费福利视频 | 国产在线观看你懂的 | 亲子乱对白乱都乱了 | 在线观看亚洲精品视频 | 精品人妻一区二区三区香蕉 | 精品爆乳一区二区三区无码av | www.成人av.com | 欧美女人交配视频 | 男生女生搞鸡视频 | 在线亚洲网站 | 中文字幕超清在线免费观看 | 亚洲精品无码久久久久久久 | 久久网亚洲 | 操亚洲美女 | 午夜三级网站 | 99人人爽 | 国产成人主播 | 九九热精品 | 亚洲影院一区二区三区 | 无遮挡裸光屁屁打屁股男男 | 欧美日韩国产在线 | 加勒比不卡视频 | 国产成a人亚洲精品 | 成人欧美一级特黄 | 日本一区二区三区免费在线观看 | 日本成人在线看 | 污污内射久久一区二区欧美日韩 | 久久蜜桃av | 国产精品国产三级国产专区53 | 女人裸体无遮挡 | 亚洲国产精品综合 | 国产精品污www在线观看 | 国产最新在线观看 | 献给魔王伊伏洛基亚吧动漫在线观看 | 青草伊人久久 | 国产裸体舞一区二区三区 | 超碰公开在线观看 | 天天色天天射天天操 | 羞羞网站在线看 | 樱花av在线| 婷婷国产精品 | 日韩女优在线视频 | 亚洲视频一 | 精品国产乱码久久久久久鸭王1 | 看a网站| 爱情岛论坛永久入口 | 日本性久久 | 国产精选一区 | 欧美 在线|