日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据挖掘与数据抽样

發(fā)布時間:2025/3/15 编程问答 18 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据挖掘与数据抽样 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

??? 前段時間在做一個挖掘模型時,模型的特征決定了選擇的數(shù)據(jù)是嚴重有偏的,怎樣在這樣的數(shù)據(jù)上進行抽樣,得到能比較好地反映真實情況的數(shù)據(jù)樣本是很關鍵的。自己對統(tǒng)計學僅僅限于大學課程的學習,很少做過實驗,在做數(shù)據(jù)預處理走了一些彎路。下面對數(shù)據(jù)挖掘中的抽樣發(fā)表一點淺見。謝謝苦瓜兄弟解答,希望和大家多多交流:)
??? 在數(shù)據(jù)挖掘的數(shù)據(jù)預處理過程中,寬表數(shù)據(jù)往往是幾十萬,上百萬級記錄的。要對所有數(shù)據(jù)進行訓練,時間上很難滿足要求,因此對數(shù)據(jù)進行抽樣就很必要了,不同的數(shù)據(jù)抽樣方法對訓練結果模型的精度有很大影響??梢钥紤]用一些數(shù)據(jù)瀏覽工具,統(tǒng)計工具對數(shù)據(jù)分布做一定的探索,在對數(shù)據(jù)做充分的了解后,再考慮采用合適的數(shù)據(jù)抽樣方法,抽取樣本數(shù)據(jù)進行建模實驗。對一般的模型,比如客戶細分,主要是數(shù)據(jù)的聚類,我在做抽樣時用了隨機抽樣,也可以考慮整群抽樣;而做離網(wǎng)預警模型或者金融欺詐預測模型時,數(shù)據(jù)分布是嚴重有偏的,而且這種有偏數(shù)據(jù)對這類模型來說恰恰是至關重要的。一般采用分層抽樣和過度抽樣結合有不錯的效果,分層抽樣和過度抽樣的區(qū)別自己也不是很了解,現(xiàn)在只能是做個概述了。
??? 幾種常用的抽樣方法:
1.簡單隨機抽樣(simple random sampling)
將所有調查總體編號,再用抽簽法或隨機數(shù)字表隨機抽取部分觀察數(shù)據(jù)組成樣本。
優(yōu)點:操作簡單,均數(shù)、率及相應的標準誤計算簡單。
缺點:總體較大時,難以一一編號。
2.系統(tǒng)抽樣(systematic sampling)
又稱機械抽樣、等距抽樣,即先將總體的觀察單位按某一順序號分成n個部分,再從第一部分隨機抽取第k號觀察單位,依次用相等間距從每一部分各抽取一個觀察單位組成樣本。
優(yōu)點:易于理解、簡便易行。
缺點:總體有周期或增減趨勢時,易產生偏性。
3.整群抽樣(cluster sampling)
先將總體依照一種或幾種特征分為幾個子總體(類.群),每一個子總體稱為一層,然后從每一層中隨機抽取一個子樣本,將它們合在一起,即為總體的樣本,稱為分層樣本
優(yōu)點:便于組織、節(jié)省經(jīng)費。
缺點:抽樣誤差大于單純隨機抽樣。
4.分層抽樣(stratified sampling)
將總體樣本按其屬性特征分成若干類型或層,然后在類型或層中隨機抽取樣本單位,合起來組成樣本。有按比例分配和最優(yōu)分配(過度抽樣是否就是最優(yōu)分配方法?)兩種方案。
特點:由于通過劃類分層,增大了各類型中單位間的共同性,容易抽出具有代表性的調查樣本。該方法適用于總體情況復雜,各類別之間差異較大(比如金融客戶風險/非風險樣本的差異),類別較多的情況。
優(yōu)點:樣本代表性好,抽樣誤差減少。

from:http://www.chinabi.net/blog/user1/105/archives/2006/1006.html

總結

以上是生活随笔為你收集整理的数据挖掘与数据抽样的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 91精品久久久久久久久久入口 | 久草免费在线视频观看 | 久久视奸 | 一本色道久久88亚洲精品综合 | 一级片大片 | 麻豆一区二区99久久久久 | 日韩网站在线观看 | 免费看片色 | 蜜桃久久久久久 | 亚洲欧美一区二区三区情侣bbw | 国产精品亚洲二区在线观看 | 国产孕妇孕交大片孕 | 日本福利视频导航 | 欧美黑人三级 | 嫩草影院在线观看视频 | 一卡二卡久久 | 国产精品精品国产色婷婷 | 国产精品久久久久久久久久免费看 | 免费欧美 | 波多野结衣中文字幕久久 | 成年人91视频 | 色婷婷在线观看视频 | 桃花久久 | 久久国产一区二区 | 日本一区二区免费在线 | 黄色av免费在线观看 | 久久午夜鲁丝片 | 91猎奇在线观看 | 中文久久久 | 精品一区二区三区中文字幕 | 亚洲影视在线观看 | 日韩理论片在线观看 | 亚洲婷婷丁香 | 老司机精品视频在线播放 | 中出一区二区 | 国产淫视 | 免费看成人片 | 日本韩国欧美一区二区 | 丝袜天堂 | 在线观看无遮挡 | 午夜影院在线观看免费 | 韩国中文字幕hd久久精品 | 日韩成人激情视频 | 人人舔| 欧美一区二区三区成人久久片 | 日韩少妇激情 | 毛片成人网 | 51成人网| 日韩精品导航 | 国产一级视频 | 双性皇帝高h喷汁呻吟 | 日韩精品成人 | 色亚洲成人 | 性色一区二区三区 | 国产成人精品一区二区三区无码熬 | 亚洲精品黄色 | 亚洲成人一二区 | 亚洲熟妇一区二区三区 | 狠狠搞av | 91丨porny丨刺激 | 偷操| wwwxxxx国产| 亚洲福利一区 | 久久激情免费视频 | 97日日夜夜 | 在线看片你懂的 | 久久久久久久久久久久电影 | 亚洲av激情无码专区在线播放 | 日韩诱惑 | 国产精品精 | 国产人妻人伦精品1国产盗摄 | 日韩插插插 | 黑人中文字幕一区二区三区 | 欧美视频精品 | 成人国产一区二区 | 国产精品一区二区三区高潮 | 欧美中文字幕视频 | 麻豆av在线播放 | 妺妺窝人体色www在线下载 | а√天堂资源官网在线资源 | 日韩在线视频中文字幕 | 国产一区亚洲二区三区 | 亚洲精品五月 | 天天综合91 | 激情内射人妻1区2区3区 | 揄拍成人国产精品视频 | 国产欧美一区二区三区在线 | 成人av网站免费 | 麻豆高清免费国产一区 | www.黄色在线观看 | 中文字幕国产综合 | 麻豆疯狂做受xxxx高潮视频 | 亚洲国产精品国自产拍久久 | 欧美日韩xxxx| 日韩精品在线一区二区三区 | 99久久婷婷| 在线观看免费看片 | 日本一区二区三区在线看 | 婷婷五月小说 |