日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

一句话+一张图——说清楚Aprioir关联规则算法

發布時間:2024/1/8 编程问答 45 豆豆
生活随笔 收集整理的這篇文章主要介紹了 一句话+一张图——说清楚Aprioir关联规则算法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一句話

關聯分析(關聯規則學習): 從大規模數據集中尋找物品間的隱含關系被稱作 關聯分析(associati analysis) 或者 關聯規則學習(association rule learning)

一張圖

解釋一下這張圖:
在關聯規則Aprioir算法中,有兩個很重要的概念,分別是頻繁項集(frequent item sets),關聯規則(associational rules),它們是用來描述隱含關系的形式。

頻繁項集(frequent item sets): 經常出現在一塊的物品的集合。
關聯規則(associational rules): 暗示兩種物品之間可能存在很強的關系。

那么 頻繁 的定義是什么呢?怎么樣才算頻繁呢? 度量它們的方法有很多種,這里我們來簡單的介紹下支持度和可信度。

支持度: 數據集中包含該項集的記錄所占的比例。例如上圖中,{豆奶} 的支持度為 4/5。{豆奶, 尿布} 的支持度為 3/5。
可信度: 針對一條諸如 {尿布} -> {葡萄酒} 這樣具體的關聯規則來定義的。這條規則的 可信度 被定義為 支持度({尿布, 葡萄酒})/支持度({尿布}),從圖中可以看出 支持度({尿布, 葡萄酒}) = 3/5,支持度({尿布}) = 4/5,所以 {尿布} -> {葡萄酒} 的可信度 = 3/5 / 4/5 = 3/4 = 0.75。

舉個栗子唄

還是上面的那個尿布和葡萄酒的栗子,讓我們仔細的看一下它的關聯規則的發現過程(Aprioir)

過程1:尋找k項頻繁集


我們規定最小支持度為0.3
L1為1項頻繁集,可以從圖中看出它的計算過程為:

P()= P ( 豆 奶 ) = 豆 奶 出 現 的 次 數 訂 單 總 數 量
L2為2項頻繁集,從L1中選擇候選者(去除了小于最小支持度的數據),計算過程為:
P()= P ( 豆 奶 , 萵 苣 ) = 豆 奶 , 萵 苣 共 同 出 現 的 次 數 訂 單 總 數 量
同理可以推出L3

過程2:發現關聯規則


這里舉一個例子說明,買了尿布的人也會繼續買葡萄酒的規則,支持度為0.6(前面已經算出),那么它的置信度計算過程為:

P(尿??>)=尿尿=P(|尿) P ( 尿 布 ? ? > 葡 萄 酒 ) = 尿 布 , 葡 萄 酒 同 時 出 現 的 概 率 尿 布 出 現 的 概 率 = P ( 葡 萄 酒 | 尿 布 )

以上就是Aprioir關聯規則算法的整體思路啦!!!

總結

以上是生活随笔為你收集整理的一句话+一张图——说清楚Aprioir关联规则算法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。