日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

reading notes -- Amazon.com Recommendations: Item-to-Item Collaborative Filtering

發(fā)布時(shí)間:2023/12/9 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 reading notes -- Amazon.com Recommendations: Item-to-Item Collaborative Filtering 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

中英譯本及下載:http://blog.sina.com.cn/s/blog_586631940100pduh.html

以下是摘要筆記:

?算法應(yīng)當(dāng)結(jié)合用戶的習(xí)慣,用戶特點(diǎn)的分類

觀影習(xí)慣是比較單一 還是比較分散

這是不同的

一、推薦的宗旨:推薦應(yīng)該要幫助顧客找到和發(fā)現(xiàn)新的、相關(guān)的、有趣的商品。

Recommendations should help a customer find and discover new, relevant, and interesting items.

二、解決推薦問(wèn)題有三個(gè)通常的途徑:傳統(tǒng)的協(xié)同過(guò)濾,聚類模型,以及基于搜索的方法。

推薦算法
大多數(shù)推薦算法,都始于先找出一個(gè)顧客集合,他們買過(guò)和評(píng)級(jí)過(guò)的商品,與當(dāng)前用戶買過(guò)和評(píng)級(jí)過(guò)的商品有重疊。算法把來(lái)自這些相似顧客的商品聚集起來(lái),排除該用戶已經(jīng)購(gòu)買過(guò)或評(píng)級(jí)過(guò)的商品,并向該用戶推薦其余的商品。

這些算法有兩個(gè)最常見的版本:協(xié)同過(guò)濾和聚類模型。其他算法——包括基于搜索的方法以及我們自己的商品到商品協(xié)同過(guò)濾——都集中于尋找相似的商品,而不是相似的顧客。針對(duì)用戶所購(gòu)買和評(píng)級(jí)的每一件商品,算法試圖找到相似的產(chǎn)品,然后聚集這些相似的商品,并給予推薦。?

1.傳統(tǒng)的協(xié)同過(guò)濾

利用協(xié)同過(guò)濾來(lái)產(chǎn)生推薦,很耗計(jì)算,如果降維,則會(huì)影響品質(zhì)。

2.聚類模型

算法的目標(biāo)是,把該用戶分配到含有最相似顧客的細(xì)分人群里,然后,算法再利用該細(xì)分顧客人群的購(gòu)買和評(píng)級(jí),來(lái)生成推薦。

較之協(xié)同過(guò)濾,聚類模型有更好的在線可擴(kuò)展性和性能、復(fù)雜和昂貴的聚類計(jì)算會(huì)離線運(yùn)行。然而,推薦品質(zhì)卻是低的

3.基于搜索的方法
基于搜索或內(nèi)容的方法,將推薦問(wèn)題視為相關(guān)商品的搜索,如果該用戶只有少數(shù)購(gòu)買或評(píng)級(jí),基于搜索的推薦算法在計(jì)算量和性能上都不錯(cuò)。然而,對(duì)于有數(shù)千次購(gòu)買的用戶,要以針對(duì)所有商品的查詢?yōu)榛A(chǔ)也不太可行,若使用子集則又降低了品質(zhì)。

三、電子商務(wù)推薦算法的環(huán)境挑戰(zhàn):
? 大型零售商有海量的數(shù)據(jù),以千萬(wàn)計(jì)的顧客,以及數(shù)以百萬(wàn)計(jì)的登記在冊(cè)的不同商品。
? 許多應(yīng)用要求結(jié)果實(shí)時(shí)返回,在半秒之內(nèi),還要產(chǎn)生高質(zhì)量的推薦。
? 新顧客很典型,他們的信息很有限,只能以少量購(gòu)買或產(chǎn)品評(píng)級(jí)為基礎(chǔ)。
? 較老的顧客信息豐沛,以大量的購(gòu)買和評(píng)級(jí)為基礎(chǔ)。
? 顧客數(shù)據(jù)不穩(wěn)定:每一次交互都可提供有價(jià)值的顧客數(shù)據(jù),算法必須立即對(duì)新的信息作出響應(yīng)。

?

商品到商品的協(xié)同過(guò)濾

?

把推薦作為一種定向營(yíng)銷工具。(每有一個(gè)用戶,就有一個(gè)用戶的個(gè)性化商店)

它如何工作

協(xié)同過(guò)濾的變種,將商品分類,而不是用戶

對(duì)于非常大的數(shù)據(jù)集,一個(gè)可擴(kuò)展的推薦算法必須離線運(yùn)行最昂貴的計(jì)算。而現(xiàn)有方法達(dá)不到這樣的要求:
? 傳統(tǒng)的協(xié)同過(guò)濾只做很少或不做離線計(jì)算,其在線計(jì)算量取決于顧客和登記在冊(cè)商品的數(shù)量。在大數(shù)據(jù)集的情況下,這樣的算法不可行,除非使用維度降低、抽樣或區(qū)隔——所有這些都降低了推薦的品質(zhì)。
? 聚類模型能離線運(yùn)行大量的計(jì)算,但推薦品質(zhì)相對(duì)較差。出于改進(jìn),可以增加人群細(xì)分的數(shù)量,但這會(huì)使在線的用戶-細(xì)分人群的分類變得昂貴。
? 基于搜索的模型離線建立起關(guān)鍵詞、范疇、作者索引,但不能提供符合興趣、定向內(nèi)容的推薦。對(duì)于購(gòu)買和評(píng)級(jí)很多的顧客來(lái)說(shuō),這些算法的擴(kuò)展性不佳。
商品到商品協(xié)同過(guò)濾的可擴(kuò)展性和性能的關(guān)鍵是,它離線建立耗時(shí)巨大的相似商品表格。該算法的在線部分——針對(duì)當(dāng)前用戶的購(gòu)買和評(píng)級(jí)來(lái)尋找相似的商品——計(jì)算量獨(dú)立于商品目錄的規(guī)模或顧客的總數(shù);僅僅取決于該用戶買過(guò)或評(píng)級(jí)過(guò)多少個(gè)商品。因此,甚至是對(duì)于超大數(shù)據(jù)集,算法也很快速。由于該算法能推薦高度關(guān)聯(lián)的相似商品,推薦的品質(zhì)就很出色10。與傳統(tǒng)的協(xié)同過(guò)濾不同,該算法在用戶數(shù)據(jù)有限的情況下也能運(yùn)行良好,在少至2到3件商品的基礎(chǔ)上,產(chǎn)生高品質(zhì)的推薦。

?連接:

http://blog.sina.com.cn/s/blog_586631940100pduh.html

http://www.xysay.com/amazon-item-to-item-collaborative-filtering-207.html

轉(zhuǎn)載于:https://www.cnblogs.com/lance-/p/3935327.html

總結(jié)

以上是生活随笔為你收集整理的reading notes -- Amazon.com Recommendations: Item-to-Item Collaborative Filtering的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。