日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

推荐系统与协作过滤面临的主要问题

發布時間:2024/4/17 windows 43 豆豆
生活随笔 收集整理的這篇文章主要介紹了 推荐系统与协作过滤面临的主要问题 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

轉自:http://xlvector.cn/blog/?m=200902

?

數據稀疏
協同過濾的精度主要取決于用戶數據的多少。如果一個系統有很多用戶的歷史數據,他就能更好的對用戶的喜歡做出預測。所以,目前推薦系統做的最好的都是那些有著很大量用戶數據的公司,比如Google, Yahoo, Netflix, Amazon等等。但是,即使擁有很多數據,數據還是不夠多,因為推薦系統的歷史還不夠長,還沒有積累足夠的數據。在目前處理稀疏數據的算法中,軟性SVD是一種最好的方法。

新用戶問題
這個問題和數據稀疏問題有一些相似性,他是指如何對新用戶做出推薦。當一個新用戶進入一個網絡時,我們對他的興趣愛好還一無所知,這時如何做出推薦是一個很重要的問題。一般在這個時候,我們只是向用戶推薦那寫普遍反映比較好的物品,也就是說,推薦完全是基于物品的。

新用戶問題還有一個變種就是長尾(long tail)問題,在Amazon中,不是所有的用戶都對很多書給出了評分,很多用戶只給少數的書給出了評分,這些用戶就處在一個長尾中,如何處理那些不太表露自己興趣的用戶,也是推薦系統的一個主要問題。

隱性喜好發現
在現在的推薦系統中,用戶的喜歡是通過用戶對某些物品進行評分獲得的。這種獲得用戶興趣的方法是一種很直接的方法。但在實際的互聯網中,用戶有很多隱性的方法表露他們的喜歡。比如用戶的文字評論,我們可以通過自然語言處理從用戶的評論中獲得用戶的興趣;或者是用戶的瀏覽行為,比如用戶長時間的瀏覽一個物品,或者用戶經常瀏覽一個物品,或者用戶
購買了一個物品,這些行為都可以作為模式識別系統中的特征。

所以,發現用戶的隱性喜好,相對于模式識別的特征提取,這方面的研究也很熱門。

用戶興趣的變化
我們知道,用戶的興趣不是永遠不變的,隨著年齡和閱歷的變化,用戶的行為會發生變化。也就是說,協同過濾其實還應該加入一個時間因子。目前對于變化的用戶興趣的研究還處于起步階段,主要是因為現有的系統歷史都不是很久,大多數用戶的興趣還是比較穩定的,但是隨著互聯網的發展,用戶興趣的變化對推薦系統的影響將會越來越明顯,所以這方面的研究也將越來越重要。

偏激的用戶和全新的物品
我們知道,這個世界上有一些用戶是很偏激的。他們和大多數人的觀點是相反的。對于這種用戶,現有的推薦系統做出的預測往往是很差的。如何處理偏激的用戶,是推薦系統中的一個重要問題。

和偏激用戶相對應的,是全新的物品。比如有一部新電影,他是顛覆性的,和以前的電影都不太相似。用戶對于這個電影的愛好和用戶以前的興趣是沒有太大關系的,因為用戶從來沒見過這種電影,這個問題也是導致現有的推薦系統精度不高的主要原因。

馬太效應以及推薦系統對互聯網的影響
我們知道,被推薦系統所推薦的物品將會越來越熱門,這就導致了大量很好的物品可能會被推薦系統所淹沒。在互聯網中,物品實在是太多了,而推薦系統只能推薦有限的物品。解決這個問題的主要方法是增加推薦系統的多樣性,比如一個推薦系統發現一個用戶非常喜歡吃德芙巧克力,那么他給這個用戶推薦10個產品,不需要都是德芙巧克力,也可以推薦別的一些巧克力,或者一些和巧克力相似的甜品。在推薦時,不僅要推薦用戶喜歡的東西,而且要通過推薦讓用戶喜歡一些東西,有的時候,用戶自己也不知道他喜歡什么,通過推薦系統,他可能會發現一些新東西他比較喜歡。

推薦系統中的作弊
只要涉及到經濟利益,就有人作弊。搜索引擎作弊是一個被研究了很久的問題,因為在搜索引擎中,自己的網站排名越高,就能獲得越多的經濟利益。在推薦系統中也是如此,比如在淘寶中,如果一個賣家的物品經常被推薦,他就可能獲得很多經濟利益。這樣,很多電子商務的推薦系統都遭受到了作弊的干擾,一些人通過一些技術手段,對自己賣的物品給出非常高的評分,這就是一種作弊行為。

推薦系統中的作弊在電子商務網站中越來越嚴重,特別是在美國這種互聯網比較發達的國家,已經受到一些研究者的重視。作弊行為相當于人為的向系統中注入了噪聲。目前解決作弊的算法主要是基于信任度和信用的。現在很多電子商務網站都引入了信用系統,比如淘寶等等。如何設計信用系統和推薦系統更好的融合,是一個重要的研究問題。

?

與推薦系統相關的資料:

Resys Group:http://www.guwendong.cn/catalog.asp?cate=8

轉載于:https://www.cnblogs.com/cmleung/archive/2009/12/15/1625031.html

總結

以上是生活随笔為你收集整理的推荐系统与协作过滤面临的主要问题的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。