日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

16个推荐系统开放公共数据集整理分享

發布時間:2024/1/17 windows 49 豆豆
生活随笔 收集整理的這篇文章主要介紹了 16个推荐系统开放公共数据集整理分享 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

(本文由深度學習與NLP編譯)

本文主要整理了一些與推薦系統相關的高質量的數據集。整理自Stack Overflow、一些文章、推薦站點和學術實驗。其中,大多數數據集都是免費、開放的,但有些不是,需要獲得許可或引用作者的工作才能使用。此外,其中也包含一些預處理數據,可用于學術實驗。鏈接和數據集描述。

?

Book

· 1. Book Crossing

BookCrossing(BX)數據集由Cai-Nicolas花了的4周(2004年8月/ 9月)從Book-Crossing社區中爬取得到的。

·?下載鏈接:http://www2.informatik.uni-freiburg.de/~cziegler/BX/

?

電子商務

· 2. Amazon

該數據集包括自1996年5月至2014年7月,來自亞馬遜上的1.428億產品的評論和metadata。

·?下載鏈接:http://jmcauley.ucsd.edu/data/amazon/

?

· 3. Retailrocket推薦系統數據集

該數據集由三個文件組成:一個行為數據集(events.csv),一個屬性數據集(item_properties.сsv)和一個類目樹數據集(category_tree.сsv)。該數據來自現實世界的電子商務網站。

·?下載鏈接:https://www.kaggle.com/retailrocket/ecommerce-dataset

?

音樂

· 4. Amazon Music

該數字音樂數據集包含來自亞馬遜的評論和元數據

· 下載鏈接:http://jmcauley.ucsd.edu/data/amazon/

?

·?5. Yahoo Music

該數據集是一個快照,收集了音樂社區對各種音樂藝術家的偏好。

·?下載鏈接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r

?

·?6. LastFM(Implicit)

該數據集收集了Last.fm網站上2千名用戶的社交網絡、tagging和music artist listening信息。

·?下載鏈接:https://grouplens.org/datasets/hetrec-2011/

?

· 7. Milion Song Dataset

Million Song數據集是一個免費的數據集,提供了一百萬條當代流行音樂曲目相關的的audio features和metadata。

·?下載鏈接:https://labrosa.ee.columbia.edu/millionsong/

?

電影

· 8. MovieLens

GroupLens Research已經從他們的電影網站收集整理的rating數據集。

·?下載鏈接:https://grouplens.org/datasets/movielens/

?

· 9. Yahoo Movies

該數據集包含從兩個不同來源收集的歌曲的rating數據集。第一個來源是用戶在與Yahoo上使用音樂服務是產生的rating數據。

· 下載鏈接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r

?

· 10. CiaoDVD

CiaoDVD是2013年12月從http://dvd.ciao.co.uk網站上抓取的DVD類別數據集。

· 下載鏈接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r

?

·11. FilmTrust

FilmTrust是2011年6月從整個FilmTrust網站上抓取的一個小型數據集。

· 下載鏈接:https://www.librec.net/datasets.html

?

· 12. Netflix

這是Netflix獎競賽中使用的官方數據集。

· 下載鏈接:http://academictorrents.com/details/9b13183dc4d60676b773c9e2cd6de5e5542cee9a

?

游戲

· 13. Steam Video Games

這是一個用戶行數據集,包含:user-id,game-title,behavior-name,value。包括“purchase”和“play”數據集。購買了,puchase的值為1,而“play”的值表示用戶播放音樂的時長。

·?下載鏈接:https://www.kaggle.com/tamber/steam-video-games/data

?

Jokes

· 14. Jester

該笑話數據集包含來自73,496個用戶,關于100個笑話的410萬連續rating數據(-10.00到+10.00)

· 下載鏈接:http://www.ieor.berkeley.edu/~goldberg/jester-data/

?

餐飲

·15. Chicago Entree

該數據集包含用戶與Entree Chicago餐廳推薦系統交互的記錄數據。

· 下載鏈接:http://archive.ics.uci.edu/ml/datasets/Entree+Chicago+Recommendation+Data

?

動漫

·16. 動漫推薦數據庫

該數據集包含來自12,294個動漫的73,516個用戶的用戶偏好數據。每個用戶都可以將動畫添加到已完成的列表中并為其評分,該數據集把這些評級整理起來。

· 下載鏈接:https://www.kaggle.com/CooperUnion/anime-recommendations-database

?

其他數據集

· GroupLens數據集

· 下載鏈接:https://grouplens.org/datasets/

?

· LibRec數據集

· 下載鏈接:https://www.librec.net/datasets.html

?

· Yahoo Research數據集

· 下載鏈接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r

?

· 斯坦福大型網絡數據集匯編

· 下載鏈接:https://snap.stanford.edu/data/

總結

以上是生活随笔為你收集整理的16个推荐系统开放公共数据集整理分享的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。