Dataset之RentListingInquries:RentListingInquries(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略
Dataset之RentListingInquries:RentListingInquries(Kaggle競賽)數(shù)據(jù)集的簡介、下載、案例應(yīng)用之詳細攻略
?
?
?
?
目錄
RentListingInquries比賽簡介
RentListingInquries數(shù)據(jù)集下載
RentListingInquries案例應(yīng)用
?
?
?
?
?
RentListingInquries比賽簡介
競賽官網(wǎng):?https://www.kaggle.com/c/two-sigma-connect-rental-listing-inquiries/overview
? ? ? ? RentListingInquries比賽的描述。找到一個完美的地方打電話給你的新家應(yīng)該比瀏覽無窮無盡的清單。RentHop通過使用數(shù)據(jù)對租賃清單的質(zhì)量進行排序,使公寓搜索更加智能。但是,盡管尋找完美的公寓已經(jīng)夠困難的了,但通過編程來組織和理解所有可用的房地產(chǎn)數(shù)據(jù)就更難了。二西格瑪和二西格瑪風(fēng)投的投資組合公司RentHop,邀請Kagglers在這場獨特的招聘競爭中,釋放他們的創(chuàng)意引擎,發(fā)掘商業(yè)價值。
? ? ? Two Sigma邀請您在本次招聘競賽中發(fā)揮您的才能。Kagglers將根據(jù)列表的創(chuàng)建日期和其他特性預(yù)測新列表收到的查詢數(shù)量。這樣做將有助于RentHop更好地處理欺詐控制,識別潛在的上市質(zhì)量問題,并讓業(yè)主和代理商更好地了解租戶的需求和偏好。
? ? ? ?Two Sigma一直處于將技術(shù)和數(shù)據(jù)科學(xué)應(yīng)用于財務(wù)預(yù)測的前沿。盡管他們在金融領(lǐng)域的大數(shù)據(jù)、人工智能和機器學(xué)習(xí)方面取得的開創(chuàng)性進展,一直在推動該行業(yè)向前發(fā)展,就像所有其他科學(xué)進步一樣,他們也受到不斷進步的驅(qū)動。這一挑戰(zhàn)為競爭對手提供了一個先睹為奇的機會,使他們得以在金融領(lǐng)域之外搶先了解二西格瑪?shù)臄?shù)據(jù)科學(xué)工作。
? ? ? ?這是Kaggle2017年舉辦的Two Sigma Connect: Rental Listing Inquiries競賽。在這個競賽中,你將根據(jù)列表內(nèi)容,如文字描述、照片、臥室數(shù)量、價格等,來預(yù)測一個公寓租賃清單的受歡迎程度。數(shù)據(jù)來自renthop.com,一個公寓上市網(wǎng)站。這些公寓位于紐約市。目標(biāo)變量interest_level由清單在網(wǎng)站上運行期間的查詢次數(shù)定義。
?
1、數(shù)據(jù)集介紹
(1)、File descriptions
train.json - the training set
test.json - the test set
sample_submission.csv - a sample submission file in the correct format
images_sample.zip - listing images organized by listing_id (a sample of 100 listings)
Kaggle-renthop.7z - (optional) listing images organized by listing_id. Total size: 78.5GB compressed. Distributed by BitTorrent (Kaggle-renthop.torrent).?
(2)、Data fields
- bathrooms: number of bathrooms
- bedrooms: number of bathrooms
- building_id
- created
- description
- display_address
- features: a list of features about this apartment
- latitude
- listing_id
- longitude
- manager_id
- photos: a list of photo links. You are welcome to download the pictures yourselves from renthop's site, but they are the same as imgs.zip.?
- price: in USD
- street_address
- interest_level: this is the target variable. It has 3 categories: 'high', 'medium', 'low'
? ? ? ? 根據(jù)公寓的listing 內(nèi)容,預(yù)測紐約市某公寓租賃listing的受歡迎程度。
標(biāo)簽: interest_level,該listing被咨詢的次數(shù)。
- (1)、有三個取值:: 'high', 'medium', 'low'。
- (2)、是一個多類分類任務(wù)。
Listing內(nèi)容:
- bathrooms、bedrooms:浴室數(shù)目、臥室的數(shù)目
- longitude、latitude:地理位置有關(guān)
- display_address、street_address:地址有關(guān)
- building_id、listing_id、manager_id
- Created:創(chuàng)建日期
- Description:更多描述信息
- features: 公寓的一些特征描述
- photos: a list of photo links
- price:價格
?
2、比賽排行榜
?
?
RentListingInquries數(shù)據(jù)集下載
如有需要,可留言索取
?
?
?
RentListingInquries案例應(yīng)用
ML之FE:利用FE特征工程對RentListingInquries(Kaggle競賽)數(shù)據(jù)集實現(xiàn)房屋感興趣程度的多分類預(yù)測
ML之FE:基于FE特征工程對RentListingInquries數(shù)據(jù)集進行預(yù)處理并導(dǎo)出為三種格式文件(csv格式/txt格式/libsvm稀疏txt格式)
?
?
?
?
《新程序員》:云原生和全面數(shù)字化實踐50位技術(shù)專家共同創(chuàng)作,文字、視頻、音頻交互閱讀總結(jié)
以上是生活随笔為你收集整理的Dataset之RentListingInquries:RentListingInquries(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ML之DataScience:基于机器学
- 下一篇: 成功解决pandas\core\inde