如何利用数据分析买到好房子?
買房是一件人生大事,我們作為一名數(shù)據(jù)分析師,如何運用數(shù)據(jù)分析的知識買到心儀的房子呢?
正文
最近樓市好像又行了,各地都傳出房地產(chǎn)調(diào)控政策松動的消息。我這個互聯(lián)網(wǎng)數(shù)據(jù)分析號主也想來聊一聊樓市了。
杭州樓市在過去的半年分化越來越明顯。三四年前同樣起點的小區(qū)目前拉開30%~40%的差價都很正常。
很多人就開始后悔:為什么當(dāng)時買的是a小區(qū)而不是b小區(qū),買錯了房少賺了幾百萬。
有這樣想法的人,其實你讓他真的回到幾年前買了B小區(qū),他還是會后悔。因為他會后悔為什么當(dāng)時買的是b小區(qū),而不是買比特幣。
買房是一件人生大事,選錯房對人生影響太大了。所以這篇文章就聊一聊”如何通過數(shù)據(jù)分析買到好房子“。
用數(shù)據(jù)選房
我作為一個同樣在幾年前在杭州買房的人,我從來不后悔當(dāng)時選擇的方案。因為我知道,即使讓我重新回到三年前,通過我當(dāng)時所有能夠掌握的信息,我也做不出比目前更好的選擇。
差別在哪里呢?
身邊有人的買房經(jīng)歷是這樣的:
從親戚朋友/電梯廣告/路邊海報/信息流廣告等處得知某樓盤即將開盤,多方打聽以后發(fā)現(xiàn)性價比很好,在銷售的多次電話催促后通知房源告罄時匆忙下單。
還有這樣的:每個周末都讓中介領(lǐng)著自己看幾套房,兩個月下來看了二十幾套,各有優(yōu)劣。老婆喜歡a小區(qū)的環(huán)境,老人覺得b小區(qū)離醫(yī)院學(xué)校近,自己覺得c小區(qū)上班方便。
最終要么選一個折中方案,折中就代表著大家都接受但其實都不滿意。
要么最后拍腦袋選一個,最后選錯就不停抱怨。
這兩種方法都有問題,前一種信息不全,后一種決策過程不清晰。
如果用數(shù)據(jù)分析的方法做決策,會收集大量信息,并根據(jù)信息得出理性的結(jié)論。只要得到的信息是相同的,每次做的決定應(yīng)該是一樣的。
具體怎么做呢?
數(shù)據(jù)分析,那肯定得要有數(shù)據(jù)呀。
我們可以寫一段爬蟲從某殼網(wǎng)上爬取附近小區(qū)的房價數(shù)據(jù),然后用地圖做一個炫酷的xx市房價熱力圖,高級一點的話點開小區(qū)還有小區(qū)的房價走勢。做出類似下圖的樣式:
(圖片來自網(wǎng)絡(luò))
你看,數(shù)據(jù)分析師短短幾個小時的時間就比普通買房者多獲得了幾個數(shù)量級的信息量。數(shù)據(jù)分析師獲取信息的能力就是這么夸張。
足不出戶,就能知天下事。是不是很高級。
接下來我就來教如何用爬蟲實現(xiàn)這一切。
真正的分析思維
爬蟲呢,就是……
教個P,其實我根本就不會爬蟲,編不下去了。
重要的是:用爬蟲獲取房價數(shù)據(jù)能解決選房買房的問題嗎?
以下問題考慮過沒有:
價格洼地就一定好嗎?
便宜的房子是不是有什么問題?
并且你以為網(wǎng)站上的價格是真實價格嗎?
房子周邊沒有學(xué)區(qū),以后小孩讀書怎么辦?
這些問題都沒有考慮,買什么房?
爬取房價數(shù)據(jù)和地理分布,最多只是輔助我們做最終決策的一個方式,而不是主要的分析方法。要得出最終的結(jié)論,還是要把數(shù)據(jù)分析的思維貫穿其中。
數(shù)據(jù)分析的思維解決問題一般有這樣幾個步驟:
明確問題
收集信息
分析數(shù)據(jù)
得出結(jié)論
明確問題
你買房到底是為了啥?是為了結(jié)婚?還是為了投資?亦或者第二套改善房?搞不清楚需求,就沒法衡量不同房子之間的優(yōu)缺點。
沒有房子是完美的。有的房子配套齊全,但是房齡老,戶型差。還有的房子戶型環(huán)境配套等都很好,但是貴!
而且人的喜好也是不同的。就算同樣是市中心的房子,喜歡熱鬧的人喜歡,喜歡自然風(fēng)光的人不喜歡。還有人喜歡住高樓層,有人喜歡住低樓層。
買房第一步,搞清買房的目的,究竟要什么樣的房子,要解決那些功能性需求以及有哪些偏好。
收集信息
之前用爬蟲爬取房價數(shù)據(jù)也是信息收集的一種,但是房子除了價格之外,還有很多其他指標(biāo)。比如戶型、采光、交通、教育等等。
沒必要把所有指標(biāo)都收集全了之后再做決策,有些指標(biāo)有些是有一票否決權(quán)的,可以先收集這些指標(biāo),縮小最后選擇的范圍。
價格信息
第一步先收集價格信息。價格信息不僅容易收集,也存在硬性約束。一般買房會有一個預(yù)算區(qū)間,太好太差的都不會考慮。這一步可以排除掉大部分小區(qū)。
周邊現(xiàn)有配套
周邊配套信息和價格信息一樣,也是相對容易獲取的,可以足不出戶在電腦或手機上完成。通過百度地圖查一下醫(yī)院、學(xué)校、商場等信息,可以把一些配套明顯不行的排除掉。
其中學(xué)區(qū)的判定不能直接通過距離判斷,學(xué)區(qū)一般是通過戶籍所屬的社區(qū)決定的。可以搜索學(xué)校的招生簡章,會標(biāo)明招生范圍是某街道某社區(qū)的。
社區(qū)的范圍是一個比較麻煩的東西,地圖一般只顯示到某某街道,不會細到某某社區(qū)。搜索某街道某社區(qū)的話只會到某一個點。
這里我推薦一個我自己發(fā)現(xiàn)的地圖網(wǎng)站openstreet。在地圖上會顯示社區(qū)名,不過社區(qū)范圍不太精確。但是街道卻非常清楚,甚至在地圖上可以看到街道的分解線。
這里能采集到的大部分是現(xiàn)有的配套(openstreet會顯示一些規(guī)劃中的道路),有些配套還在規(guī)劃中,這些就只能具體情況具體分析。
周邊規(guī)劃
周邊規(guī)劃的獲取渠道有這么幾種。
入門版 道聽途說
這是最常見的類型,最初我也在這個階段停留了很久。
一般是咨詢當(dāng)?shù)嘏笥?#xff0c;了解一些規(guī)劃。對于一些較成熟的城市來說這樣也許足夠了,成熟城市大的規(guī)劃較少,但杭州城西的規(guī)劃層出不窮,普通人還真未必搞得清楚。
就比如一般人會關(guān)心學(xué)校醫(yī)院等正向的規(guī)劃,忽略高架高壓線等負向規(guī)劃。如果門口道路要改造成高架,噪音影響還是很大的。
進階版 房產(chǎn)類公眾號
稍微好點的方式,是關(guān)注幾個房產(chǎn)公眾號。在炒房成風(fēng)的杭州,這類公眾號多如牛毛,搜幾個熱門樓盤的名字就很如找到。
這類公眾號一般對規(guī)劃很敏感,一有風(fēng)吹草動就會開一篇文章解讀。這類消息源相比朋友之間的口口相傳信息密度大得多,消息源也更可靠一些。
高階版 政府網(wǎng)站
最高階的玩法是直接從規(guī)劃的源頭入手,直接在政府網(wǎng)站看規(guī)劃文件。
這樣做的優(yōu)點是內(nèi)容一般比較全面和準確,缺點是規(guī)劃文件真的太難找了,整理起來也比較費勁。
規(guī)劃有好幾個不同級別,有國家級,省級,市級,區(qū)級。像地鐵規(guī)劃就要gwy的批準,省級的則有一些《xx省xx發(fā)展規(guī)劃綱要》,市區(qū)級是一些市政設(shè)施如學(xué)校醫(yī)院道路交通的規(guī)劃,以及土地出讓信息。
這里面國家級和省級的規(guī)劃一般是很少變化的,通過之前朋友打聽和房產(chǎn)公眾號也基本能了解。
變化比較多的是市區(qū)級的規(guī)劃。
很多道聽途說的規(guī)劃可能只是吹吹風(fēng),根本沒有規(guī)劃文件。或者之前的某個規(guī)劃已經(jīng)改了,而大家還不知道。所以市區(qū)級規(guī)劃最佳信息源還是第一手的市級區(qū)級政府網(wǎng)站。
不同地區(qū)政府部門的排版差異還是挺大的,一般的目錄是
政務(wù)公開-規(guī)劃計劃-規(guī)劃信息-空間規(guī)劃
這里面會有大量土地出讓信息和規(guī)劃文件。如下圖:
小區(qū)配套
搞定了周邊配套好規(guī)劃,接下來具體的小區(qū)信息,就需要實地考察了。
不過在實地考察前,還是有一些方便的方式做好提前排雷。
1,貝殼找房的實地視頻
貝殼找房對各個小區(qū)的物業(yè)環(huán)境拍攝了視頻,可以不用到小區(qū)就有第一手的視頻資料。
2,百度街景
百度街景是百度地圖的一項功能,如果你對房子周邊的環(huán)境不是特別熟悉的話,可以用百度街景先把附近的道路和街景搞清楚。比如我之前關(guān)注過一段時間的佛山樓市,雖然我佛山一次都沒去過,但是通過百度街景,我對佛山主要街道已經(jīng)很熟悉了。
以上都完成之后,開始進入實地考察階段。
實地考察
實地考察時,除了關(guān)注室內(nèi)的戶型和采光,也要多多關(guān)注小區(qū)的情況。主要考察這幾個方面。
小區(qū)環(huán)境
小區(qū)配套設(shè)施
物業(yè)管理水平
交通擁堵情況
停車位
鄰里畫像
主觀偏好
這些小區(qū)信息對二手房來說比較容易確定,所見即所得。新房的話,只能多看看沙盤和圖紙了。新房交付減配的情況時有發(fā)生,需要一定的運氣。認準大開發(fā)商會相對更保險。
實地看房至少要看10套不同戶型,看三五套的時候沒啥感覺,不容易給出客觀的評價。看到10套的時候基本上心里就有數(shù)了。
分析數(shù)據(jù)
說了這么多信息獲取的方式,還有一個最大的問題沒有解決。
以上的信息都很主觀,A小區(qū)和B小區(qū)究竟哪個環(huán)境更好,沒有絕對標(biāo)準,如何量化比較?
兜了這么大一個圈子,終于到了具體的數(shù)據(jù)分析環(huán)節(jié)了。
我用的方法是層次分析法。
層次分析法
層次分析法,簡稱AHP,是指將與決策總是有關(guān)的元素分解成目標(biāo)、準則、方案等層次,在此基礎(chǔ)之上進行定性和定量分析的決策方法。
上面這段話很學(xué)術(shù),沒錯,是我從網(wǎng)上復(fù)制來的。要想說清概念比較麻煩,不如直接來看案例。
層次分析法適用于多目標(biāo)決策問題,什么是多目標(biāo)呢。買房就是一個多目標(biāo)的決策問題,價格、交通、教育、醫(yī)療等都需要考慮,其中許多目標(biāo)還是矛盾的。層次分析法就是在這多個不同目標(biāo)中選擇一個最佳的方案。
層次結(jié)構(gòu)
構(gòu)建層次分析法首先要建立層次結(jié)構(gòu),結(jié)構(gòu)有三層:
目標(biāo)層
準則層
方案層
不解釋,上案例。
買房的決策就如上圖所示,一共有n套房子需要比較,每一套都參考準則層的m個準則評估,最后得到一個目標(biāo)層的總分,得分最高者就是最佳選項。得分的計算公式是維度權(quán)重*維度得分,即:
房子A的目標(biāo)分=房子A的價格得分*價格權(quán)重+房子A的交通得分*交通權(quán)重+房子A的商業(yè)得分*商業(yè)權(quán)重……以此類推。
公式里會出現(xiàn)兩個數(shù)字:
方案在不同準則內(nèi)的得分
各準則的權(quán)重
知道了這兩個數(shù)字,總得分的計算就非常簡單了。
準則權(quán)重
先說說如何算準則的權(quán)重。
第一種,直接拍腦袋。
沒錯,就是拍腦袋。我們結(jié)合自己對需求的理解,直接對準則層中交通、醫(yī)療、教育、商業(yè)等等不同的維度賦予一個分數(shù)。如果只有四個維度的話,可以這樣:
交通0.2,醫(yī)療0.3,教育0.3,商業(yè)0.2。
或者
交通0.1,醫(yī)療0.3,教育0.4,商業(yè)0.2
分數(shù)根據(jù)自己感覺去打,只要最終分數(shù)加起來等于1就行
第二種,間接拍腦袋。
沒錯,還是拍腦袋,只不過比直接拍要高級一點,做法是專家打分和對比矩陣。
對比矩陣長這樣:
表??格中的分數(shù)代表著兩兩比較的關(guān)系,分數(shù)從1-9代表不同含義:
1代表兩個因素同等重要
3代表一個因素比另一個因素稍微重要
5代表一個因素比另一個因素明顯重要
7代表一個因素比另一個因素強烈重要
9代表一個因素比另一個因素極端重要
2,4,,6,8是上述數(shù)據(jù)的中值
倒數(shù),A和B相比如果是3,那么B和A相比就是1/3
看起來是不是很精準?
那分數(shù)怎么來的呢?答案還是拍腦袋——啊不,是專家打分。
這里的專家就是你自己和家人朋友,當(dāng)日最主要的還是房子的所有人和使用者。
上面表格中的數(shù)字,還不能直接計算出權(quán)重,還需要做一下一致性檢驗。
為啥要做這一步呢?
舉個例子:如果你覺得醫(yī)療相比教育來說明顯重要,打了5分;而醫(yī)療相比商業(yè)強烈重要,打了7分,那么教育和醫(yī)療就一定不是同等重要的,如果你打了1分就是不合理的。
一致性檢驗就是幫你檢查在打分過程中是否存在標(biāo)準不統(tǒng)一的情況,具體做法這里不贅述了。
通過了一致性檢驗,可以對上述表格計算出權(quán)重,最終得出權(quán)重如下:
交通0.1017、醫(yī)療0.2636、教育0.5189、商業(yè)0.1157。
計算方法這里不展開了。
準則打分
準則的權(quán)重確定后,我們還要給各個方案的不同準則打分。
打分的方式和權(quán)重的確認類似,基本也是拍腦袋。不過我們之前收集信息的時候已經(jīng)有了一些記錄,根據(jù)這些記錄打分也算有一些根據(jù),不是胡亂拍腦袋。
舉個例子,我們通過實地調(diào)查,得到了下面的表格。
最簡單的辦法就是把這些主觀描述直接轉(zhuǎn)化成分數(shù),按照十分制或者百分制都行,只要保持統(tǒng)一即可。
稍微復(fù)雜點的話就和之前算權(quán)重的方法一樣,只不過要多做幾遍。
比如交通方面,我們對比一下ABC三套房子。
之前分數(shù)越高代表越重要,現(xiàn)在打分的時候分數(shù)越高代表該項準則下表現(xiàn)越好。
然后再對上表進行一致性檢驗,以及計算結(jié)果,得出該準則下的分值。
其他的準則同理。
得出結(jié)論
算出了準則的權(quán)重和不同方案的得分,最后計算出總得分即可。如下圖所示(數(shù)據(jù)只是演示,和之前的表格無關(guān)):
房子編號 | 交通 權(quán)重0.1 | 醫(yī)療 權(quán)重0.26 | 教育 權(quán)重0.52 | 商業(yè) 權(quán)重0.12 | 總得分 |
房子A | 0.2 | 0.35 | 0.4 | 0.1 | 0.331 |
房子B | 0.25 | 0.3 | 0.28 | 0.15 | 0.2666 |
房子C | 0.3 | 0.4 | 0.15 | 0.1 | 0.224 |
最后計算得出房子A的分數(shù)最高,所以選房子A。
不過因為之前打分的時候很多時候是拍腦袋的,帶有一點主觀成分,會有一定的偏差,如果最終前幾名得分比較接近的話,可以選出前三或前五,最終選擇其中一個。
18年末,我用上述這套方法選出的top2小區(qū),在之后的兩年都是周邊地區(qū)漲幅top5。又因為當(dāng)時收集了大量規(guī)劃信息,我一度被同事們公認為買房達人。
總結(jié)
今天聊了聊數(shù)據(jù)分析思維在買房這件事當(dāng)中的應(yīng)用。數(shù)據(jù)分析師分析一個問題,絕不是一上來就看有什么數(shù)據(jù),而是要遵循分析的基本方法,從明確問題開始一步步深入,隨后挖掘更多信息,并通過科學(xué)的數(shù)學(xué)方法得出客觀有效的結(jié)論。
這篇文章還提供了很多別人不知道的工具和技巧,希望這篇文章能幫你在大城市更好地扎下根。
對比Excel系列圖書累積銷量達15w冊,讓你輕松掌握數(shù)據(jù)分析技能,感興趣的同學(xué)可以直接在各大電商平臺搜索書名了解:
總結(jié)
以上是生活随笔為你收集整理的如何利用数据分析买到好房子?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 10分钟学会用Python轻松玩转Exc
- 下一篇: 秀!Pandas 也能爬虫!