Python精美地理可视化绘制——以中国历年GDP数据为例
專欄作者:zch,經(jīng)管專業(yè)研一在讀,Python數(shù)據(jù)分析及可視化愛好者。
有的時(shí)候,我們需要對(duì)不同國家或地區(qū)的某項(xiàng)指標(biāo)進(jìn)行比較,可簡單通過直方圖加以比較。但直方圖在視覺上并不能很好突出地區(qū)間的差異,因此考慮地理可視化,通過地圖上位置(地理位置)和顏色(顏色深淺代表數(shù)值差異)兩個(gè)元素加以體現(xiàn)。在本文案例中,基于第三方庫pyecharts,對(duì)中國各省2010-2019年的GDP進(jìn)行繪制。
我們先來看看最終效果:
01
關(guān)于繪圖數(shù)據(jù)
基于時(shí)間和截面兩個(gè)維度,可把數(shù)據(jù)分為截面數(shù)據(jù)、時(shí)間序列及面板數(shù)據(jù)。在本文案例中,某一年各省的GDP屬于截面數(shù)據(jù),多年各省的GDP屬于面板數(shù)據(jù)。因此,按照先易后難的原則,先對(duì)某一年各省的GDP進(jìn)行地理可視化,再進(jìn)一步構(gòu)建for循環(huán)對(duì)多年各省的GDP進(jìn)行可視化,形成最終的時(shí)間輪播圖。
數(shù)據(jù)來源:本文案例使用的GDP數(shù)據(jù)來源于國家統(tǒng)計(jì)局官網(wǎng),可在線下載到本地,保存為csv或excel格式,用pandas中的DataFrame進(jìn)行讀取。
02
地理可視化
一、全國各省單年GDP的可視化
在pyecharts中可使用Map類型實(shí)現(xiàn)地理可視化,其原理是通過不同顏色填充以展現(xiàn)不同的數(shù)據(jù),options實(shí)現(xiàn)圖表的調(diào)整及修飾。代碼展示如下:
import?pandas?as?pd from?pyecharts.charts?import?Map import?pyecharts.options?as?optsframe?=?pd.read_csv('C:\\Users\\dell\\Desktop\\分省年度數(shù)據(jù)2.csv',encoding='GBK') map?=?Map() map.add("我國地區(qū)的GDP",frame[['地區(qū)','2019年']].values.tolist(),"china") map.set_global_opts(visualmap_opts=opts.VisualMapOpts(min_=500,max_=12000)) map.render("2019年全國各地區(qū)GDP.html")解析:add()來實(shí)現(xiàn)了數(shù)據(jù)的加載,在配置3個(gè)參數(shù)中——第1個(gè)是圖的標(biāo)題,第2個(gè)通過.values.tolist()加載要顯示的數(shù)據(jù),第3個(gè)"china"確保顯示的地圖類型是中國。有個(gè)細(xì)節(jié)需要注意,Map 使用的中國各省份需要將全部的省、市、自治區(qū)等去掉。set_global_opts()實(shí)現(xiàn)了用顏色標(biāo)記數(shù)據(jù)的數(shù)值大小,參數(shù)min_和max_分別代表最小值和最大值。render()用于生成并保存圖像。
效果如下:
然而數(shù)據(jù)分布并不平均,可以通過is_piecewise 屬性表述分段自定義不同的顏色區(qū)間:
geo.set_global_opts(visualmap_opts=opts.VisualMapOpts(is_piecewise=True,pieces=[{"min":0,"max":10000,"label":"1~10000","color":"cyan"},{"min":10001,"max":20000,"label":"10001~20000","color":"yellow"},{"min":20001,"max":50000,"label":"20001~50000","color":"orange"},{"min":50001,"max":80000,"label":"50001~80000","color":"coral"},{"min":80001,"max":120000,"label":"80001~120000","color":"red"},]??? ))效果如下:
二、全國各省多年GDP的可視化
由于要繪制2010-2019年的GDP數(shù)據(jù),可以考慮構(gòu)建一個(gè)for循環(huán),通過str(i)+"年"的形式訪問數(shù)據(jù)表格中處于不同列的各年GDP數(shù)據(jù)。繪制輪播圖可考慮調(diào)用Timeline,代碼如下:
import?pandas?as?pd from?pyecharts?import?options?as?opts from?pyecharts.charts?import?Map,?Timelineframe?=?pd.read_csv('C:\\Users\\dell\\Desktop\\分省年度數(shù)據(jù)2.csv',encoding='GBK') tl?=?Timeline() for?i?in?range(2010,?2020):map0?=?(Map().add("省份",frame[['地區(qū)',str(i)+'年']].values.tolist(),?"china").set_global_opts(title_opts=opts.TitleOpts(title="Map-{}年GDP(億元)".format(i)),visualmap_opts=opts.VisualMapOpts(is_piecewise=True,pieces=[{"min":0,"max":10000,"label":"1~10000","color":"cyan"},{"min":10001,"max":20000,"label":"10001~20000","color":"yellow"},{"min":20001,"max":50000,"label":"20001~50000","color":"orange"},{"min":50001,"max":80000,"label":"50001~80000","color":"coral"},{"min":80001,"max":120000,"label":"80001~12000","color":"red"},]???),))tl.add(map0,?"{}年".format(i)) tl.render("2010~2019年全國各地區(qū)GDP.html")效果如下:
03
小結(jié)
本案例的實(shí)現(xiàn)并不復(fù)雜,在pyecharts官方的參考案例基礎(chǔ)上稍加改動(dòng)即可實(shí)現(xiàn)。作為一名初學(xué)者,模仿案例是提升功力的重要途徑,通過模仿可以有效吃透代碼要具體實(shí)現(xiàn)的功能,量變到質(zhì)變,就能根據(jù)自己工作和學(xué)習(xí)的需要進(jìn)行靈活應(yīng)用。
◆?◆?◆ ?◆?◆麟哥新書已經(jīng)在當(dāng)當(dāng)上架了,我寫了本書:《拿下Offer-數(shù)據(jù)分析師求職面試指南》,目前當(dāng)當(dāng)正在舉行活動(dòng),大家可以用相當(dāng)于原價(jià)5折的預(yù)購價(jià)格購買,還是非常劃算的: 數(shù)據(jù)森麟公眾號(hào)的交流群已經(jīng)建立,許多小伙伴已經(jīng)加入其中,感謝大家的支持。大家可以在群里交流關(guān)于數(shù)據(jù)分析&數(shù)據(jù)挖掘的相關(guān)內(nèi)容,還沒有加入的小伙伴可以掃描下方管理員二維碼,進(jìn)群前一定要關(guān)注公眾號(hào)奧,關(guān)注后讓管理員幫忙拉進(jìn)群,期待大家的加入。 管理員二維碼: 猜你喜歡 ●?臥槽!原來爬取B站彈幕這么簡單●?厲害了!麟哥新書登頂京東銷量排行榜!●?笑死人不償命的知乎沙雕問題排行榜 ●?用Python扒出B站那些“驚為天人”的阿婆主!●?你相信逛B站也能學(xué)編程嗎總結(jié)
以上是生活随笔為你收集整理的Python精美地理可视化绘制——以中国历年GDP数据为例的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: JavaSE小项目(小游戏)
- 下一篇: python调用hypermesh调用t