【Python】20个小技巧,让数据可视化图表更专业!
參考?uxdesign Taras Bakusevych
數據可視化是數據展示的常見方式,所謂一圖抵千言,好的圖表能高效傳遞信息,讓觀眾一目了然,差的圖表往往會不知所云。
人類大腦的一半完全是用于處理可視化信息的。當你給用戶展示一張信息圖的時候,你已經以大腦的最大帶寬路徑在影響他了。
一張設計優良的數據可視化圖能即時給予觀者深刻的印象,并能穿透一個復雜故事的蕪雜直抵問題的核心。
眾所周知,紐約時報的可視化圖表非常專業,既能闡述事實,也不失簡潔美觀。
作為普通人,其實只要遵守一些設計規則,加上一點審美訓練,也能制作出專業的可視化圖表。
這次給大家介紹20個圖表制作過程中有用的方法和規則。
1、選擇合適的圖表類型
錯誤的圖表類型會導致混淆視聽,同樣的數據集可以選擇多種圖表類型,但大家要注意甄別用法。
你想要給觀眾展示什么,這是最重要的選擇依據,下面給大家列舉了的十幾種圖表類型。
2、根據正負值選擇合適的繪圖方向
繪制水平條形圖時,在Y軸左側繪制負值,在Y軸右側繪制正值,不要把正負值繪制到軸同一側。
垂直柱狀圖同理。
3、從0基線開始繪制柱狀圖
截斷Y軸會導致表達失真。在下面的示例中,查看左側的圖表,可以很快得出結論,值 B 比 D 大 3 倍以上,而實際上差異要小得多。
從0基線開始可確保用戶獲得更準確的數據表達。
4、折線圖使用自適應Y 軸比例
對于折線圖,如果始終將 Y 軸比例限制為從0開始可能會使圖表過于平坦,無法表達趨勢變化。
由于折線圖的主要目標是表示趨勢,比較合理的是根據數據范圍調整比例,保持折線上下高度占據 Y 軸范圍的三分之二。
5、時間點稀疏時慎重使用折線圖
折線圖是由線連接的“標記”組成,通常可用于表達時間序列變化。
當時間間隔很小,且時間點較多時,折線是一種非常好的展示變化的方式,比如股票分鐘線。
但如果時間點比較稀疏,且時間間隔大,最好是使用柱狀圖來展示,比如月銷量變化。因為此情況下折線圖容易導致混淆。
6、少使用平滑折線圖
平滑的折線圖可能在視覺上令人愉悅,但它們歪曲了背后的實際數據,而且過粗的線條掩蓋了真正的“標記”位置。
7、避免使用雙軸圖
一般情況下,為了節省可視化空間,當有兩個數據系列具有相同的度量但大小不同時,可能傾向于使用雙軸圖表。
但雙軸圖表不僅難以閱讀,而且還會誤導觀眾,以為代表了 2 個數據系列之間的比較。
大多數用戶不會密切關注雙軸比例差異,只是瀏覽圖表,可能得出錯誤的結論。
8、餅圖中顯示的切片數量不宜過多
餅圖是最受歡迎且經常被誤用的圖表之一。
在大多數情況下,條形圖是更好的選擇。但是,如果非要使用餅圖,需要注意以下幾個點:
不要超過 5-7 個切片,保持簡潔
可以將額外多的最小段分組到“其他”切片中
9、直接在圖表上標注標簽
沒有適當的標簽,無論圖表多好看——它都幾乎沒有意義。
直接在圖表上標記對所有查看者都非常有幫助,因為一目了然,更節省時間。
查看圖例需要花費很多時間,一般觀眾不會仔細去對比圖例和圖表的顏色。
10、餅圖不要直接在切片上面標注
將值放在切片之上可能會導致多個問題,可讀性差,薄切片無法標注等。
更好的做法是,為每個數據標簽添加帶有清晰指向的黑色標簽。
11、餅圖切片需要排序
如果餅圖切片大小無順序,則很難理解表達的內容。
所以餅圖切片需要以一定規則排序,一般是將最大的切片放在12點鐘位置,然后按順時針方向降序放置下一個切片。
12、避免隨機性
柱狀圖排序也要避免隨機性,按照一定規則排序會更加清晰易讀。
將最大值放在頂部(對于水平條形圖)或左側(對于垂直條形圖),以確保最重要的值占據最突出的空間,減少眼球運動和閱讀圖表所需的時間。
13、圓環圖寬度要適當
當我們去掉餅圖中間部分并創建一個圓環圖時,我們可以騰出空間來顯示額外的信息,但如果寬度過窄,它會使圖表變得很難閱讀。
14、盡量避免復雜樣式,讓數據自己說話
不必要的樣式不僅會分散注意力,還可能導致對數據的誤解,讓用戶產生錯誤印象。
應該避免以下幾種:
3D樣式
陰影、漸變
斑馬紋,過多的網格線
高度裝飾、斜體、粗體或襯線字體
15、選擇與數據性質相匹配的調色板
顏色是有效數據可視化的一個組成部分,在設計時考慮這 3 種調色板類型:
定性調色板最適合顯示分類變量。分配的顏色應該是不同的,以確保可讀性。
順序調色板最適合需要按特定順序放置的數字變量。使用色調或亮度或兩者的組合,可以創建一個連續的顏色集。
發散調色板是兩個連續調色板的組合,中間有一個中心值(通常為零)。通常,不同的調色板會傳達正值和負值。確保顏色也符合“消極”和“積極”表現的概念。
16、選擇無障礙顏色設計
研究數據表明,大約每 12 個人中就有 1 人是色盲。圖表只有在廣泛的受眾可以訪問時,才能最大化它的價值。
所以在配色時注意以下幾個方面:
在調色板中使用不同的飽和度和亮度
以黑白打印的數據可視化圖表以檢查對比度和可讀性
17、時刻注意易讀性
確保排版準確傳達信息,并幫助用戶專注于數據,而不是分散注意力。
注意以下幾點:
選擇易讀的字體,比如雅黑、黑體,避免襯線和裝飾性很強的字體
避免斜體、粗體和全部大寫
確保與背景形成高對比度
不要旋轉文字
18、使用水平條形圖而不是旋轉標簽
標簽過長時不要使用旋轉角度,而是用水平條形圖來表達,這個簡單的技巧將確保用戶能夠更有效地觀看圖表。
19、選擇適合自己的圖表庫
如果你想向Web 和APP項目添加交互式圖表,將使用什么圖表庫?
現在有很多專業的圖標庫可供選擇,比如echarts、highcharts等。
圖表庫包含了許多前面提到的交互和規則。基于定義的庫進行設計將確保易于實施,并為你提供大量交互想法。
20、可交互式圖表,讓用戶自己選擇
通過更改參數、可視化類型、時間線幫助用戶進行探索,可交互式圖表能更有效的獲取有用的信息。
結論
好的數據可視化圖表會在你的腦海里久久留下關于事實、趨勢或者過程的心理模型。
圖表制作并不難,但好的圖表需要注意很多細節,避免畫蛇添足、過猶不及。
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載黃海廣老師《機器學習課程》視頻課黃海廣老師《機器學習課程》711頁完整版課件本站qq群955171419,加入微信群請掃碼:
總結
以上是生活随笔為你收集整理的【Python】20个小技巧,让数据可视化图表更专业!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何在金山毒霸软件里安装腾讯视频
- 下一篇: 【Python】一文掌握Conda软件安