工作3年,可视化毫无进步?小白都能看懂的干货,我真不想告诉你
不論是在數據可視化,還是任何項目中,搞清楚做這件事情的目的都是最重要的。
數據可視化的目標,首先在于做數據的目的,數據的目的在于“準確”、“清晰”的展示清楚一件事情的原貌。但數字本身是枯燥的,傳統意義上使用表格來展示數據,雖然能夠清晰展示一件事情的全貌,但它是不直觀的,需要花費使用者一定的時間與精力來解讀。
因此,數據可視化天然的帶有三項目標:
- 準確:精確的展示數據的特征,既不能遺漏,也不能冗余;
- 清晰:理解清楚數據目的信息,時間越短越好;
- 優雅:通過美觀而又協調的頁面,讓使用者的注意力盡可能多的留在頁面上。
相對而言,準確>清晰>優雅,我們應該盡可能多的向這三個目標靠攏。
怎樣的數據可視化是好看的
就像數據有質量和安全的原則一樣,數據可視化也有它自身的設計原則。雖然在平面設計上有許許多多設計的原則或者技巧,但在數據可視化的項目中,最重要的只有一種:認知負荷,重點在于如何快速的傳遞有效信息。
在認知負荷理論中,會假設人類的認知結構由短時記憶和長時記憶組成,短時記憶一次只能處理2-3條信息,因此假設數據圖表冗余的信息過多,短時記憶是無法很快處理完的,白白浪費了最寶貴視覺通道。例如當你第一次看到下圖時,腦袋是非常大的:
?
或者像下圖這樣,顏色沒有表示任何信息,會浪費看圖人的感情:
?
為了解決圖標冗余的問題,我們會通過格式塔原理來優化圖表,減輕看圖人的視覺負擔。完整的原理一共有八項,但我們這里介紹最重要的幾個原則:臨近、相似和閉合。
臨近原則:簡單說,當你看到相互鄰近的兩個元素時,你通常傾向于它們是一個整體,例如你看到下方左圖時,你會很自然的將臨近的三個格子看成是一組,再通過顏色區分,就可以很清楚的理解圖表所表達的涵義。
但如果看右邊的圖,柱子間距是等寬的,你就會產生非常多的困惑。事實上,我們很多的圖標插件,都是默認等寬的,在顯示數據的時候,你只要調整一點點,視覺上就會美觀很多,它就是一個好的數據可視化圖表。
?
相似原則:簡單說,人在視覺上,通常是將顏色相近,或者是形象類似的元素,當成是一個整體。例如下面的圖片中,你會很自然的將元素進行分組。
?
因此,我們在呈現折線圖時,如果將曲線的顏色進行區分,配合高亮的文字說明,會讓讀者產生非常直觀的印象。就像下圖這樣:
?
閉合原則:簡單說,如果我們將一組元素圈起來,人們就傾向于這組元素是一個整體。像下圖一樣,不論是用線條勾勒出來,還是用色塊襯托出來,你都會認為這是一個整體。
?
同樣的,我們將剛才的圖稍稍改造一下,加上色塊的襯托,內容看起來就更豐富了,并且不會讓人產生困惑。
?
數據可視化的常用工具
“工欲善其事,必先利其器。”即便我們腦中有了清晰的表達方式,但如果沒有合適的工具,還是無法完成數據可視化的宏圖大業。一般來說,我們有四類工具,可以幫助我們來實現數據可視化。
- 第一類是專業的繪圖軟件,例如PS、AI等,設計師小伙伴們會很熟悉,我們可以把數據做成大概的樣子,交給設計師幫忙進行美化,做成海報、新聞稿的樣子,但這種方式非常的偏重具體結論,很難復用。
- 第二類是圖表插件,像大名鼎鼎的Echarts,再例如Highcharts、AntV等,主要通過JS來控制插件的展示方式,在前端頁面中非常常用。有能力的公司,也會開發一些特有的可視化控件,用于支持自身的業務。但這種方式開發過程比較繁瑣,通過調整一個美觀的樣式需要非常長的時間。
- 第三類是一些圖表工具,例如最簡單的Excel、PPT,FineBI等工具,這類工具傾向于個人使用,在匯報工作、整理思路的時候非常好用。
- ?
- 第四類就是一些編程語言了,例如Python和R都有自己的可視化包,只是實現起來比較的難,但數據挖掘的同學就相對常用一些了。
?
如何開展數據可視化工作
開展數據可視化工作前,首先要搞清楚我們做數據可視化的方向是什么,一般來說有兩個方向,一種是解釋型,體現已知數據傳遞的特征價值,并追求細膩的表達方式;一種是探索型,對于未知數據的價值進行探索,支持高效的數據交互方式。
通常情況下我們做匯報,都是用的解釋型,而少數場景,例如分析交易數據中存在哪些商機時,會使用到探索型方式。
在此基礎上,我們再判斷一下使用哪種圖表類型更合適一些。如下圖:
?
再或者是英國金融時報雜志的建議:
?
接下來,我們就開展工作了,通常分為三個步驟:
- 第一步,加工需要展示的數據信息,并存到指定的系統上;
- 第二步,選擇合適的可視化工具,及展示的圖表樣式;
- 第三步,將數據圖表實現出來,并進行細節上的優化調整。
這里重點說明一下優化調整部分,最重要的就是理解視覺編碼及視覺通道的概念。簡單說,就是把人的大腦看作是計算機,你需要將圖表進行編碼加工,送到人的視覺系統里,并由人腦進行解碼。如下圖所示:
?
其實對于數據同學來說,自行調整圖表樣式會走很多的彎路,而我們要做的,就是征求設計師的意見,將圖表一些表達形態固定下來,避免自己亂造輪子。很多設計師同學會給出自己的建議,例如:
1.常規圖表不要使用3D效果,體積嚴重影響人類感知的精確性;
2.長度是最好的表達柱狀圖方式,長度與感知是線性關聯的,如下圖,左邊看起來要比右邊舒服的多:
?
3.盡量不要過度使用圓角,這樣會損耗數據的精確性。
假設沒有設計師同學的幫忙,我們也可以自己總結一些常規的經驗,例如在數倉最常用的維度建模中,如何調整維度數據與度量數據的關系,就可以通過下圖調整:
?
最后,數據可視化是一門實踐科學,與研發有固定的框架和模式不同,很多效果只有通過實踐才能得出道理。這就有點像技術和業務的關系,盡管技術是每個人都追求的最高境界,但沒有業務的幫忙,技術就難以產生真正的商業價值。
?
歡迎關注我的公眾號“商業智能研究”,私信回復“資料包”,即可領取大數據、數據中臺、商業智能、數據倉庫等6G精華資料!
?
?
?
總結
以上是生活随笔為你收集整理的工作3年,可视化毫无进步?小白都能看懂的干货,我真不想告诉你的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 以前的报表都白做了!app上做可视化数据
- 下一篇: 程序员对学历高吗?毕业是考研还是实习?