10.可视化、可视分析、探索式数据分析
前言:基于人大的《數據科學概論》第十章。主要內容為可視化的定義、可視化的意義、可視化的一般過程、科學可視化與信息可視化、可視化的原則、可視化實例、可視化的挑戰和趨勢、可視分析技術、探索式數據分析、可視化工具。
一、可視化的定義
可視化是數據的可視表現形式以及交互技術的總稱。
它通過圖形化的方式把數據給表現出來,方便用戶進行觀察和理解,并且幫助用戶對數據進行探索、發現數據里面隱藏的模式,獲得對數據的洞察力和理解。
二、可視化的意義
某些事物,用文字/數字來表達,相當地繁瑣,但是用圖形來表現,則更加容易把握和理解。
在大數據時代,數據來源多樣,數據的規模巨大,可視化技術可以幫助我們對數據進行觀察、理解、探索和發現。
三、可視化的一般過程
過濾,映射,渲染,交互。
映射和交互兩個環節是達成這個目標的關鍵。
四、科學可視化與信息可視化
目前,可視化領域包括三個主要的分支,分別是科學可視化、信息可視化、以及可視分析等。
五、可視化的原則
可視化的目的,是把復雜數據有效地展示出來,首要的原則是準確和清晰。
- 準確是指可視化結果反映的是數據的本來面目或者本質
- 清晰是指可視化結果,所表達的含義要明確。
此外,還要盡量做到
六、可視化實例
散點圖、直方圖、線圖、柱狀圖、餅圖、樹狀結構、圓錐樹、信息立方體、堆疊的河流、景區熱力圖、高維數據可視化、高維數據可視化。
七、可視化的挑戰和趨勢
- 海量的異構數據的可視化,對算法設計和硬件基礎設施,都提出了更高的要求。
- 各種新硬件被應用到可視化領域,可視化系統將支持更高的顯示分辨率
- 可視化技術被應用到更多的業務領域
- 可視化技術支持更多樣的數據的可視化
- 新的研究熱點,是基于可視化、以及可視化分析結果,進行敘事,將一個故事,并且把故事講完整、講精彩
- 可視化軟件提供更加強大的可視化分析能力
八、可視分析技術
可視分析包括三個要素
- 數據(Data),數據是所有可視化分析的基礎
- 模型(Model),包括統計模型、以及機器學習、數據挖掘模型。
- 利用可視化(Visualization),探索數據中變量之間的關系。
可視分析包括三個回路:
- 探索回路,描述分析者如何和可視化分析系統進行交互,目的是生成新的可視化結果或者調整模型,并且據此對數據進行分析。涉及動作和發現。
- 驗證回路,包括洞察和假設。
- 產生新知識回路,分析者為某個假設尋找證據,或者從數據中學習到新的知識。從證據到知識,需要一個推理的過程。
九、探索式數據分析
所謂探索式數據分析,是指對已有的數據,在盡量少的先驗假定情況下進行探索,逐步了解數據的特點。
當我們對數據的內在特點、它包含的信息,沒有足夠經驗,不知道應用用什么統計分析、數據挖掘、機器學習方法進行分析時,探索式數據分析是一種有效的分析方式。
在探索式數據分析中對高維數據進行降維
降維,是把數據或特征的維數降低,一般分為線性降維、和非線性降維。
降維的方法有:主成分分析、線性判別分析、多維尺度分析等。
十、可視化工具
-
D3.js
-
Matplotlib
-
Prefuse
降維。
降維的方法有:主成分分析、線性判別分析、多維尺度分析等。
十、可視化工具
-
D3.js
-
Matplotlib
-
Prefuse
總結
以上是生活随笔為你收集整理的10.可视化、可视分析、探索式数据分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 字体的基础知识:中文字体的特征
- 下一篇: 数据可视化分析工具评测: DataEas