Tableau 八、数据分层、数据分组、数据集
1.數據分層(層級)結構
1.1分層結構的概念與意義
分層結構是維度之間自上而下的組織形式。
Tableau默認包含對某些字段的分層結構,比如日期、時間、地理角色。
以日期為例,包含年、季度、月、日等數據分層結構。
打開“全球超市訂單數據.xlsx”。
將兩個工作表數據拖到右側。聯結為內部聯結。
將【利潤】拖到【行】,將【訂單日期】拖到【列】,點擊【年(訂購日期)】右側的+,會往下分層(稱之為下鉆),并變成-,點擊-,會把層折疊(稱為上鉆)。
1.2分層結構的創建與使用案例
打開“人工坐席接聽數據.xlsx”。
中心和人工服務接聽量柱形圖
新建工作表2,右擊【中心】——【分層結構】——【創建分層結構】。
命名為【層級】。
【維度】下變化如下
將字段【部】、【組】、【班】,拖到【中心】下面,注意順序,上下順序就是層級順序。
將【中心】放到【列】中,將【人工服務接聽量】放到【行】中,將【人工服務接聽量】放到【標簽】上。
點擊【整個視圖】。
右擊【總和(人工服務接聽量)】——【設置格式】,點擊【數字】
【數字(自定義)】,設置小數位數為0,【顯示單位】為千。
點擊【列】里的【中心】左邊的+,逐級下鉆,進行分析,發現有【未知】字段數據太高,屬于異常,排除掉。
點擊【未知】的柱形,點擊【排除】。
分析發現有兩個班的數據比較高。
中心、日期和平均呼入通話時長折線圖
新建工作表3,將【日期】拖入【列】,選擇格式為【天】。
將【中心】拖入【行】,將【平均呼入通話時長】拖入行。
點擊【中心】左邊的+,下鉆到【部】,并繼續下鉆,可以到【組】,到【班】。
不想用層級的話,右擊【移除分層結構】。
第二種創建分層結構方式
將字段【部】拖到字段【中心】上,自動打開【創建分層結構】,命名為【層級】。如果字段上下順序不對,則拖動調整。
右擊【組】——【分層結構】——【添加到分層結構】,選擇【層級】,則自動排到【層級】的最下面。
不想【組】在層級里,就直接把【組】往外拖。
注意,層級不能嵌套,但可以并列。
比如新建【層級2】,【層級2】不能放到【層級】里面。
2.數據分組
2.1數據組創建及使用
組是維度成員或度量的離散值的組合。
通過分組,可以實現維度成員的重新組合,以及度量值按范圍的分類。
字段圖標是回形針圖標。
在Tableau里,歸類重組維度成員有很多種方式,分組是其中最常見和最快速方式。
注意,組不能創建計算字段,不能出現在公式中。
新建工作表4。
將【班】拖到行中,將【人工服務接聽量】放到列中。點擊【交換行和列】。
發現13班和13班(15批新人)屬于一個班。其他也有可以合到一個組的情況。
創建分組
創建分組有兩種方式:
一是右擊【班】——【創建】——【組】。
二是在圖形里右擊【組】(注意,要點擊圖形,而不是字段)。這里使用第二種方法。
出現【創建組】的對話框,點擊【應用】和【確定】。
編輯組
右擊帶有回形針圖標的【班(組)】——【編輯組】。
將【13班(15批新人)】拖到組【13班】下,如果組名不合適,可以右擊組名——【重命名】。
按ctrl鍵,選擇【15班】和【15期新人】,點擊【分組】,則新建一組。
查找和分組
如果字段名稱太多,點擊【查找】,查找方式有三種
- 包含,屬于模糊查找,包含這個字就能找到
- 開頭為,則字段開頭必須為這個字
- 精確匹配,則查找字為全部字段。
【范圍】是查找范圍,指的是全部查詢還是在某個組內查詢,一般選全部。
想找到所有常白班,【查找成員】輸入【白】,【包含】,【范圍】選【全部】。點擊【查找全部】。
找到后,默認結果是被選中的,點擊【分組】,重命名為【常白班】。
同樣,對【運行班】分組。
將一些字段分組,稱為【其他班】。
修改圖表
將【班】拖走,將【班分組】拖到【列】中。點擊【交互行和列】。
右擊【班分組】,去掉勾選【包含“其他”】
點擊【降序】,點擊【交互行和列】。
2.2電量銷售數據按地理區域分組
打開文件“2014年各省市售電量.xlsx”
中國一般分為七個區:東北,華東,華中,華北,華南,西南和西北。
將省市按照七個區域分組。
建立地圖
新建工作表,右擊【維度】下【省市】——【地理角色】——【省/市/自治區】。
雙擊【省市】,點擊【未知】,選擇【編輯位置】。(注意,因為第七章中自定義地理編碼,如果不移除會導致未知過多,點擊【地圖】——【地理編碼】——【移除自定義地理編碼】)
修改匹配位置,點擊【確定】。
套索選擇和建組
將【省市】拖到【標簽】上。
點擊地圖上的【套索選擇】按鈕,先框選黑龍江,吉林和遼寧三省。
套索選擇后,其他省份變灰,只顯示選中的省份。
懸浮在【龍江】上,可以看見3省已選擇,點擊回形針標識,創建東北組。
同樣使用套索,選擇山東,江蘇,安徽,上海,浙江,江西,福建。選擇后懸浮在其中一個省份上,點擊回形針標識,創建分組華東組。
華北組包括內蒙古,河北,山西,北京,天津。
華中組包括河南,湖北,湖南。
西南組包括重慶、四川和西藏。
西北組包括新疆、青海、甘肅和寧夏。
右擊【省市(組)】——【編輯組】,重新命名字段名稱和群組名稱,點擊【確定】。
將【當期值】拖入【大小】。
填充地圖
新建工作表6,雙擊【中國地理區域】,將【同期值】拖到【顏色】,點擊【顏色】——【編輯顏色】,選擇【紅色—藍色發散】,勾選【倒序】。
將【中國地理區域】和【當期值】拖到【標簽】上。
右擊標簽【總和(當期值)】——【設置格式】,【數字(自定義)】,小數位數為0,顯示單位為千(K)。
添加說明,【標記】下空白處右擊勾選【說明】,雙擊說明處,輸入文字。
重命名工作表6為“各地區用電量”。【工作表】——【導出】——【圖像】。
各區域用電量標靶圖
新建工作表7。
將【中國地理區域】和【省市】拖到【行】,將【當期值】拖到列。
將【月度計劃值】拖到【詳細信息】。
右擊坐標軸——【添加參考線】。
選擇【分布】下【分區】。
【計算】里選擇【百分比】,修改為【50,100】,百分比類型為【總和(月度計劃)】。
【標簽】選擇【無】。
【格式】里【線】選擇黑色直線,填充不修改,點擊【確定】。
將【中國地理區域】拖到【顏色】,將【當期值】拖到【標簽】。
右擊標簽【總和(當期值)】——【設置格式】。
修改填充顏色:右擊坐標軸下方——【編輯參考線】,選擇【向下填充】,然后可以選多種填充顏色。
也可以同時選擇【對稱】和【反向】。【對稱】是指顏色沿著參考線對稱。
添加說明,【標記】下空白處右擊勾選【說明】,雙擊說明處,輸入文字。
重命名工作表7為“電量銷售區域標靶圖”。【工作表】——【導出】——【圖像】。
3.數據集
3.1數據集的相關概念
定義:集是滿足某些條件的數據子集,它是維度的部分成員。
圖標是
類型
| 類型 | 靜態集 | 動態集 |
| 是否會更新 | 否 | 是 |
| 可用維度度量 | 單個或多個 | 單個 |
| 創建方式 | 視圖中選擇 | 數據窗口創建 |
用途
- 集內外成員的對比分析
- 集內部成員的對比分析
3.2創建數據集
導入數據“全球超市訂單數據.xlsx”
創建靜態數據集
新建工作表8,找到負利潤的國家數據集。
將【國家/地圖】拖到【列】,將【利潤】拖到【行】。
點擊降序圖標。
從數據開始為負數的國家開始往后選。
選擇好后,懸浮在上面,選擇創建集按鈕。
修改集的名稱,點擊【確定】。
可見左側【度量】下出現【集】。
將【市場】和【細分市場】拖到【列】中
將【利潤】拖到【顏色】上。
修改【利潤】的顏色,【漸變顏色】為2階,勾選【倒序】。這樣看的更清楚。
按ctrl鍵,將圖表中藍色的選出來。選好后右擊【創建集】,修改集名稱如下,點擊【確定】。
右擊【集】下【負利潤國家2】——【編輯集】,將鼠標懸浮在每條記錄的后邊,會有×,如果不想要該記錄,可以點擊移除。
懸浮在列名上,也會有×,如果不想要改列,可以進行刪除。
點擊【清除工作表】。
將【負利潤國家2】拖到【列】中,將【利潤】拖到【行】中。可以看到集內外變化。
右擊【負利潤國家2】——【編輯集】,刪除【市場】列,點擊【應用】和【確定】。
發現圖表無變化,因為【市場】列變化不影響數據。
右擊【負利潤國家2】——【編輯集】,刪除【國家/地區】列,點擊【應用】和【確定】。
發現數據發生變化。原因是細分市場里的【公司】和【消費者】變成了內,其他的細分市場變成了外。
創建動態數據集
新建工作表9。
右擊【維度】下【產品名稱】——【創建】——【集】。
修改集的名稱,勾選【按字段】,選擇【利潤】【總和】【<=】【0】,點擊【加載】,點擊【確定】。
將【負利潤產品】拖到【行】中,將【利潤】拖到【列】中。
點擊行中【內/外(負利潤產品)】的下拉三角,選擇【在集內顯示成員】。
通過排序方式創建動態數據集
復制工作表9,【清除工作表】,這次找銷量在前100的產品。
右擊【維度】下【產品名稱】——【創建】——【集】。
修改集名稱,選擇【頂部】,勾選【按字段】,選擇【頂部】【100】【數量】【總和】,就是將銷量按降序排序,取前100個。點擊【確定】。
合并集
合并同一個維度的數據。
右擊【負利潤產品】——【創建合并集】。
修改集名稱,左邊是【負利潤產品】,右邊只能選擇【銷量TOP100】,因為兩者都是從【產品名稱】這個維度創建而來。
下面有四種選擇:
- 合并
- 相交
- 左交
- 右交
選擇相交,點擊【確定】。
通過篩選器創建數據集
將【地區】拖到【篩選器】里,勾選【南亞】【西亞】【中亞】【東亞】【東南亞】,點擊【確定】。
右擊【篩選器】下的【地區】——【創建集】。
修改集名稱,點擊【確定】。
數據集用于分層結構
將【集】下【亞洲地區】拖到【維度】——【市場】上,彈出【創建分層結構】,修改分層名稱,點擊【確定】。
3.3使用集做對比分析
將【賣情懷的產品】拖到【行】,將【利潤】拖到【列】。
選擇【行】中【賣情懷的產品】的下拉三角——【在集內顯示成員】。
點擊【顯示標記標簽】,顯示具體標簽數值。
總結
以上是生活随笔為你收集整理的Tableau 八、数据分层、数据分组、数据集的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: VS2017编译文件遇到fatal er
- 下一篇: 网页搜题插件使用