tableau中文版教程pdf_PDF 文件
本文介紹如何將 Tableau 連接到 .pdf 文件數(shù)據(jù)并設(shè)置數(shù)據(jù)源。
注意:Tableau 不支持從右到左 (RTL) 的語言。如果您的 PDF 包含 RTL 文本,則字符可能會以相反順序顯示在 Tableau 中。
進(jìn)行連接并掃描文檔表格
打開 Tableau 后,在“連接”下面,單擊“PDF 文件”。
選擇要連接到的文件,然后單擊“打開”。
在“掃描 PDF 文件”對話框中,指定想要 Tableau 掃描表格的文件中的頁面。您可以選擇掃描所有頁面、僅單個頁面或一系列頁面中的表格。
注意:?類似于大多數(shù) PDF 閱讀器,掃描將文件的第一頁計為“第 1 頁”。掃描表格時,請指定 PDF 閱讀器顯示的頁碼,而不是文檔本身中可能使用的頁碼,該頁面可能從第 1 頁開始,也可能不從第 1 頁開始。
例如,假設(shè)您想要使用下圖中的“表 1”。PDF 閱讀器顯示一個數(shù)字,而 .pdf 文件顯示其他數(shù)字。若要正確掃描此表,請指定 PDF 閱讀器顯示的頁碼。在此示例中,您指定“第 15 頁”。
在數(shù)據(jù)源頁面上,執(zhí)行下列操作:
(可選)在頁面頂部選擇默認(rèn)數(shù)據(jù)源名稱,然后輸入要在 Tableau 中使用的唯一數(shù)據(jù)源名稱。例如,使用可幫助其他數(shù)據(jù)源用戶推斷出要連接的數(shù)據(jù)源的數(shù)據(jù)源命名約定。 默認(rèn)名稱是基于文件名自動生成的。
如果文件包含一個表,請單擊工作表標(biāo)簽開始進(jìn)行分析。否則,從左窗格中將表拖到畫布上,然后單擊工作表標(biāo)簽以開始分析。
關(guān)于左側(cè)窗格中的表格
在 .pdf 文件中識別的表將被賦予唯一名稱,并在掃描后顯示在左側(cè)窗格中。例如,您可能會看到像“第 1 頁,表 1.”這樣的表名稱。表名稱的第一部分指明 .pdf 文件中表格源自其中的頁面。表名稱的第二部分指明識別的表順序。如果 Tableau 在一頁中識別出了多個表,則表名稱的第二部分可能指明以下兩項之一:
Tableau 在頁面上識別出了另一個唯一的表或子表。
Tableau 采用另一種方式解讀了頁面上的表。Tableau 可能會對表提供多種解讀,具體情況取決于該表在 .pdf 文件中的呈現(xiàn)方式。
PDF 文件數(shù)據(jù)源示例
以下是 PDF 文件數(shù)據(jù)源的示例:
獲取更多數(shù)據(jù)
通過添加更多表或連接到不同數(shù)據(jù)庫中的數(shù)據(jù),將更多數(shù)據(jù)提供到數(shù)據(jù)源中。
從當(dāng)前文件添加更多數(shù)據(jù):
從左窗格中,將其他表拖到畫布上,以使用聯(lián)接或并集合并數(shù)據(jù)。有關(guān)詳細(xì)信息,請參見聯(lián)接數(shù)據(jù)或合并數(shù)據(jù)。
如果在以上所列過程的步驟 3 中掃描的頁面未在左窗格中生成您所需的表,請單擊 PDF 文件連接旁邊的下拉箭頭,然后單擊“重新掃描 PDF 文件”。此選項允許您創(chuàng)建新的掃描,以便您可以在 .pdf 文件中指定不同的頁面來掃描表。
從不同數(shù)據(jù)庫中添加更多數(shù)據(jù):在左窗格中,單擊“連接”旁邊的“添加”。有關(guān)詳細(xì)信息,請參見聯(lián)接數(shù)據(jù)。
如果左窗格中未列出您需要的連接器,請選擇“數(shù)據(jù)”>“新數(shù)據(jù)源”以添加新數(shù)據(jù)源。有關(guān)詳細(xì)信息,請參見混合您的數(shù)據(jù)。
設(shè)置表選項
您可以設(shè)置表選項。在畫布上,單擊表下拉箭頭,然后指定數(shù)據(jù)在第一行中是否包括字段名稱。如果是這樣,這些名稱將成為 Tableau 中的字段名稱。如果未包括字段名稱,Tableau 會自動生成這些名稱。您隨后可以對字段進(jìn)行重命名。
使用 Data Interpreter 清理您的數(shù)據(jù)
如果 Tableau 檢測到它可以幫助優(yōu)化數(shù)據(jù)源以進(jìn)行分析,則會提示您使用數(shù)據(jù)解釋器。數(shù)據(jù)解釋器能夠檢測您可以使用的子表,并且能夠刪除以后可能會在分析中引起問題的唯一格式。有關(guān)詳細(xì)信息,請參見使用 Data Interpreter 清理 Excel、CSV、PDF 和 Google Sheets 中的數(shù)據(jù)。
合并 .pdf 文件中的表
您可以在文件中合并表。有關(guān)合并的詳細(xì)信息,請參見合并數(shù)據(jù)。
使用通配符搜索來合并表時,結(jié)果范圍限定為在連接到的初始文件中掃描的頁面。例如,假設(shè)您具有三個文件:A.pdf、B.pdf 和 C.pdf。您連接到的第一個文件是 A,并且將表的掃描限制為第 1 頁。當(dāng)使用通配符搜索來合并文件 B 和 C 中的表時,并集中包含的其他表只能來自 B 的第 1 頁和 C 的第 1 頁。
使用 .pdf 文件的提示
以下提示可幫助您在 Tableau 中使用 .pdf 文件。
使用 PDF 文件連接器以僅識別 .pdf 文件中的表。
PDF 文件連接器的主要目標(biāo)是在 .pdf 文件中查找和標(biāo)識表。因此,它會忽略文件中似乎不屬于表格的任何其他信息,包括標(biāo)題、說明和腳注。如果相關(guān)數(shù)據(jù)存儲在這些區(qū)域之一(如表標(biāo)題)中,您可以使用 Tableau 先將 .pdf 文件數(shù)據(jù)導(dǎo)出到 .csv 文件中,手動添加存儲在表標(biāo)題中的數(shù)據(jù),然后改為連接到 .csv 文件。有關(guān)詳細(xì)信息,請參見將數(shù)據(jù)導(dǎo)出為 .csv 文件。
使用標(biāo)準(zhǔn)表。
通常,Tableau 對使用表格格式的標(biāo)準(zhǔn)表的處理效果最好。
理想情況下,.pdf 文件中的表在一行中具有列標(biāo)題,在一行中具有行值,如下面的示例中所示。
表中或表周圍使用的顏色和陰影可能會影響表的識別方式。
具有獨特格式設(shè)置的表可能需要在 Tableau 之外進(jìn)行一些清理或手動編輯。獨特的格式設(shè)置可能包括分層標(biāo)題、跨多行的標(biāo)題名稱、跨多行的行值、斜置標(biāo)題和堆疊的表,如下面的示例中所示。
注意:Tableau 不支持連接到掃描(光學(xué)字符識別)軟件生成的 .pdf 文件。
驗證數(shù)據(jù)。
確保驗證 Tableau 在 .pdf 文件中標(biāo)識的表中的數(shù)據(jù)。您可以使用數(shù)據(jù)網(wǎng)格或結(jié)果工作簿(如果您使用了數(shù)據(jù)解釋器)來驗證數(shù)據(jù)。
避免跨多頁的表。
如果 .pdf 文件包含跨多頁的表,Tableau 會將該表解讀為多個表。若要解決此問題,請使用并集來合并這些表。有關(guān)詳細(xì)信息,請參見合并數(shù)據(jù)。
重命名其文件名包含 unicode 字符的 .pdf 文件。
連接到文件名中包含 unicode 字符的 .pdf 文件后,您可能會看到以下錯誤。
若要解決此問題,請使用非 unicode 字符重命名文件,并再次連接到 .pdf 文件。
不要使用密碼保護(hù)的 .pdf 文件。
連接到 .pdf 文件并在其中掃描表之后,您可能會看到以下錯誤。
如果 .pdf 文件受密碼保護(hù),并且 Tableau 無法訪問其內(nèi)容,則會顯示此錯誤。Tableau 不支持連接到密碼保護(hù)的 .pdf 文件。
以不同方式或不正確方式解讀的別名值。
在數(shù)據(jù)網(wǎng)格中,您可能會注意到,某些值的解讀方式與 .pdf 文件不同。通過使用別名來重命名字段內(nèi)的特定值,您可以糾正這種解讀。
例如,假設(shè)您在連接到 .pdf 文件后看到下表。某些州/省/市/自治區(qū)被解讀為小寫形式,以藍(lán)色突出顯示。
通過使用別名將小寫形式的縮寫更改為大寫形式的縮寫,您可以解決此問題。為此,請單擊列名稱旁邊的下拉箭頭,并選擇“別名”。
解決解讀為表值的列標(biāo)題。
在數(shù)據(jù)網(wǎng)格中,您可能還會注意到 .pdf 文件中的某些列標(biāo)題反而被解釋為表值。如果您的 .pdf 文件包含具有唯一格式或?qū)哟螛?biāo)題的表,則可能會發(fā)生這種情況。在這種情況下,先嘗試使用數(shù)據(jù)解釋器。如果 Data Interpreter 未解決該問題,請考慮手動將列重命名其適當(dāng)?shù)拿Q,并使用數(shù)據(jù)源篩選器來篩選被視為值的標(biāo)題名稱。
例如,假設(shè)您在連接到 .pdf 文件后看到下表。.pdf 文件中的表標(biāo)題被解釋為表值,以藍(lán)色突出顯示。
一種解決此類標(biāo)題問題的方法是按照類似于以下的步驟進(jìn)行操作:
雙擊列名稱,然后將 F1 重命名為“Year”(年份)。對 F2 至 F4 重復(fù)此步驟,分別命名為“Coal”(煤炭)、“Gas”(天然氣)和“Oil”(石油)。
單擊“Year”(年份)列的數(shù)據(jù)類型圖標(biāo),并將其更改為數(shù)值數(shù)據(jù)類型。這會導(dǎo)致將此列中的非數(shù)值轉(zhuǎn)換為空值。
在數(shù)據(jù)源頁面的右上角,單擊“添加”,單擊“添加”按鈕,然后選擇“Year”(年份)字段。
在“篩選器”對話框中,同時選中“Null”和“排除”復(fù)選框。
“Year”(年份)列中包含 Null 值的行將從數(shù)據(jù)網(wǎng)格中刪除,從而影響表中其他列的行。
關(guān)于 .ttde 和 .hhyper 文件
在計算機(jī)的目錄中導(dǎo)航時,您可能會注意到 .ttde 或 .hhyper 文件。當(dāng)您創(chuàng)建連接到數(shù)據(jù)的 Tableau 數(shù)據(jù)源時,Tableau 會創(chuàng)建 .ttde 或 .hhyper 文件。此文件(也稱為陰影數(shù)據(jù)提取)用于幫助提高 Tableau Desktop 中的數(shù)據(jù)源加載速度。盡管陰影數(shù)據(jù)提取包含類似于標(biāo)準(zhǔn) Tableau 數(shù)據(jù)提取的基礎(chǔ)數(shù)據(jù)和其他信息,但陰影數(shù)據(jù)提取將以其他格式保存,并且無法用于恢復(fù)數(shù)據(jù)。
在某些情況下,您可能需要從計算機(jī)中刪除陰影數(shù)據(jù)提取。有關(guān)詳細(xì)信息,請參見 Tableau 知識庫中的由于 TTDE 文件的緣故導(dǎo)致磁盤空間不足。
另請參見
設(shè)置數(shù)據(jù)源 – 向此數(shù)據(jù)源中添加更多數(shù)據(jù),或者在分析數(shù)據(jù)之前準(zhǔn)備數(shù)據(jù)。
構(gòu)建圖表和分析數(shù)據(jù) – 開始數(shù)據(jù)分析。
總結(jié)
以上是生活随笔為你收集整理的tableau中文版教程pdf_PDF 文件的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 已经无法合并还报请合并git_Git不能
- 下一篇: sap 获取计划订单bapi_sapba