Kettle下载安装使用
Kettle下載安裝使用
- 1. 下載
- 2. 解壓
- 3. Kettle使用,新建轉(zhuǎn)換
1. 下載
如果您是 Pentaho 的新手,您有時可能會看到或聽到被稱為“Kettle”的 Pentaho 數(shù)據(jù)集成。Pentaho Data Integration 最初是一個名為“Kettle”的開源項目。術(shù)語 KETTLE 是一個遞歸術(shù)語,代表 Kettle Extraction Transformation Transport Load Environment。Pentaho 收購 Kettle 后,更名為 Pentaho Data Integration。其他 PDI 組件(例如Spoon、Pan和Kitchen)的名稱最初是為了支持 ETL 產(chǎn)品的“烹飪”隱喻。
——Pentaho幫助文檔, Google翻譯
Kettle是一款開源免費(fèi)的ETL工具,ETL全稱 Extract - Transform - Load 意味著數(shù)據(jù)抽取,轉(zhuǎn)換,裝載的過程。
ETL是將業(yè)務(wù)系統(tǒng)的數(shù)據(jù)經(jīng)過抽取、清洗轉(zhuǎn)換之后加載到數(shù)據(jù)倉庫的過程,目的是將企業(yè)中的分散、零亂、標(biāo)準(zhǔn)不統(tǒng)一的數(shù)據(jù)整合到一起,為企業(yè)的決策提供分析依據(jù), ETL是BI(商業(yè)智能)項目重要的一個環(huán)節(jié)。
——百度
1)kettle下載地址:官網(wǎng)
2)再下個mysql驅(qū)動包:下載地址,打開地址選擇Platform Independent,然后點擊下載,有驅(qū)動包就不用下載了。
下載好后將文件解壓,將里面的 mysql-connector-java-5.1.49-bin.jar 放到,kettle解壓的lib下面( \data-integration\lib)。
3) 因為我需要用到db2,所以又下載了個db2驅(qū)動包,密碼:188p,還是放在lib目錄下,
把這兩個都放在和剛才mysql驅(qū)動包同樣的地方。(不用db2,只用mysql忽略此步,反正就是用什么數(shù)據(jù)庫按什么驅(qū)動)
2. 解壓
解壓后,點開Spoon.bat啟動
Spoon.bat:在Windows平臺上運(yùn)行spoon;
Spoon.sh:在Linux、AppleOSX、Solaris平臺上運(yùn)行Spoon。
3. Kettle使用,新建轉(zhuǎn)換
對了,需要準(zhǔn)備Java軟件的運(yùn)行環(huán)境,需要先安裝JDK,jdk1.8版本就行,配置環(huán)境變量。學(xué)過Java的應(yīng)該都有吧,不會有人沒有吧。
PDI 客戶端(也稱為 Spoon)是一個桌面應(yīng)用程序,使您能夠構(gòu)建轉(zhuǎn)換以及安排和運(yùn)行作業(yè)。
PDI 客戶端的常見用途包括:
不同數(shù)據(jù)庫和應(yīng)用程序之間的數(shù)據(jù)遷移
充分利用云、集群和大規(guī)模并行處理環(huán)境將大量數(shù)據(jù)集加載到數(shù)據(jù)庫中
數(shù)據(jù)清理步驟從非常簡單到非常復(fù)雜的轉(zhuǎn)換
數(shù)據(jù)集成,包括利用實時 ETL 作為 Pentaho Reporting 數(shù)據(jù)源的能力
內(nèi)置支持緩慢變化的維度和代理鍵創(chuàng)建的數(shù)據(jù)倉庫填充(如上所述)
Pentaho幫助文檔
下面要實現(xiàn)的就是將一個數(shù)據(jù)庫表的數(shù)據(jù),抽取轉(zhuǎn)換裝載到另一個數(shù)據(jù)庫的表里。
兩個數(shù)據(jù)庫里的表內(nèi)容是這樣的。
1) 新建轉(zhuǎn)換:可以直接Ctrl+N,也可以右鍵轉(zhuǎn)換新建,雙擊轉(zhuǎn)換也行。
新建后會出現(xiàn)下圖所示的界面。保存一下,我起名叫demo.
2)表輸入
選擇表輸入直接拖拽到右側(cè),或者雙擊都行。表輸入這個在輸入下面,不知道在哪,直接在上面搜索就行。
配置表輸入
新建連接
防止亂碼
2)插入更新
將輸出里面的插入/更新拖進(jìn)去,按shift連表輸入到插入/更新
配置插入更新,新建了個數(shù)據(jù)庫連接用來連接student表
3)運(yùn)行
點擊左上角那塊運(yùn)行,成功下面會有綠色的符號
結(jié)果是這樣的,就是性別那部分想男為1,女為0,所以再加一步值映射
4)值映射在轉(zhuǎn)換里,或者搜索一下拖拽進(jìn)去,直接拽 到這兩個中間。
配置一下,選擇要映射的字段,編輯字段要映射成的值,然后運(yùn)行一下,刷新下表就行了。
5)現(xiàn)在想將男女兩部分分開,用過濾記錄,將過濾記錄拖入進(jìn)去如下圖所在位置。
過濾記錄后面的對號和紅色的× 不是正確或者錯誤的意思,是過濾完成的數(shù)據(jù)走對號,被過濾掉的走×。
過濾條件是sex = 1, 將為1的true數(shù)據(jù)發(fā)送給男,false錯誤的發(fā)送給女。
我新加了個插入更新,更名為男和女
運(yùn)行一下。運(yùn)行之前我將之前student表里的數(shù)據(jù)全部刪除,又建了一個表用來放性別女的數(shù)據(jù),原先的就用來放性別男的數(shù)據(jù)。
OK,過濾成功。
總結(jié)
以上是生活随笔為你收集整理的Kettle下载安装使用的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: docker 安装svnserver
- 下一篇: oracle索引失效解决,Oracle索