日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Kettle下载安装使用

發(fā)布時間:2023/12/31 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Kettle下载安装使用 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

Kettle下載安裝使用

  • 1. 下載
  • 2. 解壓
    • 3. Kettle使用,新建轉(zhuǎn)換

1. 下載

如果您是 Pentaho 的新手,您有時可能會看到或聽到被稱為“Kettle”的 Pentaho 數(shù)據(jù)集成。Pentaho Data Integration 最初是一個名為“Kettle”的開源項目。術(shù)語 KETTLE 是一個遞歸術(shù)語,代表 Kettle Extraction Transformation Transport Load Environment。Pentaho 收購 Kettle 后,更名為 Pentaho Data Integration。其他 PDI 組件(例如Spoon、Pan和Kitchen)的名稱最初是為了支持 ETL 產(chǎn)品的“烹飪”隱喻。

——Pentaho幫助文檔, Google翻譯

Kettle是一款開源免費(fèi)的ETL工具,ETL全稱 Extract - Transform - Load 意味著數(shù)據(jù)抽取,轉(zhuǎn)換,裝載的過程。
ETL是將業(yè)務(wù)系統(tǒng)的數(shù)據(jù)經(jīng)過抽取、清洗轉(zhuǎn)換之后加載到數(shù)據(jù)倉庫的過程,目的是將企業(yè)中的分散、零亂、標(biāo)準(zhǔn)不統(tǒng)一的數(shù)據(jù)整合到一起,為企業(yè)的決策提供分析依據(jù), ETL是BI(商業(yè)智能)項目重要的一個環(huán)節(jié)。
——百度


1)kettle下載地址:官網(wǎng)

2)再下個mysql驅(qū)動包:下載地址,打開地址選擇Platform Independent,然后點擊下載,有驅(qū)動包就不用下載了。
下載好后將文件解壓,將里面的 mysql-connector-java-5.1.49-bin.jar 放到,kettle解壓的lib下面( \data-integration\lib)。

3) 因為我需要用到db2,所以又下載了個db2驅(qū)動包,密碼:188p,還是放在lib目錄下,
把這兩個都放在和剛才mysql驅(qū)動包同樣的地方。(不用db2,只用mysql忽略此步,反正就是用什么數(shù)據(jù)庫按什么驅(qū)動)

2. 解壓

解壓后,點開Spoon.bat啟動

Spoon.bat:在Windows平臺上運(yùn)行spoon;
Spoon.sh:在Linux、AppleOSX、Solaris平臺上運(yùn)行Spoon。

3. Kettle使用,新建轉(zhuǎn)換

對了,需要準(zhǔn)備Java軟件的運(yùn)行環(huán)境,需要先安裝JDK,jdk1.8版本就行,配置環(huán)境變量。學(xué)過Java的應(yīng)該都有吧,不會有人沒有吧。

PDI 客戶端(也稱為 Spoon)是一個桌面應(yīng)用程序,使您能夠構(gòu)建轉(zhuǎn)換以及安排和運(yùn)行作業(yè)。
PDI 客戶端的常見用途包括:
不同數(shù)據(jù)庫和應(yīng)用程序之間的數(shù)據(jù)遷移
充分利用云、集群和大規(guī)模并行處理環(huán)境將大量數(shù)據(jù)集加載到數(shù)據(jù)庫中
數(shù)據(jù)清理步驟從非常簡單到非常復(fù)雜的轉(zhuǎn)換
數(shù)據(jù)集成,包括利用實時 ETL 作為 Pentaho Reporting 數(shù)據(jù)源的能力
內(nèi)置支持緩慢變化的維度和代理鍵創(chuàng)建的數(shù)據(jù)倉庫填充(如上所述)

Pentaho幫助文檔

下面要實現(xiàn)的就是將一個數(shù)據(jù)庫表的數(shù)據(jù),抽取轉(zhuǎn)換裝載到另一個數(shù)據(jù)庫的表里。
兩個數(shù)據(jù)庫里的表內(nèi)容是這樣的。

1) 新建轉(zhuǎn)換:可以直接Ctrl+N,也可以右鍵轉(zhuǎn)換新建,雙擊轉(zhuǎn)換也行。
新建后會出現(xiàn)下圖所示的界面。保存一下,我起名叫demo.

2)表輸入
選擇表輸入直接拖拽到右側(cè),或者雙擊都行。表輸入這個在輸入下面,不知道在哪,直接在上面搜索就行。
配置表輸入

新建連接

防止亂碼

2)插入更新
將輸出里面的插入/更新拖進(jìn)去,按shift連表輸入到插入/更新

配置插入更新,新建了個數(shù)據(jù)庫連接用來連接student表

3)運(yùn)行
點擊左上角那塊運(yùn)行,成功下面會有綠色的符號

結(jié)果是這樣的,就是性別那部分想男為1,女為0,所以再加一步值映射

4)值映射在轉(zhuǎn)換里,或者搜索一下拖拽進(jìn)去,直接拽 到這兩個中間。

配置一下,選擇要映射的字段,編輯字段要映射成的值,然后運(yùn)行一下,刷新下表就行了。


5)現(xiàn)在想將男女兩部分分開,用過濾記錄,將過濾記錄拖入進(jìn)去如下圖所在位置。

過濾記錄后面的對號和紅色的× 不是正確或者錯誤的意思,是過濾完成的數(shù)據(jù)走對號,被過濾掉的走×。

過濾條件是sex = 1, 將為1的true數(shù)據(jù)發(fā)送給男,false錯誤的發(fā)送給女。

我新加了個插入更新,更名為男和女

運(yùn)行一下。運(yùn)行之前我將之前student表里的數(shù)據(jù)全部刪除,又建了一個表用來放性別女的數(shù)據(jù),原先的就用來放性別男的數(shù)據(jù)。

OK,過濾成功。

總結(jié)

以上是生活随笔為你收集整理的Kettle下载安装使用的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。