Kettle on MaxCompute使用指南
簡介:?Kettle是一款開源的ETL工具,純java實現,可以運行于Windows, Unix, Linux上運行,提供圖形化的操作界面,可以通過拖拽控件的方式,方便地定義數據傳輸的拓撲。Kettle支持豐富的數據輸入輸出源,數據庫支持Oracle,MySql,DB2等,也支持業界各種開源的大數據系統,例如HDFS, HBase, Cassandra, MongoDB等。本文將介紹如何利用MaxCompute的插件無縫對接阿里云的大數據計算平臺——MaxCompute。
| 本示例使用的工具及驅動版本 | |
| Kettle | 8.2.0.0-342 |
| MaxCompute JDBC驅動 | v3.2.8 |
Setup
Job
我們可以通過Kettle + MaxCompute JDBC driver來實現對MaxCompute中任務的組織和執行。
首先需要執行以下操作:
JDBC連接串格式為:jdbc:odps:<maxcompute_endpoint>?project=<maxcompute_project_name>
JDBC driver class為:com.aliyun.odps.jdbc.OdpsDriver
Username為阿里云AccessKey Id
Password為阿里云AccessKey Secret
JDBC更多配置見:https://help.aliyun.com/document_detail/161246.html
之后,可以根據業務需要,通過SQL節點訪問MaxCompute。下面我們以一個簡單的ETL過程為例:
?Create table節點的配置如下:
需要注意:
Load from OSS節點配置如下:
?需要注意的點同Create table節點。有關更多Load的用法,見:https://help.aliyun.com/document_detail/157418.html
Processing節點配置如下:
?需要注意的點同Create table節點。
原文鏈接
本文為阿里云原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的Kettle on MaxCompute使用指南的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Apsara Stack 技术百科 |
- 下一篇: 阿里云万郁香:多样付费选择构筑成本最优的