datax 模板_dataX3.0安装使用手册.docx
DataX3.0使用手冊目錄一、dataX概述11dataX作用12DataX3.0框架設計23DataX3.0插件體系2二、dataX安裝31創建用戶組及用戶32環境變量配置43安裝python4三、dataX使用41生成配置文件模板42配置定時任務73常見問題及處理8四、dataX插件開發及安裝81.Reader插件開發82.Writter插件開發93.插件部署10dataX概述dataX作用DataX 是一個異構數據源離線同步工具,致力于實現包括關系型數據庫(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各種異構數據源之間穩定高效的數據同步功能。為了解決異構數據源同步問題,DataX將復雜的網狀的同步鏈路變成了星型數據鏈路,DataX作為中間傳輸載體負責連接各種數據源。當需要接入一個新的數據源的時候,只需要將此數據源對接到DataX,便能跟已有的數據源做到無縫數據同步。DataX3.0框架設計DataX本身作為離線數據同步框架,采用Framework + plugin架構構建。將數據源讀取和寫入抽象成為Reader/Writer插件,納入到整個同步框架中。Reader:Reader為數據采集模塊,負責采集數據源的數據,將數據發送給Framework。Writer: Writer為數據寫入模塊,負責不斷向Framework取數據,并將數據寫入到目的端。Framework:Framework用于連接reader和writer,作為兩者的數據傳輸通道,并處理緩沖,流控,并發,數據轉換等核心技術問題。DataX3.0插件體系類型數據源Reader(讀)Writer(寫)RDBMS 關系型數據庫MySQL√√?Oracle√√?SQL Server√√?PostgreSQL√√?達夢√√?通用RDBMS(支持所有關系型數據庫)√√阿里云數倉數據存儲MaxCompute(原ODPS)√√?Analytic DB(原ADS)?√?OSS√√?云數據庫Memcache版(原OCS)√√Hive√NoSQL數據存儲Table Store(原OTS)√√?Hbase0.94√√?Hbase1.1√√?MongoDB√√無結構化數據存儲TxtFile√√JsonFile√?FTP√√?HDFS√√dataX安裝創建用戶組及用戶root@hmaster-hdfs:/home/ubuntu# groupadd dataxroot@hmaster-hdfs:/home/ubuntu# useradd -g datax datax -m -d /home/dataxroot@hmaster-hdfs:/home/ubuntu# passwd dataxEnter new UNIX password: Retype new UNIX password: passwd: password updated successfullyroot@hmaster-hdfs:/home/ubuntu# usermod -G adm -a dataxroot@hmaster-hdfs:/home/ubuntu# su - dataxdatax@hmaster-hdfs:~$ iduid=1004(datax) gid=1000(ubuntu) groups=1000(ubuntu),4(adm),1002(datax)環境變量配置export JAVA_HOME=/usr/java/jdk1.7.0_80export JRE_HOME=${JAVA_HOME}/jreexport CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/libexport PATH=$JAVA_HOME/binexport LANG=zh_CN.UTF-8安裝pythondatax@hmaster-hdfs:/home/ubuntu$ pythonPython 2.7.6 (default, Jun 22 2015, 17:58:13) [GCC 4.8.2] on linux2Type "help", "copyright", "credits" or "license" for more information.dataX使用生成配置文件模板命令:bin/python datax.py -r {YOUR_READER} -w {YOUR_WRITER}案例1:mysqlreader-> mysqlwriterdatax@hmaster-hdfs:~/datax3/datax/bin$ python datax.py -r mysqlreader -w mysqlwriterDataX (DATAX-OPENSOURCE-1
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的datax 模板_dataX3.0安装使用手册.docx的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python自动写作软件_开发了一款写作
- 下一篇: 配置根目录_npm配置文件package