海豚调度(DolphinSchedulerDolphinScheduler)2.0的下载及安装(单机版)
下載安裝包
下載地址:
https://www.apache.org/dyn/closer.lua/dolphinscheduler/2.0.0-alpha/apache-dolphinscheduler-2.0.0-alpha-bin.tar.gz
基礎軟件安裝 自己操作 主要是zookeeper和mysql或者pg
1)MySQL (5.7系列) : MySQL則需要JDBC Driver 5.1.47+;
2)JDK (1.8+) : 必裝,請安裝好后在/etc/profile下配置 JAVA_HOME 及 PATH 變量;
3)ZooKeeper (3.4.6+) :必裝;
此教程以Mysql5.7,JDK1.8,Zookeeper3.6.3為準;
4)Hadoop (2.6+) or MinIO :選裝, 如果需要用到資源上傳功能,針對單機可以選擇本地文件目錄作為上傳文件夾(此操作不需要部署Hadoop);當然也可以選擇上傳到Hadoop or MinIO集群上
注意:DolphinScheduler本身不依賴Hadoop、Hive、Spark,僅是會調用他們的Client,用于對應任務的運行。
上傳,解壓包
[root@iZ2ze05aiu283ep3b124tlZ dolphinscheduler]# mkdir ./dolphinscheduler [root@iZ2ze05aiu283ep3b124tlZ dolphinscheduler]# cd ./dolphinscheduler# 解壓 [root@iZ2ze05aiu283ep3b124tlZ dolphinscheduler]# tar -zxvf apache-dolphinscheduler-2.0.0-alpha-bin.tar.gz數據庫初始化
我這里使用的是mysql 您這也可以使用pg庫道理是一樣的\
添加mysql 啟動包
注意: 如果是pg的話就不用了
我用的是mysql-connector-java-8.0.20.jar
修改數據庫 配置
vim apache-dolphinscheduler-2.0.0-alpha-bin/conf/datasource.properties # datasource configuration #spring.datasource.driver-class-name=org.postgresql.Driver #spring.datasource.url=jdbc:postgresql://127.0.0.1:5432/dolphinscheduler #spring.datasource.username=root #spring.datasource.password=root# mysql example #spring.datasource.driver-class-name=com.mysql.jdbc.Driver spring.datasource.driver-class-name=com.mysql.cj.jdbc.Driver spring.datasource.url=jdbc:mysql://127.0.0.1:3306/dolphinscheduler?useUnicode=true&characterEncoding=UTF-8 spring.datasource.username=admin spring.datasource.password=xxx初始化數據庫
sh script/create-dolphinscheduler.sh修改運行參數
修改 conf/env 目錄下的 dolphinscheduler_env.sh 環境變量
主要是修改java 其他用不到的可以不用改
export HADOOP_HOME=/opt/soft/hadoop export HADOOP_CONF_DIR=/opt/soft/hadoop/etc/hadoop export SPARK_HOME1=/opt/soft/spark1 export SPARK_HOME2=/opt/soft/spark2 export PYTHON_HOME=/opt/soft/python export JAVA_HOME=/opt/bigdata/java-se-8u41-ri export HIVE_HOME=/opt/soft/hive export FLINK_HOME=/opt/soft/flink export DATAX_HOME=/opt/soft/dataxexport PATH=$HADOOP_HOME/bin:$SPARK_HOME1/bin:$SPARK_HOME2/bin:$PYTHON_HOME/bin:$JAVA_HOME/bin:$HIVE_HOME/bin:$FLINK_HOME/bin:$DATAX_HOME/bin:$PATH修改一鍵部署配置文件 conf/config/install_config.conf中的各參數,特別注意以下參數的配置
vim conf/config/install_config.conf
主要修改下面這些 其他像hdfs yarn hive 這些用不到 可以不用管它 如果用的到就修改
# 這里填 mysql or postgresql dbtype="mysql"# 數據庫連接地址 dbhost="192.168.100.10:3306"# 數據庫名 dbname="dolphinscheduler2"# 數據庫用戶名,此處需要修改為上面設置的{user}具體值 username="zd3" # 數據庫密碼, 如果有特殊字符,請使用\轉義,需要修改為上面設置的{password}具體值 password="zd3123"#Zookeeper地址,單機本機是localhost:2181,記得把2181端口帶上 zkQuorum="192.168.100.12:2181"#將DS安裝到哪個目錄,如: /opt/soft/dolphinscheduler,不同于現在的目錄 installPath="/home/programs/dolphinscheduler2.0"#使用哪個用戶部署,使用第3節創建的用戶 deployUser="dolphinscheduler"# 郵件配置,以qq郵箱為例 # 郵件協議 mailProtocol="SMTP"# 郵件服務地址 mailServerHost="smtp.qq.com"# 郵件服務端口 mailServerPort="25"# mailSender和mailUser配置成一樣即可 # 發送者 mailSender="xxx@qq.com"# 發送用戶 mailUser="xxx@qq.com"# 郵箱密碼 mailPassword="xxx"# TLS協議的郵箱設置為true,否則設置為false starttlsEnable="true"# 開啟SSL協議的郵箱配置為true,否則為false。注意: starttlsEnable和sslEnable不能同時為true sslEnable="false"# 郵件服務地址值,參考上面 mailServerHost sslTrust="smtp.qq.com"# 業務用到的比如sql等資源文件上傳到哪里,可以設置:HDFS,S3,NONE,單機如果想使用本地文件系統,請配置為HDFS,因為HDFS支持本地文件系統;如果不需要資源上傳功能請選擇NONE。強調一點:使用本地文件系統不需要部署hadoop resourceStorageType="HDFS"# 這里以保存到本地文件系統為例 #注:但是如果你想上傳到HDFS的話,NameNode啟用了HA,則需要將hadoop的配置文件core-site.xml和hdfs-site.xml放到conf目錄下,本例即是放到/opt/dolphinscheduler/conf下面,并配置namenode cluster名稱;如果NameNode不是HA,則修改為具體的ip或者主機名即可 defaultFS="file:///data/dolphinscheduler" #hdfs://{具體的ip/主機名}:8020# 如果沒有使用到Yarn,保持以下默認值即可;如果ResourceManager是HA,則配置為ResourceManager節點的主備ip或者hostname,比如"192.168.xx.xx,192.168.xx.xx";如果是單ResourceManager請配置yarnHaIps=""即可 # 注:依賴于yarn執行的任務,為了保證執行結果判斷成功,需要確保yarn信息配置正確。 yarnHaIps="192.168.xx.xx,192.168.xx.xx"# 如果ResourceManager是HA或者沒有使用到Yarn保持默認值即可;如果是單ResourceManager,請配置真實的ResourceManager主機名或者ip singleYarnIp="yarnIp1"# 資源上傳根路徑,支持HDFS和S3,由于hdfs支持本地文件系統,需要確保本地文件夾存在且有讀寫權限 resourceUploadPath="/data/dolphinscheduler"# 具備權限創建resourceUploadPath的用戶 hdfsRootUser="hdfs"#在哪些機器上部署DS服務,本機選localhost ips="localhost"#ssh端口,默認22 sshPort="22"#master服務部署在哪臺機器上 masters="localhost"#worker服務部署在哪臺機器上,并指定此worker屬于哪一個worker組,下面示例的default即為組名 workers="localhost:default"#報警服務部署在哪臺機器上 alertServer="localhost"#后端api服務部署在在哪臺機器上 apiServers="localhost"一鍵啟動
sh bin/install.sh然后會讓你輸入密碼
大概有十次的樣子 輸完服務就啟動了
1)訪問前端頁面地址
海豚調度:http://ip:12345/dolphinscheduler 出現下面這個頁面說明安裝成功了
初始密碼是
admin/dolphinscheduler123
啟停服務
1)一鍵停止集群所有服務
sh ./bin/stop-all.sh
2)一鍵開啟集群所有服務
sh ./bin/start-all.sh
注意事項
(1)一定要配置好JAVA_HOME和PATH。
(2)在配置完Mysql的時候,執行完相應的建表語句,可以用可視化工具(Navicat等)連上數據庫查看一下,數據庫dolphinscheduler和表有沒有建成功。
(3)在一鍵部署的時候(sh install.sh),一定要確保zookeeper是啟動狀態,要不然會出現拒絕連接的錯誤。
(4)配置文件一定要好好審查,該配置的一定要全配置上,尤其是conf/config/install_config.conf中的各參數。
總結
以上是生活随笔為你收集整理的海豚调度(DolphinSchedulerDolphinScheduler)2.0的下载及安装(单机版)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 成为Linux大神——必须要具备的基本技
- 下一篇: 【开发工具】【perf】性能分析工具pe