日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Spark2.2.0 分布式离线搭建

發布時間:2025/5/22 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Spark2.2.0 分布式离线搭建 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1、Spark簡介

Apache Spark 是專為大規模數據處理而設計的快速通用的計算引擎。Spark是UC Berkeley AMP lab (加州大學伯克利分校的AMP實驗室)所開源的類Hadoop MapReduce的通用并行框架,Spark,擁有Hadoop MapReduce所具有的優點;但不同于MapReduce的是——Job中間輸出結果可以保存在內存中,從而不再需要讀寫HDFS,因此Spark能更好地適用于數據挖掘與機器學習等需要迭代的MapReduce的算法。

Spark 是一種與 Hadoop 相似的開源集群計算環境,但是兩者之間還存在一些不同之處,這些有用的不同之處使 Spark 在某些工作負載方面表現得更加優越,換句話說,Spark 啟用了內存分布數據集,除了能夠提供交互式查詢外,它還可以優化迭代工作負載。

Spark 是在 Scala 語言中實現的,它將 Scala 用作其應用程序框架。與 Hadoop 不同,Spark 和 Scala 能夠緊密集成,其中的 Scala 可以像操作本地集合對象一樣輕松地操作分布式數據集。

盡管創建 Spark 是為了支持分布式數據集上的迭代作業,但是實際上它是對 Hadoop 的補充,可以在 Hadoop 文件系統中并行運行。通過名為 Mesos 的第三方集群框架可以支持此行為。Spark 由加州大學伯克利分校 AMP 實驗室 (Algorithms, Machines, and People Lab) 開發,可用來構建大型的、低延遲的數據分析應用程序。

2、部署準備

2.1、安裝包準備

  • spark-2.2.0-bin-hadoop2.6.tgz
  • jdk-8u161-linux-x64.tar.gz
  • scala-2.11.0.tgz

2.2、節點配置信息

2.3、節點資源配置信息

3、集群配置與啟動

3.1、安裝包上傳與解壓

操作節點:risen01

操作用戶:root

  • 上傳安裝包spark-2.2.0-bin-hadoop2.6.tgz,scala-2.11.0.tgz,jdk-8u161-linux-x64.tar.gz(如果已經存在則不需要此步驟)到 risen01節點下的~/packages目錄下,結果如圖所示:
  • 2、解壓JDK安裝包,Spark安裝包Scala安裝包和到/usr/local下

    操作節點:risen01

    操作用戶:root

    解壓JDK命令:

    tar -zxvf ~/packeages/jdk-8u161-linux-x64.tar.gz -C /usr/local

    解壓spark命令:

    tar -zxvf ~/packages/spark-2.2.0-bin-hadoop2.6.tgz -C /usr/local

    解壓Scala命令:

    tar -zxvf ~/packages/scala-2.11.0.tgz -C /usr/local

    3.2、啟動前準備

    操作節點:risen01,risen02,risen03

    操作用戶:root

  • 在/data目錄下新建立spark/work目錄用來存放spark的任務處理日志
  • 在/log目錄下新建立spark目錄用來存放spark的啟動日志等
  • 3.3、修改配置文件

    3.3.1、編輯spark-env.sh文件

    操作節點:risen01

    操作用戶:root

    說明:請根據實際集群的規模和硬件條件來配置每一項參數

    進入到/usr/local/spark-2.2.0-bin-hadoop2.6/conf目錄下執行命令:

    cp spark-env.sh.template spark-env.sh

    編輯spark-env.sh文件,添加以下內容:

    #設置spark的web訪問端口 SPARK_MASTER_WEBUI_PORT=18080#設置spark的任務處理日志存放目錄 SPARK_WORKER_DIR=/data/spark/work#設置spark每個worker上面的核數 SPARK_WORKER_CORES=2#設置spark每個worker的內存 SPARK_WORKER_MEMORY=1g#設置spark的啟動日志等目錄 SPARK_LOG_DIR=/log/spark#指定spark需要的JDK目錄 export JAVA_HOME=/usr/local/jdk1.8.0_161#指定spark需要的Scala目錄 export SCALA_HOME=/usr/local/scala-2.11.0#指定Hadoop的安裝目錄 export HADOOP_HOME=/opt/cloudera/parcels/CDH/lib/hadoop#指定Hadoop的配置目錄 export HADOOP_CONF_DIR=/opt/cloudera/parcels/CDH/lib/hadoop/etc/hadoop/#實現spark-standlone HA(因為我們HA實現的是risen01和risen02之間的切換不涉及risen03,所以這段配置risen03可有可無) export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=risen01:2181,risen02:2181,risen03:2181 -Dspark.deploy.zookeeper.dir=/data/spark"

    3.3.2、 編輯spark-defaults.conf文件

    操作節點:risen01

    操作用戶:root

    說明:請根據實際集群的規模和硬件條件來配置每一項參數

    進入到/usr/local/spark-2.2.0-bin-hadoop2.6/conf目錄下執行命令:

    cp spark-defaults.conf.template spark-defaults.conf

    編輯spark-defaults.conf文件,添加以下內容:

    #設置spark的主節點 spark.master spark://risen01:7077#開啟eventLog spark.eventLog.enabled true#設置eventLog存儲目錄 spark.eventLog.dir /log/spark/eventLog#設置spark序列化方式 spark.serializer org.apache.spark.serializer.KryoSerializer#設置spark的driver內存 spark.driver.memory 1g#設置spark的心跳檢測時間間隔 spark.executor.heartbeatInterval 20s#默認并行數 spark.default.parallelism 20#最大網絡延時 spark.network.timeout 3000s

    3.3.3、 編輯slaves文件

    操作節點:risen01

    操作用戶:root

    說明:請根據實際集群的規模和硬件條件來配置每一項參數

    進入到/usr/local/spark-2.2.0-bin-hadoop2.6/conf目錄下執行命令:

    cp slaves.templete slaves

    編輯slaves文件,修改localhost為:

    risen01 risen02 risen03

    3.4、分發其他節點

  • 執行scp命令:
  • 操作節點:risen01

    操作用戶:root

    scp -r /usr/local/spark-2.2.0-bin-hadoop2.6 root@risen02:/usr/local scp -r /usr/local/scala-2.11.0 root@risen02:/usr/local scp -r /usr/local/jdk1.8.0_161 root@risen02:/usr/local scp -r /usr/local/spark-2.2.0-bin-hadoop2.6 root@risen03:/usr/local scp -r /usr/local/scala-2.11.0 root@risen03:/usr/local scp -r /usr/local/jdk1.8.0_161 root@risen03:/usr/local
  • 需要提前創建好bigdata用戶并實現免密(這里不再贅述,此步驟如果做過可不做)
  • 權限修改
  • 操作節點:risen01,risen02,risen03

    操作用戶:root

    修改/log/spark權限命令:

    chown -R bigdata.bigdata /log/spark

    修改/data/spark權限命令:

    chown -R bigdata.bigdata /data/spark

    修改spark的安裝目錄命令:

    chown -R bigdata.bigdata /usr/local/spark-2.2.0-bin-hadoop2.6

    修改Scala的安裝目錄命令:

    chown -R bigdata.bigdata /usr/local/scala-2.11.0

    修改JDK1.8的安裝目錄命令:(此步驟如果做過可不做)

    chown -R bigdata.bigdata /usr/local/jdk1.8.0_161

    結果如圖下所示:

    3.5、啟動集群

    操作節點:risen01,risen02

    操作用戶:bigdata

    (1) 進入到/usr/local/spark-2.2.0-bin-hadoop2.6/sbin目錄下執行./start-all.sh,查看web界面如下圖所示:

    然后在進入到risen02機器的spark安裝目錄下/usr/local/spark-2.2.0-bin-hadoop2.6/sbin執行命令./start-master.sh啟動spark集群的備用主節點。(記得一定要啟動備用主節點的進程,這里我們只用risen02做備用主節點,risen03雖然也配置了有資格,但是暫時我們不需要)

    (2) 進入到/usr/local/spark-2.2.0-bin-hadoop2.6/bin目錄下執行spark-shell,并測試統計詞頻的測試,結果如下圖所示:

    截止到此,spark-standlone模式便安裝成功了!

    推薦閱讀:https://www.roncoo.com/course/view/c4e0130ea2354c71a2cb9ba24348746c

    文章來源:https://my.oschina.net/blogByRzc/blog/1800450

    總結

    以上是生活随笔為你收集整理的Spark2.2.0 分布式离线搭建的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 黄色片国产| 亚洲国产精选 | 99久久精品无免国产免费 | 激情啪啪网 | 欧美日韩a级 | 西方裸体在线观看 | 国产成人精品久久二区二区91 | 美日韩免费视频 | 国产精品久久不卡 | 人妻少妇偷人精品久久久任期 | 女人天堂网站 | 国产人妖av| 日本高清视频www夜色资源 | 自由 日本语 热 亚洲人 | 免费观看一区二区三区视频 | 中文字幕女同女同女同 | 五月天中文字幕在线 | 精品久久久亚洲 | 中文字幕在线免费看 | 男人天堂a在线 | 黄色片视频在线观看 | 国产一线二线在线观看 | 亚色在线观看 | 最新高清无码专区 | japanese在线| 亚洲高清视频免费观看 | 裸体美女免费视频网站 | 岛国av噜噜噜久久久狠狠av | 亚洲精品www | 国产真实乱人偷精品人妻 | 91麻豆国产福利精品 | 天天干天天插天天操 | 中文字幕+乱码+中文 | 少妇一级淫片免费放 | 视频区小说区图片区 | 欧美色图888| 欧美亚洲另类小说 | 欧美群交射精内射颜射潮喷 | 亚洲欧美视频 | 成人观看视频 | 成年人视频免费看 | 亚洲中国色老太 | 日韩av综合网 | 91在线观看网站 | 天天躁日日摸久久久精品 | 日韩毛片网 | 亚洲国产成人精品久久久 | 久久久久久电影 | 久久视频免费在线观看 | 色先锋影院| 在线视频这里只有精品 | 妺妺窝人体色www聚色窝仙踪 | 日韩精品网址 | 国产一区日韩精品 | 中文字幕av无码一区二区三区 | 少妇中文字幕 | 窝窝视频在线 | 午夜在线一区二区三区 | 欧美激情欧美激情在线五月 | 91肉色超薄丝袜脚交一区二区 | 粉嫩欧美一区二区三区 | 国产盗摄av | 亚洲欧美色图 | 亚洲精品喷潮一区二区三区 | 国产精品一区在线观看 | 国产午夜精品久久久久久久久久 | 精品国产精品国产偷麻豆 | 男人天堂视频在线观看 | 国产91视频播放 | 国产成人无码久久久精品天美传媒 | 色悠悠视频 | 爽爽爽av | 久久99国产精品久久99果冻传媒 | 午夜视频在线看 | 日本久操| 久久久九九九九 | 五月天天色 | 波多野结衣中文一区 | 亚洲一区免费在线观看 | 91视频在线观看免费 | 午夜理伦三级理论 | 五月婷婷操 | va婷婷在线免费观看 | 亚洲第8页 | 超碰超在线| 91狠狠干 | 成人毛片av | 免费又黄又爽又猛大片午夜 | 国产在线综合网 | wwwxx在线 | 日韩无码精品一区二区 | 国产aaa | 91久久久久久久久久久久久 | 一级毛片黄色 | 精品三级在线观看 | 美女扒开尿口让男人桶 | 999色综合 | 日本污污网站 | 精品在线播放 |