日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

基于Spark的机器学习实践 (三) - 实战环境搭建

發布時間:2023/12/15 编程问答 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 基于Spark的机器学习实践 (三) - 实战环境搭建 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

0 相關源碼

1 Spark環境安裝

◆ Spark 由scala語言編寫,提供多種語言接口,需要JVM

◆ 官方為我們提供了Spark 編譯好的版本,可以不必進行手動編譯

◆ Spark安裝不難,配置需要注意,并且不一定需要Hadoop環境

  • 下載

  • 解壓

tar zxvf spark-2.4.1-bin-hadoop2.7.tgz 復制代碼

2 Spark配置

◆ 在配置前盡量先閱讀官方文檔,避免直接從網上找配置教程

◆ 要為節點設 置好使用的內存,否則可能導致節點利用率低;

◆ 注意spark中IP與端口號的配置,以免UnknownHostException

官網配置

  • 應用默認配置

  • 配置文件

  • 復制兩份模板,開啟自行配置

單機環境配置

  • 本地IP

shell進行驗證

bin/spark-shell 復制代碼

3 Spark shell

◆ Spark shell是一個bash腳本,在./bin目錄下

◆ Spark shell 為我們事先配置好了上下文(context) 和會話(session)

  • context實例

  • session實例

  • UI

4 實戰Wordcount

4.1 Wordcount簡介

◆ Wordcount 詞頻統計,是大數據分析中最為基礎的一種任務 英文分詞較容易,直接分割空格即可。

◆ 實現思路 首先將文件中所有的單詞提取出來,然后合并相同單詞

  • 實現示意圖

項目搭建

  • 添加spark jar包

  • 全選jar包,先左鍵選中第一個,再拉到最后shift,再左鍵最后一個實現全選.

  • 新建類

  • 測試文件

`pwd`/`ls |grep L` 復制代碼

  • 編寫函數

  • 運行成功

  • 打包

  • 移除這些多余的jar包

  • 構建

  • 將jar包放到spark/bin目錄下 使用 Spark-submit 運行

Spark機器學習實踐系列

  • 基于Spark的機器學習實踐 (一) - 初識機器學習
  • 基于Spark的機器學習實踐 (二) - 初識MLlib
  • 基于Spark的機器學習實踐 (三) - 實戰環境搭建

轉載于:https://juejin.im/post/5cac4cb15188251b2f3a41af

總結

以上是生活随笔為你收集整理的基于Spark的机器学习实践 (三) - 实战环境搭建的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。