SparkSQL之thriftserver/beeline的使用
啟動thriftserver
使用命令啟動:./start-thriftserver.sh --master local[2] --jars /home/iie4bu/software/mysql-connector-java-5.1.35.jar。
然后使用jps -m查看,可以看到SparkSubmit
同樣可以通過瀏覽器進行訪問。實際上beeline訪問端口則需要訪問10000
啟動客戶端beeline
使用命令:bin/beeline -u jdbc:hive2://manager:10000 -n iie4bu
上面的圖展示了正確連接的情況。
使用命令查看表:show tables;
查詢語句:select * from sal s join people p on s.transactionid=p.id;
可以在瀏覽器中查看到作業:
可以查看詳細的執行計劃。
當我們在啟動一個beeline時,會出現兩個session:
修改thriftserver啟動時的默認端口
首先將上面的beeline和thriftserver停止。
然后啟動thriftserver時,指定端口號:14000。
./start-thriftserver.sh --master local[2] --jars /home/iie4bu/software/mysql-connector-java-5.1.35.jar --hiveconf hive.server2.thrift.port=14000
然后啟動beeline客戶端:
beeline -u jdbc:hive2://manager:14000 -n iie4bu,啟動成功:
thriftserver與spark-shell/spark-sql區別
spark-shell和spark-sql啟動時每次都需要重新申請資源,都是一個新的spark application。
thriftserver不管啟動多少個客戶端(beeline/jdbc方式),永遠都是一個spark application。好處一:是只要在啟動時申請一次就可以了,不需要在申請資源了。好處二:當一個客戶端修改一個表之后,另一個客戶端可以看到,解決了數據共享的問題,多個客戶端可以共享數據。
總結
以上是生活随笔為你收集整理的SparkSQL之thriftserver/beeline的使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Spark-shell和Spark-hi
- 下一篇: linux cmake编译源码,linu