hive 修改cluster by算法_Hive基础之导出数据
我們在hive中分析完數(shù)據(jù)后有時(shí)候需要將結(jié)果導(dǎo)出到本地文件以供其他用途。hive中提供了幾種方式來導(dǎo)出結(jié)果,下面就詳細(xì)介紹一些這幾種導(dǎo)出數(shù)據(jù)的方法。
1.導(dǎo)出到本地文件目錄
(default查看一下在本地目錄保存的文件:
[root@node3 datas可以看出,導(dǎo)出后保存的文件名稱為000000_0,導(dǎo)出是以默認(rèn)的分隔符來分隔數(shù)據(jù)的。 上面的導(dǎo)出方式?jīng)]有加入格式,我們可以使用創(chuàng)建表時(shí)的格式語法來定義導(dǎo)出的數(shù)據(jù)格式:
insert執(zhí)行結(jié)果如下:
hive (default)> insert overwrite local directory '/opt/datas/hive_exp_emp2'> ROW FORMAT DELIMITED FIELDS TERMINATED BY 't' > COLLECTION ITEMS TERMINATED BY 'n'> select * from default.emp ; Query ID = hive_20190217172424_622c001a-7ca4-4a49-94dc-468cdd6a0475 Total jobs = 1 Launching Job 1 out of 1 Number of reduce tasks is set to 0 since there's no reduce operator Starting Job = job_1550060164760_0006, Tracking URL = http://node1:8088/proxy/application_1550060164760_0006/ Kill Command = /opt/cloudera/parcels/CDH-5.15.2-1.cdh5.15.2.p0.3/lib/hadoop/bin/hadoop job -kill job_1550060164760_0006 Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 0 2019-02-17 17:24:43,307 Stage-1 map = 0%, reduce = 0% 2019-02-17 17:25:38,391 Stage-1 map = 100%, reduce = 0%, Cumulative CPU 1.55 sec MapReduce Total cumulative CPU time: 1 seconds 550 msec Ended Job = job_1550060164760_0006 Copying data to local directory /opt/datas/hive_exp_emp2 MapReduce Jobs Launched: Stage-Stage-1: Map: 1 Cumulative CPU: 1.55 sec HDFS Read: 4814 HDFS Write: 661 SUCCESS Total MapReduce CPU Time Spent: 1 seconds 550 msec OK empno ename job mgr hiredate sal comm deptno Time taken: 95.151 seconds查看一下結(jié)果:
[root@node3 hive_exp_emp可以看出,查詢導(dǎo)出來的結(jié)果是以制表符來進(jìn)行分割的。
2.命令行導(dǎo)出
還有一種方式是直接使用hive命令,加入?yún)?shù)-e來導(dǎo)出到本地文件。
[root@node3 datas可以看出,通過命令的方式也可以將hive表中的結(jié)果導(dǎo)出到本地表。
3.導(dǎo)出到hdfs文件系統(tǒng)
第三種方式是將查詢結(jié)果保存在hdfs文件系統(tǒng)中,只需要將local關(guān)鍵字去除即可。
(default需要將導(dǎo)出的文件從hdfs上下載到本地才能夠進(jìn)行查看:
[root@node3 datas4.通過Sqoop工具
另外還可以使用Sqoop工具將hive中的數(shù)據(jù)導(dǎo)入到型數(shù)據(jù)庫中,該工具也可以將關(guān)系型數(shù)據(jù)導(dǎo)入到hive或hdfs中,后面會(huì)詳細(xì)介紹該工具。
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)總結(jié)
以上是生活随笔為你收集整理的hive 修改cluster by算法_Hive基础之导出数据的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: php 定时缓存,php定时清理缓存文件
- 下一篇: httpd Server not sta