日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

hive 自定义元数据表_Hive分区表和桶表的使用

發(fā)布時(shí)間:2024/4/11 编程问答 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 hive 自定义元数据表_Hive分区表和桶表的使用 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

我們看官網(wǎng)文檔中這個(gè)地方

我們先創(chuàng)建好數(shù)據(jù)庫(kù),以供練習(xí)

使用數(shù)據(jù)庫(kù)

我們創(chuàng)建數(shù)據(jù)表

我們創(chuàng)建分區(qū)表,選取的字段不能是表中存在的字段

元數(shù)據(jù)信息

Formatted信息

那我們加載信息

load data local inpath '/data/hivetest/dept.txt' into table dept_partition partition(bmbh=1);

我們查看數(shù)據(jù)

我們看下HDFS上,是目錄的形式

所以我們可以多加載幾份數(shù)據(jù)

查看數(shù)據(jù)和HDFS上

也可以創(chuàng)建二級(jí)分區(qū)

載入數(shù)據(jù)

查看下數(shù)據(jù)

查看下元數(shù)據(jù)

再看下HDFS

我們就可以依據(jù)條件查詢使用where語句

注:分區(qū)表可以提高查詢的效率。

我們?cè)倏催@個(gè)地方-桶表

這個(gè)和分區(qū)表不一樣的地方,選取字段必須是表里的字段

我們準(zhǔn)備個(gè)員工表

我們創(chuàng)建下桶表

我們加載下數(shù)據(jù)

看下HDFS

實(shí)際在桶表中,我們應(yīng)該使用另外一種語句

運(yùn)行過程

出現(xiàn)了點(diǎn)問題

三個(gè)節(jié)點(diǎn)時(shí)間不同步,設(shè)定下時(shí)間

date -s "2019-12-5 17:50:00"

再執(zhí)行就可以了

查看結(jié)果

我們看HDFS上

我們查看下文件,已經(jīng)分開了,如果有問題看看你的hive版本是否有這個(gè)屬性沒有打開。hive.enforce.bucketing。

注:其中桶表查詢還有下面的語句,可以仔細(xì)研究下,暫時(shí)先放一放,后續(xù)學(xué)習(xí)深入再了解。

Select * from table tablesample(bucket 1 out of 2)

Tablesample是抽樣數(shù)據(jù),語法tablesample(bucket x out of y)y必須是table總bucket數(shù)的倍數(shù)或者因子。Hive根據(jù)y的大小,決定抽樣比例。例如:table總共分為64份,當(dāng)y=32時(shí),抽取(64/32)2個(gè)bucket數(shù)據(jù);當(dāng)y=128時(shí),抽取(64/128)1/2個(gè)bucket數(shù)據(jù),x表示從哪個(gè)bucket開始抽取,例如table總bucket數(shù)為32,tablesample(3 out of 16),表示總共抽取(32/16)2個(gè)bucket數(shù)據(jù),分別為第3個(gè)bucket和第(3+16)19個(gè)bucket數(shù)據(jù)。

總結(jié)

以上是生活随笔為你收集整理的hive 自定义元数据表_Hive分区表和桶表的使用的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。