當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Hive 分区表

發布時間：2024/9/16 编程问答 41 豆豆

生活随笔收集整理的這篇文章主要介紹了 Hive 分区表小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在hive中創建一個表：

create external table track_info( ip string, country string, province string, city string, url string, time string, page string ) partitioned by (day string) row format delimited fields terminated by '\t' location '/project/trackinfo/';

從HDFS中導入數據：load data inpath 'hdfs://swarm-worker1:9000/project/input/etl' overwrite into table track_info partition(day='2013-07-21');
因為我們使用分區，所以需要指定partition(day='2013-07-21')。

然后查看HDFS中的數據：

發現會自動根據我們的分區字段作為我們的目錄，進入到目錄day=2013-07-21：

執行查詢時，可以指定分區：
select count(1) from track_info where day='2013-07-21';這就會生成一個mapreduce運行。

總結

以上是生活随笔為你收集整理的Hive 分区表的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Hive 内部表与外部表
下一篇： Hive将查询结果保存到另一张表中