Hive权限与HDFS权限分离导致的一些问题
生活随笔
收集整理的這篇文章主要介紹了
Hive权限与HDFS权限分离导致的一些问题
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
Hive的權限管理一直是比較弱的,最近在線上發(fā)現(xiàn)了一個問題.線上一個ETL開發(fā)drop掉temp database里的一張表,但是發(fā)現(xiàn)hdfs上文件還在!
首先明確一下Hive drop table的流程:
0.刪除metadata
1.如果沒有啟用trash則直接刪除hdfs文件
2.如果啟用trash:
a)如果trash目錄無權限訪問(默認/user/<username>/.trash)文件則成為“僵尸”文件,永遠保留在那里
b)否則若用hive command執(zhí)行或hiveserver開啟了impersonation則將文件移動到/user/<username>/.trash下,否則移動到/user/<hiveserver runner>/.trash下
線上出現(xiàn)這個問題是因為/user目錄的mode為700,用戶無法創(chuàng)建自己的目錄導致刪除文件失敗,從以上流程可以看到,Hive的權限和HDFS的權限是相分離的,而這個問題實為Hive的Bug一直還沒有得到修復
本文轉自MIKE老畢 51CTO博客,原文鏈接:http://blog.51cto.com/boylook/1334530,如需轉載請自行聯(lián)系原作者
總結
以上是生活随笔為你收集整理的Hive权限与HDFS权限分离导致的一些问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用procd执行进程
- 下一篇: Masonry 原理与使用说明