oracle clob 查询换行,sqoop clob从Oracle导入到hive 回车换行导致记录增多
sqoop clob從Oracle導(dǎo)入到hive ? 回車換行導(dǎo)致記錄增多
發(fā)布時間:2020-06-27 02:45:01
來源:51CTO
閱讀:3159
作者:jackwxh
sqoop import --hive-import --hive-overwrite ?--connect jdbc:oracle:thin:@192.168.92.136:1521:cyporcl --username ODS --password 'od154DS$!(' ?-m 1 ?--hive-database ODS --table Q_TRA_DISPUTESTATUS --fields-terminated-by '\001' --hive-drop-import-delims ?--null-string '\\N' --null-non-string '\\N' ?--map-column-java DISPUTERESULT=String
DISPUTERESULT 這個字段是Oracleclob 類型的,里面有回車, 加載到hive 里面導(dǎo)致 記錄增多。
--map-column-java和--map-column-hive兩個參數(shù)都要顯示給出;還需要設(shè)置--hive-drop-import-delims這樣才能順利導(dǎo)出數(shù)據(jù)。
.導(dǎo)入的列有換行符如何解決
本以為萬事大吉,萬萬沒想到導(dǎo)入的列有nclob類型,里面存儲了一篇篇文章,勢必有著換行符。果不其然,hive查詢數(shù)據(jù)全部錯亂, 查詢資料發(fā)現(xiàn)--hive-delims-replacement(替換/n,/r等符號用你指定的字符)和--hive-drop-import-delims參數(shù)。可添加上去發(fā)現(xiàn)并沒有什么卵用,沒有起作用。百度goole很久,終于發(fā)現(xiàn)一篇帖子,http://stackoverflow.com/questions/28076200/hive-drop-import-delims-not-removing-newline-while-using-hcatalog-in-sqoop
意思是要用--map-column-java參數(shù)來顯示指定列為String類型。我的解決方案為 --map-column-java 我的CLOB列=String 果然,問題解決,換行符全部被去掉。不過聽說改變存儲格式 或許也可以避免這個問題,希望有著經(jīng)驗的大神來回答一下。總結(jié)下來就這么多,希望能幫助大家
總結(jié)
以上是生活随笔為你收集整理的oracle clob 查询换行,sqoop clob从Oracle导入到hive 回车换行导致记录增多的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: php 面向对象 教程,PHP学习笔记之
- 下一篇: oracle查询案例,2道经典的orac