日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

【原创】大叔问题定位分享(12)Spark保存文本类型文件(text、csv、json等)到hdfs时为什么是压缩格式的...

發(fā)布時(shí)間:2025/3/15 编程问答 39 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【原创】大叔问题定位分享(12)Spark保存文本类型文件(text、csv、json等)到hdfs时为什么是压缩格式的... 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

問(wèn)題重現(xiàn)

rdd.repartition(1).write.csv(outPath)

寫文件之后發(fā)現(xiàn)文件是壓縮過(guò)的

?

write時(shí)首先會(huì)獲取hadoopConf,然后從中獲取是否壓縮以及壓縮格式

org.apache.spark.sql.execution.datasources.DataSource

def write(

org.apache.spark.sql.execution.datasources.InsertIntoHadoopFsRelationCommand

val hadoopConf = sparkSession.sessionState.newHadoopConfWithOptions(options)

org.apache.hadoop.mapreduce.lib.output.TextOutputFormat

public RecordWriter<K, V> getRecordWriter(TaskAttemptContext job) throws IOException, InterruptedException {Configuration conf = job.getConfiguration();boolean isCompressed = getCompressOutput(job);String keyValueSeparator = conf.get(SEPERATOR, "\t");CompressionCodec codec = null;String extension = "";if (isCompressed) {Class<? extends CompressionCodec> codecClass = getOutputCompressorClass(job, GzipCodec.class);codec = (CompressionCodec)ReflectionUtils.newInstance(codecClass, conf);extension = codec.getDefaultExtension();}

isCompressed取的是mapreduce.output.fileoutputformat.compress,codecClass取的是mapreduce.output.fileoutputformat.compress.codec

?

hadoopConf初始化過(guò)程為

org.apache.spark.sql.internal.SessionState

def newHadoopConf(): Configuration = {val hadoopConf = new Configuration(sparkSession.sparkContext.hadoopConfiguration)

org.apache.spark.SparkContext

_hadoopConfiguration = SparkHadoopUtil.get.newConfiguration(_conf)def newConfiguration(conf: SparkConf): Configuration = {val hadoopConf = new Configuration()appendS3AndSparkHadoopConfigurations(conf, hadoopConf)hadoopConf}def appendS3AndSparkHadoopConfigurations(conf: SparkConf, hadoopConf: Configuration): Unit = {...conf.getAll.foreach { case (key, value) =>if (key.startsWith("spark.hadoop.")) {hadoopConf.set(key.substring("spark.hadoop.".length), value)}}

?

hadoopConf默認(rèn)會(huì)從classpath中加載所有的hadoop相關(guān)配置文件,可以通過(guò)spark-shell來(lái)簡(jiǎn)單測(cè)試:

scala> val hc = spark.sparkContext.hadoopConfiguration

hc: org.apache.hadoop.conf.Configuration = Configuration: core-default.xml, core-site.xml, mapred-default.xml, mapred-site.xml, yarn-default.xml, yarn-site.xml, hdfs-default.xml, hdfs-site.xml

scala> println(hc.get("mapreduce.output.fileoutputformat.compress"))

true

scala> println(hc.get("mapreduce.output.fileoutputformat.compress.codec"))

org.apache.hadoop.io.compress.DefaultCodec

?

綜上,只需要在創(chuàng)建SparkConf的時(shí)候設(shè)置spark.hadoop.mapreduce.output.fileoutputformat.compress=false即可不壓縮,

val sparkConf = new SparkConf().set("spark.hadoop.mapreduce.output.fileoutputformat.compress", "false")

另外還可以通過(guò)option來(lái)控制

rdd.repartition(1).write.option("compression", "none").csv(outPath)

?

轉(zhuǎn)載于:https://www.cnblogs.com/barneywill/p/10109568.html

總結(jié)

以上是生活随笔為你收集整理的【原创】大叔问题定位分享(12)Spark保存文本类型文件(text、csv、json等)到hdfs时为什么是压缩格式的...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 自慰无码一区二区三区 | 久久久久久激情 | 99热这里只有精品9 日韩综合在线 | 国产激情在线观看 | 国产二级毛片 | 国产av无码国产av毛片 | 天天操网 | 一级性生活免费视频 | av无码精品一区二区三区宅噜噜 | 91av福利| 亚洲精品国产一区 | 青青草视频免费看 | 午夜视频1000 | 无码一区二区三区 | 欧美性aaa | 五月天色婷婷综合 | 鲁丝一区二区 | 成人在线免费网站 | 99久视频 | 国产又黄视频 | 日日操夜夜骑 | 激情视频亚洲 | 久久久久亚洲av片无码v | 国外成人性视频免费 | 亚洲av无码一区二区二三区 | 一本一道久久a久久精品蜜桃 | 免费啪视频在线观看 | 91成人一区二区三区 | 日韩av在线导航 | 在线观看污污视频 | 国产一区黄 | 黄色片免费在线观看 | 欧美一级片一区二区 | 一区二区日韩欧美 | 好色先生tv官网 | 天天色天天爱 | 天天艹av | 一级片在线视频 | 美女隐私无遮挡免费 | 亚洲系列第一页 | 中文字幕高清在线免费播放 | 99re视频这里只有精品 | 国产精品一区二区在线观看 | 久久久久无码国产精品 | 极品探花在线 | av2018| 亚洲va韩国va欧美va精品 | 99久精品| 特级黄色网| 丝袜 亚洲 另类 国产 制服 | 天堂а√在线中文在线新版 | 国产精品aaa| 国产麻豆乱码精品一区二区三区 | 久久国产视频网 | 激情网站免费 | 另类一区二区 | 亚洲成人91 | 麻豆性生活 | 丰满大乳奶做爰ⅹxx视频 | 99操| 中文av资源 | 午夜精品久久久久久久99热黄桃 | 免费三片在线观看网站v888 | 狠狠躁18三区二区一区 | 在线看片 | 男生操女生逼逼 | 极品熟妇大蝴蝶20p 国产偷自拍视频 | 欧美国产精品 | 国产精品国产三级国产aⅴ9色 | 可以免费看的黄色网址 | 亚洲无码精品在线播放 | 亚洲激情影院 | 日本精品三级 | 午夜精品久久久久久久无码 | 亚洲精选av | 免费在线精品视频 | 国产在线免费观看 | 毛片高清 | 少妇2做爰bd在线意大利堕落 | 亚洲羞羞| 亚洲综合网站 | 成人精品久久久午夜福利 | 3d毛片 | 国产精品无码人妻一区二区在线 | 日本午夜电影 | 欧美成人乱码一二三四区免费 | 成人黄色动漫在线观看 | 亚洲九九精品 | 亚洲av成人精品午夜一区二区 | 香蕉婷婷| 6680新视觉电影免费观看 | 精品国产一级久久 | 欧美成人精品在线视频 | 色婷婷狠狠爱 | 操操操爽爽爽 | av一级免费 | 亚洲xxxxx| 成年人免费网址 | 久久男人网 |