永发信息网

简述一下hdfs的数据压缩算法,工作中用的是哪种算法,为什么

答案:1  悬赏:10  手机版
解决时间 2021-03-24 15:58
简述一下hdfs的数据压缩算法,工作中用的是哪种算法,为什么
最佳答案
1、在HDFS之上将数据压缩好后,再存储到HDFS
2、在HDFS内部支持数据压缩,这里又可以分为几种方法:
2.1、压缩工作在DataNode上完成,这里又分两种方法:
2.1.1、数据接收完后,再压缩
这个方法对HDFS的改动最小,但效果最低,只需要在block文件close后,调用压缩工具,将block文件压缩一下,然后再打开block文件时解压一下即可,几行代码就可以搞定
2.1.2、边接收数据边压缩,使用第三方提供的压缩库
效率和复杂度折中方法,Hook住系统的write和read操作,在数据写入磁盘之前,先压缩一下,但write和read对外的接口行为不变,比如:原始大小为100KB的数据,压缩后大小为10KB,当写入100KB后,仍对调用者返回100KB,而不是10KB
2.2、压缩工作交给DFSClient做,DataNode只接收和存储
这个方法效果最高,压缩分散地推给了HDFS客户端,但DataNode需要知道什么时候一个block块接收完成了。
推荐最终实现采用2.2这个方法,该方法需要修改的HDFS代码量也不大,但效果最高。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
体育彩票的种类有哪些?怎么玩?r
经常用Oliviam香皂洗澡好吗
对铁过敏怎么办
河南东南部有哪些城市?
高职专职投档分数是指哪些科目合计分数
关于家用电器中电器安全中所说的——隔离电源
酒萸肉与山萸肉有什么不同?
求 苏辙《其为气也……之间》的译文
求助大神,天津省考,感觉怎么样
子曰:“君子不重则不威,学则不固.主忠信,无友
断裂伸长率和拉伸强度可以体现防水涂料的什么
这样手臂膀的纹身,谁还有,,给点意见吧。
海螺里边的肉都能吃吗
第一次成功相对比较容易,①,原因是不能归零
谁说les没未来,一个老t抢婚的故事,爱要勇敢
推荐资讯
做埋蛋白线提升脸部大线好还是小线好
家里有一块石头,由于在老家农村里,老有收古
以学自损,不如无学 阅读答案
电视包装制作为什么首选C4D?C4D到底强在哪
“实收资本”简单说来是什么意思
为什么我这个人,去到哪都不受欢迎,
有车的男孩子 追女孩子是不是比较容易啊??
我欠捷信公司的钱,我还过一比款,他说要我是
事情多,不得闲.(根据意思写词语)
念佛能求世间利益吗?
省钱,吃饭,在网上淘一些食物
下列四组条件中,能识别△ABC与△DEF相似的是
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?