永发信息网

hivetez引擎和mr引擎的区别

答案:3  悬赏:0  手机版
解决时间 2021-03-15 18:39
hivetez引擎和mr引擎的区别
最佳答案
MapReduce: 是一种离线计算框架,将一个算法抽象成Map和Reduce两个阶段进行处理,每个阶段都是用键值对(key/value)作为输入和输出,非常适合数据密集型计算。Map/Reduce通过把对数据集的大规模操作分发给网络上的每个节点实现可靠性;每个节点会周期性地返回它所完成的工作和最新的状态。如果一个节点在设定的时间内没有进行心跳上报,主节点(可以理解为主服务器)就会认为这个节点down掉了,此时就会把分配给这个节点的数据发到别的节点上运算,这样可以保证系统的高可用性和稳定性。因此它是一个很好的计算框架。
TEZ:
是基于Hadoop YARN之上的DAG(有向无环图,Directed Acyclic Graph)计算框架。核心思想是将Map和Reduce两个操作进一步拆分,即Map被拆分成Input、Processor、Sort、Merge和Output, Reduce被拆分成Input、Shuffle、Sort、Merge、Processor和Output等。这样,这些分解后的元操作可以任意灵活组合,产生新的操作,这些操作经过一些控制程序组装后,可形成一个大的DAG作业,从而可以减少Map/Reduce之间的文件存储,同时合理组合其子过程,也可以减少任务的运行时间。
两者比较:

MR计算,会对磁盘进行多次的读写操作,这样启动多轮job的代价略有些大,不仅占用资源,更耗费大量的时间,
而采用TEZ计算框架,就会生成一个简洁的DAG作业,算子跑完不退出,下轮继续使用上一轮的算子,这样大大减少磁盘IO操作,从而计算速度更快。 TEZ比MR至少快5倍
相关资料链接:网页链接
全部回答
这个是两个东西。spark主要是来做小批量和准实时的数据流计算,其本身也支持类sql计算,还可以用来作为计算引擎;而hadoop包含hive.hdfs.mr和yarn,各有自己的功能
hive中在做多表关联时,由于hive的sql优化引擎还不够强大
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
新韩蕊怎么去啊,有知道地址的么
symbian是什么意思
床下放杂物是否和运势有关
亚华阀门地址在哪,我要去那里办事
一个正常三十多岁的男人和一个女人在一起两年
聚酯纤维床上用品好吗
蒙自县十里铺卫生院在哪里啊,我有事要去这个
曼联吧里的对联:纳不传瓦不射杨不过,指的都
BannerEdit是不是傻瓜软件?
迪加太湖14.5的价格多少能买到?
中国移动通信陈港天畅手机城指定专营店地址在
赛尔号抗性宝石怎么用
当x趋向于无穷大,/x^2-5x+4的极限为什么是1
洛阳市洛龙科技园内的那个中集凌宇汽车有限公
3.15都有哪些厨电被曝光过?
推荐资讯
お酒を少し饮むと食欲が出た。出る可换用ある
送喜欢女孩礼物他收下了 然后用微信发消息说
淑容第二回来到船上
06款爱丽舍前大灯可改亮一点,多少钱
黑湾地址有知道的么?有点事想过去
怎么做到安静
我有贵州省仁怀市茅台醇生产的52度浓香型白酒
深圳市人民医院法医临床司法鉴定所我想知道这
tcl电视机,没有网线插口,
我要成批量的在铝件上钻直径为22.4±0.3的孔
泰和源老北京布鞋NO.1402在哪里啊,我有事要
手指肌腱断裂三根手术后一星期同房会有什么影
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?