永发信息网

为什么groupbykey是宽依赖

答案:1  悬赏:30  手机版
解决时间 2021-12-02 23:16
为什么groupbykey是宽依赖
最佳答案
RDD的依赖:
1.窄依赖是指每个父RDD的Partition最多被子RDD的一个Partition所使用,例如map、filter
2.宽依赖是指一个父RDD的Partition会被多个子RDD的Partition所使用,例如groupByKey、reduceByKey等操作
总结:如果父RDD的一个Partition被一个子RDD的Partition所使用就是窄依赖,否则的话就是宽依赖。
特别说明:对于join操作有两种情况,如果join操作的使用每个partition 仅仅和已知的Partition进行join,此时的join操作就是窄依赖;其他情况的join操作就是宽依赖;因为是确定的Partition数量的依赖关系,所以就是窄依赖,得出一个推论,窄依赖不仅包含一对一的窄依赖,还包含一对固定个数的窄依赖(也就是说对父RDD的依赖的Partition的数量不会随着RDD数据规模的改变而改变)

注意(如何划分Stage):
1.从后往前推理,遇到宽依赖就断开,遇到窄依赖就把当前的RDD加入到Stage中;
2.每个Stage里面的Task的数量是由该Stage中最后 一个RDD的Partition数量决定的
3.最后一个Stage里面的任务的类型是ResultTask,前面所有其他Stage里面的任务类型都是ShuffleMapTask
4.代表当前Stage的算子一定是该Stage的最后一个计算步骤
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
请问fenix3都有哪些版本,怎么选啊?
2009年8月8日是什么日子
三毛之《克里斯》读后感
把一百除以五等于二十75减去67等于五合并成一
贝尔在《荒野求生――中国》做的4字型坠物线
56.2除以4除以56.2用简便方法怎么计算
上海宝乾进口汽车修理厂在什么地方啊,我要过
怎么打男朋友的备注
O2O会成为融合新的亮点吗?
求中国异闻录桐木txt全集
黑龙江转基因玉米种有哪些
Mr Black must be worried about something.
原始印欧语的构拟
大家觉不觉得陈树和TVB的女演员张可颐 就是《
上联罗衣飘飘舞心中情,下联霞光悠悠叹心中意
推荐资讯
新刑法修正案九违反危险化学品运输安全管理,
咖啡粉24克水160克比例是多少
很喜欢电视剧“马大帅”里的苏老太太。想知道
佛山市三水区西南街沙头社区居民委员会地址在
知道说下新房装修送什么好
sata与ata的具体区别是什么?
人山人海的成语接龙5个
有什么漫画软件可以看又不花钱的吗?
光伏跟5G怎么扯得上
曹操电视剧是不是瞎拍
儿童购买成人机票能上国际航班吗
Iamatallgirl改为一般疑问句
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?