传统的MapReduce模型要求每一轮MapReduce操作之后,数据必须落地到分布式文件系统上。而一般的MapReduce应用通常由多个MapReduce作业组成,每个作业结束之后需要写入磁盘,接下去的Map任务很多情况下只是读一遍数据,为后续的Shuffle阶段做准备,这样其实造成了冗余的IO操作。为了解决这一问题,提供更优的性能,大数据计算服务提供了扩展的MapReduce模型,该模型区别于普通MapReduce模型的主要特点是?
A支持Map后连接任意多个Reduce操作,如Map-Reduce-Reduce
B支持Map后不连接Reduce,而是连接另一个map,如Map-Map-Reduce
C支持Chain Mapper/Reducer,即支持Map-Reduce-Map-Reduce
D支持没有Map,直接进入Reduce