题目
第2题
A.一个Application由若干个Job组成
B.一个Job由若干个Stage组成
C.一个Stage由若干个Task组成
D.RDD中的数据可修改
第3题
A.RDD是不可变的
B.RDD支持两种类型的操作:转换(Transformation) 和动作(Actions)
C.RDD是Spark的核心概念
D.以上均正确
第8题
A.spark中的partion是弹性分布式数据集RDD的最小单元
B.同一份数据(RDD)的partion大小不一,数量不定,是根据application里的算子和最初读入的数据分块数量决定的
C.RDD是由分布在各个节点上的partion组成的
D.partion是指的spark在计算过程中,生成的数据在计算空间内最小单元
第10题
A.宽依赖开销更大
B.RDD的容错机制是基于Spark Streaming的容错机制
C.Checkpoint可以节约大量的系统资源
D.在容错机制中,如果一个节点死机了,而且运算窄依赖,则只要把丢失的父RDD分区重算即可,依赖于其他节点
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!