题目
第1题
A.一个Application由若干个Job组成
B.一个Job由若干个Stage组成
C.一个Stage由若干个Task组成
D.RDD中的数据可修改
第5题
A.spark中的partion是弹性分布式数据集RDD的最小单元
B.同一份数据(RDD)的partion大小不一,数量不定,是根据application里的算子和最初读入的数据分块数量决定的
C.RDD是由分布在各个节点上的partion组成的
D.partion是指的spark在计算过程中,生成的数据在计算空间内最小单元
第6题
A.宽依赖开销更大
B.RDD的容错机制是基于Spark Streaming的容错机制
C.Checkpoint可以节约大量的系统资源
D.在容错机制中,如果一个节点死机了,而且运算窄依赖,则只要把丢失的父RDD分区重算即可,依赖于其他节点
第8题
A.RDD具有血统机制(Lineage)
B.RDD默认存储在磁盘
C.RDD是一个只读的,可分区的分布式数据集
D.RDD是Spark对基础数据的抽象
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!