题目
A.persist(MEMORY_ONLY):表示将RDD作为反序列化的对象存储于JVM中,如果内存不足,就要按照LRU原则替换缓存中的内容
B.persist(MEMORY_AND_DISK):表示将RDD作为反序列化的对象存储在JVM中,如果内存不足,超出的分区将会被存放在硬盘上
C.通过持久化(缓存)机制可以避免重复计算的开销
D.使用cache()方法时,会调用persist(MEMORY_ONLY)
第1题
A.persist(MEMORY_ONLY):表示将RDD作为反序列化的对象存储于JVM中,如果内存不足,就要按照LRU原则替换缓存中的内容
B.persist(MEMORY_AND_DISK):表示将RDD作为反序列化的对象存储在JVM中,如果内存不足,超出的分区将会被存放在硬盘上
C.通过持久化(缓存)机制可以避免重复计算的开销
D.使用cache()方法时,会调用persist(MEMORY_ONLY)
第3题
A.RDD提供一种高度受限的共享内存模型,是一个弹性分布式数据集
B.RDD读取的数据都存储在一台机器上
C.RDD是只读存储
D.RDD 支持各种粗粒度和细粒度的操作
第4题
A.RDD读取的数据都存储在一台机器上
B.RDD是一种高效的可读写存储
C.RDD提供一种高度受限的共享内存模型,是一个弹性分布式数据集
D.RDD 支持各种粗粒度和细粒度的操作,是一个高效的多模态处理系统
第6题
A.克服MapReduce在迭代式计算和交互式计算方面的不足。
B.Mlib是Spark的机器学习库。
C.Spark streaming是一个真正的实时计算框架。
D.RDD 算子分为 transformation 和 action,transformation 是得到一个新的RDD。
第8题
A.DataFrame的推出,让Spark具备了处理大规模结构化数据的能力
B.DataFrame比原有的RDD转化方式更加简单易用,而且获得了更高的计算性能
C.Spark能够轻松实现从MySQL到DataFrame的转化,并且支持SQL查询
D.DataFrame是一种以RDD为基础的分布式数据集,提供了详细的结构信息
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!