题目
第8题
A.Spark Streaming的基本原理是事件驱动的,即来一份数据就立刻进行处理,是一种纯的流式处理的组件,可达到毫秒级时延
B.Spark SQL是Spark中用于结构化数据处理的模块在Spark应用中,可以无缝的使用SQL语句亦或是DataFrame API对结构化数据进行查询
C.Structured Streaming的核心是将流式的数据看成一张数据不断增加的数据库表,这种流式的数据处理模型类似于数据块处理模型,可以把静态数据库表的一些查询操作应用在流式计算中,Spark执行标准的SQL查询,从无边界表中获取数据
D.Spark内置MLlib和GraphX算法库,尤其是MLlib在海量数据的分布式机器场景中有广泛的应用
第10题
A.DataFrame的推出,让Spark具备了处理大规模结构化数据的能力
B.DataFrame比原有的RDD转化方式更加简单易用,而且获得了更高的计算性能
C.Spark能够轻松实现从MySQL到DataFrame的转化,并且支持SQL查询
D.DataFrame是一种以RDD为基础的分布式数据集,提供了详细的结构信息
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!