题目
A.where
B.join
C.limit
D.apply
第2题
A.dataframe是指定列名称的dataset
B.dataframe提供详细的结构信息
C.dataframe不是面向对象的
D.dataframe在序列化与反序列化时,要对数据和数据结构进行序列化
第5题
A.Hadoop
B.Impala
C.Spark
D.BigTable
第7题
A.Spark是用于大规模数据存储的NoSQL数据库
B.Spark的计算模式也属于MapReduce
C.Spark可以完全代替Hadoop
D.Spark可以进行实时数据流的数据处理
第9题
A.spark.sql.inMemoryColumnarStorage.compressed=true
B.spark.sql.inMemoryColumnarStorage.batchSize=1000
C.spark.sql.parquet.compression.codec=lzo
D.spark.sql.codegen=true
第10题
A.在Spark任务提交端,即应用服务器安装Spark即可
B.需要在集群各节点安装Spark才可以运行
C.不需在任何机器安装Spark
D.在NameNode上安装Spark
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!