题目
A.分布式文件系统GFS
B.分布式数据处理模型MapReduce
C.分布式锁服务Chubby
D.分布式结构化数据表Bigtable
E.弹性计算云EC2
第2题
第3题
A.从分布式文件系统读入数据
B.执行Map任务输出中间结果
C.通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D.执行Reduce任务得到最终结果并写入分布式系统文件
第4题
A.k-均值聚类需要大量的迭代,因此不能使用分布式计算。
B.k-均值的分布式实现需要MapReduce的各个数据节点共享假设的聚类中心。
C.k-均值算法的大量迭代运算在分布式环境下的效率一般更高。
D.k-均值在Spark内存计算框架下运行要比Hadoop MapReduce下运行要快的多。
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!