题目
A.分布式资源管理
B.分布式协调服务
C.分布式文件系统
D.分布式并行计算框架
第1题
A.分布式文件系统GFS
B.分布式数据处理模型MapReduce
C.分布式锁服务Chubby
D.分布式结构化数据表Bigtable
E.弹性计算云EC2
第2题
A.k-均值聚类需要大量的迭代,因此不能使用分布式计算。
B.k-均值的分布式实现需要MapReduce的各个数据节点共享假设的聚类中心。
C.k-均值算法的大量迭代运算在分布式环境下的效率一般更高。
D.k-均值在Spark内存计算框架下运行要比Hadoop MapReduce下运行要快的多。
第3题
第4题
A.从分布式文件系统读入数据
B.执行Map任务输出中间结果
C.通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D.执行Reduce任务得到最终结果并写入分布式系统文件
第6题
A.Hadoop是一个有Apache基金会开发的分布式系统开源架构,设计来源于Google的学术论文。
B.Hadoop最核心的功能是提供了大数据的分布式存储MapReduce和并行计算框架HDFS。
C.Hadoop 能够组织和管理成百上千台计算机。
D.Hive、ZooKeeper等,逐渐发展成了Hadoop生态系统。
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!