题目
A.来源于Google的大数据技术。
B.其原理是分而治之。
C.Shuffle是排序的意思,需要编写代码实现。
D.词频统计的实现过程中,reduce部分并不需要代码实现。
第1题
A.Hadoop是一个有Apache基金会开发的分布式系统开源架构,设计来源于Google的学术论文。
B.Hadoop最核心的功能是提供了大数据的分布式存储MapReduce和并行计算框架HDFS。
C.Hadoop 能够组织和管理成百上千台计算机。
D.Hive、ZooKeeper等,逐渐发展成了Hadoop生态系统。
第4题
A.存在于Hadoop1.0
B.YARN只能运行Hadoop生态下的MapReduce运算框架
C.YARN是采用两级式资源分配方案
D.Storm Streaming、IGraph等计算框架不能在YARN上运行,也不能访问HDFS上的数据资源
第5题
A.克服MapReduce在迭代式计算和交互式计算方面的不足。
B.Mlib是Spark的机器学习库。
C.Spark streaming是一个真正的实时计算框架。
D.RDD 算子分为 transformation 和 action,transformation 是得到一个新的RDD。
第6题
A.大数据伦理属于科技伦理的范畴
B.大数据伦理问题是指由于大数据技术的产生和使用而引发的社会问题
C.作为一种新的技术,大数据技术像其他所有技术一样,其本身是无所谓好坏的,而它的“善”与“恶”全然在于对大数据技术的使用者
D.大数据技术本身就存在“善”和“恶”的区分
第8题
A.批处理计算
B.流计算
C.图计算
D.查询分析计算
第10题
A.不同的Map任务之间不能互相通信
B.MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave
C.Map函数将输入的元素转换成<key,value>形式的键值对
D.Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!