题目
A.Pig:处理大规模数据的脚本语言
B.Tez:支持DAG作业的计算框架
C.Oozie:工作流和协作服务引擎
D.Kafka:分布式发布订阅消息系统
第1题
A.Hadoop通过并行处理加快处理速度
B.Hadoop的集群往往需要昂贵的机器来构建
C.Hadoop是可靠的,维护多个数据副本
D.Hadoop支持分布式计算
第5题
A.Spark是用于大规模数据存储的NoSQL数据库
B.Spark的计算模式也属于MapReduce
C.Spark可以完全代替Hadoop
D.Spark可以进行实时数据流的数据处理
第7题
A.HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件
B.HBase是针对谷歌BigTable的开源实现
C.HBase多用于存储非结构化和半结构化的松散数据
D.HBase是一种关系型数据库,现成功应用于互联网服务领域
第9题
A.A.HDFS是Hadoop技术体系中数据管理的基础,是一个高容错的系统,能检测和应对硬件故障
B.B.Sqoop数据同步工具,它是SQL TO Hadoop的缩写,主要用于关系型数据库和Hadoop之间的数据传输
C.C.Sqoop数据导入和导出本质上还是一个MapRuduce程序,充分利用了MapRuduce的并行化和容错性
D.D.Kafka主要用于处理活跃的流式数据,在web网站上非常常见,包括网站的pageview
第10题
A.流计算全链路整体上更加强调数据的实时性
B.链路包括数据实时采集、数据实时计算、数据实时集成
C.一个流计算作业必须至少使用一个流数据作为源
D.流计算将计算的结果数据支持写入目的数据
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!