题目
A.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
B.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
C.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
D.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
第1题
A.Hadoop
B.Impala
C.Spark
D.BigTable
第2题
A.A.HDFS是Hadoop技术体系中数据管理的基础,是一个高容错的系统,能检测和应对硬件故障
B.B.Sqoop数据同步工具,它是SQL TO Hadoop的缩写,主要用于关系型数据库和Hadoop之间的数据传输
C.C.Sqoop数据导入和导出本质上还是一个MapRuduce程序,充分利用了MapRuduce的并行化和容错性
D.D.Kafka主要用于处理活跃的流式数据,在web网站上非常常见,包括网站的pageview
第3题
A.用于传统关系型数据库和Hadoop之间传输数据
B.提供对日志数据进行简单处理的能力
C.是Hadoop体系中数据存储管理的基础
D.是一个建立在HDFS之上,面向列的针对结构化和半结构化数据的动态数据库
第5题
A.是一个分布式的、面向列的开源数据库
B.是一种编程模型,用于大规模数据集(大于1TB)的并行运算
C.是Hadoop集群当中的资源管理系统模块
D.将要储存的文件分散在不同的硬盘上,并记录他们的位置
第7题
A.Hadoop通过并行处理加快处理速度
B.Hadoop的集群往往需要昂贵的机器来构建
C.Hadoop是可靠的,维护多个数据副本
D.Hadoop支持分布式计算
第8题
A.用于定义系统级别的参数,如HDFSURL、Hadoop的临时目录等
B.名称节点和数据节点的存放位置、文件副本的个数、文件读取权限等
C.配置ResourceManager,NodeManager的通信端口,web监控端口等
D.包括JobHistoryServer和应用程序参数两部分,如reduce任务的默认个数、任务所能够使用内存的默认上下限等
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!