题目
第1题
A.Hadoop的核心计算能力的体现。适用于大批量的集群任务。
B.核心思想是把一个规模较大的任务拆分成多个规模较小的任务同时并行处理,然后将各个结果归约聚合。
C.计算过程分为Map(映射)和Reduce(归约)两个阶段。
D.可编写模块已经封装好,用户直接调用不允许修改。
第2题
A. 在分布式环境下运行Pig程序的时候,需要编写专门的 MapReduce程序
B.用户可以编写自己的函数来进行特殊用途的处理,达到扩充pig功能的目的
C.Pig系统可以对用户编写的程序进行自动地优化,从而用户可以专注于语义,而非效率
D.Pig不但可以在分布式模式下运行也可以在单机模式下运行
第3题
第4题
第5题
第6题
A.JobTracker:Master节点,只有一个,管理所有作业,作业/任务的监控、错误处理等;将任务分解成一系列任务,并分派给TaskTracker。
B.TaskTracker:Slave节点,运行Map Task和Reduce Task;并与JobTracker交互,汇报任务状态。
C.Map Task:解析每条数据记录,传递给用户编写的map(),并执行,将输出结果写入本地磁盘(如果为map-only作业,直接写入HDFS)。
D.Reducer Task:从Map Task的执行结果中,远程读取输入数据,对数据进行排序,将数据按照分组传递给用户编写的reduce函数执行。
第7题
A.MapReduce设计的一个理念就是“数据向计算靠拢”
B.MapReduce应用程序必须要用Java编写
C.MapReduce的核心思想是“分而治之”
D.MapReduce程序必须使用Combiner
第9题
A.用户编写的MapReduce程序通过Client提交到JobTracker端
B.JobTracker负责资源监控和作业调度
C.TaskTracker监控所有TaskTracker与Job的健康状况
D.TaskTracker使用“slot”等量划分本节点上的资源量(CPU、内存等)
第10题
A.JobServer 是用户作业和 JobTracker 交互的主要接口
B.JobClient 为用户提供提交作业功能
C.JobClient 提供访问子任务报告和日志功能
D.JobClient 提供获取 MapReduce集群状态信息功能
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!