Hadoop基础(习题卷18)
说明:答案和解析在试卷最后
第1部分:单项选择题,共53题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]下列不属于Python中Flask框架特点的是?
A)内置开发服务器和调试器
B)与Python单元测试功能无缝衔接
任务管理器在哪
C)使用Jinja2模板
D)端口号固定为5000,且无法修改
2.[单选题]在Java中,方法resume( )负责重新开始▁▁线程的执行
A)被stop( )方法停止
B)被sleep( )方法停止
C)被wait( )方法停止
D)被suspend( )方法停止
3.[单选题]在Java中,假如电脑上E盘没有xxx目录,则下面程序功能描述正确是_x000D_File file1=new File("e:\\xxx\\yyy"); file1.mkdir()
A)在当前目录下生成子目录:\xxx\yyy
B)在E盘自动创建xxx/yyy目录
C)在当前目录下生成文件
D)代码执行后E盘不会产生任何目录
4.[单选题]在Hadoop上提交Job时不涉及哪个实体()
A)客户端
B)HDFS
C)SecondaryNode
D)JobTracker
5.[单选题]下面哪些不是引起 Spark 负载不均的原因?(  )
A)Spark 读入的数据源是倾斜的
B)Shuffle 阶段 Key 值过于集中
C)在数据过滤阶段需要处理的数据量差异
D)Spark 的运行方式差异
6.[单选题]配置Hadoop时,JAVA_HOME包含在哪一个配置文件中?
l
B)hadoop-env.sh
l
l
B)用于名称节点和数据节点的存放位置
C)用于配置 JobHistory Server 和应用程序参数
D)配置 ResourceManager,NodeManager 的通信端口
8.[单选题]HDFS中的block默认保存____份。
A)3
B)2
C)1
D)不确定
9.[单选题]进入到MapReduce目录命令为()
A)hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /hello /out
B)hadoop hadoop-mapreduce-examples-2.7.3.jar wordcount /hello
C)hadoop hadoop-mapreduce-examples-2.7.3.jar wordcount /hello /out
D)hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /hello /home
10.[单选题]大数据至少为以下哪种存储量级?
A)PB
B)EB
C)TB
D)ZB
11.[单选题]格式化NameNode命令为()
A)hdfs namenode -formatting
B)Namenode -format
C)nameNode fomatting
D)hdfs namenode -format
12.[单选题]下列哪项是Hadoop生态系统中Spark的功能?
A)处理大规模数据的脚本语言
B)工作流和协作服务引擎,协调Hadoop上运行的不同任务
C)不支持DAG作业的计算框架
D)基于内存的分布式并行编程框架,具有较高的实时性,并且较好支持迭代计算
13.[单选题]为卸载一个软件包,应使用:
A)rpm -i
B)rpm -e
C)rpm -q
D)rpm -V
14.[单选题]Flume 数据传输的基本单元是( )
A)Event
B)Client
C)Channel
D)Sink
15.[单选题]对mapreduce描述正确的时( )
A)主要用来做对海量离线数据的处理
B)串行执行任务
16.[单选题]关于自定义数据类型,下列说法正确的是(D)
A)自定义数据类型必须继承Writable接口
B)自定义MapReduce的key需要继承Writable接口
C)自定义MapReduce的value需要继承WritableComparable接口
D)自定义数据类型必须实现readFields(DataInputdatainput)方法
17.[单选题]下列哪一个不属于HDFS1.0 中存在的问题
A)无法水平扩展
B)单点故障问题
C)单一命名空间
D)系统整体性能受限于单个名称节点的吞吐量
18.[单选题]Hadoop fs中的-get和-put命令操作对象是
A)文件
B)目录
C)两者都是
D)以上都不对
19.[单选题]HDFS集中的namenode职责不包括()。
A)维护HDFS集的目录树结构
B)维护HDFS集的所有数据块的分布、副本数和负载均衡
C)负责保存客户端上传的数据
D)响应客户端的所有读写数据请求
20.[单选题]下列哪个属性是l中的配置?
plication
B)fs.defaultFS
C)mapreduce.framework.name
sourcemanager.address
21.[单选题]HDFS默认的当前工作目录是/user/$USER, fs.default.name的值需要在哪个配置文件内说明
l
l
l
D)以上均不是
22.[单选题]Hadoop的配置目录在哪里?
A)/etc/hosts
B)/etc/hadoop
C)$HADOOP_HOME/conf
D)$HADOOP_HOME/etc/hadoop
23.[单选题]Client 端上传文件的时候下列哪项正确?
A)数据经过 NameNode 传递给 DataNode
B)Client 只上传数据到一台 DataNode,然后由 NameNode 负责 Block 复制工作
C)Client 端将文件切分为 Block,依次上传
D)以上都不正确
B)在Python中,OOP把数据类型和对象作为程序的基本单元
C)Python的面向对象的设计思想是抽象出Class,根据Class创建Instance
D)OOP把对象作为程序的基本单元,一个对象包含了数据和操作数据的函数。
25.[单选题]以下哪个技术与大数据无关
A)云技术
B)分布式处理技术
C)存储技术
D)物联网技术
26.[单选题]在hadoop集搭建中,需要将主机master上opt目录下的jdk文件远程拷贝到从机slave01的opt下,以下使用的命令正确的是()
A)scp /opt/jdk slave01:/opt/jdk
B)scp master:/opt/jdk /slave01:/opt/jdk
C)scp -r /opt/jdk slave01:/opt/jdk
D)scp -r slave01:/opt/jdk master:/opt/jdk
27.[单选题]下列哪些不是 ZooKeeper 的特点()
A)顺序一致性
B)原子性
C)多样系统映像
D)可靠性
28.[单选题]以下哪项措施可以解决小文件问题?
A)HAR文件
B)Sequence文件
C)HBase
D)其他都对
29.[单选题]哪个模块负责HDFS数据的存储?
A)NameNode
B)DataNode
C)ZooKeeper
D)JobTracker
30.[单选题]在大数据的计算模式中,流计算解决的是什么问题?
A)针对大规模数据的批量处理
B)针对大规模图结构数据的处理
C)大规模数据的存储管理和查询分析
D)针对流数据的实时计算
31.[单选题]处于安全模式的时候,集处于____状态。
A)只读
B)只写
C)可读可写
D)不可读写
32.[单选题]在整个mapreduce运行阶段 数据是以()键值对的形式存在的
A)key-value
D)链式
33.[单选题]在Linux中,查看已启动的服务列表的命令是
A)systemctl list-unit-files|grep enabled
B)systemctl is-enabled firewalld
C)systemctl disable firewalld
D)systemctl enable firewalld
34.[单选题]关于HDFS Federation 的设计的描述,哪个是错误的?
A)属于不同命名空间的块可以构成同一个“块池”
B)HDFS Federation中,所有名称节点会共享底层的数据节点存储资源,数据节点向所有名称节点汇报
C)设计了多个相互独立的名称节点
D)HDFS的命名服务能够水平扩展
35.[单选题]Hive 查询语言和SQL 的一个不同之处在于哪一个操作?
A)Group By
B)Join
C)Partition
D)Union
36.[单选题]通过浏览器界面监控 Hive 的状态, 以下是查看的端口
(    )
A)master:8088
B)192.168.1.6:50070
C)master:16010
D)master:9999
37.[单选题]将数据更新写入_______,只有其写入完成后,commit()才返回给客户端。
A)Zookeeper
B)HMaster
C)Region Server
D)HLog
38.[单选题]关于HBase的三层结构中各层次的名称和作用的说法,哪个是错误的?
A)Zookeeper文件记录了用户数据表的Region位置信息
B)-ROOT-表记录了.META.表的Region位置信息
C)META.表保存了HBase中所有用户数据表的Region位置信息
D)Zookeeper文件记录了-ROOT-表的位置信息
39.[单选题]Doug Cutting所创立的项目的名称都受到其家人的启发,以下项目不是由他创立的项目是
A)Hadoop
B)Nutch
C)Lucene
D)Solr
40.[单选题]()是用来解决海量大数据文件存储问题的,是目前应用最广泛的分布式文件系统。
A)HDFS
B)HBase
C)HIve