数据试卷
单选题,每一题只有一个正确选项,110
1,大数据不是要教机器像人一样思考。相反,它是(A)。
A : 把数学算法运用到海量的数据上来预测事情发生的可能性
B : 被视为人工智能的一部分
C : 被视为一种机器学习
D : 预测与惩罚
2,MongoDB是一种NoSQL数据库,具体地说,是(B)存储数据库。
A : 键值
B : 文档
冬笋怎么保存时间长而新鲜C : 图形
D : XML
3,以下哪种说法是错误的(B)。
A : 将罪犯的定罪权放在数据手中,借以表达对数据和分析结果的崇尚,这实际上是一种滥用
B : 随着数据量和种类的增多,大数据促进了数据内容的交叉检验,匿名化的数据不会威胁到任何人的隐私
C : 采集个人数据的工具就隐藏在我们日常生活所必备的工具当中,比如网页和智能手机应用程序
D : 预测与惩罚,不是因为所做,而是因为将做
4,下列关于MapReduce的说法错误的是(D
A : MapReduce将复杂的、运行于大规模集上的并行计算过程高度地抽象到了两个函数:MapReduce
B : MapReduce采用分而治之策略,一个存储在分布式文件系统中的大规模数据集,会被切分成许多独立的分片(split),这些分片可以被多个Map任务并行处理
C : MapReduce设计的一个理念就是计算向数据靠拢,而不是数据向计算靠拢,因为,移动数据需要大量的网络传输开销
D : MapReduce应用程序必须要用Java来写
5,下面与Zookeeper类似的框架是(D)
A : Protobuf
B : Java非诚勿扰11号于川绿野
C : Kafka
D : Chubby
6,可以对大数据进行深度分析的平台工具是(C)。
A : 传统的机器学习和数据分析工具
B : 第二代机器学习工具
C : 第三代机器学习工具
D : 未来机器学习工具
7,哪个是HDFSHadoop Distributed File System)适合做的(B)。
A : 大量小文件存储
B : 流式数据访问
C : 随机写入
D : 低延迟读取
8,HBase依赖(D)提供强大的计算能力。
A : Zookeeper
B : Chubby
C : RPC
D : MapReduce
9,工业大数据的主要应用不包括(D)。
A : 设备状态分析
B : 用电分析与预测
C : 工业原料自动分类
D : 自然语言处理
10,建立在相关关系分析法基础上的预测是大数据的(C)。
A : 基础
B : 前提
C : 核心
D : 条件
11,在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该更着重于(A)为其行为承担责任。
A : 数据使用者
B : 数据提供者
C : 个人许可
D : 数据分析者
12,智慧城市的构建,不包含( C)。
A : 数字城市
B : 物联网
C : 联网监控?
D : 云计算
13,支撑大数据业务的基础是( B)。
A : 数据科学
B : 数据应用
C : 数据硬件
D : 数据人才
14,机器学习的实质在于(B)。
A :
B :
C : 判断
D : 理解
15,下列关于大数据的分析理念的说法中,错误的是(D)。
A : 在数据基础上倾向于全体数据而不是抽样数据
B : 在分析方法上更注重相关分析而不是因果分析
C : 在分析效果上更追究效率而不是觉得精准
D : 在数据规模上强调相对数据而不是绝对数据
16,Hadoop是由何种语言编写的(C)。
A : Scala
B : Erlang
C : Java
D : Python
17,hadoopdatanode的在作用(A)。
A : 存储数据
B : 管理集中的节点
C : 写入数据
D : 删除数据
18ios14充电提示音题,可视化是将大数据分析结构展示出来的主要方式,不属于大数据分析与可视化的特性的是(D)。
A : 迭代性
B : 容错性
C : 参数收敛的非均匀性
D : 扩展性
19犹如怎么造句,关于工业大数据与互联网大数据的比较何者为伪(D)。
A : 互联网大数据是大量样本
B : 工业大数据尽可能全面使用样本
C : 互联网大数据对资料品质的要求较低
D : 工业大数据以统计分析为主通过挖掘样本中各个属性之间的相关性进行预测
20,关于HiveHadoop其他组件的关系,描述错误的是(D)。
A : HIVE最终将数据存储在HDFS
B : HiveSQL其本质是执行的MapReduce任务
C : HiveHadoop平台的数据仓库工具?
   
D : HiveHBase有强依赖
21,下面哪个场景不适合HBase的应用(A)。
A : 需要完全拥有传统关系型数据库所具备的ACID特性
B : 需要很好的性能伸缩能力
C : 需要在海量数据中实现高效的随机读取
D : 能够同时处理结构化和非结构化的数据
22,大数据的最显著特征是( A)。
A : 数据规模大
B : 数据类型多样
C : 数据处理速度快
D : 数据价值密度高
23,假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系。
A : 因果;相关
B : 相关;因果
C : 并列;相关
D : 因果;并列
24,下列关于计算机存储容量单位的说法中,错误的是( C)。
A : 1KB1MB1GB
B : 基本单位是字节(Byte
C : 一个汉字需要一个字节的存储空间
D : 一个字节能够容纳一个英文字符
25,以下说法不正确的是(D)
林俊杰哥哥A : Hadoop Streaming使用Unix中的流与程序交互
B : Hadoop Streaming允许我们使用任何可执行脚本语言处理数据流
C : 采用脚本语言时必须遵从UNIX的标准输入STDIN,并输出到STDOUT
消防工程师证报考条件及考试科目D : Reduce没有设定,上述命令运行会出现问题
26,有关MapReduce的输入输出,说法错误的是(B)
A : 链接多个MapReduce作业时,序列文件是首选格式