大数据试卷
单选题,每一题只有一个正确选项,共110题
第1题,大数据不是要教机器像人一样思考。相反,它是(A)。
A : 把数学算法运用到海量的数据上来预测事情发生的可能性
B : 被视为人工智能的一部分
C : 被视为一种机器学习
D : 预测与惩罚
第2题,MongoDB是一种NoSQL数据库,具体地说,是(B)存储数据库。
A : 键值
B : 文档
冬笋怎么保存时间长而新鲜C : 图形
D : XML
第3题,以下哪种说法是错误的(B)。
A : 将罪犯的定罪权放在数据手中,借以表达对数据和分析结果的崇尚,这实际上是一种滥用
B : 随着数据量和种类的增多,大数据促进了数据内容的交叉检验,匿名化的数据不会威胁到任何人的隐私
C : 采集个人数据的工具就隐藏在我们日常生活所必备的工具当中,比如网页和智能手机应用程序
D : 预测与惩罚,不是因为所做,而是因为将做
第4题,下列关于MapReduce的说法错误的是(D)
A : MapReduce将复杂的、运行于大规模集上的并行计算过程高度地抽象到了两个函数:Map和Reduce
B : MapReduce采用“分而治之”策略,一个存储在分布式文件系统中的大规模数据集,会被切分成许多独立的分片(split),这些分片可以被多个Map任务并行处理
D : MapReduce应用程序必须要用Java来写
第5题,下面与Zookeeper类似的框架是(D)
A : Protobuf
B : Java非诚勿扰11号于川绿野
C : Kafka
D : Chubby
第6题,可以对大数据进行深度分析的平台工具是(C)。
A : 传统的机器学习和数据分析工具
B : 第二代机器学习工具
C : 第三代机器学习工具
D : 未来机器学习工具
第7题,哪个是HDFS(Hadoop Distributed File System)适合做的(B)。
A : 大量小文件存储
B : 流式数据访问
C : 随机写入
D : 低延迟读取
第8题,HBase依赖(D)提供强大的计算能力。
A : Zookeeper
B : Chubby
C : RPC
D : MapReduce
第9题,工业大数据的主要应用不包括(D)。
A : 设备状态分析
B : 用电分析与预测
C : 工业原料自动分类
D : 自然语言处理
第10题,建立在相关关系分析法基础上的预测是大数据的(C)。
A : 基础
B : 前提
C : 核心
D : 条件
第11题,在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该更着重于(A)为其行为承担责任。
A : 数据使用者
B : 数据提供者
C : 个人许可
D : 数据分析者
第12题,智慧城市的构建,不包含( C)。
A : 数字城市
B : 物联网
C : 联网监控?
D : 云计算
第13题,支撑大数据业务的基础是( B)。
A : 数据科学
B : 数据应用
C : 数据硬件
D : 数据人才
第14题,机器学习的实质在于(B)。
A : 想
B :
C : 判断
D : 理解
第15题,下列关于大数据的分析理念的说法中,错误的是(D)。
A : 在数据基础上倾向于全体数据而不是抽样数据
B : 在分析方法上更注重相关分析而不是因果分析
C : 在分析效果上更追究效率而不是觉得精准
D : 在数据规模上强调相对数据而不是绝对数据
第16题,Hadoop是由何种语言编写的(C)。
A : Scala
B : Erlang
C : Java
D : Python
第17题,hadoop中datanode的在作用(A)。
A : 存储数据
B : 管理集中的节点
C : 写入数据
D : 删除数据
第18ios14充电提示音题,可视化是将大数据分析结构展示出来的主要方式,不属于大数据分析与可视化的特性的是(D)。
A : 迭代性
B : 容错性
C : 参数收敛的非均匀性
D : 扩展性
第19题犹如怎么造句,关于工业大数据与互联网大数据的比较何者为伪(D)。
A : 互联网大数据是大量样本
B : 工业大数据尽可能全面使用样本
C : 互联网大数据对资料品质的要求较低
D : 工业大数据以统计分析为主通过挖掘样本中各个属性之间的相关性进行预测
第20题,关于Hive与Hadoop其他组件的关系,描述错误的是(D)。
A : HIVE最终将数据存储在HDFS中
B : HiveSQL其本质是执行的MapReduce任务
C : Hive是Hadoop平台的数据仓库工具?
D : Hive对HBase有强依赖
第21题,下面哪个场景不适合HBase的应用(A)。
A : 需要完全拥有传统关系型数据库所具备的ACID特性
B : 需要很好的性能伸缩能力
C : 需要在海量数据中实现高效的随机读取
D : 能够同时处理结构化和非结构化的数据
第22题,大数据的最显著特征是( A)。
A : 数据规模大
B : 数据类型多样
C : 数据处理速度快
D : 数据价值密度高
第23题,假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系。
A : 因果;相关
B : 相关;因果
C : 并列;相关
D : 因果;并列
第24题,下列关于计算机存储容量单位的说法中,错误的是( C)。
A : 1KB<1MB<1GB
B : 基本单位是字节(Byte)
C : 一个汉字需要一个字节的存储空间
D : 一个字节能够容纳一个英文字符
第25题,以下说法不正确的是(D)。
林俊杰哥哥A : Hadoop Streaming使用Unix中的流与程序交互
B : Hadoop Streaming允许我们使用任何可执行脚本语言处理数据流
C : 采用脚本语言时必须遵从UNIX的标准输入STDIN,并输出到STDOUT
消防工程师证报考条件及考试科目D : Reduce没有设定,上述命令运行会出现问题
第26题,有关MapReduce的输入输出,说法错误的是(B)。
A : 链接多个MapReduce作业时,序列文件是首选格式
发布评论