《探索大数据与及人工智能》习题及答案
单选
1、Spark Streaming是什么软件栈中的流计算?
金融类大学排名
A. Spark B. Storm C. Hive D. Flume
2、下列选项中,不是大数据发展趋势的是?
寒露谚语A. 大数据分析的革命性方法出现 B. 大数据与与云计算将深度融合
C. 大数据一体机将陆续发布 D. 大数据未来可能会被淘汰
3、2011年5月是哪家全球知名咨询公司在《 Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?
A. 比尔·恩门 B. 麦肯锡 C. 扎克伯格 D. 乔图斯
4、以下哪个属于大数据在电信行业的数据商业化方面的应用?
A. 精准广告 B. 网络管理C. 网络优化 D. 优化
5、以下哪个不属于大数据在电信行业的应用?
A. 数据商业化 B. 物流网络 C. 企业运营D. 客户关系管理
6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A. 首席数据官 B. 首席科学家C. 首席执行官 D. 首席架构师
7、下列选项中,不是kafka适合的应用场景是?
A. 日志收集 B. 消息系统 C. 业务系统 D.流式处理
8、下列选项中,哪个不是HBASE的特点?
A. 面向行 B. 多版本 C. 扩展性 D. 稀疏性
9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?
A. 数量越多处理时间越长 B. 数量越多处理时间越短
B. 数量越小处理时间越短 D.没什么关系
10、在Spark的软件栈中,用于机器学习的是
A. Spark Streaming B. Mllib C. GraphX D.SparkSQL
11、Spark是在哪一年开源的?
A. 1980 B. 2010 C. 1990 D. 2000
12、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是?
A结构化数据 B. 非结构化数据 C. 半结构化数据 D. 全结构化数据
13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?
A. 机器性能 B. 语言歧义性 C. 知识依赖 D. 语境
14、语音识别常用的应用有四个,下列不是常用应用的是?
A. 聊天 B. 拨号 C. 导航 D. 设备控制
15、以下哪种学习方法不属于人工智能算法?
A.迁移学习 B. 对抗学习 C. 强化学习 D.自由学习
16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?
A. 模型 B. 表结构 C. 结果 D. 报表
17、总体来说,人工智能发展的未来趋势是?
A. 上升 B. 下降 C. 不动 D. 大幅度下降
18、中国移动自主研发、发布的首个人工智能平台叫做()
A. 九天 B. OneNET C. 移娃 D.大云
19、以下数据单位从小到大排列的顺序是?
A. GB、B、KB B. BKBMB C. KB、ZB、PB D.B、MB、KB
20、以下数据单位换算错误的是?
A. 1KB=1024B B. 1GB=1024MB C. 1TB=1000GB D. 1MB=1024KB
21、以下不是非结构化数据的项是?
A. 图片 B. 音频 C. 数据库二维表数据 D. 视频
22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?
A. Reduce B. Hash C. Clean D. Loading
23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?
A. AI B. BI C. AL D. AF
24、下列选项中,哪项是由谷歌开发的人工智能算法框架?
A. Kafka B. Tensorflow C. Caffe D.Torch
25、BP神经网络的学习规则是?
A. 梯度上升法 B. 梯度下降法 C. 梯度提升法 D. 梯度曲线法
26、语音识别产品体系有四部分,下列哪项不是体系之一?
A. 坎蒂丝 斯瓦内普尔语音合成 B. 语音播放 C. 语音识别 D. 语义理解
27、数据生态中,算法模型分为两代,那么第一代算法模型是?
A. Tez B. Spark C. Pig D.MapReduce
28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的
场合,受益就相对较小;
A. 内存 B. 硬盘 C. 磁带 D. 显卡
29、下列选项中,哪项是分布式文件存储系统?
A. HDFS B. Flume C. Kafka D. Zookeeper
30、工信部正式发布大数据产业”十三五“发展规划是在哪一年?
A. 1987 B. 1997 C.2007 D. 2017
31、学习没有标签的数据集的机器学习方法是?
A. 监督学习 B. 无监督学习 C. 半监督学习 D. 强化学习
32、当前世界产生的数据总量的单位是?
A. KB B. ZB C. GB D. TB
33、下列选项中正确说明价值密度低的是?
A.100TB数据中有50TB有效数据 B. 1TB数据中有1KB有效数据
C.100PB数据中有100PB有效数据 D. 10EB数据中有10EB有效数据
34、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。
A. 精灵 B. 阿尔法蛋 C. 小度 D. 移娃
35、IBM的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。
A. AlphaGo B. 深蓝C. 图灵机模型 D. 深度学习机器人
36、在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode是文件存储者,那么Client是什么呢?
A. 连接器 B. 客户端 C. 接口提供者 D. 数据采集
37、mapreduce计算模型适用于哪种任务?
古迹
A. 多线程处理 B. 有关联的行处理 C. 批处理 D. 实时数据变化处理
38、大数据特征有几种(不包括IBM提出的新特征)?
A.1 B.2 C.3 D.4
39、Hadoop是()年诞生的?
A.1985-1985 B.1995-1996 C.2005-2006促织原文及翻译注释 D.2015-2016
40、以下哪个不属于大数据在电信行业的数据商业化方面的应用?
A. 精准广告 B.网络管理 C.营销洞察 D.大数据检测和决策
41、传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?
A. 给定标签 B.离散 C.分类 D.回归
42、下列选项中,正确描述Flume对数据源的支持的是?
A. 只能使用HDFS数据源 B.可以配置数据源 C.不能使用文件系统 D.不能使用目录方式
43、IBM提出的大数据5V特征包括()、更快(Velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)
A. 更有效 B.小学三年级作文秋天更大(Volume C.更充分 D.更直观
44、下列选项中,不是大数据的一部分的是?
A.海量计算 B.大量数据管理 C.数据分析 D.单机计算
45、Flume采用了三层架构,分别为agent,collector和()
A. Map B.storage C.Shuffle D.Hash
46、HBASE的特点不包括?
A.面向列 B.稀疏性 C.多版本 D.低可靠性
47、mapreduce计算模型适用于哪种任务?
A.多线程处理 B. 有关联的行处理 C. 批处理 D.实时数据变化处理
48、最初的大数据概念还比较模糊,只是隐约的知道像个性化推荐、搜索引擎之类的处理需理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商?
A. 谷歌 B. 百度 C. 360 D. bing
49、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论级别的突破。而哪项技术将继续成为大数据智能分析的核心技术?
A. 机器学习 B. 智能物流 C. 脑科学 D. 智能终端
50、下列选项中,正确描述Flume对数据源的支持的是?
A. 只能使用HDFS数据源 B. 可以配置数据源 C. 不能使用文件系统 D. 不能使用目录方式
51、HBASE的特点不包括哪些?
A. 面向行 B. 稀疏性 C. 多版本 D. 高可靠性
52、下列选项中,不是用于数据存储的技术是哪一个?
A. MongoDB B. MySQL C. HDFS D. Java
53、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工智能称为()
A. 高人工智能 B. 低人工智能 C. 强人工智能 D. 弱人工智能
54、下列选项中,不是人工智能的基础设施的是?
A. CPU服务器 B. GPU服务器 C. 专用芯片D. 游戏显卡
54、以下不是大数据特征的是?
A. 数据体量大 B. 数据种类多 C. 价值密度高 D. 处理速度快
55、以下应用没有使用你的地理位置信息的是?
A.美团 B. 滴滴 C. 高德地图 D. word
56、下列选项中,不是Flume的特点的是?
A. 可靠性 B. 集中式架构 C. 可扩展性 D. 可管理性
57、在Spark的软件栈中,用于交互式查询的是
A. SparkSQL B. Mllib C. GraphX D. Spark Streaming
58、下列选项中,不是大数据的一部分的是?
A. 海量计算 B. 大量数据管理 C. 数据分析 D单机计算
59、人工智能、机器学习、深度学习的包含关系是()
A. 机器学习>深度学习>人工智能 B. 人工智能>深度学习>机器学习
C.人工智能>机器学习>深度学习 D. 深度学习>人工智能>机器学习
60、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?
A. 机器性能 B. 语言歧义性 C. 知识依赖 D. 语境
61、BP神经网络模型拓扑结构不包括
A.输入层 B. 隐层 C. 输出层 D. 显层
62以下哪个不是语音识别的范畴?
A. 语音听写 B. 语音合成 C. 语音转写 D. 语音唤醒
63、Alpha Go是第一个击败人类职业()选手的人工智能程序。