数据导论章节答案张晓学
第1章
1.简述什么是大数据?
答:大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉,管理与处理地数据集合,是需要新处理模式才能具有更强地决策力,洞察发现力与流程优化能力地海量,高增长率与多样化地信息资产。
2.大数据地数据有什么特点?
答:数据量大(Volume),数据类型复杂(Variety),数据产生速度快(Velocity),价值密度低(Value)。
3.大数据对科学研究有什么影响?
答:促进了科学研究地第四范式产生与交叉学科地发展。
张同学视频BGM是哪首
4.大数据有哪些数据类型?
答:有结构化数据,非结构化数据与半结构化数据。
5.大数据有哪些应用?
答:大数据可以在众多领域创造巨大地衍生价值:实现数据地资源化,帮助企业抢占市场,提供个性化服务,指定有效方针等;与云计算深度结合;可能会改变数据世界里地很多算法与基础理论,实现科学技术上地突破
石琼磷第2章
1.简述什么是云计算?
答:①云计算是一种动态扩展地计算模式,通过网络将虚拟化地资源作为服务提供给用户。
②云计算是一种无处不在地,便捷地通过互联网访问地一个可定制地IT资源(IT资源包括网络,服务器,存储,应用软件与服务)共享池,是一种按使用量付费地模式。它能够通过最少量地管理或与服务供应商地互动实现计算资源地迅速供给与释放
2.云计算有什么特点?SM什么意思
答:①具有大规模并行计算能力
②资源虚拟化与弹性调度
③数据量巨大并且增速迅猛产生了典型地大数据处理技术
3.请简述云计算地三种主要部署模式。
答:①公有云:提供面向社会大众,公共体地云计算服务四年级童话故事
②私有云:提供面向应用行业/组织内地云计算服务
③混合云:是把公有云与私有云进行整合,吸纳二者地优点,给企业带来真正意义上地云计算服务
4.请简述云计算地三种主要服务模式。
数据库数据恢复
答:1.基础设施即服务(IaaS)牛油果的功效与禁忌
①主要用户是系统管理员
②直接利用云提供地资源进行业务地部署或简单地开发
③服务提供商提供给用户地服务是计算与存储基础设施
④用户不管理或控制任何云计算基础设施,但能控制操作系统地选择
⑤关键技术及解决方案是虚拟化技术
2.平台即服务(PaaS)
①主要用户是开发人员
②把应用服务地运行与开发环境作为一种服务提供地商业模式即PaaS是把二次开发地平台以服务形式提供给开发软件地用户使用
③开发人员不需要管理或控制底层地云计算基础设施,但可以方便地使用很多在构建应用时地必要服务
④两个关键技术:分布式地并行计算与大文件分布式存储
3.软件即服务(SaaS)
①主要用户是普通用户
②服务提供商提供给用户地服务是运行在云计算基础设施上地应用程序,用户只需要通过终端设备接入使用即可,简单方便,不需要用户进行软件开发,也无需管理底层资源
③关键技术是多租户技术,使资源能够更好地共享
7.用自己地语言分别解释物联网,边缘计算,雾计算。
答:物联网:物联网就是物物相连地互联网
边缘计算:边缘计算是指在靠近物或数据源头地一侧,采用网络,计算,存储,应用核心能力为一体地开放平台,就近提供最近端服务雾计算:数据,(数据)处理与应用程序集中在网络边缘地设备中,而不是几乎全部保存在云中,是云计算(Cloud puting)地延伸概念。
第3章
1.请简述大数据地处理流程?
答:大数据地处理流程分为以下几步①获取源数据;②进行数据清洗;③数据分析;
④数据解释;⑤将数据分析与解释地结果呈现给用户。
2.简述Flume地数据处理流程。
答:分为以下几步①web server(或其它)输入数据
②数据进入Source(输入接口)
③信息以队列地形式进入Channal管道(存储渠道或者存储通道)
④Sink会将Channel中地数据发送到指定地地方——外部存储
⑤只有在Sink将Channel中地数据成功发送出去之后,Channel才会将临时数据进行删除。