数据处理技术
Big Data Technology
课程代码:08410128
学分:3
学时:56(其中:课堂教学学时:40 实验学时:0 上机学时:16 课程实践学时:0 )
先修课程:计算机基础
适用专业:信息管理与信息系统专业,电子商务专业,工业工程专业
教材:大数据技术原理与应用(林子雨著,人民邮电出版社)
一、课程性质与课程目标
(一)课程性质(需说明课程对人才培养方面的贡献)
本课程是“信息管理与信息系统”专业的一门专业选修课。大数据作为继云计算、物联网之后IT行业又一颠
覆性的技术,备受关注。大数据时代的到来,迫切需要高校及时建立大数据技术课程体系,为社会培养和输送一大批具备大数据专业素养的高级人才,满足社会对大数据人才日益旺盛的需求。本课程定位为大数据技术入门课程,为学习者搭建起通向“大数据知识空间”的桥梁和纽带,帮助学习者形成对大数据知识体系及其应用领域的轮廓性认识,为他们在大数据领域“深耕细作”奠定基础、指明方向。
(二)课程目标(根据课程特点和对毕业要求的贡献,确定课程目标。应包括知识目标和能力目标。)
1. 把握大数据基本概念和应用领域,大数据处理架构及相关流行技术等。培养学生熟练运用信息化工程理论、方法和工具,并具有大数据规范、分析和实施的基本技能;
2. 对大数据存储相关技术的概念和原理具有一般性认识,并初步培养信息素养和信息处理能力,从而具备在政府、企业信息化过程担任管理信息化咨询,信息系统运维管理和信息化项目评价能力;
3. 加强大数据处理和分析的核心技术的理解与学习,培养学习者将大数据与企业和社会实践紧密结合的意识,能系统掌握信息技术和信息管理基本理论、知识和技能,并可承担信息中心的信息处理技术工作与培训机构的教育工作;
4. 训练自主学习和探究分析大数据领域的研究内容及发展动向的能力,能承担软件公司的信息系统开发、实施指导与监理工作。
注:工程类专业通识课程的课程目标应覆盖相应的工程教育认证毕业要求通用标准;
(三)课程目标与专业毕业要求指标点的对应关系(认证专业专业必修课程填写)
注:课程目标与毕业要求指标点对接的单元格中可输入“ ”,也可标注“H、M、L”。
二、课程内容与教学要求
第一章大数据概述
(一)课程内容
大数据时代,大数据的概念,大数据的影响,大数据的应用,大数据关键技术,大数据计算模式,大数据产业,大数据与云计算、物联网等。
(二)教学要求
掌握大数据及其相关技术的概念。
(三)重点与难点
一劳永逸是什么意思1. 重点
了解大数据的概念,大数据关键技术,大数据计算模式。
2. 难点
了解大数据关键技术,大数据计算模式,大数据产业,大数据与云计算、物联网。
第二章大数据处理架构Hadoop
(一)课程内容
Hadoop概述, Hadoop生态系统,Hadoop的安装与使用等。
(二)教学要求
了解Hadoop,理解Hadoop生态系统,学会Hadoop的安装与使用。
(三)重点与难点
1. 重点
理解Hadoop生态系统,学会Hadoop的安装与使用。
2. 难点
学会Hadoop的安装与使用。
第三章分布式文件系统HDFS
(一)课程内容
分布式文件系统、HDFS简介、HDFS的相关概念、HDFS体系结构、HDFS的存储原理、HDFS的数据读写过程、HDFS编程实践等。
(二)教学要求
了解分布式文件系统、HDFS相关概念;理解HDFS体系结构、存储原理和数据读写过程;初步实践HDFS编程。
(三)重点与难点(若不单独列出,需在教学要求中适当注明)
1. 重点
理解HDFS体系结构、存储原理和数据读写过程。
2. 难点
初步实践HDFS编程。
第四章分布式数据库Hbase
(一)课程内容
分布式数据库Hbase概述、HBase访问接口、HBase数据模型、HBase的实现原理、HBase运行机制、HBase编程实践等。
(二)教学要求
了解分布式数据库Hbase相关概念和数据模型;理解HBase的实现原理和运行机制;初步实践HBase编程。
(三)重点与难点
1. 重点
理解HBase的实现原理和运行机制。
2. 难点
初步实践HBase编程。
第五章NoSQL数据库
(一)课程内容
NoSQL数据库简介、NoSQL兴起的原因、NoSQL与关系数据库的比较、NoSQL的四大类型、NoSQL 的三大基石、从NoSQL到NewSQL数据库等。
2022年立秋是哪天(二)教学要求
了解NoSQL数据库、兴起的原因;理解NoSQL与关系数据库的区别;了解NoSQL的四大类型、
三大基石,以及NewSQL数据库。
老饭骨(三)重点与难点(若不单独列出,需在教学要求中适当注明)
1. 重点
了解NoSQL数据库、兴起的原因;理解NoSQL与关系数据库的区别。
2. 难点
理解NoSQL与关系数据库的区别;了解NewSQL数据库。
第六章云数据库
(一)课程内容
云数据库概述、云数据库产品、云数据库系统架构、云数据库实践等。
(二)教学要求
了解云数据库相关概念及其产品;理解云数据库系统架构;并实践云数据库。
(三)重点与难点(若不单独列出,需在教学要求中适当注明)
1. 重点
理解云数据库系统架构;并实践云数据库。
2. 难点
初步实践云数据库。
第七章MapReduce
(一)课程内容
孟瑶三围MapReduce简介、MapReduce的工作流程、MapReduce实例分析:WordCount、MapReduce的具体应用、MapReduce编程实践等。
(二)教学要求
了解MapReduce相关概念和工作流程;理解并分析MapReduce实例;掌握MapReduce的具体应用;初步实践MapReduce编程。
(三)重点与难点(若不单独列出,需在教学要求中适当注明)
1. 重点
了解MapReduce相关概念和工作流程;理解分析MapReduce实例;掌握MapReduce的具体应用。
2. 难点
掌握MapReduce的具体应用;初步实践MapReduce编程。
第八章Hadoop再探讨
(一)课程内容
Hadoop的优化与发展、HDFS2.0的新特性、新一代资源管理调度框架YARN、Hadoop生态系统中具有代表性的功能组件介绍等。
(二)教学要求
了解Hadoop的优化与发展、HDFS2.0的新特性、新一代资源管理调度框架YARN和Hadoop生态系统中具有代表性的功能组件。
(三)重点与难点(若不单独列出,需在教学要求中适当注明)
1. 重点
Hadoop的优化与发展。
2. 难点东来东往的资料
知晓HDFS2.0的新特性、了解Hadoop生态系统中具有代表性的功能组件。
第九章Spark
(一)课程内容
Spark概述、Spark生态系统、Spark运行架构、Spark的部署和应用方式、Spark编程实践等。
(二)教学要求
网上怎样订火车票
了解Spark相关概念、其生态系统、运行架构、部署和应用方式;初步掌握Spark编程实践。
(三)重点与难点(若不单独列出,需在教学要求中适当注明)
1. 重点
了解Spark相关内容。
2. 难点
初步掌握Spark编程实践。
第十章流计算
(一)课程内容
流计算概述、流计算的处理流程、流计算的应用、开源流计算框架Storm、Spark Streaming 设计等。
(二)教学要求
了解流计算相关概念、流计算的处理流程、流计算的应用;理解开源流计算框架Storm及Spark Streaming设计。
(三)重点与难点(若不单独列出,需在教学要求中适当注明)