《大数据技术与应用》教学大纲一、课程基本信息
梦见小女孩1.课程代码:21122600
2.课程中文名称:大数据技术与应用课程英文名称:Technologies and Applications of Big Data
3.面向对象:信息工程学院软件工程系三年级学生
4.开课学院(课部)、系(中心、室):信息工程学院 软件工程系
5.总学时数:40讲课学时数:24,实验学时数:16
6.学分数:2.5
7.两弹之父是谁授课语种:中文,考试语种:中文
8.宋承宪成宥利教材:待定二、课程内容简介
课程将系统讲授大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、 分布
数据库HBaseNoSQL长春油价数据库、云数据库、分布式并行编程模型MapReduce,流计算、 图计算、数据可视化以及大数据在互联网、生物医学和物流等各个领域的应用。
三' 课程的地位、作用和教学目标
专业选修课,大数据技术入门课程,为学生搭建起通向“大数据知识空间”的桥梁和纽 带,以“构建知识体系、说明基本原理、引导初级实践、了解相关应用”为原那么,为学生在 大数据领域“深耕细作”奠定基础、指明方向。在HadoopHDFS> HBaseMapReduce等 重要章节,安排了入门级的实践操作,让学生更好地学习和掌握大数据关键技术。
四'与本课程相联系的其他课程
先修课程:数据库系统概论、计算机高级语言程序设计五' 教学基本要求
(1)能够建立对大数据知识体系的轮廓性认识,了解大数据开展历程、基本概念、主要影 响、应用领域、关键技术、计算模式和产业开展,并了解云计算、物联网的概念及其与大数 据之间的紧密关系;
(2)能够了解Hadoop的开展历史、重要特性和应用现状,Hadoop工程结构及其各个组件, 并熟练掌握王健林 后台Hadoop平台的安装和使用方法;
(3)能够了解分布式文件系统的基本概念、结构和设计需求,掌握Hadoop分布式文件系 统HDFS的重要概念、体系结构、存储原理和读写过程,并熟练掌握分布式文件系统HDFS 的使用方法;
(4)能够了解分布式数据库HBase的访问接口、数据模型、实现原理和运行机制,并熟练 掌握HBase的使用方法;
5)能够了解NoSQL数据库与传统的关系数据库的差异、NoSQL数据库的四大类型以及NoSQL数据库的三大基石;基本掌握RedisMongoDBNoSQL数据库的使用方法;
6)能够了解云数据库的概念、基本原理和代表性产品的使用方法;
(7)能够熟练掌握分布式编程框架MapReduce的基本原理和编程方法;
(8)能够了解流计算与批处理的区别,以及流计算的基本原理;
(9)能够了解图计算的基本原理;
10)能够了解数据可视化的概念和相关工具;
11能够了解大数据在互联网等领域的典型应用。
六'考核方式与评价结构比例
(1)平时成绩:学生完成上机练习题目,并提交上机实验报告,实验报告成绩作为平时成 绩;
2)期末考试:采用笔试,闭卷;
3)最终成绩:平时成绩和期末考试成绩按比例加权求和。
七、教学参考资料[1]陆嘉恒.Hadoop实战.机械工业出版社.2011年.
[2]曾大聃,周傲英(译).Hadoop权威指南中文版.清华大学出版社.2010年.
[3]迪米达克(Nick Dimiduk),卡拉纳(Amandeep Khurana),谢磊.HBase实战中文版.人
民邮电 出版社;第1201391日)八、教学进度与内容安排
高允真
序次
教学基本内容' 重点、难点
1
介绍大数据的基本概念和应用领域,并阐述大数据、云计算和物联网的相互关系
2
介绍大数据处理架构Hadoop
3
分布式文件系统HDFS的基本原理和使用方法
4
分布式数据库HBase的基本原理和使用方法
5
NoSQL数据库的概念和基本原理
6
云数据库的概念和基本原理
7
分布式并行编程模型MapReduce原理和使用方法
8
流计算基本原理
9
图计算基本原理
10
数据可视化概念、工具和案例
11
大数据在互联网领域的典型应用:推荐系统