本栏目责任编辑:王力
计算机教学与教育信息化
计算机工科生数据科学思维人才培养模式研究与实践
李荣远,龙法宁,陆钊
(玉林师范学院计算机科学与工程学院,广西玉林537000)
摘要:随着第四次工业革命的到来,各产业设备逐渐走向智能化。计算机类专业人才培养引入数据科学思维至关重要,针
对计算机类工科生思考模式由数据到知识,最终用知识解决问题的传统思维。提出以数据科学与大数据技术、人工智能等专业为背景,探索学生从数据直接解决问题的数据科学思维培养模式。拥有数据科学思维三要素能力(理论、实践、精神)是每个学生必备条件。文章研究如何将数据科学思维融入课堂教学中,探索在学习新技术前,以数据为导向,激发学生从数据收集到萃取价值过程中数据科学思维模式。
关键词:数据科学;传统思维;大数据思维;数据科学三要素;数据价值中图分类号:TP18
文献标识码:A
文章编号:1009-3044(2021)01-0144-03
开放科学(资源服务)标识码(OSID ):
Research and Practice on the Training Model of Data Science Thinking Talents for Computer Engineering Students LI Rong-yuan,LONG Fa-ning,LU Zhao (Yulin Normal University,Yulin 537000,China)Abstract:With the advent of the fourth industrial revolution,various industrial equipment is gradually becoming intelligent.It is very important to cultivate computer professionals to introduce data science thinking.The traditional thinking of computer engineer⁃ing students from data to knowledge,and ultimately to solve problems with knowledge.Put forward the background of data science,big data technology,artificial intelligence and other majors to explore the data science thinking training model of students solving problems directly from data.The ability of the three elements of data science thinking (theory,practice,and spirit)is a prerequisite for every student.This article studies how to integrate data science thinking into classroom teaching,and explores how to use data as the guidance before learning new technologies,and stimulate students'data science thin高云翔回国
king mode from data collection to value extraction.
Keywords:data science;traditional thinking;big data thinking;three elements of data science;data value
1引言
2013年,Mattmann CA [1]和Dhar V [2]在《自然》和《美国计算机学会通讯》上分别发表题为《计算——数据科学的愿景》和《数据科学与预测》论文,从计算机科学与技术视角讨论数据科学的内涵,使数据科学纳入计算机科学与技术专业的研究范畴。之后随着数据摩尔定律爆发,将数据科学推向顶端[3]。
“数据科学”与“大数据”是两个既有区别又有联系的术语,可以将数据科学理解为大数据时代一门新科学[4]。数据科学是一门以“数据”为研究对象,并以数据统计、机器学习、数据可视化等为理论基础,主要研究数据加工、数据管理、数据计算、数
据产品开发等活动的交叉性学科[5]
。数据思维是学会如何获取数据、分析数据、萃取数据价值和应用数据的思维[6]。目前,大数据已受到各学科领域的高度关注,成为包括计算机科学和统
计学在内的多个学科领域的新研究方向。同时,大数据研究中
仍存在一些误区或曲解,如片面追求数据规模、过于强调计算架构和算法、过度依赖分析工具、忽视数据重用、混淆数据科学与大数据的概念以及全盘否定大数据等[7]。计算机工科生主要是培养实际应用能力的工程技术人员,注重实践培养。但现状中,学生遇到数据不知从何着手,用什么工具。计算机或大数据方向学生学习过各种工具。如编程语言:C 、Java 、Python ;大数据主流架构:Hadoop 、Spark ;机器学习模型:决策树、随机森林;深度学习模型:BP 神经网络、CNN 、RNN 等。缺少使用数据科学分析处理能力,不会融会贯通,或其在学习过程中注重单一概念、模型、算法,无系统性及逻辑性,整个培养过程以运用各种工具为主,缺少以数据为基础到解决问题的逻辑能力。培养模式并不是掌握所有知识体系,再去解决问题,而是根据部
收稿日期:2020-10-20
基金项目:玉林师范学院校级科研项目资助(Grant No.2019YJKY29);OBE 理念下数据科学与大数据技术核心课程体系的构建
(201901070008);新工科多方协同育人模式改革与实践(201802111006);双螺旋模式大数据专业人才培养体系的探索与实践(2020XGK03);自筹教改项目——计算机工科生数据科学思维人才培养模式研究与实践(2020XJJGZC09)
作者简介:李荣远,男,云南宣威人,硕士,讲师,研究方向:机器学习、大数据;龙法宁,男,广西玉林人,硕士,高级工程师,通讯作者,
研究方向:深度学习;陆钊,男,广西玉林人,硕士,副教授,研究方向:大数据处理。
144
计算机教学与教育信息化
本栏目责任编辑:王
Computer Knowledge and Technology 电脑知识与技术
第17卷第1期(2021年1月)
分知识直接去解决问题。因此,计算机类或大数据方向教学环境中融入数据科学思维至关重要,并养成数据思维习惯是人才
培养模式的关键[8-9]
文科专业就业前景好2数据科学思维模式
2.1传统思维到大数据思维模式
面对数据,学生思维模式一般有两种,传统思维和大数据
思维。传统思维是我能为数据做什么,而数据科学思维是数据能为我做什么。数据科学主要是从数据中发现潜藏的有价值的信息,并直接解决问题。如图1中对中文翻译“你好吗”传统思维与大数据思维思考模式的异同。
(1)传统思维:Step1:将“你好吗”这句话通过分词,如根据自己系统已有的知识,将句子分3个词,出这3个词对应的各中文。
Step2:将英文字母进行组织。(2)大数据思维:“你好吗”这个句子在现实中多次用“How You good is[错数据
知识
问题
数据
问题
翻译实例你好吗
经济学专业学什么你好吗How are you You
Good,well
Is,are,do,
Step2图1传统思维与大数据思维思考模式对比
2.2数据科学DIKUW 模型
数据科学主要研究目标从数据D (Data )到信息I (Informa⁃tion )、知识K (Knowledge )、理解U (Understanding ),最终到智慧W (Wisdom )的转化,如图2所示数据科学DIKUW 实例转换模型。从数据到智慧呈现金字塔形式逐级攀升,体现思维从过去到未来的一种思考模式。以计算机就业实例为导向,逐一分析未来需学习哪些知识,从而适应社会的发展。DIKUW 模型思考过程如下:
图2数据科学DIKUW 转换模型
英文生日祝福语
(1)数据:发现一些零散的数据。
(2)信息:通过多条数据之间的关联得到对应的信息。(3)知识:从多条信息中发现模型、规律,获得新知识。(4)理解:利用新增信息、知识理解和洞见新的机会。(5)智慧:做出数据驱动型决策,有选择性地投资,降低风险,预测未来。2.3数据科学三要素原则
数据科学不同于其他学科,应具有重要的三要素原则:理
论、实践和精神[10]
。其中理论与实践一般在各学科中都有涉及。但要保持终身学习的能力,精神至关重要。如3C 精神,Creative Working (创造性地工作)、Critical Thinking (批判性地思考)、Curious Asking (好奇性地提问)。需要将这些精神融入理论和实践中去。这3种精神是支撑学生终身学习的精神支柱。
3数据科学思维课程体系建设
数据科学思维根据数据科学三要素原则,现代信息技术的发展,如百度大脑6.0、自动驾驶汽车、脑机接口Neuralink 、智慧仓储、华为5G 等高新技术加速万物互联,设备逐渐走向智能化发展。数据科学思维在各项新技术中起关键作用,培养学生养成数据科学思维的能力至关重要。教学培养过程中应从以下几个方面设计。3.1理论学习
开设数据科学导论理论+实践课程,或者在计算机导论课
程中插入数据科学理论知识,由校企合作或资深专家亲授,将现实应用中的云计算、大数据、物联网、人工智能、信息安全、5G 技术整体串接。以案例为导向激发学生兴趣,开阔视野,结合专业知识启发性地思考。3.2实践巩固
通过校企数据挖掘可视化平台、虚拟仿真平台或者开源数据挖掘可视化平台来实践巩固数据科学理论知识。国家推行产教融合、校企合作培养模式,大量企业走进高校,利用企业数据挖掘可视化平台:如曙光、星环大数据挖掘可视化平台;开源可视化平台如Orange 、R-Programming 、WEKA 、RapidMiner 等,通过虚拟化技术生动地将模型展示在学生面前,从而激发学生动手实践乐趣。
(1)入门阶段:零基础学生通过平台上组件推拽、流程指向即可实现数据挖掘可视化,方便学生快速掌握机器学习、深度学习等大量模型。
(2)进阶阶段:开设数据科学核心编程选修课程,如Py⁃thon 、R ,两种语言已在统计学和机器学习占用一席之地。已开发大量包,两者之间可以通过接口相互调用,学习两者语言是精通数据科学必经之路。企业或学校用现实案例,以企业项目(人脸识别、电影推荐、情感分析、词云图)、竞赛题目(Kaggle 、泰迪杯数据挖掘挑战赛、数学建模)为导向,以数据为中心,问题为导向。通过实践学习,让学生掌握数据科学工具能做什么,以及如何做,启发科学分析问题的能力。3.3终身学习的精神能力
具有数据科学理论和实践能力,并不行,还需具有良好的
精神素质。根据平台虚拟结果的展示,培养学生深度思考的能力,如机器学习训练模型结果差,分析是否过拟合、模型选择是否合理、特征处理是否正确、参数设置是否合理等多维度思考模式,培养学
生在解决最终问题的同时,反思为什么,只有让学
145
本栏目责任编辑:王力
计算机教学与教育信息化Computer Knowledge and Technology 电脑知识与技术第17卷第1期(2021年1月)
生保持好奇心同时具有批判性精神是学生终身学习的动力。
4结语
未来社会逐渐走向智能化,各校高度重视培养先进人才,
特别是数据科学与大数据、人工智能等专业人才,目前一些高校已经制定一些培养方案,但人才缺失面临一些问题,数据科学思维培养方式是今后教学改革的重要目标。
参考文献:
[1]Mattmann C A.Computing:A vision for data science[J].Na⁃ture,2013,493(7433):473-475.
[2]Dhar V.Data science and prediction[J].Communications of the ACM,2013,56(12):64-73.[3]Gartner J.Gartner ’s 2014hype cycle for emerging technolo⁃gies maps the journey to digital business[OL].www.gart⁃ner/newsroom/id/2819918.
[4]Provost F,Fawcett T.Data science and its relationship to big
data and data-driven decision making[J].Big Data,2013,1(1):51-59.
[5]朝乐门.数据科学理论与实践[M].北京:清华大学出版社,2017.
[6]姜海红.浅谈大学计算机基础通识课程如何培养学生计算思维与数据思维能力[J].计算机产品与流通,2020(1):258.
[7]崔琳,吴孝银,张志伟.面向学生计算思维培养的数据科学与大数据技术专业课程体系建设模式探究[J].无线互联科技,2020,17(4):121-122.
[8]陈鲸.未来互联网+大数据时代数据科学发展与应用[J].网信军民融合,2019(06):17-20.
[9]朝乐门,邢春晓,张勇.数据科学研究的现状与趋势[J].计算机科学,2018,45(1):1-13.
郝邵文个人资料[10]朝乐门.数据科学[M].北京:清华大学出版社,2016.
【通联编辑:王力】
(上接第141页)
并给出解决问题的方案;实验结束时各组以答辩的形式演示汇报自己的设计成果。类似这种综合性实验更好地将科学、技术、工程、艺术、数学等融入进了整个教学过程中,同时增强了学生自主研究的能力、团队合作精神、实践动手能力,充分发挥了学生的创造性。
实验项目的实施流程可以参照图2。在实验项目实施前,教师根据实际情况进行知识拓展来引导学生,学生查阅资料,以保证实验的顺利实施。实验项目实施过程中,教师要注重培养学生解决实际问题的能力,引导学生独立分析问题,提出方案,构建模型,设计实验,评估改进等一系列过程。为了让学生更有成就感,可将学生的最终作品进行评价和展示。
3结束语
文中就《信号与系统》课程学时紧、任务重,理论性强,等等
特点,结合实际教学经验,提出了以下显化STEAM 理念的教学策略:(1)结合学生和多种教学模式的特点,根据实际情况进行因材施教、因地施教,包括混合式教学模式的探讨和实践、开发调节课堂气氛的课堂教学案例,多样化的课后辅导形式等等。(2)注重学生动手能力和创造力的培养,进一步加强实稍息是左脚还是右脚
践教学,
包括强化仿真软件MATLAB 的应用,开发融合STEAM 理念的
综合性实验项目等。通过实施一系列策略,在理论教学和实践教学过程中逐步激发学生的学习兴趣,让学生直观形象地理解理论知识,提高学生的动手能力和创造力,提高课程的教学效果。
参考文献:
[1]田世海,王宇奇,安宁.基于STEAM 教育的大学生跨专业创新素养研究[J].黑龙江教育(高教研究与评估),2020(6):82-84.[2]毛盼娣,廖晓文,李敏,等.基于STEAM 的应用型电子信息工程专业课程融合教学研究[J].文化创新比较研究,2020,4(13):158-159.[3]毕峰.《信号与系统》课程教学改革与实践策略探讨[J].创新创业理论研究与实践,2020,3(9):24-25.
[4]冯英翘,宋超,黄晓红,等.面向专业应用型人才培养的信号与系统课程改革[J].华北理工大学学报(社会科学版),2020,20(2):85-88,126.
[5]林宏翔,史洪宇.应用型本科高校《信号与系统》课程教学改进及探究[J].高教学刊,2019(16):138-140.
【通联编辑:唐一东】
146