计算机科学中的数学pdf_不懂数学的⼈,能在计算机领域⾛多
远?
计算机专业常听到这样⼀句调侃:
⼀流程序员靠数学
⼆流程序员靠算法
三流程序员靠逻辑
四流程序员靠SDK
五流程序员靠 Google 和 StackOverFlow
计算机专业如何学好数学?这个问题⼀直备受计算领域⼩伙伴们关注。打开知乎,你会看到相关问题的热度,⼀直居⾼不下:
所以,苦于学习数学的计算机专业的朋友们,你并不孤单。
恰好,⼈邮君看到⼀位计算机前辈的现⾝说法:
作为⼀名曾经计算机专业的学⽣,我也曾困惑并排斥学数学这件事。⼤学时候,某个教授告诉我们,学好数学才能真正学好计算机。
我⼀直质疑这门难到让⼈怀疑⼈⽣的学科真的那么重要么?数学和计算机能有多⼤的关系呢?在质疑中,我果断的抛弃了数学,潜⼼学算法和程序设计。在后来的⼯作中,甚⾄遇到lab、课设,得过且过,抄⼀抄应付了事。
然⽽进⼊了⼯作岗位多年,进⼊了更⾼的level之后,我才知道⼀流程序员靠数学的理论 ,
并不只是程序员互相调侃调侃那么简单。
在实际的⼯作中当计算机专业的⼩伙伴们⾯对⼀个⼜⼀个的计算机问题时,就会不断后悔⾃⼰当初没有好好学数学,虽然的确能⽤算法的知识解决很多的问题,但是因为数学⼯具的基础薄弱,做出来的算法的实⽤性都很差。经过不断反思总结,就会发觉⽆论是数据结构与算法,还是程序设计,其底层原理和思路⼤都源⾃于数学。
很多⼩伙伴在⼯作中发觉了⾃⼰的弱势⼜开始回过头来恶补数学,却⼜遇到和当初⼀样的问题——各种课程听得昏昏欲睡,教科书也⾮常死板,看得头⽪发冷,更别提怎么帮助⼤家解决实际的⼯程问题。
很多时候数学知识晦涩难懂,并不是因为学⽣不努⼒,⽽是书本没讲好,它没有从源头讲清楚数学知识的本质。只有“知其然,并知其所以
然”才能加深对知识的理解,在升级打怪的路上畅通⽆阻。
说到这⾥,就不得不提⼀本备受读者喜爱的书——吴军博⼠的《数学之美》,它帮助很多⼈,改变了对数学的刻板印象,打开了学习数学的⼤门。
作者:吴军
正如作者吴军博⼠所说,技术分为道和术,教会⼤家具体⽅法的是“术”,教会⼤家做事原理和原则的是“道”。《数学之美》这本书更多地是为⼤家讲解技术的道,⽽⾮术。这能引发读者的思考,让⼤家从实际的⼯程应⽤中领悟数学之美!
举⼏个书中的例⼦,让⼤家⼀睹为快。
数学的简单之美:从“0与1”到搜索引擎
《数学之美》的第⼋章从最简单的布尔代数谈起。
布尔代数虽然⾮常简单,却是计算机科学的基础,它不仅把逻辑和数学合⼆为⼀,⽽且给了我们⼀个全新的视⾓看待世界,开创了数字化时代。
世界上不可能有⽐⼆进制更简单的计数⽅法了,它只有两个数字:0 和 1。
⼆进制除了是⼀种计数⽅式外,它还可以表⽰逻辑的“是”与“⾮”。
布尔运算
1 (TRUE, 真) 和 0(FALSE,假)。布尔运算是针对⼆进制,尤其是⼆进制第⼆个特性的运算,它很简单,运算的元素只有两个:1 (TRUE, 真) 和 0(FALSE,假)。
“或” (OR) 和 “⾮”伊恩惠
“⾮”(NOT) 三种。
“与”(AND)、 “或”
基本的运算只有 “与”
(后来发现,其实这三种运算都可以转换成“与”“⾮”AND-NOT⼀种运算)
丁子峻婚礼运算规则是这样的:(如果觉得简单可以跳过看应⽤)
运算规则
如果 AND 运算的两个元素有⼀个是 0,则运算结果总是 0。如果两个元素都是 1,运算结果是 1。
如果 OR 运算的两个元素有⼀个是 1,则运算结果总是 1。如果两个元素都是 0,运算结果是 0。
NOT 运算把 1 变成0,把 0 变成 1。
这么简单的布尔运算是如何应⽤
应⽤到搜索引擎中的呢?
最简单索引的结构,是⽤⼀个很长的⼆进制数表⽰⼀个关键字是否出现在每篇⽂献中。有多少篇⽂献,就有多少位数,每⼀位对应⼀篇⽂献,1 代表相应的⽂献有这个关键字,0 代表没有。
“原⼦能”对应的⼆进制数是0100100001100001……。从前往后第2、第5、第9、第10、第16位上数字是1,表⽰第
⽐如关键字“原⼦能”
家纺品牌“应⽤”对应的⼆进制数是2、第5、第9、第10、第16篇⽂献包含关键字“原⼦能”。注意,这个⼆进制数⾮常之长。同样,我们假定“应⽤”
将这两个⼆进制数进⾏布尔运算0010100110000001……。那么要到同时包含“原⼦能”和“应⽤”武汉二本大学
同时包含“原⼦能”和“应⽤”的⽂献时,只要将这两个⼆进制数进⾏布尔运算
AND(“与”操作)。根据“与”的运算规则,我们知道运算结果是0000100000000001……,表⽰第5篇、第16篇⽂献满⾜要求。AND(“与”操作)
在布尔代数提出80多年后,1938年⾹农在他的硕⼠论⽂中指出⽤布尔代数来实现开关电路,使得布尔代数成为数字电路的基础。最终,⼈类⽤⼀个个开关电路最终“搭出”电⼦计算机,打开数字化时代的⼤门。
数学⽆处不在:余弦定理与新闻分类密不可分的关系
《数学之美》来告诉你其中的奥秘!
何猷君多高余弦定理与我们常见的新闻分类有什么关系?《数学之美》
如果让编辑来对新闻分类,他⼀定会先读懂新闻,然后出其主题,最后根据主题的不同对新闻进⾏分类。
然⽽计算机本质上只能做快速计算,为了让计算机能够“算”新闻,就要求我们先把⽂字的新闻变成⼀组可计算的数字,然后再设计⼀个算法来算出任意两篇新闻的相似性。
⾸先,对于⼀篇新闻中的所有实词,计算出它们的TF-IDF值。把这些值按照对应的实词在词汇表的位置依次排列,得到⼀个向量。⽤这个向特征向量。每⼀篇新闻都可以应对这样⼀个特征向量。
农事活动有哪些量来代替这篇新闻,并成为新闻的特征向量
两篇新闻的主题是否接近,取决于它们的特征向量“长得像不像”。如果两个向量的⽅向基本⼀致,说明相应的新闻⽤词的⽐例基本⼀致。因此,就可以通过计算两个向量的夹⾓来判断主题的接近程度。
这时候我们的余弦定理登场,⽤来计算两个向量之间的夹⾓。当夹⾓的余弦值接近于1时,两条新闻相似,可以归为⼀类;当夹⾓的余弦为0,说明两篇新闻根本没有相同的主题词,它们毫不相关。
把⼈⼒从繁琐的⼯作中解放出来,我们需要学习数学!
数学是粘合剂:数学思维与其他学科的融合
数学原理应⽤于⾃然语⾔处理领域中,将语⾳识别带出实验室,⾛向实际 作为现代⾃然语⾔处理的奠基者,贾⾥尼克教授成功地将 数学原理
应⽤。
《数学之美》这本书⽤贾⾥尼克教授(世界著名语⾳识别和⾃然语⾔处理专家,也是作者吴军博⼠的导师)的例⼦,阐述了数学思维与学科融合的重要性。
在贾⾥尼克之前,科学家们把语⾳识别问题当作⼈⼯智能和模式匹配问题,⽽贾⾥尼克将语⾔识别问题定义为通信问题,将统计的⽅法应
将统计的⽅法应
隐马尔可夫模型(声学模型和语⾔模型)把语⾳识别概括得清清楚楚。
统计语⾳识别的框架结构,并⽤两个隐马尔可夫模型
⽤于⾃然语⾔处理
⽤于⾃然语⾔处理,提出统计语⾳识别
采⽤基于统计的⽅法,贾⾥尼克和他领导的 IBM 华⽣实验室(T.J.Watson)将当时的语⾳识别率从70%提升到90%,同时语⾳识别的规模从⼏百单词上升到⼏万单词,从根本上使得语⾳识别有实⽤的可能,奠定了今天⾃然语⾔处理的基础。
《数学之美》
更多⽤数学解决⼯程问题的精彩实例,请见——《数学之美》
《数学之美》这本书包含了吴军博⼠对科技信息领域发展变化的总结归纳,阐述了⾃⼰对数学和信息处理的专业学科的理解,把与搜索相关的众多领域中奇妙的数学应⽤娓娓道来。
通过数学和应⽤相结合的⽅式,吴军博⼠把数学背后的本质思维写得透彻、⽣动。有读者说,读了《数学之美》,才发现⼤学时学的数学知识,⽐如马尔可夫链、矩阵计算,甚⾄余弦函数原来都如此亲切,并且栩栩如⽣,才发现⾃然语⾔和信息处理这么有趣。
相⽐第⼆版,最新的第三版还与时俱进的增加了区块链数学基础,量⼦通信原理,以及⼈⼯智能的数学极限
区块链数学基础,量⼦通信原理,以及⼈⼯智能的数学极限,这些最为热门的主题的介绍。
知乎视频w ww.zhihu
和作者的初衷⼀样,⼈邮君希望这本书可以通过⼀些实例,帮助⼤家体会数学之道,领悟数学之美,以便在今后解决实际问题时能够举⼀反三。
========
赠⼈玫瑰,⼿留余⾹,不要忘记点赞、收藏、关注 @⼈民邮电出版社 哦~
⼀键三连,感恩有你~