未识别的网络
图像识别技术是信息时代的⼀门重要的技术,其产⽣⽬的是为了让计算机代替⼈类去处理⼤量的物理信息。随着计算机技术的发展,⼈类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。简单分析了图像识别技术的引⼊、其技术原理以及模式识别等,之后介绍了神经⽹络的图像识别技术和⾮线性降维的图像识别技术及图像识别技术的应⽤。从中可以总结出图像处理技术的应⽤⼴泛,⼈类的⽣活将⽆法离开图像识别技术,研究图像识别技术具有重⼤意义。
1图像识别技术的引⼊
图像识别是⼈⼯智能的⼀个重要领域。图像识别的发展经历了三个阶段:⽂字识别、数字图像处理与识别、物体识别。图像识别,顾名思义,就是对图像做出各种处理、分析,最终识别我们所要研究的⽬标。今天所指的图像识别并不仅仅是⽤⼈类的⾁眼,⽽是借助计算机技术进⾏识别。虽然⼈类的识别能⼒很强⼤,但是对于⾼速发展的社会,⼈类⾃⾝识别能⼒已经满⾜不了我们的需求,于是就产⽣了基于计算机的图像识别技术。这就像⼈类研究⽣物细胞,完全靠⾁眼观察细胞是不现实的,这样⾃然就产⽣了显微镜等⽤于精确观测的仪器。通常⼀个领域有固有技术⽆法解决的需求时,就会产⽣相应的新技术。图像识别技术也是如此,此技术的产⽣就是为了让计算机代替⼈类去处理⼤量的物理信息,解决⼈类⽆法识别或者识别率特别低的信息。
1.1图像识别技术原理
其实,图像识别技术背后的原理并不是很难,只是其要处理的信息⽐较繁琐。计算机的任何处理技术都不是凭空产⽣的,它都是学者们从⽣活实践中得到启发⽽利⽤程序将其模拟实现的。计算机的图像识别技术和⼈类的图像识别在原理上并没有本质的区别,只是机器缺少⼈类在感觉与视觉差上的影响罢了。⼈类的图像识别也不单单是凭借整个图像存储在脑海中的记忆来识别的,我们识别图像都是依靠图像所具有的本⾝特征⽽先将这些图像分了类,然后通过各个类别所具有的特征将图像识别出来的,只是很多时候我们没有意识到这⼀点。当看到⼀张图⽚时,我们的⼤脑会迅速感应到是否见过此图⽚或与其相似的图⽚。其实在“看到”与“感应到”的中间经历了⼀个迅速识别过程,这个识别的过程和搜索有些类似。在这个过程中,我们的⼤脑会根据存储记忆中已经分好的类别进⾏识别,查看是否有与该图像具有相同或类似特征的存储记忆,从⽽识别出是否见过该图像。机器的图像识别技术也是如此,通过分类并提取重要特征⽽排除多余的信息来识别图像。机器所提取出的这些特征有时会⾮常明显,有时⼜是很普通,这在很⼤的程度上影响了机器识别的速率。总之,在计算机的视觉识别中,图像的内容通常是⽤图像特征进⾏描述。
1.2模式识别
模式识别是⼈⼯智能和信息科学的重要组成部分。模式识别是指对表⽰事物或现象的不同形式的信息做分析和处理从⽽得到⼀个对事物或现象做出描述、辨认和分类等的过程。
计算机的图像识别技术就是模拟⼈类的图像识别过程。在图像识别的过程中进⾏模式识别是必不可少的。模式识别原本是⼈类的⼀项基本智能。但随着计算机的发展和⼈⼯智能的兴起,⼈类本⾝的模式识别已经满⾜不了⽣活的需要,于是⼈类就希望⽤计算机来代替或扩展⼈类的部分脑⼒劳动。这样计算机的模式识别就产⽣了。简单地说,模式识别就是对数据进⾏分类,它是⼀门与数学紧密结合的科学,其中所⽤的思想⼤部分是概率与统计。模式识别主要分为三种:统计模式识别、句法模式识别、模糊模式识别。
2图像识别技术的过程
既然计算机的图像识别技术与⼈类的图像识别原理相同,那它们的过程也是⼤同⼩异的。图像识别技术的过程分以下⼏步:信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。
信息的获取是指通过传感器,将光或声⾳等信息转化为电信息。也就是获取研究对象的基本信息并通过某种⽅法将其转变为机器能够认识的信息。
预处理主要是指图像处理中的去噪、平滑、变换等的操作,从⽽加强图像的重要特征。
特征抽取和选择是指在模式识别中,需要进⾏特征的抽取和选择。简单的理解就是我们所研究的图像是各式各样的,如果要利⽤某种⽅法将它们区分开,就要通过这些图像所具有的本⾝特征来识别,⽽
获取这些特征的过程就是特征抽取。在特征抽取中所得到的特征也许对此次识别并不都是有⽤的,这个时候就要提取有⽤的特征,这就是特征的选择。特征抽取和选择在图像识别过程中是⾮常关键的技术之⼀,所以对这⼀步的理解是图像识别的重点。
分类器设计是指通过训练⽽得到⼀种识别规则,通过此识别规则可以得到⼀种特征分类,使图像识别技术能够得到⾼识别率。分类决策是指在特征空间中对被识别对象进⾏分类,从⽽更好地识别所研究的对象具体属于哪⼀类。
3图像识别技术的分析
随着计算机技术的迅速发展和科技的不断进步,图像识别技术已经在众多领域中得到了应⽤。2015年2⽉15⽇新浪科技发布⼀条新
闻:“微软最近公布了⼀篇关于图像识别的研究论⽂,在⼀项图像识别的基准测试中,电脑系统识别能⼒已经超越了⼈类。⼈类在归类数据库Image Net中的图像识别错误率为5.1%,⽽微软研究⼩组的这个深度学习系统可以达到4.94%的错误率。”从这则新闻中我们可以看出图像识别技术在图像识别⽅⾯已经有要超越⼈类的图像识别能⼒的趋势。这也说明未来图像识别技术有更⼤的研究意义与潜⼒。⽽且,计算机在很多⽅⾯确实具有⼈类所⽆法超越的优势,也正是因为这样,图像识别技术才能为⼈类社会带来更多的应⽤。
3.1神经⽹络的图像识别技术
神经⽹络图像识别技术是⼀种⽐较新型的图像识别技术,是在传统的图像识别⽅法和基础上融合神经⽹络算法的⼀种图像识别⽅法。这⾥的神经⽹络是指⼈⼯神经⽹络,也就是说这种神经⽹络并不是动物本⾝所具有的真正的神经⽹络,⽽是⼈类模仿动物神经⽹络后⼈⼯⽣成的。在神经⽹络图像识别技术中,遗传算法与BP⽹络相融合的神经⽹络图像识别模型是⾮常经典的,在很多领域都有它的应⽤。在图像识别系统中利⽤神经⽹络系统,⼀般会先提取图像的特征,再利⽤图像所具有的特征映射到神经⽹络进⾏图像识别分类。以汽车拍照⾃动识别技术为例,当汽车通过的时候,汽车⾃⾝具有的检测设备会有所感应。此时检测设备就会启⽤图像采集装置来获取汽车正反⾯的图像。获取了图像后必须将图像上传到计算机进⾏保存以便识别。最后车牌定位模块就会提取车牌信息,对车牌上的字符进⾏识别并显⽰最终的结果。在对车牌上的字符进⾏识别的过程中就⽤到了基于模板匹配算法和基于⼈⼯神经⽹络算法。
3.2⾮线性降维的图像识别技术
计算机的图像识别技术是⼀个异常⾼维的识别技术。不管图像本⾝的分辨率如何,其产⽣的数据经常是多维性的,这给计算机的识别带来了⾮常⼤的困难。想让计算机具有⾼效地识别能⼒,最直接有效的⽅法就是降维。降维分为线性降维和⾮线性降维。例如主成分分析(PCA)和线性奇异分析(LDA)
等就是常见的线性降维⽅法,它们的特点是简单、易于理解。但是通过线性降维处理的是整体的数据集合,所求的是整个数据集合的最优低维投影。经过验证,这种线性的降维策略计算复杂度⾼⽽且占⽤相对较多的时间和空间,因此就产⽣了基于⾮线性降维的图像识别技术,它是⼀种极其有效的⾮线性特征提取⽅法。此技术可以发现图像的⾮线性结构⽽且可以在不破坏其本征结构的基础上对其进⾏降维,使计算机的图像识别在尽量低的维度上进⾏,这样就提⾼了识别速率。例如⼈脸图像识别系统所需的维数通常很⾼,其复杂度之⾼对计算机来说⽆疑是巨⼤的“灾难”。由于在⾼维度空间中⼈脸图像的不均匀分布,使得⼈类可以通过⾮线性降维技术来得到分布紧凑的⼈脸图像,从⽽提⾼⼈脸识别技术的⾼效性。
3.3图像识别技术的应⽤及前景
计算机的图像识别技术在公共安全、⽣物、⼯业、农业、交通、医疗等很多领域都有应⽤。例如交通⽅⾯的车牌识别系统;公共安全⽅⾯的⼈脸识别技术、指纹识别技术;农业⽅⾯的种⼦识别技术、⾷品品质检测技术;医学⽅⾯的⼼电图识别技术等。随着计算机技术的不断发展,图像识别技术也在不断地优化,其算法也在不断地改进。图像是⼈类获取和交换信息的主要来源,因此与图像相关的图像识别技术必定也是未来的研究重点。以后计算机的图像识别技术很有可能在更多的领域崭露头⾓,它的应⽤前景也是不可限量的,⼈类的⽣活也将更加离不开图像识别技术。
发布评论