⼈脸识别国内外现状及发展
分⼏个⽅⾯分别的论述⼀下⼈脸识别的技术和产业发展的相关状况。
第⼀,⼈脸识别技术的价值在哪⾥。我们把⼈脸作为⼀个⽣物学特征,作为⼀个商业化运⽤,只是备选的⼀个⽅案之⼀。⽣物学当中,唯⼀的判断的标准,其实识别从精准度的⾓度和不可替代的⾓度来讲,最精准的是虹膜,但是虹膜的识别采集成本⾮常⾼,识别的效率相对不是很⾼,需要等待的时间。所以这两个条件约束了整个的产业化运⽤只能局限在相对⼩众的,对识别要求极⾼的军⼯、国防等安全性⾮常⾼的远的投⼊,不适合⼤范围的推⼴。
第⼆,指纹。我们知道指纹的唯⼀性⽐较强,指纹同时采集成本是⽐较低的,⽐对成本也不⾼。但是为什么指纹没有成为⼀个特别⼤的可供⽀付、刷脸可替代的⽅案呢?实际上主要的原因是因为指纹的可复制性,是⼀个静态图像之间的⽐对,现在我们可以看到淘宝也好,各种各样的⼤量的指纹贴,指纹膜,可复制的特征,不适合⽀付。所以指纹现在也⼤致上被pass了。
第三和第四分别是⼈脸识别和声⾳识别技术。这两个在现在横向来相⽐,采集成本和⽐对的效率,以及⽣命特征的唯⼀性来讲,性价⽐⽐较⾼。所以现阶段来看,⼈脸识别浮出⽔⾯,是有它的道理的,这是它的价值。商业特征的应⽤场景到底在哪⾥。
⼈脸识别的应⽤场景是⾮常宽泛的,现在主要两块,⼀个是⾦融⾏业,⼀个是安保⾏业。⾦融⾏业,已经从马云的蚂蚁⾦服演⽰中看到了场景,通过刷脸进⾏⽀付,显然刷脸可以付钱了,为什么不可以签收快递呢,下⼀步淘宝应该会把淘宝签收快递的功能打通。我相信有⼀天,我们会收到⽆⼈机送来的快递,⽆⼈机在你的⾯前拍⼀张照⽚,进⾏对⽐,就知道这个⽤户就是需要的⽤户,完成整个的⽀付过程。实际上这种场景,是经过多⽅⾯的讨论和认证的。基于这样的场景,是跟第三⽅的⽀付认证相关的,包括我们看到的腾讯的银⾏,第⼀张远程开卡,就是通过⼈脸识别的技术,把⼈证合⼀进⾏认证,这样远程开户,远程开卡的功能,在我们的券商,在我们的⽹络银⾏上⾯,应该有⼴泛的应⽤。
对于安保⾏业来说,刷脸开门,现阶段,⼈脸识别的应⽤应该说达到了⼀个可具备商业化的⽔平,我们举个例⼦,在去年的时候,⾹港有⼀个导演叫许鞍华,他在南京地铁中丢了⼀个他的⽪包,这个案件的破获,只花了5个⼩时。视频监控⾥⾯获取了⼀张照⽚截图,截到了嫌疑⼈的照⽚,是极其模糊的,侧脸的照⽚,如果⾁眼⽐对,发现不了什么。但是有⼀家⾮上市公司,在这⾥不能提供他的公司名称,他们通过⼀个图像还原技术,把那个照⽚还原出可能嫌疑⼈的样⼦,清晰照,⽤这个照⽚到图库当中⽐对,锁定嫌疑⼈的⾝份,把嫌疑⼈抓获,只需要了5个⼩时的时间。现在安防领域的监控,我们可以看到各个省市以及地级市,都在上⼤量的视频监控,⼈脸识别的⼤平台。在整个安防的投⼊当中,上⼀代的安防只是静态的记录下来数据,但是下⼀代的安防,是对实时数据的采集、辨认,就是⼀个核⼼的技术,这个技术,⼈脸识别在其中发挥的作⽤是很⼤的。
我们再拓展⼀下,未来的商业⽤途,到底有没有第⼆代⼈脸识别技术的潜在的应⽤的场景呢。我们说在未来,应该说原来整个确定⾝份的⾝份证,但是证和⼈的⽐对需要⼈⼯来完成。如果我们直接界定,达到了这样的⼀个标准,实际上每个⼈所对应的唯⼀的ID就是脸部的⽣物特征。这个识别了以后,所有的地⽅都可以⽤刷脸的⽅式,所有的地⽅都可以⽤刷脸去开门,⽤刷脸去做各种各样的事情。你刷脸的数据,包括你去坐⽕车、坐飞机、去哪⼉吃饭、购物、收快递等等,这些数据都会掌握到⼈脸识别中,刷脸的数据将取代现在线上的点击量.
现在信⽤卡、银⾏卡消费的数据,其实有助于知道⽤户消费习惯和消费数据,做⼤数据的营销和征信,但是刷脸时代来临之后,这个的价值更⼤了。有很多张卡,但是只有⼀张脸,这是唯⼀的。刷脸数据是2.0时代当中,我们重点看到的。
为什么在这个时间段,⼈脸识别的技术会⼤范围的爆发出来,⼤范围的应⽤起来,成熟度到底怎么样呢?我们⾸先要界定⼀下⼈脸识别技术要达到产品化的应⽤,是两阶段的过程。第⼀阶段,需要获取⼤量的样本数据,这些数据是⽤于训练的,训练的是学习算法,这个是深度学习算法,把这些数据和相互⼈之间的关系提取出来,进⾏⼀个特别的⽐对。耦合度⾼,超过⼀定的⽔平之后,我们会认定这两个⼈是⼀个⼈,但是这个模型是需要投⼊⼤量的成本,这个成本包括优化的成本,包括数据训练的成本,包括运算的成本,我们当时⼈脸识别的⼀个业内的公司,这家公司的创始⼈,曾经说,⼈脸识别的技术意味着什么呢?太上⽼君的炼丹炉,有了这个炉之后,⼤数据是炉⼦炼的原料,解决计算能
⼒资源的稀缺。因此这些合在⼀起,形成了现在⼈脸识别⼤爆发的时代,就是我们说的技术上的突破。
但是在产业上⾯的应⽤来看,⽬前我们可以看到,美国和以⾊列的⼈脸识别,特别是动态识别的⽔平是国际领先的。全⽹的实时监控当
中,FBI在去年推出了他们的下⼀代的电⼦识别系统,总的投⼊是超过10亿美⾦的。在美国将来⽆论是在什么地⽅犯了事,监控锁定犯罪嫌疑⼈,进⾏全⽹追捕。
国内是什么⽔平呢?顶尖的学术⽔平,就代表着国内产业发展的阶段。⽬前主要是三种⼒量,⼀个是清华⼤学的苏光⼤教授,他是中国的⼈脸识别之⽗。第⼆个是中科院的⾃动化所的李教授,他早年在微软的亚洲研究院当中获得了⾮常⾼的成就,后来到了中科院的⾃动化所,专攻⼈脸识别。在奥运会当中,以及后来很多的⼈脸识别的应⽤当中,提供了⽐较好的技术。第三⽀就是⾹港中⽂⼤学的汤晓鸥教授的团队,
每年会进⾏学术界的⽐赛,他是⾼记录的保持者。⽬前的识别率是超过了⼈类的脸部识别的总体⽔平,汤教授帮助讯飞在语⾳识别领域之后,在⼈脸识别的领域当中,建⽴了⾃⼰的⾏业地位。所以国内基本上⽬前是这样的发展阶段,我们去推导下⾯的阶段,我们怎么去甄别⼈脸识别的技术,到底哪⼀家靠谱,哪⼀家不靠谱,我们可以提出⼀些关键的甄别的关键点。这些点在哪⾥呢?
第⼀,我们要区分的,动态和静态配合式的识别还是⾮配合式的识别。配合式的就是像蚂蚁⾦服那样的,需要数据的⽐对⽅进⾏配合,可以很好的去采集正脸的⼆维的数据。另外,就是⾮配合式的,⾮配合式的没有办法对排除⽅的配合,是需要随机采集的图⽚进⾏⽐对,这个识别的效果会差⼀些,但是识别的时效性会很⾼。
这两种模式当中,我们关注三点。
第⼀点,你的⼈脸建模当中到底提取了多少个特征点进⾏⽐对,这个跟我们⼈脸上⾯的⼀些特征是关键节点,每个⼈的差异很⼤,⽽你选取的特征点的数据越多,⽐对的准确率就会越⾼。我们也采访了⼀些专家,他们⽬前能够做到的特征点的⽐对,应该是在700个点以上。⽬前⼤部分做刷脸的门禁这样系统产品的公司,特征点的选取⼤概是在50个左右。所以我们去做调研和交流,可以问⼀下整个公司⼈脸识别建模当中特征点的数量。
第⼆点,⼈脸识别数据库的数据样本和⼤⼩,这是⼀个⾮常重要的指标。样本及⼤⼩,是我们可供的数据集,这些必须要对⼈脸,⽐如说⼀个⼈有500张照⽚,拍的都是他的脸,不同的⾓度和位置、光线,把这些数据进⾏合理的清洗,供机器去训练包括⽐对和识别之后,可以告诉你是识别对了还是识别错了,这样的样本数⾮常重要,有助于训练,提⾼模型的准确率。因此可标签的数据样本集的⼤⼩,这个⼤⼩⽬前⾄少是百万以上的级别,才会使得现在识别率能够提升到世界领先的⽔平,这个也是可以甄别的关键点之⼀。
第三点,是不是你的商业模式能够对你的整个的数据的获取,我们说⼈脸数据的⽐对,形成⼀个正循环的模式。实际上数据来源,⼈脸的样本来源,是来源于两个⾮常重要的渠道,美图秀秀和美颜照相机,这是⼀个商业的互换,这个数据,因为考虑到做⼀个脱敏的处理,剩下的只有⼏百个关键的特征点的数据,其他的都被略去,⽤脱敏的技术之后,形成了从获取数据到训练模型,再到优化模型,持续的反馈结果,获取新的数据,这样的⼀个正循环的过程。有了这个以后,你的模型的数据就会获取的很好了,这是商业模式上⾮常重要的⼀个指标。
如果有了这三个指标之后,应当说同时具备了这三个,可能是在⼈脸识别领域当中有⾮常⼤的领先优势,或者是未来发展潜⼒的东西。同时我们在直观的性能⽅⾯去分析,直观的到底识别的表现上有两个⾮常重要的指标,⼀个是识别的准确率,我们界定了刚才说的学术界当中,每年⼀⽐的⼈脸识别⼤赛,现在基本上测试⽔平都在95%以上,但是是⼈和图⽚之间相互⽐对,说明是这个⼈,这算⼀个,再⽐对⼀个,⼜对了,算第⼆个。所有的⼈和照⽚都是匹配好的,最后正确率在99.2%左右,这是我们说的⽬前的正常的⽐对⽅法。
还有⼀个⾮常重要的⽅法,我们看到商业银⾏和淘宝在内的⼀些⼈脸识别的技术,会提出⼀个错误率的问题,这个数据,⽬前来看可以做到⼗万分之⼀的错误率,别⼈拿着我的⾝份证去⽐对,如果机器能够区分出来,是不通过,这是对的。如果机器把我的⾝份证给别⼈的时候也通过了,这可能就是⼀个错误的,错误率要在⼗万分之⼀左右才可以,⽬前能达到这样错误率的公司是屈指可数的,这是⼀
个识别准确率的问题.
另外还是在多⼤样本中可以实现这样的准确率,这个是⾄关重要的。⼀个公司⾥⾯也就是两三百个⼈,在这些⼈当中,挑选出来通过,没有什么难度。但是在公安部的⼤平台当中,省级的平台当中,都是上亿⼈的⾝份证照⽚中,要准确的挑出来⼗个或者是⼀百个候选⼈,这个范围缩⼩到这个概率当中,你的准确率能有多⼤,这是⼀个很重要的指标。
第⼆点,识别的速度问题。同样还是刚才我们说到的样本集的⼤⼩决定了识别的速度。本⾝你在可供⽐对的样本中,没有很⼤的数据,⽐如说是成千上万的,识别的数⼤家都是差不多,都是在1秒之内作出反映,但是如果在⼀个上亿的⼤的样本当中,去把照⽚准确的识别出来,这样对时间的要求,对效率反映的要求就提⾼了。所以识别速度是⼀个很重要的指标。
以上我们说了五个指标,我们说这个确实是可以对公司的具体能⼒和技术进⾏综合判断的。
基于以上我们说的这些,关注的公司是有识别技术的公司,这个识别技术是⼈脸识别的技术。我们前⾯讲了,本⾝国内发⾔的⼏⽀学术界的⼒量⼤家⾮常清楚,来源于哪⼀⽀,背靠着哪⼀⽀强⼤的学术团队,研究团队的⼒量,使得这家公司是⼀个很好的位置。⽐如说我们前⾯讲到的科⼤讯飞,在汤晓鸥教授的⽀持下,他们的团队是学术界第⼀的⼒量在⽀持他们,这是⼀个资源性的优势。⽐如说川⼤智胜,这个和李教授他们有密切的合作,同时他们⾃⼰在图象识别领域当中,也有⾃⼰独特的技术,
承担着国家⼤量的科研基⾦的项⽬,同时我们也特别强调⼀个就是川⼤智胜的⼈脸识别技术,是⽬前我们看到的⼈机交互,因为这个和⼆维的平⾯识别有很⼤的区别,优势⾮常明显,因为采集到了五官之间⽴体曲⾯之间的结合,所以采集到的数据量更丰富。可供⽐对的特征也是更多的,我们之前在视频当中到拍到的侧脸,不清晰的照⽚,很难去识别出来犯罪嫌疑⼈到底是谁,是因为我们⼆代⾝份证库当中,本⾝就是只有正脸的可供⽐对的数据。三代或者是四代⾝份
证采集数据的过程当中⽣物特征肯定要被提取出来,⾸先是指纹,三维的⼈脸识别会更快,三代四代可能就会被提取。
许鞍华
⼀旦需要被提取到三维的⼈脸的数据,那么这个时候川⼤智胜作为国内⽬前唯⼀⼀家有产品和技术的公司,⾯临的是⼴阔的市场。但是我们同时也要看到,三维⼈脸识别虽然有⾮常惊⼈的优势,同时劣势也是⾮常明显的,特征点的选取,包括侧脸的选取,是有难度的。同时表情的因素,其实对于数据处理的影响,没有在⽴体表情的因素那么好,提取的时候效率是偏低的,消耗的数据也⾮常⼤。所以现在来看,我们能够看到的应⽤场景⽬前还是⼩范围的,包括像美国对犯罪的有案底的犯⼈,我们国内⽬前在监狱当中也逐步的推⼴,将来全民都要采集,这肯定是⼀个⾮常巨⼤的市场。同时这家公司在⼈脸识别公司当中,技术特点和现在持续的对三维⼈脸识别加码,有⼀个项⽬是1.8个亿,要投⼊到研发当中,国家⾃然科学基⾦也已经持续的⽀持他们三维⼈脸识别的学术研究的项⽬,已经⽀持了很多年。所以在这个领域,应该是到了开花结果的地步。所以这⼀点,我们特别提⽰⼤家要关注这个公
司,在技术上确实是有稀缺性的。
科⼤讯飞,就是典型的我们刚才讲的商业模式,可以实现⼈脸识别数据正循环的公司,是拥有互联⽹端的⼊⼝的。之前在语⾳的领域当中,讯飞语⾳云⾛的就是这样的模式,我获取的是你语⾳的数据,⽤你的数据持续的训练我后台的算法,使得他们提升和保持和其他竞争对⼿的领先优势。这样的话,数据端的循环,从语⾳的这个领域当中,复制到图像识别,就是⼈脸识别当中。⼤家如果关注讯飞,⼤家可以看到,在上个星期的时候,推出了双重⽣物特征的识别的因素,双重是什么呢?两重加密以后,确实就是这个⼈,把出错的概率降到⾮常低的⽔平。同时识别,双重加密之后,这个⾝份验证的过程可以做到数量级上⾯的提升。
有了这样⼀种开放云的平台之后,讯飞的数据正规化的过程也在逐步的建⽴,他下⼀步会和⾮常多的第三⽅的应⽤⽅合作,包括可以刷脸开锁的智能硬件⽅⾯,包括和电话银⾏,电话客服,还有邮箱去实现他的数据⼊⼝的正循环的过程。我们核⼼的问题就是以上的这样的⼀些判断的标准来去甄别的。我认为讯飞实际上是⾮常有希望的⼈脸识别的公司。我们在报告当中,也提到了讯飞是⼀个⽣态级的公司,不光是在⼈脸识别的这个领域当中有⽐较强的资源优势和技术优势,以及商业模式的优势。同时在我们整个的⼈⼯智能领域当中,讯飞超脑可以不断的⽤它孵化,基于学习的模式,从语⾳迁移到现在的图像,下⼀步迁移到语义当中,不断的做技术的衍⽣,这样的⽣态链⼀旦形成的话,在⼈⼯智能产业的地位是不可动摇的。所以⼈⼯智能整个的产业,我们想推的是科⼤讯飞。
⼈脸识别的领域当中,讯飞的优势也是⾮常明显的,同时我们也是看好川⼤智胜拥有的三维⼈脸识别的技术。其他的品牌公司,我们可以看到欧⽐特收购的公司,在安防领域的⼈脸识别当中,在监狱当中是超过50%的,在产品化⽅⾯也做的⾮常好。其他的两家,刚刚推出了⾃⼰的识别技术,现在了解的信息当中,还没有办法很好的甄别他们现在是否拥有满⾜我们以上的五个标准。在以后的调研和跟踪当中,我们会对他们的标准进⾏梳理和进⼀步的分解。这是对识别类公司的分析.
下⼀个阶段,我们觉得还有⽐较好的投资机会,除了第⼀类识别类的,第⼆类应该是数据资源类的,数据资源⽬前来看就是视频资源,有⽐较好的视频资源的公司,可以通过视频资源进⾏持续的深度学习的算法和优化,也许他⾃⼰没有这个技术和能⼒,但是可以通过技术合作的⽅式,到研发团队或者是公司进⾏合作,共同开发优势。⽬前在视频资源当中的这些公司进⾏梳理的话,我觉得东⽅⽹⼒在这个当中步⼦迈的最前。⽬前产品端还是没有关于⼈脸识别成型的产品推出来,但是他的应⽤是在于多年的视频数据的积累。这个是和后期有密不可分的关系。先收购了⼴州的安防领域的视频监控的智能化的公司,这个步⼦⼀迈出去,布局的意图⾮常的明显。摄象头公司会往视频的公司侵占,后⾯的公司将来可能会往存储的环节去挤压,有可能将来会把分析和存储在⼀个环节当中就完成了,这个时候⾯临的压⼒是⽐较⼤的,所以转型的动⼒也是最迫切的,意愿也是最强烈的。所以总体总结下来,现在⼈脸识别技术⼤爆发,并不是偶然的,应该说很好的满⾜了我们讲的⼈⼯智能的三⼤条件。深度学习的算法,⼤数据和云计算,这三个条件成熟了以后,在拐点到来的时候,⼤规模的商业化应
⽤是⽔到渠成的。下⼀个阶段,基于计算机视觉的应⽤,在视频监控领域当中,对⼈的⾏为模式的识别、跟踪和分析,这些都会成为⼀个⾮常⼤的市场,成熟度还有待于进⼀步的检验。但是这个市场我们已经都看得到了,所以现在我跟⼤家探讨⼈脸识别的产业的发展机会,我觉得其实⼤家需要关注的不仅仅在于⼈脸识别技术本⾝的发展,也不仅仅在于哪⼏家上市公司拥有哪⼏项技术,⽽是看到背后代表的是整个计算机视觉的兴起。⼈⼯智能报告当中也提到过,计算机视觉的1.0版本,是对静态图像的识别,2.0版本,肯定是动态视频内容的理解和学习,包括像⾕歌的⽆⼈驾驶汽车,包括报告⾥⾯提到过的以⾊列的那个公司,也是纳斯达克上市的,他们⽤计算机视觉的技术实现了汽车的辅助的⽆⼈驾驶。在这个领域当中,实际上计算机视觉可供开发的应⽤⾮常丰富的。现在还有⼀个法律的问题,就是允许不允许⽆⼈驾驶的汽车上路,合法不合法的问题,⼤家不⽤担⼼这个问题。因为这个公司IPO 的时候,这个公司的CEO 说过⼀句话,他说现在还在担⼼⽆⼈驾驶的汽车上路合法不合法,但是我可以肯定的告诉你,⼗年以后,⼈开车上路是不合法的,这肯定是⼀个⼤的⽅向和趋势。这就是我从⼈⼯智能的领域延伸出来的,⼈脸识别只是⼀个点,更多的还有待于⼤家去⼀点⼀点的发掘。个⼈分类:
相关热词:
▼查看关于本篇⽂章更多信息