基于AlexNet卷积神经网络的人脸情绪识别技术研究未识别的网络
作者:姜冰 王慧莹 陈晨 钟幸丽 王显龙
来源:《电脑知识与技术》2022年第27期
        摘要:随着我国科学与技术的高速发展,人脸情绪识别技术拥有广阔的应用前景,但传统神经网络模型的人脸情绪识别效果不佳。文章将对基于AlexNet卷积神经网络的人脸情绪识别技术进行分析,并对基于AlexNet卷积神经网络的人脸情绪识别技术未来发展前景进行探讨。
        关键词:卷积神经网络;人脸情绪识别;AlexNet
        中图分类号:TP18 文献标识码:A
        文章编号:1009-3044(2022)27-0024-03
        开放科学(资源服务)标识码(OSID):
        1 引言
        人脸情绪识别技术很好地将计算机技术与生物学融合在一起,此技术通过网络模型提取和识别采集人脸情绪面部特征图像,根据人类习惯性的面部变化,判断图像所表达的情绪[1]。人脸情绪一直是人行为分析的重点,人脸情绪识别技术在各领域都有着广泛的应用。
在心理学领域,情绪识别技术和其他行为分析技术能够帮助研究人员获取多方面、更加准确的数据。在儿童教育领域,利用情绪识别技术可以对教学成果进行评估,并针对儿童的不同反应,选择适合他们的教育方式;在医疗领域,可以通过人脸情绪识别评估患者的疼痛程度或抑郁程度。除此之外,情绪识别还可应用于护理领域、交通驾驶领域等。现有技术中,因为情绪识别设备的复杂,应用不够广泛,使用也不够方便。因此,提供一种使用方便、适用范围广、识别准确率高的基于图像识别的情绪识别判定方法是非常有必要的。下文将从AlexNet卷积神经网络的角度出发,进行人脸情绪识别的技术分析与研究。
        2 人脸情绪识别的主要技术
        人脸情绪识别技术是在基于人脸情绪生物特征识别基础上,运用计算机技术参考对照加以分类认证情绪类别,进而完成对人脸情绪识别的过程。此技术同时涉及计算机科学、生物学、心理学等众多学科[2]。一般的情绪识别受背景环境等非人为干扰因素影响较大,通常识别效果不佳。AlexNet模型是卷积神经网络(CNN)的重要模型之一,AlexNet的高性能更适用于当今飞速发展的信息时代。此外,区域特征分析算法近几年也在人脸识别技术中被人们广泛应用,与计算机图像学相融合,将情绪识别的图像处理相关技术与生物统
计学相关原理结合,采用图像处理技术提取视频中的人像特征点,另外使用统计学有关原理进行一系列分析建模。人脸情绪捕获与跟踪功能也起到了关键作用,即从图像或视频流的某一帧中检测出人像并且使人像能够单独分离出来,并自动将其保存。人像跟踪是指利用上述人像捕获技术,当出现人脸情绪时自动地对其进行追踪。通常来说,实现人脸情绪识别最关键的一步是提取表情特征,依照图像中的脸部特征以及表情细节变化等相关特征数据化的表现,即可得出精确的提取以及分析,其次将图片导入建立的系统数据库中做对比,最后得到相应结论。理论分析看起来简单易懂,不过实际应用起来却困难重重,此过程极易受到光线强度及其他因素的干扰,人脸情绪本身复杂的表情以及化妆等因素更增加了难度。因此本文研究分析了基于AlexNet的情绪识别技术,包括图片预处理、卷积神经网络以及情绪识别算法,以便更好地改善这一问题。
        2.1 人脸情绪图片预处理技术
        在人脸识别过程,人脸图片预处理是一个重要环节。图片在输入时,由于图片采集环境的不相同,比如光照的明暗程度和设备性能的优劣等,会存在对比度不够、有噪声等缺点。另外,人脸在整幅图片中间的大小和位置会因为距离远近、焦距大小等而不确定,从
而影响人脸算法的识别准确率。因此,为了确保人脸图片中人脸的大小,位置以及人臉图片质量的一致性,必须对图片采用预处理技术。
        人脸图片预处理技术的方法主要包括人脸的扶正、人脸图片的增强以及归一化等。人脸的扶正需要通过人脸关键点对人脸做对齐校准,从而得到人脸位置端正的人脸图片;图片增强就是指在人脸图像清晰度逐步提高的过程中,使得计算机处理和识别图片更加方便有利。而归一化工作则是使得到的灰度取值范围以及尺寸达到高度相似。通过人脸图片的预处理,将采集到的人脸图片进行过滤、旋转、移动、调节灰度、等比例放大缩小、归一化姿态等几个基本处理步骤,得到在尺寸大小、距离长短、光线强度标准化的人脸图片,以此提高人脸算法的识别准确率。
        2.2 卷积神经网络技术
        在神经网络理论中比较关键的组成部分就是卷积神经网络模型,该模型可以实现对人类大脑结构及其功能做出一系列数据化的模拟反应[3]。卷积神经网络需要通过多层的神经网络组合起来运用。卷积神经网络使得全连接层上的参数明显减少,提高整体的网络训练速度,避免出现过拟合问题。在图像识别的过程中,神经元仅需要辨识该图像的局部特征,
而非整体特征,即可使得图像识别的精准程度和图像识别的速度得到提升。一般情况下,卷积神经网络通常由输入层、卷积层、池化层、全连接层组成,如图1所示。
        3 情绪识别算法
        情绪识别算法比较复杂,但基本步骤大致如下:首先获取若干人脸情绪表情图像,可使用摄像头采集对象面部表情图像;接下来对表情图像进行预处理,对获得的表情图像进行剪切处理,去除头发、背景、轮廓等区域,而后对表情图像进行尺度归一化和灰度归一化处理,获得纯人脸情绪图像;接着进行表情特征提取,提取面部关键特征点的位置作为特征区域,关键特征点包括眉毛、眼睑、嘴唇、下巴等,并对关键特征点进行强度分级,生成表情特征图像;最后进行情绪识别判定,用提取的表情特征图像与数据库中的标准表情图像进行对比分析,并识别判定。本文在进行相关面部图像表情采集的过程中运用了网络爬虫数据采集技术,此方法只需要使用互联网爬虫技术便可以自动进行图像获取,再使用图像数据爬取技术即可把爬取到的数据存储下来,极大地提高了数据采集效率。
        3.1数据预处理
        在进行相关原始数据处理之前,将收集的正面且无任何遮挡的人脸情绪图像,进行剔除多余背景信息的操作,再存入数据库中。对已存入数据库中并且已经处理过的图像进行统一修改,使其尺寸相同、格式一致。另外,人脸情绪表情数据信息采集后需要统一改为JPG格式,以便后续算法对其的处理。
        3.2 利用AlexNet模型进行情绪识别
        首先,对原始图片做一定比例的缩放,之后裁剪滑动框里移动的图片,并进行相应的预处理,随后将预处理后的图片传输到训练好的卷积神经网络中进行下一步的判断,根据得到的判定矩阵,反向寻此滑动框在原始图片中对应的坐标,最后截取到的图片即为所需要的人脸情绪图像,AlexNet网络结构如图2所示。
        4 情绪识别的流程
        情绪识别采用特征脸法,将一部分图集转换为一个特征向量集,运用投影点在此空间内相应的方向和长度判断位置,用PCA技术做空间变化,进而得到不同的特征向量。通过此方法可以准确定位人脸情绪特征,显著提高人脸情绪识别的效率。特征脸方法的实现过程如下:
        首先,获取集合S,其中包含M张人脸图像。将每张图像转换成一个N维的向量排成一行,把这M个向量放到一个集合S里,如式(1)所示:
        S = {Γ1,Γ2,Γ3,...,[ΓM]} (1)[5]
        然后根据获取到的人脸情绪向量集合S,计算平均图像Ψ ,如公式(2)所示:
        Ψ = [1Mn=1MΓn] (2)[5]
        再通过S集合里的每个元素减去Ψ,来计算每张图像和平均图像的差值Φ,如公式(3)所示:
        Φi = [Γ]i-Ψ (3)[5]
        通过M个正交的单位向量un ,来描述Φ(步骤三中的差值)分布。通过下式(4)计算un里面的第k(k=1,2,3...M)个向量uk,如下所示: