基于卷积神经网络的人脸识别检测分析
编者按:为了提高人脸识别检测精度,应用卷积神经网络进行分析。在建立AlexNet网络结构的基础上,将Dropout技术引进全连接层中,给出了具体的卷积神经网络结构参数。研究结果表明:本文算法表现出较高的召回率,人脸签到系统的基础需求得到满足。侧脸及戴头盔遮挡照片观察对比得出,检测人脸图片的准确度及清晰度均相对较高,表明对于部分遮挡人脸或侧脸采用本文算法展示的鲁棒性较佳。该研究有助于提高在遮挡情况下人脸识别能力,对图像处理优化起到一定的理论支撑。
基金项目:河南省高等学校青年骨干教师培养计划,项目编号:2021GGJS190
0 引言
人脸识别技术的关键就在于人脸检测,作为重要研究方向广泛应用于模式识别和计算机识别领域[1]。人工设计特征作为传统人脸检测方法的重要监测依据。目前由于人脸检测算法表现出较高的检测精度,因而应用于多个领域[2]。人脸检测算法结合深度学习在卷积神经网络得到广泛应用下逐渐获取进一步发展,早已作为主流研究方法应用于各领域,检测准确率高于传统方法,超过95%[3],拓展人脸识别研究具有重要的意义。
近年,人脸识别技术早已被Facebook、Google、商汤科技、旷世科技应用融入到各个领域,尤其是在卷积神经网络不断持续进步发展的趋势[4]。很多挑战和问题在实际应用环节始终存在。尽管从识别准确度来看,在LFW 数据集中应用多种方式均可获取较佳结果,人眼识别能力也得到显著提升,然而必须要选取大量训练样本训练各深度模型,倘若研究机构场所小型化或属于高校,实现相对较为困难[5]。所以目前亟需解决的主要问题就在于怎样训练可满足人脸匹配要求和快速区别人脸特征的性能佳且结构简单[6]。本文应用卷积神经网络到人脸识别领域,并开展网络训练以及测试优化分析。
1 基于卷积神经网络的人脸检测算法
图1给出了AlexNet网络模型结构图。网络模型中全连接层和卷积层分别为3 个和5 个,总共为8 层。将ReLU、局部响应归一化及池化层增加至前两层后,将Dropout 和池化加入到第6、7 层,并在第8 层应用softmax 分类器[7]。
图1 AlexNet网络结构
将Dropout 技术引进全连接层中,这种情况下全连接层在AlexNet 网络模型训练整个流程中的连接概率为固定且以随机稀疏方式为主,将部分神经元丢弃,有利于网络复杂度降低,参数计算量得到减少,过拟合现象也会在某种程度上减小[8]。需采取局部归一化操作方式处理输出结果,有效抑制局部神经元,进而促进网络泛化能力的进一步强化。
网络模型算量与卷积核结构尺寸大小相关,感受也随着卷积核尺寸增大而扩大,尽管图片特征信息提取效率有效增加,但计算参数急剧增加。小尺寸的卷积核被更多研究学者应用,可有效增加模型的宽度和深度。网络参数模型训练时长将得到显著减少,同时还有利于降低第一层的参数计算量。
在人脸检测时应用本文提出的网络模型,需提前区分人脸及非人脸区域,为确保降低神经网络参数,将第2 个全连接层删除,仅将第1、第3 个全连接层保留。按照1×1 卷积核尺寸标准修改第1 个全连接层,用全连接神经网络替代原有神经网络,任意大小的尺寸均可输入卷积神经网络,人脸分类选用第2 个全连接层。本文所用的网络结构参数见表1 所示。本文所用的网络结构逻辑见图2 所示。
图2 网络结构逻辑图
将Dropout 技术引进全连接层中,这种情况下全连接层在AlexNet 网络模型训练整个流程中的连接概率为固定且以随机稀疏方式为主,将部分神经元丢弃,有利于网络复杂度降低,参数计算量得到减少,过拟合现象也会在某种程度上减小[8]。需采取局部归一化操作方式处理输出结果,有效抑制局部神经元,进而促进网络泛化能力的进一步强化。
网络模型算量与卷积核结构尺寸大小相关,感受也随着卷积核尺寸增大而扩大,尽管图片特征信息提取效率有效增加,但计算参数急剧增加。小尺寸的卷积核被更多研究学者应用,可有效增加模型的宽度和深度。网络参数模型训练时长将得到显著减少,同时还有利于降低第一层的参数计算量。
在人脸检测时应用本文提出的网络模型,需提前区分人脸及非人脸区域,为确保降低神经网络参数,将第2 个全连接层删除,仅将第1、第3 个全连接层保留。按照1×1 卷积核尺寸标准修改第1 个全连接层,用全连接神经网络替代原有神经网络,任意大小的尺寸均可输入卷积神经网络,人脸分类选用第2 个全连接层。本文所用的网络结构参数见表1 所示。本文所用的网络结构逻辑见图2 所示。
表1 网络结构参数
2 实验结果分析
2.1 数据集
作为评测数据集,FDDB 常用于人脸检测。灰度和彩色图共2 845 张图片均包含在数据集中,共有5 171人脸标注数据,人脸拍摄环境为自然状况。测试集挑战性较高,同时低分辨率、遮挡等情况都包含在内,拍摄环境与日常应用场景都十分贴近。
作为人脸检测的大型基准数据集,WIDERFace 由香港中文大学建立而成。采用手工标注数据集,人脸总数为4 万张,光照及遮挡等不同场景下人脸图像变化情况均包含在内。
2.2 网络模型训练设置
本文在训练改进卷积神经网络时,将Tensorfl ow 深度学习开源平台作为重要应用工具,选取NVIDIAGTX1050 型GPU 加速,训练数据用SSD 固态硬盘缓存,完成CUDA9.0GPU 并行计算库的安装。
网络训练基于网络参数完成,同时将0 作为卷积层学习率,训练的卷积层为候选框生成网络特有,为确保能实现卷积神经网络中人脸分类及候选框生成网络间的共享,最后环节需要微调人脸分类网络。
2.3 实验结果分析
在人脸检测中对本文改进的模型结构性能进行验证,选取测试的数据集为FDDB 人脸数据集。召回率要求在实际使用过程中的严格程度更深,所以评估本算法应用的评价指标以FDDB 为主,Falsepositive 表示横轴,即FP,误检数为检测出人脸但实际非人脸的数量,Truepositiverate 表示纵轴,即recall 召回率。如图3 所示,为测试曲线图。
本文对比了CascadeCNN 及MTCNN 等较为经典的人脸检测算法,测试评价方法均选用FDDB 数据库实现,另外还对比了各检测方法所耗费的时长,下图为各检测算法对应的数据结果。
图3 FDDB评价图
算法比较结果见表2。其中,fps 表示检测速度,即每秒传输的帧数。通常算法检测速度随帧数增长而加快。本文主要是在GPU 上完成检测速度的统一测试。与CascadeCNN、MTCNN,两种算法相比,本文算法表现出较高的召回率,对比表中数据得出准确率最高,相比于MTCNN 和CascadeCNN 检测速度较低,人脸签到系统的基础需求得到满足。
表2 算法比较
为了确保人脸检测算法多个特征能更直观且清晰地显示,在开展人脸检测验证前采用随机方式挑选图片,图4 为检测具体结果。侧脸及戴头盔遮挡的单人照片依次如图(a)(b)所示,通过观察对比得出,检测人脸图片的准确度及清晰度均相对较高,这意味着对于部分遮挡人脸或侧脸采用本文算法展示的鲁棒性较佳。
(a)
(b)
图4 测试结果图
3 结束语
本文开展基于卷积神经网络的人脸识别检测分析,得到以下有益结果:
1)本文算法表现出较高的召回率,人脸签到系统的基础需求得到满足。
2)对于部分遮挡人脸或侧脸采用本文算法展示的鲁棒性较佳。
参考文献:
[1] 姜绍忠,姚克明,陈磊,等.基于CNN与Transformer混合模型的口罩人脸识别方法[J].传感器与微系统,2023, 42(1):144-148.
[2] 徐武,陈盈君,汤弘毅,等.局部特征映射与融合网络的人脸识别优化算法[J].河南科技大学学报(自然科学版),2023, 44(02):59-64+72+7-8.
[3] 仲崇丽,刘华.改进卷积神经网络的热红外成像人脸识别[J].激光杂志,2022,43(12):117-121.
[4] 季瑞瑞,谢宇辉,骆丰凯,等.改进视觉Transformer的人脸识别方法[J].计算机工程与应用,2023,59(8):117-126.
[5] 赵洪坡,刘显梅.数据挖掘的热红外成像人脸识别研究[J].激光杂志,2022, 43(11):47-51.
[6] 孙金龙,吴振宁,肖仲喆,等.关于人脸识别算法对不同照明技术的鲁棒性研究[J].电子器件,2022, 45(5):1123-1128.
[7] 马倩,马祥.联合松弛块对角表示矩阵回归的遮挡人脸识别[J].计算机应用研究,2023,40(2):612-616+633.
[8] 张晨晨,王帅,王文一,等.针对人脸识别卷积神经网络的局部背景区域对抗攻击[J].光电工程,2023,50(1):113-125.
[9] 戚琦,马迎新,王敬宇,等.面向算力受限边缘环境的双分支多尺度感知人脸检测网络[J].通信学报,2020,41(8):165-174.
[10] 皮家甜,杨杰之,杨琳希,等.基于多模态特征融合的轻量级人脸活体检测方法[J].计算机应用,2020,40(12):3658-3665.
[11] 王艺皓,丁洪伟,李波,等.复杂场景下基于改进YOLOv3的口罩佩戴检测算法[J].计算机工程,2020,46(11):12-22.
(本文来源于必威娱乐平台 杂志2023年8月期)
加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码