浅析人脸辨识的技术环节

发布时间：2022-06-20 阅读量：925 来源: 我爱方案网整理发布人: Aurora

人脸辨识的核心问题，不管是人脸确认(face verification)或是人脸识别(face identification)，都必须在人脸上取出具有辨别度的特征值。

也就是说，同个人的多张照片，即使在不一样的光源、时间、打扮、些微的表情、视角变化之下拍摄，还具有非常类似的高维数值(可以想象在高维空间中非常相近的点群)，相反地，对于不同人的照片，需很容易区别，在高维空间中维持相当的距离。

这目标听起来很直觉，但是研究人员几十年来的努力到最近才有突破性的发展。

人脸辨识的一般步骤为：人脸侦测、人脸校正、人脸特征值的撷取。目的在照片中，找到人脸的位置，利用人脸的特征点(如嘴角、人中、眼睛等)为锚点，将人脸校正到同一个比较基准，然后取出特征值来进行辨识。

早期的人脸侦测大多基于效率的考量，利用组合一系列简易的运算来检测画面中的可能人脸，甚至可以在相机的硬件中实现。但是在实际场域中的应用仍然有诸多限制，直到这几年深度卷积神经网络(Convolutional Neural Network；CNN )的使用，才让侦测率大大提升。

人脸特征值的撷取是最核心的问题。早期广泛采用的方法为特征脸(eigenface)，这是1991年MIT提出的方法，原理是人脸具有大致的轮廓，可以找出特征人脸为基础来线性组合出各个人脸。理论上同一个人的线性组合参数应该类似，所以就用这些组合参数来作为人脸特征值。

此外，还可以利用人脸各个器官之间的相对位置、比例等作为特征值。或是利用邻近画素的亮度差来表示特征值的局部二值样式(Local Binary Patterns；LBP)。或是将人脸特定位置的外观，利用具代表性的小区块进行编码的稀疏编码法(sparse coding)。这些技术都为人脸辨识的落实往前推进一步。为求系统稳定，大部分应用系统都采用鸡尾酒作法，也就是混搭各种特征值。

为何早期使用人脸辨识的场域不多呢？因为错误率所造成的困扰远大于技术的效率。举例来说，保全系统使用人脸辨识作为门禁卡，如果错误率5%的话，每100人次进出，就有5次需要人为介入，不胜其烦。

技术的正确率、稳定度的提升关乎可否全面落实到产品上，也就只有等到深度学习(更准确为卷积神经网络)技术的突破，才让人脸辨识数十年的研究有机会在产业界带来广泛应用的机会，而且有机会溢出传统安控领域而成为个人化的基础引擎。

相关资讯

晶振启动时间影响因素解析与优化方向

晶振的启动时间，通常是指其通电后进入稳定振荡状态所需的时间。若启动时间过长，可从以下五个常见的影响因素方面进行优化。

解析RTC实时时钟芯片的工作原理

RTC（Real-Time Clock，实时时钟）芯片作为一种独立的专用计时器件，其核心功能包括提供稳定的日历时钟、在主电源断电后持续运行、支持定时中断以及输出高精度时间戳，为各类嵌入式系统提供可靠的时间基准。

无源晶振与有源晶振在MCU应用中的关联逻辑与选型指南

时钟系统是保障微控制器（MCU）稳定运行的核心，而晶振作为关键时钟源，主要分为无源晶振与有源晶振两种类型。下面将围绕工作原理、硬件接口、电气特性及其在MCU中的适配场景等维度，系统解析这两类晶振与MCU之间的关联逻辑。

VC-OCXO压控恒温晶振管脚功能定义解析

恒温晶振（Oven Controlled Crystal Oscillator，简称OCXO）是高精度频率源的核心组件，选用切型更优（如SC切、AT切高精度型）、封装应力极小的高Q值晶片，通过恒温槽的超精密控温，让晶振始终工作在零温度系数点，几乎消除温度引发的频率漂移。

晶振倍频干扰解决方案：从PCB布局优化到源头抑制与电路整改

晶振倍频干扰（即高次谐波辐射）是电磁兼容（EMC）设计中非常棘手的问题，通常表现为基频25MHz的5次、7次谐波（如125MHz、175MHz等）处辐射超标。该问题源于晶振输出方波信号包含丰富的高次谐波成分，若PCB布局不当，晶振及其走线极易构成高效辐射天线，导致电磁干扰增强。