人脸识别新进展：利用算法解决图像3D建模问题

小安 • 来源：地平线机器人 • 2024年4月12日下午1:51 • 知识 • 阅读 72

在计算机视觉领域，人脸识别一直以来都是学术界和工业界的双重宠儿。学术上的热门和工业市场的迫切需求，使得围绕该方向的核心技术自深度学习爆发以来，得到了更为迅猛的发展。

得益于深度学习，当前计算机对人脸属性的分析判断在某些（姿态、光照）限制条件下已经媲美甚至超越人类，但是如何在非限制条件下，使计算机获取和人类一样，从姿态万千的人脸图像中依然能够进行识别的能力，是一项非常具有挑战性的工作。

今天，地平线《大牛讲堂》邀请到美国密歇根州立大学刘小明教授，他将结合自己近年来有关人脸识别的研究成果和发表在多篇世界顶级期刊(CVPR,TPAMI等)的论文，为大家带来分享――2D/3D shape estimation and recognition for large-pose faces。

神奇idea:大姿态下人脸图像矫正算法

人脸矫正是人脸属性分析中至关重要的一步，能够直接影响整体性能的好坏。在深度学习之前就有许多优秀的方法被提出，例如知名度较高的ASM和AAM，这些方法能够在人脸变化不大的条件下取得比较好的效果，但是对于一些发生遮挡或者姿态角度偏大的情况就差强人意了；在深度学习出来之后，一些基于深度学习的方法虽然能够解决上述部分问题，但是对姿态角度偏大的情况仍然无能为力。

针对上述问题，刘小明教授在2016年CVPR的一篇论文中有提出一个神奇的idea，利用3D人脸可变模型来解决2D图像中姿态角度偏大问题，该方法神奇之处在于能够使3D人脸模型“学习”2D图像中人脸在拍照时候的姿势状态，如下图左边的第一步，给神经网络输入通用正面人脸模板模型和2D图像，神经网络识别获取图像中人脸的姿态角度参数矩阵，利用这些参数就可以使模型“做出”和图像中人脸同样的脸部朝向。

反过来，对改变姿态之后的3D模型，我们给它“拍个照”，变成2D图像，那么3D模型上的关键点通过“拍照”，就映射到2D图像上来了，得到一个初步的粗定位；此时，再根据关键点坐标，把原始图像切片，输入到另外的网络来调整3D模型的形状参数，使得模型更加精确的拟合2D图像，这样多次迭代之后，关键点便被精确定位出来；该方法开创性地利用3D人脸可变模型来学习2D图像，并且通过级联CNN神经网络回归来提高精确度，使得即使大姿态下，被遮挡的关键点也能被很好的定位出来。