手机

ICCV 2021 人脸识别新技术影视剧中的人物身份一网打尽

在最新的计算机视觉会议 ICCV 2021 上,京东探索研究院、悉尼大学以及腾讯数据平台部联合完成了一项创新性的研究论文“SynFace: Face Recognition with Synthetic Data”,这篇文章旨在解决当前人脸识别模型训练过程中存在的隐私问题、标签噪声和长尾分布等问题。通过引入生成仿真的人脸数据来代替真实数据进行训练,并且提出了一种名为Identity Mixup的混合方法,这使得生成数据中的类内距离大幅缩小,从而极大地提高了人脸模型的准确率。

该论文指出,由于近年来对隐私保护日益重视,大部分大规模人脸训练数据集已被下架,无法再访问。此外,这些从互联网收集的数据还存在标签噪声和长尾分布的问题,如若不妥善设计网络结构或损失函数,必将导致识别准确率下降。而这些真实面部特征缺乏具体特性标注(如表情、姿态、光照条件),因此无法系统性地分析这些因素在人脸识别中的影响。

为了应对上述挑战,该团队开发了DiscoFaceGAN作为基本生成模型,与真实数据训练得到的模型进行对比分析。实验结果显示,即便是使用生成仿真的人脸图片,也能够达到与现有最先进方法相当甚至超越其性能。这表明利用合成数据可以有效地替代传统方式获取大量高质量面部图像,而不会遇到实际应用中可能出现的问题。

为了进一步优化合成人的性能,研究人员提出了Identity Mixup(IM)策略,它结合了Mixup算法,将两个身份系数线性插值,以产生新的身份系数,同时改变相应标签。通过可视化分析,可以看到这种操作不仅能增大合成人的类内距离,而且能够平滑过渡,使得每个样本都更加接近自然界中的变化规律。此外,他们还引入Domain Mixup(DM)作为一种领域适应策略,以减少合成和真实世界之间差异带来的误差。

最后,该团队通过一系列实验验证了他们提出的方法。在不同的设置下,他们发现随着深度(即每个类别内部样本数量增加)的提升,准确率会逐步上升,但当深度超过一定程度后,其增长趋势就会放缓。而宽度(即类别数量)的增加则显著提升了准确率,并且具有更重要的地位。在所有实验中,都证明了Identity Mixup可以稳定提升准确率,对抗各种潜在错误源头,比如长尾分布和低质量样本。

总之,本文介绍了一种基于生成仿真的新颖人脸识别技术,它不仅克服了现有方法所面临的一系列难题,还展现出强大的表现能力,为未来的人工智能发展提供了新的可能性。本文也为那些想要了解如何利用最新影视资讯来加强人物背景信息挖掘者的朋友们提供了一份宝贵参考资料。

你可能也会喜欢...