如何以编程方式收集巨大的面部数据集以进行面部识别?

问题描述

因此,我正在尝试使用Facenet在此面部识别系统上进行工作。该项目的难点在于数据,因为我至少需要100K类带标签人脸图像。最终,我想将编码存储在数据库中以进行实时人脸检测。有些数据集(例如“野外带有标签的面孔”)由巨大的面部数据集组成,但与面部图像的质量和每个类别上的图像数量不一致。我还研究了facenet的训练方法,发现它是针对“ 100万名人脸数据集”进行训练的。我认为我无法使用它,因为它用于训练我要用于我的项目的Facenet。因此,我的问题是如何以编程方式收集人脸数据集?谢谢

解决方法

我建议您查看VGGFace2数据集。它存储着330万个9K +身份的人脸图像。

另一个好人是FaceScrub。它存储了530个身份的10万张面部图像。

FaceNet都没有使用VGGFace2或FaceScrub进行培训。如今,许多研究都使用这些数据集训练模型,并在Labeled Faces in the Wild(LFW)数据集上测试模型。 LFW存储了5749个身份的13000张面部图像。