如何以编程方式收集巨大的面部数据集以进行面部识别？

问题描述

因此，我正在尝试使用Facenet在此面部识别系统上进行工作。该项目的难点在于数据，因为我至少需要100K类带标签的人脸图像。最终，我想将编码存储在数据库中以进行实时人脸检测。有些数据集（例如“野外带有标签的面孔”）由巨大的面部数据集组成，但与面部图像的质量和每个类别上的图像数量不一致。我还研究了facenet的训练方法，发现它是针对“ 100万名人脸数据集”进行训练的。我认为我无法使用它，因为它用于训练我要用于我的项目的Facenet。因此，我的问题是如何以编程方式收集人脸数据集？谢谢

解决方法

我建议您查看VGGFace2数据集。它存储着330万个9K +身份的人脸图像。

另一个好人是FaceScrub。它存储了530个身份的10万张面部图像。

FaceNet都没有使用VGGFace2或FaceScrub进行培训。如今，许多研究都使用这些数据集训练模型，并在Labeled Faces in the Wild（LFW）数据集上测试模型。 LFW存储了5749个身份的13000张面部图像。

computer-vision face-recognition facial-identification machine-learning