VoxCeleb2 是一个从开源媒体自动获得的大规模说话人识别数据集。 VoxCeleb2 包含来自 6k 多个扬声器的超过 100 万个话语。由于数据集是“在野外”收集的,语音片段被现实世界的噪音破坏,包括笑声、串音、频道效果、音乐和其他声音。该数据集也是多语言的,来自 145 个不同国籍的演讲者,涵盖了广泛的口音、年龄、种族...
PubFig Dataset 是一个大型人脸数据集,主要用于人脸识别和身份鉴定,其涵盖互联网上 200 人的 58,797 张图像,不同于大多数现有面部数据集,这些图像是在主体完全不受控制的情况下拍摄的,因此不同图像中姿势、光照、表情、场景、相机、成像条件和参数存在较大差异,该数据集类似于 UMass-Amherst 创建的 LFW 数据集。
类别数目和图片数目比主流训练集加起来还要多 Glint360K具有36w类别,和1700w张图片,不论在类别数还是图片数目,相比起MS1MV2都是大幅度的提升。 3.如何训练大规模的数据 人脸识别任务特点就是数据多,类别大,几百万几千万类别的数据集在大公司非常常见,例如2015年的时候,Google声称他们有800w类别的人脸训练集。训如...
特点:Facescrub是一个包含超过10万个标记过的人脸图片的数据集,同样涵盖多个不同的面部属性和光照条件,适用于人脸识别的深入研究。 8. MORPH 特点:MORPH是一个跨年龄和表情变化的人脸识别数据集,包含超过4万张标记过的人脸图片,特别适用于评估人脸识别算法在年龄和表情变化下的性能。 9. HELEN 特点:HELEN是一个专注...
用Vec2Face 生成的 HSFace10k 训练的模型,首次在人脸识别的年龄测试集 (CALFW) 上实现了性能超越同尺度的真实数据集(CASIA-WebFace [2])。另外,当合成数据集的 ID 数量大于 100k 后,训练的人脸识别模型在毛发测试集 (Hadrian) 和曝光度测试集 (Eclipse) 上也同样超越了 CASIA-WebFace。
人脸识别:insightface自定义数据集制作 | 附练手数据集随着科技的不断发展,人脸识别技术已经深入到各个领域,如安全监控、身份验证、智能家居等。而在人脸识别领域,一个高质量的数据集是模型训练的关键。本文将介绍一种基于insightface的人脸识别自定义数据集制作方法,并附上一个练手数据集。一、人脸数据集制作 数据收...
【PaddlePaddle】 PaddleDetection 人脸识别 自定义数据集 简介 特性 一、数据集制作 1.收集数据 2.标注 1.打开图片文件夹 2.点击change_save_dir 选择 xml保存路径 3.标注 二、下载 三、训练 1.修改配置文件 2.开始训练 3.导出模型 四、使用 四、使用 ...
8. YouTube Faces Dataset 该10GB的名人视频数据集包含155,560张连续帧,适用于视频中人脸检测和识别。9. CelebA属性数据集 CelebA包含200K名人图像,40个属性注释,适合人脸属性识别和编辑任务。10. 耶鲁人脸数据库 耶鲁数据库包含15人165张GIF灰度图像,适用于表情识别和分身对比。
MPR是由飞行的无人机在室内和室外环境中收集行人重识别数据集。由于它只有一个摄像头,所以作者在原论文中提出了三种不同类型的评价实验。所有的行人检测都是通过Piotr Dollar工具箱中的金字塔特征检测得到的。它有两个子数据集。数据集01已经被标记了113610次检测。数据集02提供数据集01的原始帧数据。
一、 公共数据集 1.Labeled Faces in the wild Home(LFW) 很多公司号称识别率高达99%,是基于这个数据库。数据集合偏小,此时用一个在大量数据上预训练过的模型,在这个数据集合上测试。并且验证数据包含训练数据。 2. CASIA-FaceV5 包含500个人的照片,每个人5张,共2500张照片。照片size:height 480,width 640。