LFPW的第1版包含来自网络下载图像的1,432张面孔,使用google.com,flickr.com和yahoo.com等网站上的简单文本查询。 每个图像由三名MTurk工作人员标记,下面显示的29个基准点包含在数据集中。 LFPW最初在以下出版物中描述: 面部基准点,人脸标注,面部数据集
“使用范例共识来定位部分面孔”
Peter N. Belhumeur,David W. Jacobs,David J. Kriegman,Neeraj Kumar,
第24届IEEE计算机视觉和模式识别会议(CVPR)会议录,
2011年6月。
[ pdf ] [ 海报 ] [ 项目页面 ]
LFPW用于评估面部(面部基准点)检测方法,该方法在1,132个图像上进行训练并在300个图像上进行测试,因此将数据集分成两个文件,一个用于训练和测试。可以从这里下载数据库:
- kbvt_lfpw_v1_train.csv.gz(1.6MB)
- kbvt_lfpw_v1_test.csv.gz(418KB)
由于版权问题,我们无法以任何格式向任何人分发图像文件。相反,我们提供了一个图像URL列表,您可以自己下载图像。我们意识到这使得无法精确地比较数字,因为图像链接会随着时间的推移慢慢消失,但我们没有其他选择。这似乎是其他大型基于Web的数据库似乎正在发展的方式。
数据格式
数据集位于CSV文件中,使用制表符('\ t')作为分隔符。文件的第一行定义字段。第一个是“imgurl”,它是图像的原始URL。第二个是“worker”,可以是“worker_0”,“worker_1”,“worker_2”或“average”之一。这些是不同的工人标签,以及我们计算的平均值(x,y位置的算术平均值和类型的中位数)。因此,大多数图像在csv文件中有4行,一行对应于每个工作者,一行对应于平均值。(请注意,某些工作人员存在一些错误,因此某些图像只有3行。)
以下是所有基准。每个基准点有3个字段:<fid> _x,<fid> _y,<fid> _t,它们对应于x和y位置(具有子像素精度)和可见性类型。可见性可以采用以下值:
0:可见
1:被头发/眼镜/等遮挡。
2:因视角隐藏
3:因图像裁剪而隐藏
以下是不同的基准点(总共35个):
- left_eyebrow_out
- right_eyebrow_out
- left_eyebrow_in
- right_eyebrow_in
- left_eyebrow_center_top
- left_eyebrow_center_bottom
- right_eyebrow_center_top
- right_eyebrow_center_bottom
- left_eye_out
- right_eye_out
- left_eye_in
- right_eye_in
- left_eye_center_top
- left_eye_center_bottom
- right_eye_center_top
- right_eye_center_bottom
- left_eye_pupil
- right_eye_pupil
- left_nose_out
- right_nose_out
- nose_center_top
- nose_center_bottom
- left_mouth_out
- right_mouth_out
- mouth_center_top_lip_top
- mouth_center_top_lip_bottom
- mouth_center_bottom_lip_top
- mouth_center_bottom_lip_bottom
- left_ear_top
- right_ear_top
- left_ear_bottom
- right_ear_bottom
- left_ear_canal
- right_ear_canal
- 下巴