介绍
由美国国防部(DoD)赞助了人脸识别技术(FERET)计划。FERET计划的目标是开发自动面部识别功能,可用于协助安全,情报和执法人员履行职责。该计划包括三个主要元素:
- 赞助研究
- 收集FERET数据库
- 执行FERET评估
赞助研究的目标是开发人脸识别算法。收集FERET数据库以支持赞助研究和FERET评估。进行FERET评估以测量算法开发的进展并确定未来的研究方向。
FERET计划于1993年9月开始,马里兰州Adelphi陆军研究实验室P. Jonathon Phillips博士担任技术代理。最初,FERET计划包括三个阶段,每个阶段一年。第一阶段的目标是建立自动人脸识别算法的可行性,并建立一个衡量未来进展的绩效基准。第2阶段和第3阶段的目标是进一步发展人脸识别技术。在第2阶段成功结束后,国防部反药技术发展计划办公室启动了FERET示范工作。这项工作的目标是将FERET评估算法移植到实时实验/演示系统。
FERET赞助的算法开发研究
FERET计划是在广泛的机构公告(BAA)下启动的。国防部和执法人员联合收到并评估了24项提案。获奖提案是根据他们的先进理念和不同方法选择的。授予五个算法开发合同。选择的组织和主要调查员是:
- 麻省理工学院(MIT),Alex Pentland
- 罗格斯大学,约瑟夫怀尔德
- 分析科学公司(TASC),Gale Gordon
- 伊利诺伊大学芝加哥分校(UIC)和伊利诺伊大学厄巴纳香槟分校,刘易斯萨德勒分校和托马斯黄
- 南加州大学(USC),Christoph von der Malsburg
对于阶段2,选择MIT,TASC和USC继续开发其算法。麻省理工学院和南加州大学的团队继续致力于从静止图像开发人脸识别算法。TASC的努力扩展了他们开发用于识别视频中的面部的算法的方法。TASC努力的重点是从运动中估计面部的三维形状,然后根据其形状识别面部。罗格斯的第二阶段工作比较和评估了用于人脸识别和检测的长波红外(热)和可见图像的相对优点。这项研究的结果在J. Wilder,PJ Phillips,C. Jiang和S的“可见和红外图像的面部识别比较”一文中提出。
FERET数据库
面部图像的标准数据库对于FERET计划的成功至关重要,既为标准图像提供标准图像,又提供足够数量的图像以允许测试这些算法。在FERET计划开始之前,无法准确评估或比较面部识别算法。各种研究人员为他们正在调查的问题收集了自己的数据库。大多数数据库都很小,由少于50个人的图像组成。值得注意的例外是三位主要研究人员收集的数据库
- 麻省理工学院(MIT)的Alex Pentland组建了一个约7500张图像的数据库,这些图像是在受控照明的高度可控环境中收集的。所有图像都将眼睛放在已注册的位置,并且所有图像都是完整的正面视图。
- 罗格斯大学的约瑟夫·怀尔德(Joseph Wilder)组建了一个在类似控制条件下收集的约250人的数据库。
- 南加州大学(USC)的Christoph von der Malsburg及其同事使用了大约100张图像的数据库,这些图像具有可控的大小和光照,但确实包括一些头部旋转。
FERET计划旨在建立一个独立于算法开发人员收集的大型面部图像数据库。乔治梅森大学的Harry Wechsler博士被选中指导该数据库的收集。数据库收集是Wechsler博士和Phillips博士的合作。在半控制环境中收集图像。为了在整个数据库中保持一定程度的一致性,在每个摄影会话中使用相同的物理设置。由于每次会话都必须重新组装设备,因此在不同日期收集的图像会有一些细微差别。
FERET数据库是在1993年8月到1996年7月之间的15个会话中收集的。该数据库包含1564组图像,总共有14,126个图像,包括1199个个体和365个重复图像集。重复集是数据库中已有人的第二组图像,通常在不同的一天拍摄。
对于某些人来说,在他们的第一次和最后一次会议之间已经过了两年多,有些主题被拍摄了多次。这段时间过长非常重要,因为它使研究人员能够首次研究一年内发生的受试者外观变化。
FERET评估
在创建FERET数据库之前,大量论文报告了在有限大小的数据库(通常<50个人)上的杰出识别结果(通常> 95%正确识别)。这些算法中只有少数使用通用数据库报告了图像上的结果,更不用说满足在包括单独的训练和测试集的标准测试协议上进行评估的理想目标。因此,没有方法可以在各种算法之间进行有根据的比较。
FERET数据库使研究人员能够在公共数据库上开发算法,并使用该数据库报告文献中的结果。文献中报道的结果未提供算法之间的直接比较,因为每个研究人员使用不同的假设,评分方法和图像报告结果。独立管理的FERET评估允许直接定量评估不同方法的相对优势和劣势。
更重要的是,FERET数据库和评估澄清了人脸识别的最新技术,并指出了未来研究的总体方向。FERET评估允许计算机视觉社区评估该领域的总体优势和劣势,不仅基于单个算法的性能,而且还评估所有测试算法的总体性能。通过这种评估,社区以公正和公开的方式了解了需要解决的重要技术问题。
进行了三组评估,最后两次评估被多次管理。有关评估的日期和组,请参阅下表。在FERET资助下开发的算法需要参与FERET评估。其他组织被邀请参加FERET评估,但未获得FERET计划的资助。这些组织包括Excalibur Corp,密歇根州立大学,洛克菲勒大学,罗格斯大学(仅限Sep96评估)和马里兰大学。
第一次FERET评估于1994年8月进行,即Aug94评估,旨在测量可自动定位,标准化和识别数据库中面部的算法的性能。测试由三个子测试组成,每个子测试具有不同的图库和探针组。第一个子测试检查了算法识别来自316个人的画廊的面孔的能力。第二个子测试是虚警测试,它测量算法拒绝不在画廊中的面部的程度。第三个子测试将姿势变化对性能的影响作为基础。
第二次FERET评估于1995年3月进行,即Mar95评估。目标是衡量自最初的FERET评估以来的进展,并在更大的画廊(817个人)上评估这些算法。此评估的另一个重点是包含重复图像的探针集,其中复制图像被定义为在不同日期拍摄相应图库图像的人的图像。
第三次也是最后一次FERET评估于1996年9月进行,称为Sep96 FERET评估。对于Sept96评估,我们设计了一种新的评估协议,该协议要求算法将一组3323图像与一组3816图像进行匹配。因此,算法必须执行大约1260万次匹配。新协议设计允许确定多个图库和探针集的性能分数,并执行更详细的性能分析。结果报告了以下情况:(1)一个人的画廊和探测图像是在相同的照明条件下同一天拍摄的,(2)一个人的画廊和探测图像是在不同的日子拍摄的,(3)一个人的画廊和探测图像相隔一年,(4)一个人的画廊和探测图像是在同一天拍摄的,但照明条件不同。1996年9月的评估有两个版本。第一个测试的部分自动算法是通过为图像提供眼睛中心的坐标。第二种是通过仅提供图像来测试全自动算法。
此外,评估的设计者实施了两种面部识别算法(PCA和相关)以提供基线性能。为了更好地理解人脸识别算法,对基于PCA的识别算法进行了详细研究,结果在H. Moon和PJ Phillips的“基于PCA的人脸识别算法的计算和性能方面”中出现,感知,(NISTIR)。
摘要
国防部反毒品技术发展计划办公室于1993年开始实施人脸识别(FERET)计划,并于1998年完成该计划。该计划的总资金超过650万美元。
FERET计划包括三个主要元素。首先是赞助将面部识别从理论推进到工作实验室算法的研究。许多参与FERET的算法构成了当今商业系统的基础。其次是FERET数据库的收集和分发,其中包含1116个人的14,126张面部图像。国防部反药物技术开发计划办公室仍然收到访问FERET数据库的请求,该数据库目前由国家标准与技术研究所维护。FERET数据库的开发部分已经分发给原始FERET计划之外的100多个组。决赛,也是最受认可的,
FERET评估中使用的测试方法构成了PJ Phillips,A。Martin,CL Wilson和M. Przybocki在IEEE Computer,2月,pp中描述的“ 生物识别系统评估简介 ”中描述的整体生物识别评估方法的基础。.56-63,2000。(生物识别专题)。
该评估方法已被纳入英国生物识别工作组的“生物识别装置性能测试最佳实践”。如清楚所示,FERET计划继续对今天的面部识别社区产生深远的影响。
FERET计划是一项非常成功的工作,为面部识别界提供了方向和可信度。我们刚刚开始发现该程序在面部识别技术初期的重要性。随着FERET即将从活动计划过渡到历史计划,国防部反药技术开发计划对其留给生物识别界的印记感到非常自豪,更为自豪的是FERET理想和评估方法正在被使用目前的计划办公室和其他政府机构的计划。