本页介绍了戴姆勒行人检测基准数据集 |
|
数据集 我们的培训和测试样本包括手动标记的行人和非行人边界框,这些框是从城市环境中的车载校准立体摄像机台上捕获的图像。对于每个手动标记的行人,我们通过几何抖动创建了其他样本。非行人样品是形状检测预处理步骤的结果,该步骤具有宽松的阈值设置,即包含对更困难图案的偏向。 使用半全局匹配算法(H. Hirschmueller,通过半全局匹配和互信息进行立体声处理,IEEE PAMI,30(2):328-341,2008)来计算密集的立体声。 -和运动自适应正则化流(A. Wedel等人,《结构和运动自适应正则化用于高精度光流》,ICCV,2009年)。 训练和测试样本的分辨率为48 x 96像素,行人周围有12像素边框。请注意,本文中的实验(见上文)是在36 x 84像素的图像上完成的,该图像的边框为6像素,即所提供数据集的作物,其三部分布局分别对应于头部,躯干,腿部。对于数据集的发布,我们选择为图像提供更大的边框,并且没有预先定义的组件布局,以允许在组件选择方面具有更高的灵活性。 |