N. Schneider和DM Gavrila。递归贝叶斯滤波器的行人路径预测:比较研究。在《计算机科学讲座笔记》中。德国模式识别会议(GCPR)的第一卷。8142,施普林格,2013。
数据集包含从固定和移动的车辆收集的68个行人序列的集合。考虑了四种不同的行人运动类型:过马路,停车,开始行走和弯腰。行人没有被遮挡。
原始立体声对(8位PGM,1176x640) 校准数据 地面实况(GT)注释, 行人探测器的测量和 车辆数据(速度,横摆率) 事件标签和事件发生时间标签(以帧为单位的TTE)。特别是,我们以(u,d)形式提供航迹数据(GT注释,探测器测量值),其中u是横向图像坐标,而d是视差。在静态接地平面假设的情况下,这允许计算也提供的接地平面(X,Z)上的行人位置。
使用基于HOG / linSVM的检测器计算行人边界框(即,测量的横向图像位置)。通过(H.Hirschmueller,通过半全局匹配和互信息的立体声处理,IEEE PAMI,30(2):328-341,2008)计算视差d。立体图像的可用性允许使用不同的行人检测器和/或立体算法进行实验。
这些序列总共有19612个立体图像对。12485张图像包含手动标记的行人边界框,9366张图像包含行人检测器测量值。在我们的论文中,我们仅在5-50的距离范围内进行评估,并且需要“有效”的视差测量。这种选择会产生9152个地面真实情况和7937个测量对象。
有关更多信息,请参见我们上面的GCPR'13出版物或阅读文档。