数据集
我们的数据集包括从城市环境中的车载校准立体摄像设备中捕获的手动轮廓标记的行人图像。对于每个行人抠图,我们提供一个24位PNG图像,一个浮动视差图和一个地面真实形状。
使用半全局匹配算法(H. Hirschmueller,通过半全局匹配和互信息的立体声处理,IEEE Trans。on PAMI,30(2):328-341,2008)来计算密集立体声。
785个图像切口的高度在34到468像素之间,宽度在11到267像素之间。在我们的BMVC'13出版物中,仅使用高度大于120像素的样本。我们为样品的每一侧提供了额外的10%边框。
我们用于训练Boosted Decision Tree Ensemble的数据集来自出版物
T. Scharwchter,M。Enzweiler,U。Franke和S. Roth。“高效的多线索场景分割”。在计算机科学讲义中(德国模式识别会议(GCPR)的专着),卷8142。Springer,2013年。