该野生鱼类标记图像数据集是由NOAA渔业(国家海洋渔业服务机构),以鼓励开发,测试,以及为不受约束的水下图像自动图像分析算法的性能评估。
数据集包括鱼,无脊椎动物和海床的图像,这些图像是使用部署在遥控车(ROV)上的摄像系统采集的,用于渔业调查。注释数据包含在随附的数据文件(.dat,.vec和.info)中,这些文件描述了图像中标记的鱼目标的位置。
该手稿(Cutter等人,2015年)演示了基于使用训练图像数据集开发并使用测试集进行评估的分类器自动检测鱼类的方法。该数据集可用于进一步开发复杂环境中鱼类或无脊椎动物的检测;跟踪视频图像序列中的多个动物目标;动物种类的识别和分类;立体图像对中动物的测量;和海底栖息地的特征。
推荐引用:G. Cutter;K. Stierhoff;Zeng,J.(2015)“使用Haar级联和新的图像数据集在不受约束的水下视频中自动检测石鱼:带标签的野外鱼类,” IEEE计算机视觉应用冬季研讨会,第57-62页。
负责这些数据的NOAA科学家可能拥有图像档案,这些档案可以为协作应用和评估算法提供额外的机会。应该在出版物中提供使用这些数据集的信誉,如数据集存档中包含的“ how-to-cite.txt”文档中所述或如上所述。
数据集
野生图像数据集(v.1.1)中带有标签的鱼。 带有
标签的野生鱼具有三个组成部分:训练和验证的正图像集(已验证的鱼),负图像集(非鱼)和测试图像集。训练和测试集具有随附的注释数据,这些数据定义了图像中每个标记的鱼目标对象的位置和范围。这些代表专家分析人员定义的边界矩形,格式为OpenCV使用的.dat文件。
培训和验证正面图像集:包含石斑鱼(Sebastes spp。)和海床附近的其他相关物种的图像,这些图像是使用部署在遥控车辆(ROV)上的前斜向数码相机拍摄的由西南渔业科学中心在对加利福尼亚南部沿海的岩石海底环境进行调查期间。这些摄像机的静止帧代表ROV缓慢移动且运动影响不是影响因素的调查期间的实例。训练集包含929个图像文件,其中包含1005个带有相关注释的标记鱼(它们的标记位置和边界矩形)。这些标记定义了相机的各种物种,大小和范围的鱼,并且包括背景组成不同的部分。
培训和验证负面图片集:包括3167张图片。在野外训练和测试图像集中,从带标签的鱼中提取了可下载档案中提供的147个海底负图像(提取了不含鱼的区域)。其余3020张图像可从 OpenCV HaarTraining上的教程中获得,也可从 data negatives目录中获得。
测试图像集:包含在近海底鱼类调查期间使用ROV的高清(HD; 1080i)摄像机收集的图像序列。用于检测的测试图像包括来自ROV调查的视频镜头。用于评估本研究检测器的视频片段(“ TEST_VIDEO_ROV10.mp4”; 210帧,每秒3帧(fps))代表原始视频序列的第10帧(2分钟,约30 fps)。对于210帧3fps测试视频,所有鱼目标均带有注释。测试视频中鱼的注释包括“已验证”或“明显”的描述符,其中已验证表明视频分析人员可以识别出鱼,并且明显的物体被认为是鱼,但无法根据单个框架中可见的属性进行验证。这些明显的鱼在远处看起来像淡淡的斑点。这些区别是在注释数据中进行的,因为我们认为某些分类器会检测到这些明显的鱼,但我们不希望分类器能够这样做。我们也不一定要探测器这样做。也就是说,如果分类器正在检测那些明显的鱼类,那么它可能正在检测图像中的许多其他非鱼类目标,从而使其效率低下且不切实际。在数据集测试视频的带注释的帧中总共标记了2061个鱼对象。其中,有1008条是经过验证的鱼,而1053条是明显的鱼。在序列中,ROV正在移动;背景似乎正在移动并且从不同方向被照亮(随着ROV的移动和旋转);水流中的小颗粒流过去;鱼静止或以各种速度运动;鱼有很多方向。一些鱼被部分地藏在岩石或缝隙中;远处出现一些模糊的鱼状物体。
野生数据集(v1.0,2014年12月)中的原始Labeled鱼类仅包含抽取后的测试视频序列(“ Test_ROV_video_h264_decim.mp4”),该序列仅包含原始视频中的标记帧。完整帧率视频的十分之一帧被标记为鱼类目标的位置。此版本的数据集(v1.1,2015年1月)还包含完整的测试视频序列(“ Test_ROV_video_h264_full.mp4”)。完整视频和抽取后的视频都带有附带分析标记的文本文件(遵循OpenCV .dat文件约定)。通常,对于m个标记,格式为:视频文件名(帧号)标记数x1 y1 w1 h1 x2 y2 w2 h2 ... xm ym wm hm。例如,如果有两个标记,最后的8个值定义边界矩形:Test_ROV_video_h264_full.mp4(fr_14)2 1021 362 94 63 953 289 9061。抽取视频的标记文件(“ Test_ROV_video_h264_decim_marks.dat”)指示抽取和完整序列的帧号,例如Test_ROV_video_h264_decim.mp4(fr_1)(fullfr_14)2 1021 362 94 63 953 289 9061。完整视频中有2101帧,抽取后的视频中有210帧,但是标记了206帧;即,一些检查的框架不包含鱼。)表示抽取和完整序列的帧号,例如Test_ROV_video_h264_decim.mp4(fr_1)(fullfr_14)2 1021 362 94 63 953 289 9061。抽取后的视频中有2101帧,抽取后的视频中有210帧,但是206标有框架;即,一些检查的框架不包含鱼。)表示抽取和完整序列的帧号,例如Test_ROV_video_h264_decim.mp4(fr_1)(fullfr_14)2 1021 362 94 63 953 289 9061。抽取后的视频中有2101帧,抽取后的视频中有210帧,但是206标有框架;即,一些检查的框架不包含鱼。