卫星图像使用Planet卫星图像对San Franciso Bay中的船只进行分类
卫星图像可提供对各种市场的独特见解,包括农业,国防和情报,能源和金融。需要机器学习和计算机视觉算法来帮助自动化分析过程。
该数据集的目的是帮助解决在卫星图像中检测大型船舶位置的艰巨任务。自动化此过程可应用于许多问题,包括监控港口活动水平和供应链分析。
内容
该数据集包括从在加利福尼亚州旧金山湾和圣佩德罗湾地区收集的Planet卫星图像中提取的图像芯片。它包括4000个80x80 RGB图像,这些图像标记有“船”或“无船”分类。图像芯片来自PlanetScope全画幅视觉场景产品,这些产品经过矫正后的尺寸为3米像素。
提供了一个压缩目录shipsnet.zip
,其中包含整个数据集(.png图像芯片)。每个单独的图像文件名都遵循特定的格式:{label} __ {场景ID} __ {经度} _ {latitude} .png
- 标签:值为1或0,分别代表“船”类和“无船”类。
- 场景ID:提取图像芯片的PlanetScope视觉场景的唯一标识符。场景ID可与Planet API一起使用,以发现并下载整个场景。
- longitude_latitude:图像中心点的经度和纬度坐标,其值由单个下划线分隔。
该数据集还以JSON格式的文本文件分发shipsnet.json
。加载的对象包含data,label,scene_ids和位置列表。
每个80x80 RGB图像的像素值数据存储为数据列表中19200个整数的列表。前6400个条目包含红色通道值,后6400个包含绿色,最后6400个包含蓝色。图像以行优先顺序存储,因此数组的前80个条目是图像第一行的红色通道值。
在索引列表中的值我在标签,scene_ids,和位置各自对应于我的个图像数据列表中。
类标签
“船”类包括1000张图像。此类中的图像几乎位于单船主体的中心。包括大小,方向和大气收集条件不同的船舶。此类的示例图像如下所示。
“无船”类别包括3000张图像。其中三分之一是对不包括船舶任何部分的不同土地覆被特征(水,植被,裸土,建筑物等)的随机抽样。接下来的三分之一是“部分船舶”,仅包含一部分船舶,但不足以满足“船舶”类别的完整定义。最后三分之一是以前由机器学习模型贴错标签的图像,通常是由亮像素或强线性特征引起的。此类的示例图像如下所示。