175种鸟类数据集-免费大数据平台！-可思数据

175种鸟类数据集

发布：可思数据时间：2020-03-29

数据类型：图形图像热度

数据采集定制

数据标注定制

文件类型：.zip 文件大小：2 GB

授权方式：公共开源 发布时间：2020-03-29

数据来源：Gerry 数据语言：英文

数据介绍：

175种鸟类的数据集。23657个训练图像，875个测试图像（每个物种5个）和875个验证图像（每个物种5个）。
所有图像均为jpg格式的224 X 224 X 3彩色图像，还包括jpg格式的“合并”图像集，该图像集将训练，测试和验证图像到一个单一的数据集中，这对想要创建自己的训练，测试和验证集的用户很有用，
每种物种的图像都包含在单独的子目录中，如果您使用来自目录的Keras流作为实现输入数据。
图片是通过互联网搜索按物种名称收集的。一旦下载了某个物种的图像文件，就使用我开发的python重复图像检测程序检查它们是否存在重复图像。删除所有检测到的重复项，以防止它们成为训练，测试和验证集之间的通用图像。
之后，将图像裁切，以使鸟类至少占据图像中像素的50％。然后将图像调整为jpg格式的224 X 224 X3。裁剪可确保在被CNN处理时，它们在图像中具有足够的信息以创建高度准确的分类器。每个文件的所有文件也按顺序编号。因此，测试图像被命名为1.jpg至5.jpg。对于验证图像也是如此。训练图像也使用“零”填充顺序编号。例如001.jpg，002.jpg….010.jpg，011.jpg…..099.jpg，100jpg，102.jpg等。零值填充可与python文件功能一起使用，并保留目录中的Keras流。
训练集不平衡，每个物种的文件数不等。但是，每个物种至少都有100个训练图像文件。这种不平衡不会影响我的内核分类器，因为它在测试集上达到了98％以上的准确性。
数据集中的一个重大失衡是雄性物种图像与雌性物种图像的比率。大约80％的图像是男性，而20％是女性。典型的雄性的颜色要多样化得多，而一个物种的雌性通常是平淡的。因此，雄性和雌性图像看起来可能完全不同。几乎所有测试和验证图像均来自该物种的雄性。因此，分类器在女性物种图像上的表现可能不佳。
数据集中还包括经过训练的模型文件BIRDS-224-175-98.62.h5和文本文件BIRDS-175.txt。这些文件与伴随的Predictor程序结合使用，该程序使用这些文件使用经过训练的模型对输入图像进行预测。文件夹预测变量测试集包含101个Predictor程序可以预测的测试图像。我将很快发布预测程序。最后，有一个文件错误列表98.62.txt，其中显示了该模型在875个测试图像上具有的测试集上的错误列表。

下载地址：

下载提取码：wzyq

特别声明：

人工智能交流群扫码邀请

无相关信息

175种鸟类数据集

客服QQ