多标签图像分类
这项研究的目的是开发一种深度学习模型,该模型将从图像中识别自然场景。这种类型的问题属于多标签图像分类,其中实例可以在预定义的类别中分为多个类别。
数据集
数据集包含2000个自然场景图像。
前处理
将所有图像大小调整为100 x 100像素,并创建了两个集合,即训练集和测试集。训练集包含1600张图像,测试集包含200张图像。
训练
由于这是多标签图像分类,因此损失函数为二进制交叉熵,而使用的激活函数在输出层为S型。Keras没有提供多标签输出的规定,因此在训练之后,有一种概率阈值方法可以分别找到每个标签的最佳阈值,然后使用马修斯相关系数评估阈值的性能,然后使用此阈值进行转换这些概率分别为1和0。