Fashion-MNIST是Zalando文章图像的数据集 - 由60,000个示例的训练集和10,000个示例的测试集组成。每个示例都是28x28灰度图像,与10个类别的标签相关联。Zalando打算将Fashion-MNIST作为原始MNIST数据集的直接替代品,用于对机器学习算法进行基准测试。它具有相同的图像大小和训练和测试分割的结构。
原始的MNIST数据集包含许多手写数字。AI / ML / Data Science社区的成员喜欢这个数据集并将其用作验证算法的基准。事实上,MNIST通常是研究人员尝试的第一个数据集。他们说:“如果它不适用于MNIST,它根本不起作用”。“好吧,如果它对MNIST有效,它可能仍然会失败。”
Zalando寻求替换原始的MNIST数据集
内容
每个图像的高度为28个像素,宽度为28个像素,总共为784个像素。每个像素具有与其相关联的单个像素值,指示该像素的亮度或暗度,较高的数字意味着较暗。该像素值是0到255之间的整数。训练和测试数据集有785列。第一列由类标签组成(见上文),代表服装品。其余列包含关联图像的像素值。
- 为了在图像上定位像素,假设我们已将x分解为x = i * 28 + j,其中i和j是0到27之间的整数。像素位于28 x 28矩阵的第i行和第j列上。
- 例如,pixel31表示从左边开始的第四列中的像素,以及从顶部开始的第二行,如下面的ascii图中所示。
标签
每个培训和测试示例都分配给以下标签之一:
- 0 T恤/上衣
- 1裤子
- 套头衫
- 3连衣裙
- 4外套
- 5凉鞋
- 6件衬衫
- 7运动鞋
- 8袋
- 9踝靴
TL; DR
- 每行都是一个单独的图像
- 第1列是类标签。
- 剩下的列是像素数(总共784个)。
- 每个值都是像素的暗度(1到255)
致谢
-
使用以下脚本将数据集转换为CSV:https://pjreddie.com/projects/mnist-in-csv/
执照
麻省理工学院许可证(MIT)版权所有©[2017] Zalando SE
特此授予任何获得本软件和相关文档文件(“软件”)副本的人免费许可,以无限制地交易本软件,包括但不限于使用,复制,修改,合并的权利根据以下条件,出版,分发,再许可和/或出售本软件的副本,并允许向其提供本软件的人员这样做:
上述版权声明和本许可声明应包含在本软件的所有副本或实质部分中。
本软件按“原样”提供,不提供任何明示或暗示的保证,包括但不限于适销性,特定用途的适用性和不侵权的保证。在任何情况下,作者或版权所有者均不对任何索赔,损害或其他责任承担任何责任,无论是在合同,侵权行为还是其他方面,由本软件引起或与之相关,或者与本软件的使用或其他交易有关。软件。