Fashion MNIST数据集类似于MNIST的数据集,包含70,000张28x28标记的时尚图像。Fashion-MNIST的数据集-包含60,000个示例的训练集和10,000个示例的测试集。每个示例都是一个28x28灰度图像,与来自10个类别的标签相关联。Zalando打算将Fashion-MNIST用作直接替代原始MNIST数据集的基准机器学习算法。它具有相同的图像大小以及训练和测试分割的结构。
原始MNIST数据集包含许多手写数字。AI / ML /数据科学社区的成员喜欢此数据集,并将其用作验证其算法的基准。实际上,MNIST通常是研究人员首先尝试的数据集。
内容
每个图像的高度为28像素,宽度为28像素,总计784像素。每个像素都有一个与之关联的像素值,表示该像素的亮度或暗度,数字越高表示像素越暗。该像素值是0到255之间的整数。训练和测试数据集有785列。第一列包含类别标签,代表服装。其余列包含关联图像的像素值。
- 要在图像上定位像素,假设我们将x分解为x = i * 28 + j,其中i和j是0到27之间的整数。该像素位于28 x 28矩阵的第i行和第j列。
- 例如,pixel31表示从左数第四列,从顶数第二行的像素,如下面的坐标图所示。
标签
每个培训和测试示例都分配有以下标签之一:
- 0 T恤/上衣
- 1条裤子
- 2套头衫
- 3礼服
- 4外套
- 5凉鞋
- 6衬衫
- 7运动鞋
- 8袋
- 9踝靴
TL; DR
- 每行是一个单独的图像
- 第1列是类别标签。
- 剩余的列是像素数(共784个)。
- 每个值是像素的暗度(1到255)