乳房组织病理学图像
198,738个IDC(-)图像补丁; 78,786个IDC(+)图像补丁
浸润性导管癌(IDC)是所有乳腺癌中最常见的亚型。为了给整个样本分配侵略性等级,病理学家通常会关注包含IDC的区域。结果,自动进阶分级的常见预处理步骤之一是描绘整个安装载片内部IDC的确切区域。
内容
原始数据集包括以40倍扫描的162个乳腺癌(BCa)标本的完整幻灯片图像。从中,提取了277,524个大小为50 x 50的色块(198,738 IDC阴性和78,786 IDC阳性)。每个补丁的文件名的格式为:U XX YY classC.png - >例如10253 idx5将x1351 y1101 class0.png。其中u是患者ID(10253 idx5),X是裁剪该补丁的位置的x坐标,Y是裁剪该补丁的位置的y坐标,C表示其中0是非IDC的类别1是IDC。