从乳腺肿块的细针抽吸(FNA)的数字化图像计算特征。它们描述了图像中存在的细胞核的特征。
在3维空间中描述的空间如下:[KP Bennett和OL Mangasarian:“两个线性不可分集合的鲁棒线性编程判别”,优化方法和软件1,1992,23-34]。
属性信息:
1)ID号
2)诊断(M =恶性,B =良性)
3-32)
为每个细胞核计算十个实值特征:
a)半径(从中心到周边点的距离的平均值)
b)纹理(灰度值的标准偏差)
c)周边
d)面积
e)平滑度(半径长度的局部变化)
f)紧密度(周长^ 2 /面积-1.0)
g)凹度(轮廓的凹入部分的严重程度)
h)凹点(轮廓的凹入部分的数量)
i)对称性
j)分形维数(“海岸线近似”-1)
为每个图像计算这些特征的平均值,标准误以及“最差”或最大(三个最大值的平均值),
从而得到30个特征。例如,字段3是平均半径,字段
13是半径SE,字段23是最差半径。
所有功能值都用四个有效数字重新编码。
缺少属性值:无
等级分配:357良性,212恶性