论文部分内容阅读
乳腺癌是发病于两性乳房细胞的癌症总称。在世界范围内,乳腺癌是仅次于肺癌的常见癌症,也是第五致命的癌症。根据医学实验统计,女性的乳腺癌发病率是男性的100倍,但男女病患的康复机率却是相当的。因此,乳腺癌也就成为女性,特别是都市职业女性,最常见的恶性肿瘤之一。
乳房细针穿刺是乳腺癌常见诊断中准确度较高的一种诊断方法。另外,相对于粗针活检,它对病患伤害度较低。然而,这种人工诊断却表现出稳定性不足,耗时、耗人力等缺点。自1976年,Shortliffe等人成功将新兴的人工智能技术扩展到了医学领域以来,医学专家连同人工智能研究者都更希望通过计算机人工智能的技术手段帮助提升医学诊断的效率、准确度以及稳定度。
本文针对乳腺癌细针穿刺的计算机辅助诊断,借助美国威斯康辛大学诊疗科学中心乳腺癌病患的细针穿刺诊断数据,提出了一种新的算法框架。它有别于众多监督和半监督学习的方式,是基于EM算法高斯混合模型的一种投票式的无监督算法,简称投票式EM算法(Voting EM,VEM)。除了乳腺癌检测的数据之外,VEM并不需要乳房肿快的良性或恶性标签。在VEM的基础之上,本文完成了两个实验设计,在证明VEM对乳腺癌细针穿刺诊断的有效性以及稳定性之后,实验充分利用了乳腺癌病忠的三个属性视图作VEM聚类,并根据聚类结果对聚群做合理的标引,由此可以得到的三个不同的聚类结果。将这三个结果做交集,得到的统一聚类标签作为自动标引的样本,最后引入贝叶斯网络分类,完成一种非人工标引的半监督的学习算法。
通过实验证实本文提出的算法框架在一定的稳定度下,普遍达到了93%以上的准确度。