论文部分内容阅读
随着社会的进步和经济的不断发展,人们的生活质量显著提高,而快节奏、高压力的工作环境,也给人们的健康带来了隐患。女性中,乳腺癌的发病率逐年上升,严重威胁着女性的身心健康。而早期筛查可发现早期病变,早诊断、早治疗可以有效降低乳腺癌的死亡率。乳腺X线图像作为分辨率高,清晰度好的乳腺影像检查方式,被广泛应用于乳腺疾病的早期筛查。肿块作为乳腺癌的征象,放射科医师会根据肿块的情况来判断乳腺病变的程度。由于医师阅片量大,加上乳腺本身结构的复杂性,容易因疲劳造成漏诊和误诊的情况,而作为“第二双眼睛”的乳腺肿块计算机辅助检测算法可以辅助医师进行决策,提高病变的检测效率。本文结合了放射科医师检测病变的流程及机器学习、人工智能等领域的技术,对乳腺X线图像中的可疑肿块进行检测,主要工作成果概括如下:首先,针对之前研究者仅基于含有肿块的乳腺图像进行检测的问题,我们引入了双阶段检测方法。在对DDSM和INbreast两种乳腺X线影像数据集,进行不同的预处理后,采用深度多示例学习方法对图像进行粗检测,筛选出含有肿块的图像,再采用区域卷积神经网络检测图像中的良性肿块和恶性肿块,这种双阶段的检测方法更符合放射科医师的阅片习惯和工作流程,提高了乳腺肿块计算机辅助检测算法的实用性。其次,针对基于卷积神经网络对乳腺图像进行分类,准确率低的问题,采用了深度多示例学习方法进行分类。将原始图像划分为多个示例,基于Inception-v3网络提取特征,再采用线性逻辑回归和sigmoid函数得到每个示例的分类概率,将概率最大的示例的标签作为图像的分类标签。同时,基于乳腺图像中正示例集中分布于肿块区域的特性,设计了稀疏低秩的损失函数对网络参数进行调节,提高了对乳腺图像进行粗检测的准确率。最后,基于对DDSM和INbreast数据集特性的分析,对DDSM和INbreast分别采用Fast RCNN和SSD的方法进行肿块检测。针对Fast RCNN采用的选择性搜索方法中,基于图的图像分割方法生成的初始区域有空洞,导致无效候选框多的问题,我们采用线性谱聚类的超像素方法,生成形状保持性和轮廓紧凑性更优的初始区域,在基于多层次的合并算法后生成的候选框的质量更高,进一步提高了基于Fast RCNN进行乳腺肿块检测算法的性能。实验表明,本文提出的乳腺肿块计算机辅助检测算法,能较为准确地筛选出含有肿块的图像,并检测出图像中的良性肿块和恶性肿块,在保证检测准确率的同时,降低了假阳率。