论文部分内容阅读
目的: 1.探讨基于乳腺影像报告和数据系统(Breast Image Report and DataSystem,BI-RADS)的支持向量机(Support Vector Machine,SVM)在乳腺钼靶检查中对肿瘤良恶性的辅助诊断价值,以期提高影像医师的诊断水平。同时建立BI RADS数据库,实现乳腺肿瘤患者信息的系统规范和数字化管理,有利于今后开展乳腺肿瘤的临床、科研及教学工作,以及病人的追踪随访。 2.验证SVM在小样本情况下的分类性能。 方法: 搜集2012年1月至2013年12月两年间在我院就诊,并接收手术治疗或穿刺活检术,术前行乳腺X线摄片检查,术后病理证实为良性或恶性肿瘤的患者108人,年龄范围19~81岁,平均年龄47.2岁,中位年龄40岁。以一侧乳腺为一个样本,共120个样本为研究对象,其中良性病变76例,恶性病变44例。实际报告中影像医师的评定结果作为对照组,BI-RADS1、2、3级为阴性评价,0、4、5级为阳性评价。以BI-RADS(第4版)为标准,设定19个观察指标并量化为SVM输入向量:年龄、左右、腺体分型、肿块数量、肿块部位、肿块深浅、肿块密度、肿块大小、肿块形态、肿块边缘、肿块晕征、钙化形态、钙化分布、结构扭曲、特殊征象、淋巴结、乳头、皮肤、血管。以病理结果的良恶性为SVM分类标签。 由两名高年资影像医师盲法读片,将各观察指标数据录入数据库。以LibSVM3.18为SVM工具,以RBF函数为核函数,采用网格搜索的方法获取最佳参数,然后以该参数进行5次折叠交叉验证(5-Fold Cross Validation)。算出SVM模型预测结果与影像医师实际报告结果的准确率、敏感度、特异性、阳性预测值和阴性预测值等各项诊断评估指标;使用SPSS19.0对两种结果的差异进行配对样本的X2检验,对两种结果的一致性以病理结果为标准,进行Kappa值检验。以P<0.05为有统计学意义。 结果: 本组共108位患者的120个样本,其中良性病变76例(63.3%),以纤维腺瘤和囊肿为主,恶性病变44例(36.7%),以浸润性导管癌为主。无肿块者一共14例。有钙化者一共46例(38.3%),良性18例(23.7%),恶性28例(63.6%)。 以RBF函数为SVM核函数的最佳参数:C=24,g=1/27。SVM模型预测结果的准确率、敏感度、特异性、阳性预测值和阴性预测值分别为:0.908、0.818、0.961、0.923、0.901。影像医师实际报告结果的五项诊断评价指标分别为:0.775、0.864、0.724、0.644和0.902。SVM模型的准确率、特异性和阳性预测值均要明显高于影像医师,但敏感度略低,阴性预测值基本一致。SVM模型、医师组和病理结果两两进行配对样本的X2检验,均具有显著差异(P<0.01)。以病理结果为标准,SVM模型的Kappa值为0.798(κ>0.75,P<0.01),医师组的Kappa值为0.548(0.4<κ<0.75,P<0.01),SVM模型与病理结果的一致性更高。 结论: SVM模型具有强大的机器学习能力和泛化能力,高维度下的小样本也能获得很好的分类性能。BI-RADS具有良好的征象概括能力,对乳腺影像诊断和数据管理具有很大的指导作用。基于BI-RADS的SVM模型对乳腺钼靶检查中的肿瘤良恶性有较高的辅助诊断价值,其预测结果达到了相对较高的准确率、特异性、阳性预测值和阴性预测值,但需要更大的样本进一步提高敏感度。SVM可以作为乳腺钼靶诊断的一种有益补充。