基于超声深度学习模型在乳腺BI-RADS 4类病变中预测乳腺癌的价值

来源 :昆明医科大学 | 被引量 : 0次 | 上传用户:jinhe_ieka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目 的]以乳腺癌术后病理结果为金标准,以超声图像主观特征和基于不同的深度学习模型及百度大脑开放平台图像处理后的数据为基础,探讨乳腺BI-RADS 4类肿块在不同的深度学习模型、百度大脑开放平台(EasyDL)以及运用列线图建立乳腺超声相关模型预测乳腺癌的价值。[方 法]1回顾性收集2019年01月—2019年12月于昆明医科大学第三附属医院接受乳腺癌切除术女性患者超声图像17231张(2578例),所有患者经严格筛选后,获得患者的年龄、初潮年龄、一级家族史、术前超声图像、描述性报告和术后病理资料。所有病例经过纳入标准、排除标准及图像预处理后,本研究纳入标准的研究对象为717张乳腺超声肿瘤图像,共计260例患者。2由两名从事乳腺超声诊断≥10年的超声医师独立通过乳腺超声图像的各项特征对良恶性进行分类评估,意见不统一时由1名主任医师最后决定。根据2019年版的《中国抗癌协会乳腺癌诊治指南与规范》对乳腺肿块的评估,本次研究纳入的评估内容包括:肿块的形状、纵横比、边界、边缘、回声模式、病灶后方回声、周围组织和钙化。由计算机随机抽取30名患者,由两位医师对其进行评估,利用Kappa检验对两位医师的一致性进行评价。3建立深度学习模型。选择ResNet18、ResNet34、ResNet50及ResNet101作为本次研究的预训练模型,按照步骤分为以下几步建模:数据准备、数据扩充和增强、数据加载、迁移学习、训练、验证、测试。百度大脑(EasyDL)模型则通过平台训练、验证、测试完成专属模型的构建。4将所有病例的形状、纵横比、边界、边缘、回声模式、病灶后方回声、周围组织和钙化纳入多元Logistic回归分析进行筛选,用R语言把比较有统计学差异的乳腺超声特征纳入并建立单一医师主观评估列线图预测模型。5将所有病例的年龄、初潮年龄、一级家族史纳入多元Logistic回归分析进行筛选,将筛选出来的有统计学意义的临床危险因素,结合上述具有统计学意义的乳腺超声特征建临床危险因素一医师主观评估列线图预测模型。6将深度学习模型对每一张超声图像的真实结果、预测结果及预测概率导出,由两名医师结合预测结果最好的深度学习模型对随机抽取的30张图像进行结局(良性/恶性)预测,联合筛选出的最优医师主观评估模型得出深度学习—医师主观评估联合模型。7为全部8个模型绘制ROC曲线,得出AUC、准确率、精确率、灵敏度、特异度、阴性预测值、阳性预测值、召回率、F1值及Kappa值,绘制校准曲线和DCA曲线分别评价预测模型的预测性能及临床实用性。最后将各模型进行比较。[结 果]1 一般资料:260例(717张乳腺超声图像)因乳腺肿块首诊、超声分类为BI-RADS 4类且有明确病理结果的患者,其中病理结果为良性的患者154例(154/260,59.2%),恶性的患者106例(106/260,40.8%),病理结果为良性的患者中BI-RADS 4A、4B及4C类的患者分别有113例、28例、13例,病理结果为恶性的患者中BI-RADS 4A、4B及4C类的患者分别有36例、41例、29例,其中医师判断正确的BI-RADS4A、4B及4C类病变的分别有119例、47例、29例,判断错误的分别有30例、5例、13例;良性患者的病理类型为纤维腺瘤83例、乳腺病(包括硬化性腺病)40例、导管内乳头状瘤18例、急慢性炎伴肉芽肿性小叶性乳腺炎10例、良性叶状肿瘤2例、纤维—肌纤维母细胞来源肿瘤1例,恶性患者的病理类型为浸润性导管癌79例、导管内原位癌24例、黏液癌3例;入组患者平均年龄(45.14±9.80)岁,其中病理结果为良性的患者平均年龄(41.96±8.66)岁,恶性患者平均年龄(49.76±9.56)岁;良性与恶性两组间年龄比较差异有统计学意义(P<0.05)。入组患者初潮平均年龄(13.64±1.72)岁,其中病理结果为良性的患者初潮平均年龄(13.68±1.50)岁,恶性患者初潮平均年龄(13.58±2.00)岁;良性与恶性两组间初潮年龄比较差异无统计学意义(P>0.05)。入组患者中无恶性肿瘤家族史患者共236例(90.8%),有1位一级恶性肿瘤家族史患者23例(8.8%),大于1位一级恶性肿瘤家族史患者1例(0.4%);其中病理结果为良性的患者中无恶性肿瘤家族史患者149例(96.8%),有1位一级恶性肿瘤家族史患者5例(3.2%),大于1位一级恶性肿瘤家族史患者0例(0%);恶性的患者中无恶性肿瘤家族史患者87例(82.1%),有1位一级恶性肿瘤家族史患者18例(17.0%),大于1位一级恶性肿瘤家族史患者1例(0.9%),该患者的母亲、一个姐姐及一个妹妹均患乳腺癌;良性与恶性两组间一级家族史比较差异有统计学意义(P<0.05)。入组患者的临床危险因素中良恶性两组间差异具有统计学意义的指标为患者年龄及一级家族史(P<0.05)。2乳腺超声图像特征差异性比较:入组患者的乳腺超声图像特征中良恶性两组间差异具有统计学意义的指标为形状、纵横比、边界、边缘、内部回声、病灶后方回声及钙化(P<0.05)。3两位医师主观评估一致性检验:两位医师对随机抽取的30位患者的乳腺肿块超声特征主观评估进行一致性检验,结果显示,只有在乳腺肿块“内部回声”是否均匀上不具有一致性,其他指标均具有一致性。其中一致性很好的超声特征为:病灶后方回声;一致性较好的超声特征为:形状,边界,边缘以及钙化;一致性中等的超声特征为周围组织侵犯,纵横比。4建立单一医师主观评估模型和临床危险因素—医师主观评估模型:对构建Logistic多因素回归模型的特征进行筛选,筛选出有统计学意义的超声特征指标为:纵横比、边界、病灶后方回声及钙化(P<0.05),筛选出有统计学意义的临床危险因素指标为:年龄、一级家族史。通过构建Logistic多因素回归模型,运用R语言建立单一医师主观评估模型和临床危险因素—医师主观评估模型。就两个模型的ROC曲线来看,单一医师主观评估模型的AUC为0.809,灵敏度为81.25%,特异度为92.93%,模型预测准确率82.31%;临床危险因素—医师主观评估模型的AUC为0.845,灵敏度为81.31%,特异度为87.58%,模型预测准确率85.00%,两个模型预测性能均较好,但临床危险因素—医师主观评估模型更具有说服力;就两个模型的校准曲线来看,两个模型均具有较好的预测能力,但单一医师主观评估模型的预测值与观察值有更好的重合性,该预测模型准确率更高。就两个模型的DCA曲线来看,模型的曲线(probility)均高于极值曲线(All与None),说明两个模型均具有临床应用价值,但临床危险因素—医师主观评估模型的曲线较单一医师主观评估模型更高,体现了更高的临床应用价值。5建立深度学习—医师主观评估联合模型:将ResNet50和临床危险因素—医师主观评估模型联合建立深度学习—医师主观评估联合模型。6比较各模型的预测性能:各深度学习模型ResNet18、ResNet34、ResNet50、ResNet101、单一医师主观评估模型、临床危险因素—医师主观评估模型、深度学习—医师主观评估联合模型的AUC值分别为:0.748、0.851、0.856及0.767、0.809、0.849、0.90;准确率(%)分别为:76.85、86.19、86.89、78.24、82.31、85.00、90.00;精确率(%)分别为:88.78、92.44、94.39、87.56、73.59、82.08、86.67;灵敏度(%)分别为:75.21、84.79、84.50、77.37、81.25、81.31、92.86;特异度(%)分别为:80.26、88.52、91.12、79.84、85.00、82.93、87.58、87.50;阳性预测值(%)分别为:88.78、92.44、94.39、87.56、73.59、82.08、86.67;阴性预测值(%)分别为:60.91、77.85、76.87、65.80、88.31、87.01、93.33;召回率(%)分别为:75.21、84.79、84.50、77.37、81.80、81.25、81.31、92.86;F1 值(%)分别为:81.43、88.45、89.17、82.15、81.60、77.23、81.69、89.66;Kappa 值分别为:0.512、0.714、0.727、0.546、0.628、0.690、0.800;EasyDL的准确率(%)为82.30,精确率(%)为81.50,灵敏度(%)为78.00,特异度(%)为 85.00,召回率(%)为 81.80,F1 值(%)为 81.60。7深度学习—医师主观评估联合模型的AUC最高(AUC=0.900),表明该模总体型预测能力最好,其次预测能力较好的是ResNet50(AUC=0.856);深度学习—医师主观评估联合模型的灵敏度最高(92.86%),特异度较好(87.50%),该模型漏诊率最低;ResNet50的特异度最高(91.12%),灵敏度中等(84.50%),该模型误诊率最低;深度学习—医师主观评估联合模型的在所有模型中准确率最高(90.00%);列线图模型中准确率最高的是临床危险因素—医师主观评估模型(85.00%);深度学习模型中准确率最高的是ResNet50(86.89%)。ResNet 50的阳性预测值最高(94.39%),该模型正确预测恶性病例的效能最高;深度学习—医师主观评估联合模型的阴性预测值最高(93.33%),该模型正确预测良性病例的效能最高。ResNet 50的精确率最高(94.39%),该模型在所有预测结果中正确预测良恶性病变效能最好。深度学习—医师主观评估联合模型的召回率最高(92.86%),该模型在实际预测结果中正确预测良恶性病变效能最好。深度学习一医师主观评估联合模型的F1值和Kappa值最高(89.66%,0.800),该模型预测分类的精度最好。百度大脑(EasyDL)的每组数据就总体而言没有最差的指标,基本达到了深度学习模型的要求。[结 论]1相较于医师主观评估模型及临床危险因素—医师主观评估模型,基于超声深度学习模型在乳腺BI-RADS 4类病变中对乳腺癌的预测有一定价值,可以提高乳腺癌预测的灵敏度,并作为常规乳腺超声筛查的有效补充,有一定的临床应用价值。2列线图相较于传统Logistic回归分析方程具有更强的可读性,在对结局进行预测时体现了较好的预测效能。3虽然本次研究针对深度学习的数据量在理论上应该更多,但是在数据量较少的情况下也获得了较高的准确率,若继续提高数据量,则模型的预测效能还将有更好地体现,证明ResNet深度学习模型适用于超声图像进行图像分类的应用。4百度大脑(EasyDL)平台针对图像分类目前具有非常完善的功能,在本次研究中数据量较少且平台免费的配置环境下,可以获得与ResNet相媲美的准确率,证明EasyDL可以为基层地区、初级学习者或零AI基础的需求者提供可靠的AI平台,可以满足不同需求的人个性化自主制定自己的AI模型。5虽然人工智能是目前医学研究中的热点和焦点,但是在AI的研究和应用中,人在其中的地位是不可替代的,应该辩证的看待人工智能与临床实践的关系,这样才能更好的将未来掌握在人类自己手中。
其他文献
[目的]通过比较行常规经鼻蝶复杂类型垂体腺瘤切除术和神经导航下经鼻蝶复杂类型垂体腺瘤切除术的两组患者的手术时间、术中出血量、术后激素恢复正常率、肿瘤切除程度、是否术后脑脊液漏、是否颅内感染、是否术后尿崩等指标,分析神经导航系统应用于经鼻蝶复杂类型垂体腺瘤切除术的优缺点,为经鼻蝶复杂类型垂体腺瘤患者的临床治疗提供一定的参考价值。[方法]回顾性分析昆明医科大学第二附属医院神经外科2019年7月1日至2
[目的]应用3D打印个性化定制型PEEK假体修复重建不同部位骨肿瘤切除后的骨缺损,观察其安全性及临床疗效,为不同原因造成骨缺损的患者采用3D打印PEEK假体修复重建提供临床使用依据。[方法]回顾分析昆明医科大学第三附属医院(云南省肿瘤医院)骨外二科自2019年1月至2021年5月行3D打印PEEK假体植入手术治疗的原发骨肿瘤患者资料共11例,男性5例(45.5%),女性6例(54.5%)。年龄范围
[目的]探讨术中导航技术对原发性肝癌手术的应用价值,对其应用于原发性肝癌手术的有效性及安全性进行系统评价。[方法]通过计算机检索关于原发性肝癌手术中应用术中导航技术的所有发表的文献进行meta分析。检索的各大数据库包括中国知网、万方、中国生物医学文献数据库、PubMed、Embase和Cochrane library等。检索时间由各大数据库建库至2021年1月。按照纳入标准和排除标准进行文献的筛选
[研究背景及目的]肺癌是目前全球发病率和死亡率最高的恶性肿瘤。2020年我国约有81.5万的新增肺癌病例,死亡约71万人,最新癌症数据显示肺癌依然是严重威胁人民群众健康的重大疾病。非小细胞肺癌是肺癌中最常见的组织学类型,在肺癌病例中占比超过80%,其中肺腺癌是主要的亚型,手术是首选的治疗手段。在临床实践中,肺腺癌患者对治疗的获益程度体现出巨大的差异,直接关乎患者的生存预后。本研究旨在对肺腺癌患者的
[目的]结肠癌(Colon cancer,CC)是消化道常见的恶性肿瘤,癌胚抗原(Carcinoembryonic antigen,CEA)是一种针对结肠癌和其他消化道恶性肿瘤常用的一种恶性肿瘤早期检测分子标记物,目前应用CEA在我国临床术后肿瘤复发率和转移率的情况分析具有一定的临床研究性和参考价值,但对于术前CEA处于正常水平的患者,与其总平均生存期(Overall Survival,OS)及无
[目的]探讨甲状腺微小乳头状癌(PTMC)术前双能CT碘图联合临床特征预测中央区淋巴结转移(CLNM)的价值,旨在为临床外科医生是否行中央区淋巴结清扫术提供重要依据。[方法]收集2019年7月一2020年6月云南省肿瘤医院术前行颈部双能CT扫描,病检确诊为PTMC且均行CLNM清扫的165例患者。以病检结果为“金标准”将患者分为CLNM组和无CLNM组。根据患者是否发生颈部CLNM分为CLNM组(
[目的]评价结肠镜、免疫法粪便隐血试验(Fecal Immunochemical Test,FIT)及个体化筛查三种结直肠癌(Colorectal Cancer,CRC)筛查方案在云南省昆明市城市居民中的参与率及筛查效果。[方法]采用随机对照试验研究设计,2018年5月至2019年5月在昆明市五华区、西山区及云南省肿瘤医院体检中心进行人群招募,将符合纳入排除标准的受试者按照1:2:2随机分配到三个
[目的]研究血浆纤维蛋白原(FIB)水平及血清白蛋白(Alb)水平及两者联合检测与胃癌术后患者总生存期(OS)的关系。[方法]回顾性的分析了 2014年1月-2016年12月三年间昆明医科大学第二临床医院收治的胃癌(GC)患者,查阅患者相关临床病历资料,包括性别、年龄、肿瘤大小、有无淋巴结转移、TNM分期、白蛋白水平、纤维蛋白原水平、肿瘤位置及肿瘤细胞分化程度等资料。通过电话、及返院复查等主要随访
[目的]观察肺癌术后前三天血清白蛋白水平的变化情况,探讨肺癌术后前期发生低蛋白血症的危险因素,为防治肺癌术后前期发生的低蛋白血症提供临床依据。[方法]收集整理336例行肺癌手术患者的相关资料,时间位于2019年12月至2020年12月期间,行手术治疗的均为云南省肿瘤医院胸外二科患者。对患者术前、术后连续前三天的血液生化检查结果及可能导致肺癌术后发生低蛋白血症的因素进行分类和记录,以其行肺癌术后前三
第一部分 CT影像组学在肾透明细胞癌鉴别诊断中的应用研究[目的]基于CT影像组学特征构建包括肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)、肾乏脂肪型血管平滑肌脂肪瘤(Angiomyolipoma without visible fat,AML.wovf)、肾乳头状细胞癌(papillary renal cell carcinoma,pRCC)、和肾嫌色