基于深度学习的放大蓝激光成像和放大窄带成像模式下早期胃癌识别模型的诊断效果对比

来源 :中华消化杂志 | 被引量 : 0次 | 上传用户:wx669
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的

研制基于深度卷积神经网络的放大蓝激光成像(ME-BLI)和放大窄带成像(ME-NBI)模式下早期胃癌识别系统,比较2种模式下模型的性能差异,并探讨模型训练方式对准确度的影响。

方法

回顾性收集ME-BLI和ME-NBI下的胃良性病灶和早期胃癌的内镜图像,共收集5个数据集和3个测试集:数据集1包括2 024张非癌和452张早期胃癌ME-BLI图片,数据集2包括2 024张非癌和452张早期胃癌ME-NBI图片,数据集3是数据集1和2的合集(共4 048张非癌、904张早期胃癌ME-BLI和ME-NBI图片),数据集4在数据集2的基础上增加62张非癌和2 305张早期胃癌ME-NBI图片(共2 086张非癌和2 757张早期胃癌ME-NBI图片),数据集5在数据集3的基础上增加62张非癌和2 305张早期胃癌ME-NBI图片(共4 110张非癌、3 209张早期胃癌ME-BLI和ME-NBI图片);测试集A包括422张非癌和197张早期胃癌ME-BLI图片,测试集B包括422张非癌和197张早期胃癌ME-NBI图片,测试集C是测试集A和测试集B的合集(共844张非癌、394张早期胃癌ME-BLI和ME-NBI图片)。根据5个数据集分别构建5个模型,分别评估其在3个测试集中的表现。通过以病灶为单位的视频测试,比较ME-NBI和ME-BLI模式下早期胃癌识别模型在临床环境下的性能差异,并与4名资深内镜医师进行比较。主要终点指标为早期胃癌的诊断准确度、灵敏度和特异度。采用卡方检验进行统计学分析。

结果

模型1在测试集A的表现最佳,准确度、灵敏度、特异度分别为76.90%(476/619)、63.96%(126/197)、82.94%(350/422);模型2在测试集B的表现最佳,准确度、灵敏度和特异度分别为86.75%(537/619)、92.89%(183/197)、83.89%(354/422);模型3在测试集B中的表现最佳,准确度、灵敏度和特异度分别为86.91%(538/619)、84.26%(166/197)、88.15%(372/422);模型4在测试集B的表现最佳,准确度、灵敏度和特异度分别为85.46%(529/619)、95.43%(188/197)、80.81%(341/422);模型5在测试集B的表现最佳,准确度、灵敏度和特异度分别为83.52%(517/619)、96.95%(191/197)、77.25%(326/422)。根据图片识别早期胃癌,模型2~5的准确度均高于模型1,差异均有统计学意义(χ2=147.90、149.67、134.20、115.30,P均<0.01);模型2和3的灵敏度和特异度均高于模型1,模型2的特异度低于模型3,差异均有统计学意义(χ2=131.65、64.15、207.60、262.03、96.73,P均<0.01);模型4和5的灵敏度均高于模型1~3,模型4和5的特异度均低于模型1~3,差异均有统计学意义(χ2=151.16、165.49、71.35、112.47、132.62、153.14,176.93、74.62、14.09、15.47、6.02、5.80,P均<0.05)。以病灶为单位的视频测试结果显示,医师1~4的平均准确度为68.16%;模型1~5的准确度分别为69.47%(66/95)、69.47%(66/95)、70.53%(67/95)、76.84%(73/95)和80.00%(76/95)。模型1~5之间、模型1~5与医师1~4之间的准确度比较差异均无统计学意义(P均>0.05)。

结论

基于深度学习的ME-BLI早期胃癌识别模型具有较好的准确度,但诊断效果略差于ME-NBI模型;ME-NBI联合ME-BLI早期胃癌识别模型的诊断效果优于单独模式下的模型;增加ME-NBI图片数量,尤其是早期胃癌图片,可以提高ME-NBI模型的灵敏度,但特异度有所下降。

其他文献
该文对《肝硬化门静脉血栓管理专家共识》中门静脉血栓的流行病学,对肝硬化预后的影响、危险因素、影像学检查、诊断、病情评估和治疗策略等方面的推荐要点予以解读,以期能让医师更好地理解其内容并合理应用于临床。
目的分析学龄期哮喘儿童家庭管理方式与行为问题、睡眠障碍之间的关系,为学龄期哮喘儿童的疾病控制及家庭管理提供参考。方法运用横断面调查法,分别采用儿童哮喘家庭管理方式测评量表、儿童行为量表(child behavior checklist,CBCL)、儿童睡眠紊乱量表(sleep disturbance scale for children,SDSC)对108例学龄期的哮喘儿童进行调查,采用Pearson相关分析法分析三者之间的关系。结果108例学龄期哮喘儿童家庭管理方式总得分为(241.21±23.52)分
目的探讨心脏骤停患者心肺复苏抢救中的影响因素。方法回顾性收集2015年9月-2018年9月急救中心收治的304例成年心脏骤停患者的临床数据,包括患者基本人口学信息、现场心肺复苏(cardio-pulmonary resuscitaion,CPR)情况[包括是否有目击者、目击者是否实施CPR、胸部按压分数(chest compression fraction,CCF)、到达急救中心时间等],患者24 h的存活率,采用单因素分析和Logistic回归分析研究心脏骤停患者CPR后24 h存活率的影响因素。结果单
报告一例耳鼻喉科手术电刀诱发心律失常患者.在全身麻醉下行面部病损切除术中应用彭氏电刀,患者2次出现室性心动过速.对于年老体弱的患者在手术过程中应密切观察患者的生命体
目的 探讨问题导向教学法(FBL)+病例引导教学法(CBL)教学在口腔住院医师规范化培训中的效果.方法 将2015年1月-2019年12月口腔住院医师规范化培训的30名学员随机分为对照组和
肝硬化门静脉高压将导致严重并发症如食管胃静脉曲张破裂出血、顽固性腹水、门静脉血栓等,严重影响患者生活质量以及生存期。经颈静脉肝内门体分流术(TIPS)能够显著降低门静脉压力,但是该治疗手段对于患者的受益程度、治疗时机以及适应证存在一定争议。该文简述了TIPS手术的历史起源、临床实践中地位演变以及当前世界各地指南共识等方面,着重讨论TIPS处理的时机以及适应证,回顾了目前诸多临床队列研究结论观点,并对早期TIPS(early TIPS)相关的治疗提出了展望。
目的研究缩短禁食禁饮时间对妊娠期糖尿病(gestational diabetes mellitus,GDM)产妇分娩结局的影响。方法纳入笔者所在医院2018年5月-2019年5月收治的行剖宫产术的GDM产妇90例进行研究,将其随机分成干预组和对照组,各45例。对照组实施常规禁食禁饮处理,即术前禁食8 h,禁饮6 h。干预组则适当缩短禁食禁饮时间,即术前禁食6 h,禁饮2 h。比较2组围术期相关指标水平、不良妊娠结局发生情况、产妇术前不适反应发生情况、产妇满意度情况。结果干预组术前血糖水平及满意率显著高于对
目的分析特应性皮炎(AD)患者的舌象图像特征与中医证型的关联性。方法选择2018年3月至2020年10月广西中医药大学第一附属医院皮肤科门诊收治的AD患者130例作为病例组,另选择同期健康体检者40名作为对照组。采集研究对象舌象图像,获得了其红绿蓝(RGB)值和色调-饱和度-强度(HSI)的色调(H)值,并分析这些特征值与中医证型的关联性。结果130例AD患者中脾虚湿盛型49例(37.69%),湿热内蕴型45例(34.62%),血虚风燥型36例(27.69%)。血虚风燥型组、脾虚湿盛型组和湿热内蕴型组的R
目的探讨卒中健康管理师在卒中患者全程管理中的实践效果。方法选取2017年6-12月神经内科住院的56例脑卒中患者为对照组,选取2018年6-12月神经内科住院的56例脑卒中患者为干预组,对照组采用常规护理方法,干预组在对照组的基础上采用卒中健康管理师全流程干预。比较2组患者的服药依从性、功能恢复情况、出院后规律复诊及卒中再发情况。结果2组服药依从性及改良Rankin量表评分在时间效应、组间效应及交互效应上比较,差异均有统计学意义(F时间=3.572,P=0.025;F组间<
目的探讨半导体激光治疗仪在外科腹部手术患者术后伤口治疗中的应用效果。方法选择干部病房外科2017年8月-2019年5月收治的腹部外科手术患者204例,其中腹腔镜手术109例,达芬奇手术42例,开刀手术53例。将同类手术方式的患者按照随机数字表法分为对照组和观察组。对照组术后伤口按普外科常规消毒换药处理,观察组在此基础上联合半导体激光治疗仪照射伤口。分别比较3种手术方式的对照组和观察组患者伤口疼痛情况、伤口愈合情况和术后住院天数。结果3种手术的观察组患者术后4、7 d的伤口疼痛评分均低于对照组(P<0