甲状腺结节可解释AI诊断系统的研究与实现

来源 :东华大学 | 被引量 : 0次 | 上传用户:hanyandai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
甲状腺是人体最大的内分泌腺体,甲状腺结节则是甲状腺内部的肿块,可分为良性和恶性两类。我国的甲状腺结节发病率高居全球前列,属于高发性疾病,患者基数大。超声检查由于其高效且无创的特点成为了筛查诊断甲状腺结节的主要手段。甲状腺超声报告通常描述了甲状腺腺体、局灶性病变和淋巴结的形态及血流特征,这些特征是临床医生进行结节良恶性诊断的主要依据。因此,利用人工智能技术对甲状腺超声特征进行深度学习,建立甲状腺结节AI诊断模型,辅助临床医生进行甲状腺结节良恶性的诊断,有助于缓解医护资源不足的现状。目前,已有不少学者投入到如何将人工智能技术应用于甲状腺结节诊断的研究中,并且已经取得不错的成果。然而,大多数AI诊断模型只处于研究阶段,无法在医院内普及应用,主要原因为:医学诊断的容错性低,且深度学习模型是不可解释的,人们无法信任一个不能提供解释的黑盒模型的判断。因此,同时具备诊断能力和解释能力,是推广使用AI诊断模型的必要条件。针对甲状腺结节高发性及现阶段诊断模型缺乏可解释性的问题,本文研究并实现了甲状腺结节可解释AI诊断系统,该系统主要分为两个模块,分别为基于结构化超声特征的甲状腺结节诊断模型的训练模块和甲状腺结节诊断模型的局部后解释模块。前者训练的模型用于实现超声报告的预测,得到诊断结果;后者用于分析预测模型在实例范围内的行为,得到解释结果。本文的主要研究内容包括如下三个方面:1)阐述了甲状腺结节可解释AI诊断系统的总体框架,分析了系统模块组成及各模块作用。在此基础上说明了甲状腺结节可解释AI诊断系统需要由甲状腺结节诊断模型训练模块和局部后解释模块组成的必要性,并具体描述了每个模块的流程。2)构建了基于结构化超声特征的甲状腺结节诊断模型。首先分析了甲状腺超声文本报告的特点,接着利用甲状腺语义树驱动的结构化扫描方法将文本报告转换为结构化数据。再利用患者在适当时间范围内的病理检查结果提取对应超声报告的标签,完成超声特征数据集准备。在此基础上,训练基于Deep FM的甲状腺结节良恶性预测模型。最后,在实验部分展示了结构化结果以及证明了基于结构化超声特征的甲状腺结节诊断模型的有效性。3)具体阐述了甲状腺结节诊断模型的局部后解释方法,该方法改进了主流模型后解释方法LIME的解释不稳定的弊端,具体从三个点进行改进。一是针对生成扰动数据集时,LIME对每维特征独立采样导致生成样本偏离实际数据分布,提出了构建贝叶斯网络并基于贝叶斯网络进行相关性采样,得到考虑特征之间相关性的生成样本再进一步获取扰动数据集;二是针对数据维度较高时,LIME无法区分扰动样本与待解释实例距离远点和近点的缺陷,提出了先对数据进行基于自编码器降维再计算权重的方式;三是针对局部拟合时,LIME采用的线性模型的拟合效果较差,提出了以回归决策树代替作为局部拟合模型,使其能够在得到清晰特征权重的同时提升局部拟合度。最后通过实验结果的分析,证明了改进后的局部后解释方法具有更高的稳定性,并在系统中对诊断和解释结果进行了展示。综上,本文通过对系统的框架设计和各模块流程、基于结构化超声特征的甲状腺结节诊断模型的构建、甲状腺结节诊断模型的局部后解释方法的阐述,研究并实现了甲状腺结节可解释AI诊断系统。
其他文献
熔体直纺长丝作为一种重要的工业纺织品生产原料,在生产生活中用途十分广泛。为方便熔体直纺长丝的存储和运输,化纤企业通常将其卷绕成化纤丝饼。在卷绕过程中,熔体直纺长丝由于导丝辊拉力不稳定以及挂钩处局部受力不均等因素影响,部分纺丝会发生断裂并出现长丝局部断头现象。企业将熔体直纺长丝局部断头的严重程度作为评判化纤丝饼质量等级的主要指标之一。目前,由于缺乏熔体直纺长丝断头自动化检测方面的相关研究,化纤生产线
近些年来随着算法、算力、数据快速地发展,人工智能的发展遇到了新一轮的机会。在本次浪潮中各行各业都受到了人工智能的影响,尤其互联网企业在本次浪潮中得到了更多的发展契机,其中在线医疗、电商、文娱等相关领域分别从人工智能技术中受惠,且人工智能也催生了一批基于人工智能技术主导的公司。本文以A公司智能客服项目作为风险管理研究对象,结合经典的风险管理理论,对项目开发过程中所面临的内外部风险进行识别、分类以及进
地域文化是城市文化的集中体现。城市的自然状况、历史底蕴与人文环境造就了城市独特的地域文化特色。导视系统作为区域的信息识别设施,除了具有方向指示的功能外,同样承载着地域文化的历史印记。基于地域文化的导视系统,对场所历史及文化的体现有着重要的作用。本研究以石库门地域文化为研究对象,探索地域文化特征应用于导视系统设计的创新方法。首先,明确地域文化的隐性特征和显性特征的提取方法,并对石库门地域文化和老码头
随着在线社交网络的发展,社交平台下的用户群体也日渐壮大。新浪微博平台注册用户接近四亿,活跃用户超过一亿,是目前国内最大的微型博客社交平台。用户可以发布微博来分享信息,其它用户也可以通过评论或转发来对信息做出反馈。庞大的用户群体使得在新浪微博平台上有诸多类似于广告营销的应用。如何将微博下的社交网络特点利用起来,高效地进行广告营销,是一个很有研究价值的问题。构建社交平台上的用户影响力传播模型,利用用户
在线评测(Online Judge,OJ)系统为编程用户提供自主练习的平台,而OJ系统中大量的题目造成编程用户的选题困扰,因此在OJ系统中添加题目推荐模块对于编程用户而言具有重要作用,可以辅助他们进行题目的选择,节省选题时间。本文首先根据学生做题通过率进行题目推荐,通过率高的题目学生容易做对,能增加其做题兴趣,所以算法的目的是给学生推荐通过率高的题目。算法使用深度知识追踪(Deep Knowled
编织物编织成型后,具有良好的力学性能,所以在我国航空航天领域有非常多的应用。同时编织物力学性能受多方面因素影响,其中编织角和跳纱都是影响编织物力学性能的关键。而在实际编织机工作过程中,对于编织物上的编织角、跳纱的检测依然停留在人工检测阶段,容易出现错检、漏检的现象,效率极低。本课题针对立体编织物加在加工生产时对编织物检测的自动化程度不高的问题,设计了一个基于机器视觉的立体编织物实时检测系统。该检测
连城地瓜干是连城县传统的地方特色产品,位居"闽西八大干"之首,已有300多年的历史,早在清代,连城红心地瓜干已成为"贡品",取名为"金薯片"。连城地瓜干色泽鲜亮,香气纯正,口感甘醇、柔软细腻、有韧性。连城县地处福建省西部山区武夷山脉南段,属中亚热带气候区,雨水及光照充足,有效积温长,
期刊
随着信息科学技术的迅猛发展和互联网的普及,各种社交软件和电商平台的数据库存储着上百亿幅图像。在海量图像数据面前,传统的基于文本的图像检索系统存在着人工标注效率低以及受主观影响较大等缺点,已经不能满足人们日常对于图像检索的需求。基于内容的图像检索系统(Content-Based Image Retrieval)是使用图像的可视化特征对图像进行检索。图像检索提取的特征需要能够准确地表述自身所包含的语义
深度神经网络的运算通常都依赖于高性能的显卡,大容量的存储,优良的散热系统等,这些设备的高昂成本严重制约了其进一步发展和推广。同时,性能越优异的网络,其参数量和模型复杂度也越大,而一般的计算设备几乎无法运行。因此,对深度神经网络的压缩与加速成为业界的研究热点,但是对复杂模型进行轻量化设计,通常又会导致模型精度的损失。面对模型的轻量化导致精度下降的问题,本文以深度残差网络Res Net为例,对深度神经
骨龄是一种对骨骼成熟度的解释,通过它可以确定人类的生物学年龄,判断儿童的发育情况。骨龄应用诞生至今已有几十年之久,它不仅在儿科的临床环境中起着重大的作用,其应用已延伸至多个领域。目前,众多专业医师仍采用传统的骨龄评估方式,例如评分法、图谱法等。传统的骨龄评估方式耗时费力,容易受到主观因素的干扰且难以普及。在深度学习兴起之前,为克服人工骨龄评估带来的问题,人们尝试使用传统的图像处理方式来辅助医师进行