面向智能中医辅助诊疗的多注意力和知识辅助神经网络设计研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:SHIWENBEI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中医在我国医疗体系处于重要地位,几千年来为民族繁荣和人民健康做出了巨大贡献,特别在最近的新冠疫情(COVID-19)中,中医诊疗技术发挥了重要作用。在“人工智能+”的大背景下,智能中医技术的研究能为中医打开智能化发展的新格局。中医知识体系庞大且错综复杂,医师严重依赖大量临床经验。将中医知识库融合多源体征信息,嵌入中医领域知识,再进行全过程高效、客观的健康管理是智能中医研发的必然趋势。
  本文的研究内容着重于智能中医辅助诊疗技术中的问诊和望诊部分,尽管基于神经网络的深度学习技术已经被成功应用到了包括医疗领域的各个领域,但与其他智能医疗应用类似的是,在我们研究智能中医的辅助诊疗中的问诊和望诊任务时,将面临如下智能医疗领域常见的,以及本文任务独有的挑战:1.医疗数据中充满噪声,不管是患者提问等文本数据,还是患者舌像等图像数据,对预测结果产生有效影响的往往是细节特征;2.中医诊疗任务是专业性极强的预测任务,需要丰富的领域背景知识作为指导;3.中医临床门诊数据采集成本高,可用的数据有限,对神经网络模型建模效率的要求比其他任务更高;4.中医门诊以全科医学为主,在实际情况中常常需要面对罕见病例的情况,这就要求智能中医辅助诊疗模型具备少样本甚至零样本学习(又称零次学习)的能力;5.除了上述挑战之外,真实门诊场景下采集的问诊,望诊数据,需要克服自然语言中不确定语境,计算机视觉中多种光照,多种拍摄角度,拍摄质量不均衡等各种可能对最终系统性能的干扰因素,对提出模型的鲁棒性,泛化能力提出了更高的要求。
  面对上述棘手的挑战,在本文涵盖的研究过程中,我们重点从基于注意力与知识辅助两个方面探索了面向智能中医应用的神经网络模型,在做出该研究侧重时我们考量了注意力机制与知识辅助技术的如下益处:1.注意力机制有利于模型更精准地捕捉患者问诊,望诊输入数据中的关键细节特征,并提升模型的建模效率;2.知识辅助可以帮助我们训练更鲁棒的辅助诊疗模型,并有助于增加模型的可解释性。
  基于上述考量,本文进行了如下方面的创新性研究:
  (1)在中文患者在线提问的智能导诊任务中,针对患者提问的文本短,噪声多,关键语素特征领域特定强等问题,提出了“关键语素生长的强注意力序列建模架构”(Morpheme Growth,MG),在短文本中抽取并扩展关键语素,增强关键语素特征在循环神经网络建模中的影响力,以提升模型对于关键导诊特征的捕获能力。
  (2)在舌像-中医处方的关联性挖掘相关研究中,创新地提出了基于舌像的卷积神经网络(Convolutional Neural Network,CNN)自动化中医处方构建模型,为了更好地建模中医专家的诊治疗法,提出了隐式疗法主题辅助任务机制(Auxiliary Latent Therapy Topics,AUX_LDA)以对中医疗法主主题知识进行建模,利用多任务的架构同时学习对于关键药材的检索流程以及中医疗法的隐式构建流程,以达到更逼真的自动化中药处方生成效果。
  (3)为了进一步改善深度卷积神经网络的建模效率,提出了面向卷积神经网络的内成像特征通道注意力结构(Inner-Imaging Network,InI-Net),该结构将卷积神经网络各层的特征图浓缩信号进行重新排列,形成一张伪内成像图,我们用它来组织卷积通道的互补关系,进一步地,提出的模型使用多尺寸的滤波器在伪内成像图上建模卷积通道间的成组关系,增强深度卷积网络内部组件间的多样性,互补性及卷积建模整体的完备性。
  (4)在上一个创新工作的基础上,我们将基于内成像机制的卷积网络用于面向舌像的患者患病部位预测这个中医辅助诊疗的真实任务上,为了建模散布在舌像各个部位的细节病理特征,提出了全通道区域注意力网络(Fully-Channel Regional Attention Network ),它在内成像通道注意力结构的基础上提出了随机局部区域池化技术(Stochastic Regional Pooling,SRP),通过在一张特征图上采样多个局部区域的信号并作为通道注意力机制的输入,帮助模型自动化屏蔽图像边缘的噪音信号,同时强化舌像上细节病理特征的权重。
  (5)在最后阶段,本文探索了模型在面对零次学习的情形下,结构化知识图谱辅助深度神经网络完成学习的机制。首先基于语义属性间的共现关系建立属性关系知识图谱,然后提出基于图建模的视觉-语义纠缠网络(Graph-based Visual-Semantic Entanglement Network,GVSE),利用图神经网络对视觉特征中的隐式属性关系映射进行建模,同时与卷积网络通道实现充分地交互,最终获得语义表达能力优异的零次学习特征,帮助模型从某种程度上克服零次学习中的领域漂移问题。这部分的研究为后续解决智能中医辅助诊疗中的零样本难题打下了很好的基础。
其他文献
固体氧化物燃料电池(SOFC)具备工作温度高、燃料来源广、使用寿命长等优点,被广泛应用在分布式发电系统。但SOFC单独工作时效率较低,严重限制其推广应用。将SOFC与燃气轮机(GT)组合发电不但可以显著提升系统综合效率,还可以降低环境污染,引起分布式发电厂的关注。然而,固体氧化物燃料电池-燃气轮机(SOFC-GT)混合系统是一个规模庞大、控制参数繁多和组件相互耦合的复杂系统,因此需要建立其动态模型
学位
学位
MgB具有临界转变温度高、相干长度大、化学组成和晶格结构简单、原料价格低廉等优点,而且远比陶瓷性氧化物高温超导体容易加工成形。这些优越的特性使其在超导电力、电子器件、国防以及医疗仪器(特别是核磁共振成像磁体)等方面具有广泛的应用前景。本文系统研究了各种不同物理化学性质的物质掺杂对MgB线带材微观结构和超导性能的影响。通过详细的分析和测试手段,探讨了纳米C掺杂提高线带材的临界电流密度的原因。分析了各
学位
本论文的研究目的是在不同的气体组分、气压、电压参数条件下,详细研究基于Pulser/sustainer技术的紫外预电离长脉冲TE CO激光的输出特性,取得了如下成果: 1.改进了谐振腔机械结构。通过不同气压下激光器的运转实验证明,新设计的光桥系统和谐振腔结构装调方便,能够在不同气压条件下保持状态稳定。2.设计了新型的激励电路。在原来激励电路中引入一个串联电感为Pulser/sustainer回路所
学位
纳米材料的制备和性能研究是近几十年来国际上各领域的学者关注的焦点,材料有一个维度在纳米尺度就可以称为纳米材料,本文以一维SnO2纳米结构为代表,着重研究了半导体纳米结构制备、性能研究;二维BaxSr1-xTiO3、BaZrxTi1-xO3纳米薄膜的制备、性能研究以及基于BZT薄膜的移相器研制,开展了多方面创新性的实验工作。取得了如下结果:  1.研究了Vapor-Liquid-Solid(VLS)
学位
该论文主要研究的是静止图像水印.在第一章中介绍了数字水印技术的背景、定义、分类、应用、主要特征和数字水印的攻击行为及数字水印算法的评估等问题.在第二章从原理上给出了一个一般的数字水印框架和数字水印的基本问题,包括水印的产生、嵌入和提取;另外,介绍了数字水印技术的典型算法,对前人的工作进行了回顾和总结.第三章是该文的重点,改进和提出了三种数字水印算法并且分别进行了实验仿真:1、基于混沌、纠错编码、位
学位
电气化铁路近年来已经成为了我国最主要的铁路牵引动力方式,其覆盖范围越来越广,在铁路中的比例也越来越大,而保证接触网设备的正常工作对电气化铁路的安全运行起到至关重要的作用。如今以深度学习为手段的接触网异常检测技术正逐渐成为主流方法,然而深度学习对于数据量的要求很高,因此为了进一步提高基于深度学习的接触网设备检测的准确性及可靠性,找到高效且智能的数据增强技术具有重要的意义。  本文的研究工作以6C系统
学位
本文主要研究基于采样数据的事件驱动系统及其应用。首先基于推广的连续离散分析方法给出了在不同通讯条件下保证事件驱动系统指数稳定的充分条件,而后分别将其应用到一类本质非线性系统的输出反馈控制,一类多输出非线性系统的观测器设计以及多智能体系统分布式优化等问题中。主要工作可以总结如下:  第一章介绍了课题的研究背景。分别说明了事件驱动控制,输出函数未知的非线性系统镇定问题,非线性观测器设计及分布式优化与控
四旋翼飞行器是一种结构简单、体积较小、易于操控、能够垂直起降的无人航空器,它凭借着这些优点被广泛应用于民用和军事领域。四旋翼无人机能够稳定飞行需要依靠它的飞行控制系统,因此对飞控系统的研究具有重要意义。对于这个欠驱动、多变量、强耦合的非线性系统,可能还会受到各种环境因素的影响,提高四旋翼控制系统的稳定性、鲁棒性和抗扰性是很有必要的。本文基于自抗扰控制技术,设计了四旋翼姿态和位置的自抗扰控制器,实现
该文主要研究遗传算法的理论及应用.首先分析遗传操作的可达性和达概率以及交叉和变异概率的上限,然后针对遗传算法的早熟收敛提出新的种群多样性衡量标准、作用因子函数及个体浓度等概念,提出一种新的近亲交叉回避策略,基于上述工作提出几种改进的遗传算法:一种新的优胜劣汰遗传算法、自适应变步长定向变异遗传算法、基于抽象遗传算法模型的自适应遗传算法、自适应小生境递阶遗传算法及改进的压缩映射遗传算法,证明了自适应变
学位