论文部分内容阅读
作为中国古代科学中的突出成就,中医药在现代的发展面临着基础薄弱、传承不足和创新不够等劣势。当前机器学习和人工智能等技术是发展中医药学的有利工具:以中医处方为基础开发智能中医辅助诊疗系统,有利于更加高效地挖掘中医临床经验,传承中医精髓;进一步将古老的中医药学与现代医学相结合,开展中医药作用机制等研究,有助于从多视角研究中医理论,加快中医药现代化发展。中医临床诊疗遵循“辩证论治”的基本原则:辩证时医生通过综合分析“望闻问切”得到的病人症状,辨清疾病的病因,诊断为某种证候;论治则根据证候选择相应的治疗方法来组方开药。因此辅助中医师根据症状来归纳证候,进一步根据证候给出用药推荐,是智能中医诊疗系统的两个关键任务。但实践过程中,由于辩证本身的模糊性和复杂性,导致大多数真实的处方中缺少证候的标注数据。基于此,现有的药方推荐方法以一组症状为输入,输出一组中药作为药方来供中医师参考。证候作为联系症状和中药的隐变量来捕捉两者在处方中的共现信息。此类模型未充分刻画中医药实体间的多元异构关系,且在建模“辩证”时忽略了多个症状共现时的集合信息。综上所述,药方推荐任务面临着以下挑战:(1)中医处方的数据稀疏性。每个中医处方通常只包含若干症状和对应的十几味中药,稀疏的实体共现信息限制了模型的泛化能力。(2)辩证论治的复杂性和模糊性。传统中医理论从宏观视角看待人体,具有高度抽象性和概括性,导致没有统一的辩证体系,且医案中也缺乏证候诊断的标准答案。(3)中医实体关系的异质性。中医药领域包含症状、证候、治法、中药等多元实体及它们之间的丰富异质关系,增加了处方分析的难度。近年来,图表示学习发展为机器学习领域中的一类热门研究课题。图表示学习的核心思想是将图中的节点、边或全图映射到一个低维特征空间,同时保持原有的图结构信息不变。应用图表示学习挖掘电子商务等推荐系统中的图数据提升了推荐准确性和用户体验的满意度。受此启发,针对上述三个挑战,本文将中医处方转化为异质图数据,以图神经网络为技术框架,融合中西医知识图谱来刻画中医药与西医药多元实体间的复杂异构关系,学习中西医多视角下症状和中药的表示;进一步综合多个症状的表示来归纳证候,根据证候表示生成合适的药方。本研究从中西医多角度为中医临床用药规律的发现和总结,及中医药的研究创新提供了有力支持。本文的研究内容和技术贡献总结如下:1.基于多图卷积网络的证候感知的药方推荐。本文提出了一种证候感知的多图卷积网络模型。首先根据处方构建了症状-中药图、症状-症状图和中药-中药图,利用图卷积网络在上述三个图上学习到症状和中药的全面表示。考虑到症状-中药图的异质性,本文设计了二分图卷积网络来区分症状和中药两种不同的类型空间。随后给定一组症状,融合该症状集合中所有症状的表示归纳出隐式的证候表示,将证候表示匹配到的中药组成推荐药方。真实中医处方数据上的实验结果表明了图神经网络在建模中医实体间高阶语义关联上的优越性,以及根据整体论建模复杂辩证论治过程的必要性。2.基于图注意力网络的知识增强的药方推荐。进一步考虑到“论治”这一阶段中,中医的遣药组方遵循“七情配伍”原则,不同药物用于缓解不同的症状,共同配合来发挥疗效。因此一个药方中每味中药对应的证候表示应该有所不同,以体现症状和中药之间多样化的对应关系。基于这一发现,本文提出了一种知识增强的图注意力网络模型。在表示学习阶段,本文利用图注意力网络来区分症状-中药之间、症状-症状之间、中药-中药之间关联关系的强弱,并融入从中医知识图谱提取的实体表示以学习得到同时包含拓扑结构和节点特征信息的表示。在预测阶段,利用注意力机制为每味中药学习到各自对应的证候表示,再筛选合适的中药用于推荐。本研究细粒度建模了辩证论治的流程,帮助挖掘处方中的复杂规律。实验结果验证了融合知识图谱特征和注意力机制有助于提升药方推荐的准确性。3.基于图注意力网络的元路径引导的药方推荐。仅从中医药学理论体系出发推荐中药,不利于中医药的创新突破和现代化发展。因此本文构建了中西医结合知识图谱,提出了元路径引导的图注意力网络模型,搭建了中西医多视角下的药方推荐系统。首先本文根据中医药和现代医学在分子生物学水平上的共通之处构建了中西医结合知识图谱。随后,在此基础上设计了多条涵盖中医理论和现代药理学理论的元路径来引导图注意力网络的传播,学习多视角下症状和中药的表示。最后采用与前两个工作类似的证候归纳方法生成推荐药方。本研究运用多学科交叉的思想将中医药理论与现代医学体系相结合,有利于深入探索中医药的潜在作用机制。实验结果说明了融合中西医多视角有利于提升药方推荐的准确性,且模型具有一定的可解释性。