中医诊疗数据的隐语义分析技术

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:hawk1918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中医学是中国传统文明中的重要组成部分,目前已经被应用于治疗多种复杂疾病,并且取得了较好的效果。在大数据背景下,中医临床中已经积累了大量的医疗数据,对这些数据的建模与分析可以用于临床辅助诊疗,带动中医学的理论与临床的发展。因此,如何结合中医理论对临床诊疗数据建模是一个研究重点。另外,这些数据中蕴含着中医实体之间的复杂的语义关系,如何利用这些数据提升模型的分析能力也是一个难题。因此,本文提出面向中医诊疗数据的隐语义分析技术。具体地,本文通过改进的主题建模方法挖掘中医医案数据中的症状与药物之间的关系,并且为给定症状推荐药物。首先,本文提出了多内容LDA模型,引入中医理论中病机的概念,分析医案文档中症状与药物之间的关系,并且提出了相应的药物推荐方法。然后基于更加丰富的多种形式的中医数据,提出了两种中医实体的向量化表示方法,用于获取包含更加丰富信息的中医实体词向量。进一步地,本文将词向量融入主题模型中,提出了多内容词向量LDA模型,具备更优的分析效果和推荐性能。本文的主要贡献点概括如下:·基于多内容LDA模型的中医诊疗提出了多内容LDA模型MC-LDA,将中医理论中的病机看作主题模型中的隐含主题,用于连接医案数据中的症状与药物单词。模型的输出结果可以用于分析症状和药物之间的对应关系。此外,提出了药物推荐算法用于临床辅助诊疗:根据给定的病人的一系列症状推荐一组药物。·中医实体的向量化表示方法提出了两种中医实体向量化表示方法,并且对结果进行可视化展示与分析。第一种方法基于上下文信息,第二种方法基于中医知识图谱。中医实体的向量化表示基于更加丰富的医学数据,提供了包含更加丰富信息的中医实体词向量,这些词向量后续可以作为多种机器学习模型的输入,提升模型的效果。·基于多内容词向量LDA模型的中医诊疗考虑到中医实体间存在的语义信息,进一步提出了多内容词向量LDA模型MC-eLDA。每篇医案文档包含一组症状词向量和一组对应的药物词向量,模型用高斯分布对这些词向量进行建模。提升了同一主题下的词的语义相关性,进而提升模型挖掘症状与药物之间的关系的效果和药物推荐效果。
其他文献
现代诗歌是一种重要的文学样式,它打破了旧体诗格律形式的束缚,用接近群众的白话语言反映现实生活、表达作者情感。课改后的初中语文现代诗歌教学有了一定的改进,但在教师、
目的:偏头痛是一种较常见的原发性头痛,病因、发病机制至今尚未完全明确。偏头痛反复发生的血管舒缩功能异常将导致脑终末小动脉的血流量异常,脑血管痉挛收缩期有可能急剧减
行政诉讼中止贯穿于行政诉讼各个阶段,在不同国家和地区行政诉讼中有不同的表现,有分散性、暂停性、可恢复性、法定性、多元性和可消除性等特征,它不仅能够保障诉讼活动程序
诸葛亮不仅是三国时期真实存在的历史人物,还是中国古典文学不朽的艺术典型。从历史形象到有血有肉的艺术形象,这其中经历了一千多年的历史沉淀。魏晋南北朝时,陈寿《三国志
目的:研究可见及紫外分光光度法测定中药复方总黄酮含量的方法。方法:可见光分光光度法是以芦丁为参照品,NaNO2-Al(NO3)3-NaOH体系作显色剂,在510 nm波长测定总黄酮含量。紫
语言的意义问题是语言哲学的核心问题,语言哲学家从不同的视角研究意义问题,产生了不同的意义理论,奎因对意义问题也有自己独到的见解。奎因意义理论的思想根源主要有以下几
以生物基聚乳酸二元醇与脂肪族二异氰酸酯为原料,通过两步法制得生物基聚氨酯丙烯酸酯预聚物(PLA-PUA);表征PLA-PUA性能,结果显示其硬度高并且具备一定的疏水性和耐温性。通
本论文旨在为交替传译中的笔记培训教学大纲设计提出建议。作者通过对专家们先前提出的理论的分析总结,提出自己对交替传译中笔记教学的几点建议。交替传译是口译中最传统也
郑樵的《尔雅注》一书成书于南宋,虽然这是一本训诂专书,但是书中有不少音注,通过对这些音注进行研究,可以使我们进一步了解有宋一代的语音事实,同时也是对诸家得出的关于宋