基于LDA模型的医疗诊断研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:CBN_cntjlz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中医作为传统生命科学的一个重要组成部分,在疾病诊疗方面具有特色和显著的临床疗效。几千年的中医诊疗实践积累大量的临床数据和医学文献,这些数据包含宝贵的中医理论知识和规律,利用数据挖掘技术探求中医药诊治疾病的规律,形成用数字描述和表达的中医药内容,将有力推动中医药研究的规范化进程。近年来,研究人员应用聚类分析、关联规则和回归分析等方法研究中医理论,并已取得一定的研究进展,但由于中医药信息的特殊性,对挖掘算法的高效性和鲁棒性有较高的要求,仍难以体现中医语义复杂性特点及中医诊疗系统性特点。   本文利用主题模型研究中医临床诊疗规律,不仅认为主题模型能够提取中医临床诊疗数据的语义特征,而且关于主题模型的推理过程与《伤寒论》里所述的“观其脉症,知犯何逆,随证治之”的中医辨证论治过程基本一致,都是从显变量的过程到隐变量的过程再到显变量的过程。实验表明,利用主题模型分析临床诊疗数据能够提取中医诊疗规律,为中医临床研究提供一种新颖的理论方法。   本文主要工作如下:   1)分析并总结了以LDA为代表的主题模型的产生背景、发展过程及LDA模型常用的推理方法。   2)在原来LDA模型基础上,对特征词采用加权机制,从而提高主题间的区分能力和可解释性,同时利用建模后的主题作为特征进行支持向量机分类,提高了分类准确率。   3)利用KL距离、主题间相似度和模型复杂度确定主题数目。   4)分析主题模型和中医辨证论治的关系,在LDA模型和作者.主题模型的基础上,提出症状-中药-治法-诊断(SHTDT)主题模型,用于自动提取这四者之间的主题结构,探索具有临床意义的多个实体间的关系。同时利用实体间的关联度和特征词加权机制,对SHTDT进行改进,提高了主题分类的准确度。  
其他文献
为了克服传统配色的诸多缺陷,提高配色速度和精度,本文将数据相关分析和多项式拟合的思想引入到织物配色过程中。以色彩混合原理及理论为基础,通过分析和处理大量的实验数据,
随着计算机网络技术和信息技术的迅猛发展,人类社会进入了全球信息化的时代,网络信息安全也突显出前所未有的重要性,远程身份认证作为信息安全必不可少的一方面成为了研究的
纸浆浓度是造纸过程中最重要的生产参数之一,对纸张的定量高低起着决定性的影响。通过数据监控系统检测控制纸浆浓度及相关数据,对生产过程的控制、运行的可靠性以及计量等方面
农业生产与人们的日常生活息息相关,随着人们生活水平的提高,引进高端技术的温室产业也越来越受到市场的青睐。无线传感器网络以其低成本、低功耗的特点在农业领域得到广泛的应
两个守卫(two-guard)问题是计算几何中的重要研究课题之一,由于很多实际问题都可以转化为平面内的几何模型进行求解,两个守卫的搜索区域以平面内的简单多边形为模型,在它的边
近年来,无线网络技术和应用发展迅猛,其中无线局域网(WLAN)最令人关注。人们使用无线手持设备通过WLAN的固定基础设施(AP)可随时访问互联网。手持设备普遍使用容量有限的电池
随着社会和科技的进步,门禁系统朝着智能化方向发展,门禁系统是确保人们财产是否安全的首要因素,一直以来门禁系统的安全性都是大家关注和研究的热点。目前各式各样的门禁系
近年来,无线局域网发展迅速并被广泛应用。介质访问控制(MAC)作为局域网的关键技术之一,对局域网的网络性能(如吞吐量与时延性能)起着决定性的作用。无线局域网由于其传输介
Web服务互联互通的特点是Web服务集成和应用的基础,它支持开放、动态的互操作模式,可以大大降低系统集成的开销和复杂性,因此获得了学术界的高度重视和产业界的大力支持。Web
谱减法和改进谱减法是常用的语音增强方法,但无论是谱减法还是改进谱减法在处理过程中都使用的是傅里叶变换。由于傅里叶变换的单一转换方式不能较好的处理随机信号,所以对处