基于文本语义分块的中医病情分类问题研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:evaxiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中医智能医疗研究对于解决我国中医传承难、中医资源匮乏、中医“看病难”等一系列问题,具有十分重要的意义。其中,智能辩证是中医智能医疗中最基本而又最关键的一步。本文通过将智能辩证问题抽象为一个病情文本分类问题,首先提出基于分块向量的病情文本相似性计算方法,将病情文本按照所描述的病位划分为块,并赋予各个病位块不同的权重来区分主次症状,通过计算块向量的余弦夹角找出两段病情文本的相似症状。然后,结合自然语言处理和数据挖掘相关技术,给出了中医病情文本分类模型。最后,以中医肾病综合征七种分型患者的病程数据为基础,通过实验将基于文本块向量相似性的病情分类模型与传统的文本分类模型进行对比。实验结果表明,本文提出的基于文本块向量相似的病情分类模型具有更高的准确性。论文主要贡献如下:1)研究传统的文本表示、文本相似性计算方法,并分析各个方法的优缺点,实现基于TF-IDF特征的随机森林病情分类模型和SVM病情分类模型,两种模型F1 值为 75.38%和 75.20%。2)针对中医病情文本,提出了一种基于分块向量的病情文本特征表示方法,更准确的表达了文本语义;以病位词的文档频率为块权值,区分主次症状。3)在基于分块向量的病情文本特征表示方法的基础上,提出了一种基于文本分块向量的相似性计算方法(Similarity Based On Block Vector,SBBV算法),并与现有的文本相似性计算方法做实验对比,证明该方法的准确率明显高于现有方法。4)在基于文本块向量特征的文本相似性计算方法的基础上进一步提出了相应的中医病情文本分类模型,综合F1值达到90.81%。最后,融合病情的非文本特征,提出了多维度的中医病情分类方法,综合F1值较文本分类模型提升近1%。
其他文献
我国的环境监测已经逐步的形成了具有我国特色的环境监测技术与管理,为我国的环保工作贡献出了巨大的力量,但是目前的环境监测工作仍然存在着不少的问题。主要对我国环境监测
研究心理问题,解决心理问题,释放压力,营造健康的生活环境是我们从精神分析理论出发研究《厄舍古屋的倒塌》目的所在,这对当今建设生态社会、和谐社会也有着深刻的警示意义。
当我们刚刚纪念完“五四”运动80周年,仅仅过了3天,以美国为首的北约无视国际公法,用5枚导弹悍然袭击了我驻南使馆,造成人员伤亡和财产损失。“五四”运动,北京青年学生高擎起一面反帝
目的:探讨麻甘颗粒联合阿奇霉素治疗小儿支原体肺炎(MPP)的疗效及机制。方法:选取MPP 102例为研究对象,采用信封法随机分为观察组和对照组各51例,对照组给予阿奇霉素治疗,观
目的 利用高频超声探讨Hb变异的血液透析患者与颈动脉内中膜厚度(CIMT)之间的可能关系。方法 对66例的维持性血液透析(透析时间≥12个月)患者的Hb值进行回顾性分析。 根据KDO
有理系数多项式在有理数域Q上的可约性判别是一个比较复杂的问题.本文从有理系数多项式的次数n出发,利用Eisenstein判别法及其推广形式,例谈了有理系数多项式在Q上的可约性问
小学语文探究式学习具有过程性、探究性、创新性;小学语文探究式学习的教学策略就要做到创设问题情景,激发学生的问题意识和主体意识,发挥学生的主导作用,关键就是提出问题和
戏剧,作为一种独特的文学体裁,自出现之日起就引起了人们的高度喜爱与广泛认可,并在文学史上占据着重要的地位。文本以戏剧课程教学为研究对象,对于新形势下的高中戏剧课程教
从理论上分析了磨料射流用于切割混凝土路面的可行性,引入声发射作为检验切割效果的工具,对声发射技术及其进展作了介绍,进行了实验的设计,希以此拓展高速公路维护的方法.
近年来,企业员工思想多样化、利益多元化等因素给基层党建工作的开展带来很大影响,原有的"就党建抓党建"的工作模式显得有些力不从心。我们胜利建工第三工程处党委牢牢把握基层