中医医案数据挖掘技术研究

被引量 : 0次 | 上传用户:yaohaoyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
名老中医的医案是智慧的结晶,使用数据挖掘技术可以帮助我们从专家的医案中挖掘出大量隐藏的临证经验与用药规律。然而中医医案是以自由文本的形式存在的,必须先使用文本挖掘技术从自由文本中抽取出信息,构建结构化的医案,才能更好地使用数据挖掘技术来获取知识。本文首先研究了文本挖掘技术中的文本分类和信息抽取这两个技术,并将这些技术应用于名老中医医案结构化研究中。对于上述结构化医案,采用数据挖掘方法挖掘出其中的一些临证经验。本文研究内容如下:1.研究了基于字特征的中文文本分类技术。采用了信息增益(IG)技术进行特征选择,用余弦相似度来度量文档间的相似性,采用KNN分类器,在基于复旦大学新闻语料库的实验中,文本分类的正确率达到86.92%,宏平均分类性能达到接近87%的水平。实验结果表明字特征是中文文本分类特征建模中的一种有效方法。2.研究了中文文本信息抽取技术。针对名老中医医案,采用了Meta-Bootstrapping算法来提取术语,并设计了术语抽取中所需的模式结构。该方法无需任何浅层自然语言处理和语料标注,仅需提供少量的种子词,经过一定的迭代次数,就可以完成术语抽取任务。在对某名医206份医案的术语抽取实验中,方剂名,辨证信息和治则的术语抽取实验F1-测度值分别为64.29%,56.21%和76.64%。在抽取术语的基础上,完成了医案结构化的实验。3.基于文本分类和信息抽取处理后的病案,本文就名老中医临证经验挖掘系统中的数据预处理模块进行了深入研究,为后续数据挖掘工作的进行提供了清洁的,结构化的源数据。4.基于预处理后的症状信息,完成了慢性胃炎辨证过程的建模研究。采用基于因子分析的方法对现有的隐结构模型进行改进,改进了模型的准确性和训练速度。5.基于预处理后的处方信息,完成了药物量效关系研究。设计并实现了基于加权欧式距离的层次聚类算法。以某名医哮喘医案数据为例,挖掘了药物使用的规律并得到合理的解释。
其他文献
高等职业教育是我国高等教育的重要组成部分,大力发展高等职业教育,是进一步加快我国经济结构调整步伐,积极完善高等教育体系的战略性举措,对于培养大批技术应用型的高技能人
随着宽带互联网热潮正在世界范围内的兴起,C2C电子商务模式便以其信息交流迅速、商品品种丰富、交易成本低等特点,迅速带动了整个网购市场的扩张和大众消费观念的转变。C2C电
<正> 全国有二十一个省、市、自治区已相继征收排污费,为排污收费的理论研究提供了条件。我想从价值规律角度对排污费的性质等有关问题作一些探讨。一、排污费的定义由于征收
<正>"2014年中国土地科学论坛"将于2014年8月19-21日在呼和浩特举行。本次论坛由全国高校土地资源管理院长(系主任)联席会、《中国土地科学》编辑部和内蒙古师范大学共同主办
<正>语文教学不能忘"本"十分重要,这个"本"包含四个方面:一人本,二文本,三本色,四本义。我们必须切实了解,语文教学对象是人,教学的内容是文。围绕"文"展开的教学活动就必须
近年来,利用磁场-趋磁细菌工艺处理重金属废水是国内外一个新型的研究领域,它具有速度快、选择性高等优点,而且不造成二次污染,以该复合工艺处理重金属废水,这方面的研究鲜有
本文是关于单簧管指键构造的演变及其自身构造改变带来的音乐表现逐渐丰富的研究。在管乐器中,单簧管作为一种独具魅力的乐器,是深受广大音乐爱好者和音乐专业人员喜爱的乐器
20世纪90年代以来,经济全球化的趋势日益明显。经济全球化对世界经济产生了许多积极的影响,发展中国家在经济全球化进程中也受益良多。经济全球化不仅给发展中国家带来了先进
在全空气系统中,由于受建筑条件的影响,各支管之间阻力肯定不均衡,一般采用三通调节阀或对开多叶调节阀来完成风量分配。但为保证重要房间或主要支管上的风量不致于过大或过
近年来我国着力推行行政问责,取得了积极进展,但是在问责主体、追责范围、问责的公正性以及被问责官员的重新任用等方面还存在着突出问题。为了提升行政问责的制度化水平、强