一种非结构化数据中医知识抽取与关联的方法

被引量 : 0次 | 上传用户:litho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和Internet的飞速发展,数字图书馆以其便捷性和易访问性,正日益取代传统图书馆作为知识传播中心的地位,成为新兴的数据和知识中心。然而数字图书馆的海量数字化资源大多是非结构化的,其文本信息都很难被各种应用程序识别和直接利用,更不用说蕴含在文本中的知识了。因此,基于文本处理的知识抽取和挖掘技术已经成为数字图书馆领域的一个研究热点,并且出现了许多基于不同原理的技术和方法。本文主要研究了非结构化的中医药书籍文本的知识抽取和关联技术,并以此实现了一个中医药信息服务系统。该系统完成了中医药书籍文本的知识抽取和关联工作,同时利用抽取和整合的信息辅助读者查阅数字图书馆中的中医药文献。知识抽取是利用支持向量机的方法完成的。首先设计中医药知识的概念体;其次为概念体的每个内容设置一个支持向量机;然后根据中医药文本的排版布局特征、用词特征以及内容特征等设置各个支持向量机的特征向量;最后通过组合各单个概念体内容的抽取模式得到整个概念的抽取模式。此方法有效地解决了从非结构化文本中抽取结构化信息的难题。知识关联着重于中医药知识点之间的关系挖掘,利用目录文件中的分类层次结构挖掘中医药知识点之间的直接联系;利用字符串匹配或文本相似度比较挖掘中医药知识点之间的间接联系;利用聚类的方法挖掘方剂间的潜在联系。本文的所提的知识抽取和关联技术,将中医知识从非结构化的文本中抽取出来,以特定的结构存储、组织,并对各知识点进行有效的关联,并在此基础上实现了一个中医药信息服务系统,为读者提供多元化的信息服务。
其他文献
目的:分析血清降钙素原、C-反应蛋白( CRP )在骨折术后感染中的变化规律及意义,探讨其在术后感染诊断中的价值。方法收集2010年1月至2015年2月行骨折手术治疗且并发术后感染的患者
辽宁省自承办第十二届全运会伊始,在省内各地相继兴建大型体育场馆,而众多场馆的赛后运营现状并不乐观。我国大型体育场馆运营难题长期存在并未得到实质性的解决。以国家高度
学习目标1.了解童话故事用想象的手法和夸张的情节反映社会生活的特点。2.了解本文语言描写的精妙,把握人物形象和作品的思想意义。3.联系现实生活,体验反思,培养学生敢说真话的良
随着高校人事制度的改革不断深入,进一步加强和优化师资队伍建设是保证我国高等院校持续健康发展的重要保障。如何设立科学、有效的高校教师绩效考核体系,更大可能性地激发高
刘索拉与残雪在1985年发表的小说创作,是新小说中两个重要但又不同的写作面向:前者突出的是个体对传统的反抗,并向读者传递了一代青年的苦闷、迷惘等情绪;后者强调反抗本身,
随着社会工业化进程和人口老龄化加剧,人们对护理服务需求的范围不断扩展,对护理服务质量的要求也越来越高,但传统的护理教育忽视了学生综合能力和应试能力的培养,加之近年来
大学生思想政治教育是不同于其他教育对象的思想政治教育,显现出一定的特殊性。这主要是由于它的教育对象---大学生的特殊性所决定的。大学生在年龄结构、知识水平和身心发展
互联网的出现弥补了网络领域中思想政治教育方式的空白,网络中技术革新的持续发力为网络思想政治教育的内容与形式注入新鲜的血液,让其生命的活力与持续力得到前所未有的发展
大学生对我们国家的国家命运和国家前途有着巨大的影响,是我们国家未来发展的希望。其中,大学生的政治价值观影响着国家发展的未来。在国际错综文化和复杂的国际背景冲击下,
<正>当今社会,多数人们认为体育源于游戏,电子竞技的发展也如出一辙,是游戏发展的高级阶段。于是乎,2003年11月18日,中国国家体育总局批准电子竞技为我国正式开展的第99个体