基于信息抽取的知识生成系统

被引量 : 0次 | 上传用户:dzxxdzc2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展以及越来越多的网页被发布,海量的信息以电子文档的形式出现在我们面前。为了及时应对信息大爆炸所带来的严重挑战,人们迫切需要借助一些自动化的工具从海量的信息源中去粗取精,去伪存真,迅速找到自己需要的有价值信息。信息抽取技术正是在这种背景下产生出来的。该技术原来的目标是从自然语言文档中找到特定的信息,是自然语言处理领域的一个重要分支。包装器是一种广泛应用的信息抽取技术,利用它人们可以把网页转化为结构化的数据。但是不同网页的结构不尽相同,而且同一网页在更新时网页结构也有可能发生改变。因此,找到一个相对通用的方法来自动或者半自动地产生包装器并对网上信息进行准确抽取是当今信息处理领域中的一个热点问题。由于传统的抽取技术不是基于语义的,提取出来的信息无法被计算机所理解,因而达不到数据处理智能化的目的。语义网是一种能够让计算机理解的新型的Web内容形式,在它的辅助之下,计算机会根据关键名称定义的超链接和逻辑推理规则发现语义数据的含义。在上述背景下,本文对基于本体的信息抽取和知识生成技术进行了深入地探讨和研究,基于模式发现和领域本体,利用后缀数组将包装器学习出来,领域本体自动将抽取出来的原始数据进行映射,并形成知识存贮在RDF文件当中,从而实现了从网页中半结构化的内容中抽取知识。本文同时设计并实现了一个平台独立的基于领域本体的手工标注工具。其主要功能是通过预匹配、本体呈现、实例名推荐等来指导用户对网页进行语义标注,最终生成知识并存放在RDF文件当中。
其他文献
阅读是获取语言知识和信息最直接、最有效的方法之一,同时也是外语学习中最重要的技能之一;阅读是语言的主要输入方式,也是提高英语综合能力的基础,创作性的说写源于有效的阅
高原肺水肿是高原地区常见的危重急症之一,本文就我科收治的29例高原肺水肿患者进行了护理干预,认为有效的健康教育对预防和治疗高原肺水肿起到非常重要的作用。
刑法理论界和实务界对行贿和受贿犯罪从理论到实践均作过大量有益的探讨。但迄今为止,在行贿和受贿罪的量刑方面仍存在不完善、不公平的现象,如行贿罪与受贿罪相比量刑是否过
<正> 直管式乙状结肠镜检查可以发现肛门部位和乙状结肠部位的病变,但对于降结肠、横结肠、升结肠的病变就超出其长度范围,无能为力了。近十年来,发明了纤维结肠镜,长度可达2
目的:探讨急性高原肺水肿(high altitude pulmonary edema,HAPE)的临床观察与护理。方法:分析在玉树抗震救灾期间急诊抢救的21例HAPE患者的临床资料。结果:21例患者经吸氧、
现代成人教育是现代高等教育不可或缺的组成部分,随着成人教育培训过程的不断完善与发展,以及绩效评估研究工作的不断推进,都最大限度的促进了现代成人教育的发展。成人教育
隐喻一般情况下被认为是一种用于修饰话语的普通语言修辞手段,是一种非正常的语言使用。从认知的角度来研究语言是语言研究的一个方面,因为语言能力是人类认知能力的体现,学
民政法制是指围绕民政管理的事项,由民政行政部门负主要责任的法制体系的总称,外延上包括民政立法及根据立法设立的各种具体制度。民政法制涉及的管理事项广泛,其涵盖民政法
美国社区学院从19世纪末20世纪初创建以来,经过100多年的发展,成为美国高等教育领域中最富有活力的一个层次,它对推动美国高等教育的大众化、普及化、民主化进程起到了举足轻
在2005年股权分置改革这一政策面的重大利好消息下,中国的股票市场迎来了崭新的春天,加之国际游资对人民币升值的预期促使国际投机资本涌入中国股票市场,中国股票市场一下成