一种多本体支持的语义标注模型的研究

来源 :大连海事大学 | 被引量 : 4次 | 上传用户:2km
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网上信息的不断增加,用户很难快速而准确地搜索到所需要的信息,这是因为当前的Web信息无法被机器理解,只能通过用户的阅读来理解。语义网的出现,就是为了解决这样的问题。语义网是在当前网络的基础上增加一层,在该层上利用本体为网络信息添加形式化的描述,并通过标注的形式表现出来,使其成为机器可理解的信息,更利于人机交互。为网络信息添加语义的过程就是语义标注。语义标注是全面实现语义网的基础。目前的语义标注工具大部分是单本体支持的,但通常网页信息会涉及到多个本体。因此,本文提出一种多本体支持的语义标注模型。该模型包括四个模块,分别是本体集成模块、信息抽取模块、信息标注模块和信息检索模块。本体集成模块首先对关联的多个本体进行集成,然后对集成后的本体进行解析,根据本体知识生成JAPE规则;信息抽取模块是在JAPE规则的指导下,借助基于本体的信息抽取技术抽取出概念、实例和关系;信息标注模块中采用文档综合相关度算法,通过计算文档相关度,整合标注信息并将其存入标注库。在本模型中,采用标注信息与网页分离的存储策略,旨在加强信息标注与网页的独立性,便于标注信息的更新和维护。用户通过调用信息检索模块进行信息查询,从标注库中可以检索出用户需要的信息。针对该模型,本文设计实现了一个原型系统MASAS(Multi-ontologies Aided Semantic Annotation System),该系统通过Web Service的方式提供给用户。最后利用OAEI2008测试集对系统进行了实现验证,实验结果表明本文提出的模型和算法是可行的,语义标注可达到较高的准确率。
其他文献
自一里水电站为涪江左岸支流小溪河梯级电站第二级,于2002年5月开工建设,2004年9月投产发电,装机容量130MW,设计水头477m,引水隧洞长9.5km,引用流量34m^3/s,为地下厂房,气垫式调压室。
大家都知道,开车时如果打瞌睡,会引发车祸,那么坐车的人是不是就可以放心打瞌睡呢?很多人认为,坐车打瞌睡无妨,既可以赶路,又可以“补觉”,可谓一举两得。每天清晨,在私家汽车、出租车
为了解决传统数字城市三维建模中存在的空间数据通用性差、缺乏语义和拓扑关系分析机制等问题,为最大限度地减少三维空间数据资源浪费,提出一种基于CityGML的虚拟三维数字城
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
会议
O2O(online to offline)这个概念最早来源于美国,O2O的发展将线下的商务机会与互联网结合,让互联网成为线下交易的平台,涉及到线上,又可涉及到线下,提供在线支付“预约消费”
从B层学生初中科学的课堂教学出发,对课堂教学建模形式进行探索研究,促进立足科学素养的科学、文化、道德等方面的素养内容进一步得到落实,提高不同层次学生的学习效率。
近年来,扬州市邗江区按照"区域经济特色化,特色经济产业化,产业发展规模化"的总体思路,以科学发展观为指导,从加快区域特色经济发展的实际出发,通过政策配套、资源整合、产业
朱子在《大学章句》中,将"止于至善"之"至善"界定为"事理当然之极",强调"事"的重要性和人"做事"的当然性,从而在本体层面为世间万事提供了形而上的根据和理由,反映了朱子肯定政治社会和