基于本体和元数据的语义标注平台模型与系统架构研究

来源 :山东理工大学 | 被引量 : 12次 | 上传用户:wugenkuaizi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的普及和Web技术的蓬勃发展,带来了网络资源量的激增,网络已经成为人们获取信息的主要渠道之一,深深影响到人类社会生活的各个方面。语义网(Semantic Web)是新一代互联网络,它的主要目标是使网页内容成为机器可理解和处理的内容,这样将使机器可以充分利用网页中的语义信息,有效满足用户的知识需求。然而,语义网的实现需要大量包含语义元数据的网页内容,但现有的网页中仍不具备这样的元数据。利用本体为网页增加语义元数据信息是语义标注(Semantic Annotation)研究的主要内容。经过语义标注后的网页能够被机器所理解,这样不仅可以加快搜索速度,而且可以有针对性地为用户推送需求服务。本文首先对语义标注的研究现状和语义网的发展进行了论述,然后将本体和元数据作为语义标注的理论基础来研究。经过大量的文献调研和对基础理论的研究,提出了一种基于本体和元数据的语义标注模型——语义标注瀑布模型(Waterfall Model)和一种系统架构——协作式语义标注系统架构,并对语义标注瀑布模型的实现进行了论述,在模型实现的过程中将本体实例嵌入语义标注平台形成了基于本体的语义标注平台。本体实例选择WordNet本体库,语义标注平台选择GATE标注平台。最后将标注结果进行了存储。本方案的实施为基于本体的语义标注平台研究提供了实例,解决了语义标注平台中不能进行本体词汇扩充的缺点,WordNet的使用对标注过程中产生的同义词、近义词、词间上下位关系和语义消歧等问题起到了重要作用。
其他文献
“专书语法研究是汉语史的基石。”在古汉语虚词中,副词具有数量大、类别复杂、语义半虚半实等特点。长期以来,学界对于副词的研究尚有不足。《左传》是我国最早最详备完整的编
扩频通信是现代通信系统中的一种重要的通信方式,直接序列扩频通信系统是目前应用最广的扩频系统之一。直接序列扩频系统广泛地应用于卫星、测距、通信等众多领域,具有保密性
痛经是妇科常见的疾病之一,由于病因的复杂性,也被视为医学界的共同难题。因对自身生理病理情况的不理解,不少患者会以为痛经是随经期前后必然出现的正常症状,而并未有去寻求
为了鼓励公司的发展,我国现行有关公司资本制度由原来的实缴资本制改为分期缴纳资本制,有限责任公司股东可以选择分期缴纳出资的方式设立公司,只要在缴纳首次最低限额出资后,
目的探究与分析体腔热灌注化疗治疗恶性胸水的疗效。方法选取2014年5月~2015年5月我院收治的恶性胸水患者90例作为研究对象,采取随机数字表法,将其分为对照组与观察组,各45例
我国的老工业城市往往是依托资源的开发而发展起来的,这些城市为国民经济的发展做出了重要的贡献。但从上世纪80年代开始,由于资源的日益枯竭、环境的不断恶化,这些城市相继
网络盗版问题主要集中在商业软件、影视作品和文学作品领域,本文从翻译权入手来研究这三个领域中具有代表性的几个问题,如游戏软件的未授权汉化问题、外国影视作品的字幕翻译问
在反腐深入人心的时代背景下,反腐大剧《人民的名义》引起了全社会的关注。以《人民的名义》剧中女性形象为研究对象,在借鉴了女性主义研究成果的基础上,对剧中女性进行了正
利用ZigBee技术网络自组织以及无线网络通信的特性,本文设计了一个用于探测物体温度的采集系统,该系统的温度采集终端可以在系统网络的有效范围之内采集温度。也可以到网络辐射
为保证信息系统工程项目建设目标的顺利实施,信息系统工程监理工作在全国普遍展开。分析了目前我国信息系统工程监理存在的问题,并提出促进信息工程监理咨询业健康快速发展的