基于Web的空间本体构建方法研究

被引量 : 10次 | 上传用户:hanhan188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
尽管过去的十年已有成熟的本体工程工具,手工获取空间本体依然是一个耗时、昂贵、高度技巧化,并且有时很麻烦的任务,很容易导致地理领域知识获取瓶颈。这些问题类似于过去二十年来知识工程师在知识获取方法学或定义知识库工作平台上处理过的问题。事实证明,数据挖掘和机器学习技术的整合对地理领域知识获取是有益的。如何利用知识获取技术来降低空间本体构建的开销的相关技术称为空间本体学习技术。空间本体学习即从现有的知识源获取地理领域知识、以(半)自动方式构建或更新空间本体。空间本体学习技术可以支持从Web上现有的数据中抽取空间本体。作为互联网上最重要的应用之一,Web(万维网)提供了便捷的文档发布与获取机制,并逐步成为各类信息资源的聚集地。由于文本是Web上最丰富的资源,基于Web的本体学习技术的研究主要侧重于从自由文本中获取本体。自由文本依据一定的造句法表达特殊的语义,使得知识工程师可以基于一些背景知识来理解其中的含义。然而,由于缺乏一定的结构,要使机器能够自动地理解纯文本并从中抽取出所需要的知识,则必须利用自然语言处理(NLP)技术对其预处理,然后利用统计、机器学习等手段从中获取知识。基于Web的本体学习方法通常包括术语抽取,语义解释,和创建领域本体。对于基于Web的空间本体学习也包括这三个方面。过去空间本体的构建都是手工的从无到有,根据各自不同应用需求来建立本体,对本体的概念,关系及公理进行形式化的定义,借助各种的本体构建工具来构建本体并进行推理验证,以及对于本体的应用的研究:例如基于本体的空间搜索引擎。而对于从Web上抽取术语以构建空间本体,在其过程中的空间概念学习的语义歧义消除这一基础步骤的系统研究很少。本文试图从自然语言理解的方向着手,研究空间概念学习的语义解释的相关理论与技术;从方法论的角度实现对空间概念语义的深层理解,研究空间本体的构建。论文的创新点包括以下三个:1.论文对自然语言词汇语义与空间信息词汇语义的联系与区别进行了系统的分析与研究,并对WordNet中的空间本体概念进行了细致的分析。2.论文从语义解释的角度对空间信息词汇语义进行歧义消除,引入基于论旨角色标记体系理论,在此基础上采用选择限制、统计词义消歧等技术解决语义歧义问题。3.为了实现从Web页面中自动抽取空间本体,论文提出了一个空间本体学习模型,该模型主要包括Web文档预处理、空间领域术语抽取、空间概念学习、空间关系学习。
其他文献
作者导师张介眉教授为我国名老中医学家,从事中医内科临床与科学研究50余年,擅长中医、中药,以中西医结合方法对消化系统疾病的防治有其独到的见解和经验,自成特色,并在疑难
深静脉血栓(DVT)属于下肢静脉回流障碍性疾病,血栓形成大都发生于制动状态(尤其是骨科大手术),而且由血栓脱落引起的致死性肺栓塞是临床常见的猝死原因之一[1]。近年来,尽管
<正>想象作文就是以想象为主体的一种作文形式。它要求学生以已知的知识和生活为基础,以合理性、科学性为准则,充分展开想象的翅膀,在作文天地里自由飞翔。《语文课程标准》
G蛋白偶联的雌激素受体(Gprotein-coupled estrogen receptor1,GPER)曾被命名为G蛋白偶联受体30(Gprotein-coupled receptor30,GPR30),是近年发现的一种有别于雌激素经典核受
目的:观测理筋推拿法结合扬刺滞针温针灸法治疗第三腰椎横突综合征的临床疗效。方法:搜集门诊第三腰椎横突综合征确诊患者共62例随机分为治疗组和对照组各31例,治疗组采用理
根据课题组之前提出的"干细胞具有先天之精的属性,是先天之精在细胞层次的存在形式,且先天之精包括全能干细胞在内的所有遗传物质",肾精包括先天之精和后天水谷所化之精,在各
燃气是当前人们生活中一种非常重要的燃料能源,加强燃气工程建设,提高燃气输配技术水平是保障人们正常使用燃气的关键。现本文就主要对燃气输配技术的相关问题进行研究分析,
目的:探讨体针与耳穴贴压并用疗法治疗肝火旺盛型经行头痛的作用机制。方法:法:将85例经行头痛患者随机分为两组。治疗组43例,采用体针与耳穴压丸并用的方法治疗;对照组42例,
蛋白质折叠指没有任何固定结构形式的蛋白质多肽链经过复杂作用,转化成活性蛋白质结构的物理学过程。蛋白质折叠的理论研究是理论生物学的基本内容。它对蛋白质工程、蛋白质
金属蚀刻技术历史悠久,是一项既古老又新颖、既普通又尖端的技术。随着新技术的发展,新产品的开发,金属蚀刻技术发挥着越来越重要的作用。本文从金属蚀刻的原理入手,简单介绍