领域本体构造中数据源选取及构造方法的研究

被引量 : 6次 | 上传用户:huiz_CSU
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体构造方法的研究有利于本体的广泛应用和推广,尤其对WWW向下一个版本转化具有现实意义。目前,本体构造多侧重在方法过程的研究,如果能够加强对本体数据源内部特征的分析,会进一步减少有效信息丢失、无用数据被采用等问题。本文在详细分析数据源特点的基础上,分别提出文档分解模型,输入输出驱动模型以及两层向量空间模型,并集成神经网络、模糊FCA等多种智能方法,建立本体手工和(半)自动构造方法,并实现一个本体构造工具。主要研究内容和结果如下:(1)本体数据源选取研究。本体数据源选取效果直接影响本体构造的质量,目前本体数据源的研究大多集中在文本数据源的研究。对文本数据源的分析不仅要考虑了术语、概念在文档中的频率及含有术语文档在整个文档中的百分率,而且还要考虑术语在文档中的位置信息、文档标引源的位置特性。本文通过文档分解模型的建立,利用抽象方法,完成对本体数据源的概念性、关系性和预测性等特点的分析。并针对这些特点分别采用改进的VSM方法、基于本体关系距离以及神经网络的方法计算相关权值。同时,本文采用Java+Oracle技术,完成本体数据源选取系统的设计与实现,通过“湿地保护”相关的真实文档验证该方法,得到较好的选取结果。(2)特殊领域本体的手工构造——湿地保护领域本体的构造方法研究。建立“数字化”湿地的目的是实现湿地的知识管理和信息共享,而湿地本体的构造,是达到此目标的基础。本文通过对现有手工构造本体技术分析的基础上,提出构造湿地保护本体的方法——WP-Onto方法,以输入输出驱动模型完成本体数据源的组织,把相关知识进行归类并建立知识集,对概念、关系细化提取,实现本体编码及形式化表示。另外,本文还对湿地保护本体应用进行研究,包括信息共享和知识管理两个部分。(3)利用Web资源完成本体构造方法研究,不仅会缩短本体的构造周期,而且还会扩大本体的应用范围。但基于Web的数据提取、知识获取比较困难,与实际应用相比还有一定的距离。本文分析基于Web本体构造数据源的动态、海量、异质、变化、开放性等特点,本体构造的基础问题——形式化表示方法,总结本体构造的关键技术及技术难点。设计一个基于Web本体构造系统架构,为实现基于Web领域本体构造方法提供一个框架性的思路。(4)本体学习工具实现研究。为构造出一个效率、准确率较高的本体学习工具,本文采用面向对象思想的分析方法,把传统的单层文本向量空间模型改进为两层向量空间模型(Double Vector Space Model,简称D-VSM),该模型不仅具有属性特性,而且还具有很强的关系特性。在此模型的基础上,引入FFCA(Fuzzy Formal Concept Analysis模糊形式概念分析)本体学习技术。该技术充分考虑D-VSM模型中数据分布特点,较好地解决本体学习通用性、本体关系获取等问题。基于上述方法实现一个本体学习工具,为本体的(半)自动构造提供有力的支持。综上,本文给出本体构造几个关键问题的研究:在文档分解模型基础上,建立一个本体数据源选取系统;在输入输出驱动模型的基础上,提出湿地保护领域WP-Onto本体手工构造方法;在两层向量空间模型的基础上,分析Web数据特点,并结合模糊FCA方法,实现一个本体学习工具。以本体数据源选取为基础,在本体手工构造和(半)自动构造两个方面进行有效的研究,取得了较好的结果。
其他文献
本研究以CNKI中国引文数据库(新)收录的1979-2008年间"高等教育专题"论文为研究对象,运用内容分析法,对其中4253篇高被引论文所使用的研究方法进行了分析。研究显示,我国高等
在一个发布会现场,身着黑色礼服的李云迪在演绎完舒曼的《幻想曲》后便匆匆离开。他喝了几口星巴克的黑咖啡、吃了一个不加橄榄、洋葱、酸黄瓜的汉堡后,便端坐在沙发上与《21
在"大众创业,万众创新"的时代浪潮下,创业教育是我国高等教育进一步发展的需求。文章主要分析了大学生创业教育的现状,以提高大学生的创业意识和创业能力为目标,有针对性地提
对南京、苏州、无锡、徐州四地在校大学生的758份有效调查问卷表明:大学生月消费额中等偏低;生活费来源较单一,主要由家庭供给;吃穿住行通讯电脑诸方面呈稳健的消费行为与平
近些年我国的糖尿病的发病率逐渐增高,2011年,中国成人中糖尿病的患病率已上升到11.6%,多种因素促进其发展为糖尿病肾病(DN),微炎症参与其中,而糖尿病肾病患者容易发生营养不
如何对农村新型社区进行有效物业管理,已成巩固与推进我国新农村建设急需解决的新课题。文章探讨了将现代物管制度引入新农村建设中的必要性与可行性,分析了新农村建设中现代
随着全球经济的迅猛发展,国际交流日趋增多,口译人才需求量越来越大。而目前大多数口译教学中着重讲解翻译理论知识、训练口译技能和技巧等,忽视了对口译人才心理素质方面的
本文在企业信息化的背景下,阐述了当今企业档案信息资源建设的现状,并对其建设原则和策略进行浅析。
目的:探讨加味过敏煎治疗慢性肾炎的作用机理。方法:应用Bertani氏方法制作阿霉素肾病大鼠模型,以海昆肾喜胶囊作对照组,观察加味过敏煎治疗组对阿霉素肾病大鼠动物模型的肾
通过问卷调查和访谈,分析乡村旅游社区参与的方式和现状,提出基于社区参与的乡村旅游发展创新模式和参与机制。