基于Web的本体学习研究

来源 :武汉理工大学 | 被引量 : 35次 | 上传用户:yutianfeipao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体能够支持人机之间、机器之间的信息交换、知识共享与重用,而得到越来越广泛的重视、研究和应用。然而,领域本体的匮乏却是困扰本体理论研究与现实应用的最主要瓶颈之一,本体学习应运而生,它能够以自动或半自动化的机器学习方式从多种不同的数据源中获取本体。相比国外较多本体学习研究而言,中文环境下本体学习刚刚拉开序幕。本文通过对基于Web的本体学习的研究,为具有实用价值的中文本体学习系统的研发提供理论方法基础。论文在借鉴国外现有的本体学习理论、方法和技术的基础上,结合中文自然语言处理的研究成果,对中文环境下领域本体的概念获取、继承关系学习、属性关系学习和本体实例获取的理论方法展开研究。论文主要研究内容如下:(1)通用本体学习系统的体系结构。设计了一种通用本体学习系统体系结构,由建立在资源层基础上的五大功能模块构成,分别为:资源管理模块、通用资源读写模块、数据预处理模块、本体抽取模块和本体评价与编辑模块。本文所提出的基于Web的本体学习的方法可组件式地无缝集成到该体系结构中。(2)多策略领域概念获取。提出了一种融合信息抽取、中文自然语言处理、语言学和统计等多种策略的领域概念获取算法。能根据页面块特征判定结果自适应选择信息抽取或基于隐马模型和候选名词短语约简的术语获取方法,研究了基于搜索引擎的术语间同义词关系识别方法以及领域概念的过滤算法。(3)继承关系学习。提出了基于Web分类目录判定的继承关系学习方法和基于语境自学习的继承关系学习方法。前者主要包括网页中Web分类目录判定算法、分类目录标注规则、隐式分类目录模式发现机制、标注文档合并中的歧义消解算法以及继承关系映像规则。后者主要包括继承关系语境的自学习机制和基于语境的继承关系获取算法。两种方法各有优缺点,具有互补性。(4)基于知网的属性关系学习。属性关系具有重要作用,但研究很少。首先采用基于语境自学的方法获取候选属性集合;分析认为候选属性集合由非属性词汇、无效属性和有效属性构成,提出了利用知网中属性义原所描述的上下位关系实现非属性词汇过滤和利用属性一一宿主关系实现无效属性过滤的算法;研究基于领域概念树的实现属性关系映射与修剪的基本规则,设计了相应的算法。(5)本体实例的获取。分析了Web网页中个体知识表示的主要形式,提出了基于本体的网页主题概念和个体知识表示特征的判定算法,重点设计了Web表格中本体实例获取的规则,包括本体实例表格识别规则、属性单元识别规则、属性值单元识别的基本规则和扩展规则、实例名称识别规则,给出了算法总体描述。
其他文献
随着Internet的迅速发展,网络安全问题日益严重,安全威胁事件逐年上升,近年来的增长态势变得尤为迅猛。其中,网络蠕虫由于危害严重、攻击范围大、爆发速度快,己经成为目前互
神经变性病是中老年人常见疾病,其病因至今不明,且尚无药物可治愈。近年来,肠道菌群与健康和疾病的关系逐渐成为热点话题。研究表明,肠道菌群失调与免疫系统疾病、代谢性疾病
介绍了管流矿化的概念及其实施条件,对基于原矿管流矿化和中矿管流矿化方式的几类柱式浮选设备进行了分析,讨论了管流矿化方式在诸如实现高效紊流矿化和优化设备结构形式方面
基于LQR控制器的汽车悬架能很大程度上改善悬架性能,但是控制器加权系数矩阵Q与R没有确定的解析方法,由先验知识决定,难以得到全局最优的LQR控制器。因此,利用差分进化算法设
随着网络应用的扩展,网络安全受到的威胁日益严重,尤其是恶意代码的泛滥对网络和应用造成了很大的破坏。在恶意代码中,蠕虫由于无需人的干预,能够自动传播,因此造成的危害最
本文在分析力量素质在竞技体育中作用的基础上,着重讨论了举重运动员力量训练的方法.
临床资料病人,女性,49岁。因间断性咳嗽、气短20 d入院。既往3年前因摔伤至右侧胫腓骨骨折行手术内固定治疗。20 d前出现阵发性咳嗽,咳少量白色粘痰,气短逐渐加重,活动时明显
随着改革开放的不断深入,铁路工程建设成为建设高效运输网络中的一个重要部分。铁路工程项目具有涉及利益相关者多、时间跨越大、施工技术复杂等特点,在工程项目全寿命周期内
根据1996~2001年6~11月西北太平洋海城柔鱼生产统计及其表温数据,利用GAM模型分析了表温、月份、经玮度等因子对柔鱼资源状况的影响。分析结果认为,经纬度、月份和表温对CPUE都
基于人类在电子信息技术领域研究的不断深入,以半导体技术为代表的一大批信息电子信息技术在人们工作、生活和学习中得到了广泛的应用。本文以LED半导体照明、太阳能电池、平