从文本中构建领域本体技术综述

来源 :计算机学报 | 被引量 : 0次 | 上传用户:bigwbiso
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体是一种重要的知识库,其包含的丰富的语义信息可以为问答系统、信息检索、语义Web、信息抽取等领域的研究及相关应用提供重要的支持。因而,如何快速有效地构建本体具有非常重要的研究价值。研究者们分别从不同角度提出了大量有效地进行本体构建的方法。一般来讲,这些本体构建方法可以分为手工构建的方法和采用自动、半自动技术构建的方法。手工本体的方法往往需要本体专家参与到构建的整个过程。存在着构建成本高、效率低下、主观性强、移植不便等缺点,因而,此类方法正逐步被大量基于自动、半自动技术的本体构建方法所代替。自动、半自动构建的方法不需要(或仅需少量)人工参与,可以很方便地使用其它研究领域(如机器学习、自然语言处理等)的最新研究成果,也可以方便地使用不同数据源进行本体构建。其中,文本数据源具有数据量大、获取方便的优点。因而,越来越多的研究者开始关注如何有效地使用文本资源进行本体构建。本文全面分析了以文本为数据源,采用自动、半自动技术进行本体构建的国内外最新研究成果。本文首先介绍了当前一些具有代表性的关于以文本为数据源进行本体构建的技术综述文章。在这一部分内容中,本文重点关注了各个综述文章针对本体构建技术研究所得出的结论。接着,本文从“全局”与“局部”两个角度对本体构建方法进行了详细的介绍。在“全局”角度介绍中,本文根据本体构建过程中用到的主导技术,将本体构建方法分为统计主导的方法和语言分析主导的方法两类,分别对各类方法进行了详细的介绍并分析了各类方法的优缺点。在“局部”角度介绍中,本文把本体构建过程分为以下子任务:术语抽取、概念抽取、关系(包括层次关系和非层次关系)抽取、本体形成。分别从每个任务所使用的技术,从“任务—技术”这一角度,介绍了当前以文本为数据源进行本体构建的国内外最新技术研究进展。第三,本文对当前本体构建技术的常用评价方法以及最新关于本体构建技术评价方法的研究成果进行了介绍。第四,本文选取了几种当前在国际上具有广泛影响力的本体构建系统,对其进行本体构建的具体过程以及生成的本体结果进行了介绍。第五,本文对当前本体构建研究过程中所面临的问题和挑战进行了深入的分析。最后,本文结合当前机器学习及自然语言处理研究领域的最新研究成果,讨论了本体构建未来的研究方向。
其他文献
考察了RuO2/Al2O3催化剂制备过程中Ru前体、制备方法、焙烧温度以及Ru负载量等因素对催化剂催化甲醇选择氧化合成甲缩醛性能的影响,并结合X射线衍射(XRD)、X射线光电子能谱(X
NOx是重要的大气污染物之一,燃烧发电厂排出的烟气中含有大量NOx,所以脱硝技术越来越受到人们重视。选择性催化还原(SCR)作为一种极为有效的烟气脱硝方法,其脱硝效果可以达到
当前人类活动引起温室气体排量的逐年增长导致全球变暖,给生态环境和人类自身带来了严重和不可逆转的负面影响。由于排放量巨大,C02被认为是最重要的一种温室气体。对C02的捕
雾霾污染在我国日趋严重,主要集中在京津冀、长三角、珠三角和四川盆地地区。西南酸雨区成都市雾霾污染较严重,贵阳市随着经济的发展,雾霾现象逐渐显现。本文选取酸雨区贵阳
氮氧化物是柴油车尾气中的主要污染物之一,氨气选择性催化还原技术是脱除NOx最有效的方法,其中催化剂的研发是核心技术。铜基分子筛催化剂因表现出优异的脱硝性能而成为目前
重金属污染给公共健康和环境带来很大威胁,尤其是一些工业污水,如电镀、冶金、电池制造废水,通常这些工业废水中含有较高的重金属元素,经过预处理后往往还有较低浓度的重金属
甲状腺结节病因主要为情志内伤、水土失宜及饮食失调,其中与体质因素均有一定相关性。王旭教授认为甲状腺结节临床大多起病于肝,基本病位在肝脾,总病机为肝气郁结,失于疏泄,
目的 研究青年男性一次平板运动对外周血细胞和心功能的影响。方法 筛选健康青年男性21例,采用Bruce方案行平板运动试验,以次级量目标心率(220-年龄)×90%为终点。运动前1 h和结
通过查阅、分析古今文献,结合临证经验,探讨从胃阴虚论治杂症的理论依据,介绍从胃阴虚论治杂症的经验。胃阴亏虚作为临床常见证候,可见于人体多个系统的多种疾病。肺胃同属燥
网络语言是网民在网络沟通交流中所产生的一种语言,随着因特网的普及,网络语言开始从网络中渗透到日常生活用语中。网络新词的不断出现,很多时候可用认知语言学中的转喻来解