基于WordNet的本体构建及其在安全领域应用关键技术研究

被引量 : 0次 | 上传用户:robertrobertrobert
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的知识化和智能化发展趋势,使得信息和数据的表示不只是停留在语法层面,更要聚焦到语义及语用层面。本体作为一种能在语义层面上描述信息和数据的概念模型,为解决该类问题提供了一种良好途径。然而,现有本体构建方法基本上是人工处理,该类方法尽管本体概念和概念间关系比较准确,但其构建效率不能满足当今信息技术发展的速度要求。因此,自动本体构建方法成了迫切需求,目前的自动本体构建方法尽管在构建效率上取得了一定的提高,但是所构建本体中的概念及其关系由于所采用技术性能差等原因导致准确度较差。针对以上不足,本文充分利用现有资源,提出一种基于WordNet的本体构建方法,该方法基于所给初始本体,自动从WordNet抽取出相关领域的本体。该方法因为采用了自动化技术,所以在构建效率上有了较大的提高:由于所构建本体中的概念和概念间关系来自WordNet,而WordNet中的概念及关系是由专家选择和建立,因此所构建本体中的概念及关系比较准确。该方法使得本体构建效率及所构建本体内容的准确度都有所提高。更进一步,从应用需求来看,互联网的开放性使得信息内容安全问题日益严重,快速构建出与信息内容安全信息相关的安全领域本体是解决内容安全问题的有效途径,也是对本文的基于WordNet的本体构建方法的进一步的需求:再加上信息内容安全相关信息具有涉及面广、领域跨度大、更新速度快等特点,这也为本文的本体构建方法提出了更大的挑战,增加了一定的难度。本文成功将本体构建方法应用到了安全领域,构建了与信息内容安全信息相关的安全领域本体,并且针对该领域信息更新快等特点,对安全领域本体进化中的关键技术进行了研究,提出了基于Markov的概念自动抽取算法及基于MI矩阵的分类关系学习方法,本文还将生成的安全领域本体应用到Web信息服务系统当中,目的是从互联网中准确检索并抽取用户所需的信息内容安全相关的信息,放入到本地数据库,供用户分析和决策。本文对基于WordNet的本体构建方法中的关键技术进行了研究,同时对将该方法应用到安全领域生成与信息内容安全相关的安全领域本体以及该本体的进化和应用中的关键技术进行了探讨,具体各项研究内容如下:1.提出了基于WordNet的本体的构建方法,该方法的提出是针对现有构建方法中的不足,尤其是人工构建方法的构建效率低及自动本体构建生成的本体中内容准确度差等缺点。本文具体阐述了构建方案:以现有资源WordNet为基础,基于初始本体,采用抽取算法从WordNet中抽取出本体。2.为了提高本体构建方法中所采用的语义相似度算法的性能,本文的从最基本的语义相似度参数入手,构建了的信息内容IC参数DN模型。该模型的求值只与WordNet自身结构相关,不需要其它资源的参与。DN模型不只是考虑了概念在WordNet中is_a关系分类树中的子节点数,还考虑了概念所处分类树中的深度,使得概念的IC参数值更为精确,实验数据表明DN模型与其它参数模型相比具有一定的优越性。3.基于语义相似度参数,本文对语义相似度算法进行了研究。在对已有相似度算法研究的基础上,给出了语义相似度算法的改进模型,该模型以IC参数为基础,同时将概念对间的路径考虑在内,使概念间语义相似度值的准确性有所提高,在与其它语义相似度算法比较后,显示该算法模型具有更好的性能。4.语义相似度算法是从WordNet中抽取本体概念和关系的基础,本文抽取算法基于所给出的语义相似度算法的改进模型,分别求出初始本体中的概念与WordNet中的概念的语义相似度值,按照所给定阈值,抽取出本体概念及关系。然后,根据本文制定的is_a关系添加规则,对初始本体进行概念和is_a关系扩展,最终生成本体。5.安全领域本体的构建是对本文基于WordNet的本体构建方法的进一步的需求,本文成功地将基于WordNet的本体构建方法应用到安全领域,并生成了与信息内容安全相关的安全领域本体。6.信息的发展使得信息内容安全相关的新概念和新关系不断产生,因此,生成的安全领域本体需要不断丰富和完善。本文针对安全领域本体进化中的关键技术进行了研究,提出了基于Markov的概念抽取算法和基于MI矩阵的分类关系学习方法。7.最后,本文将生成的安全领域本体应用到WEB信息服务系统,对互联网中的信息内容安全相关信息进行检索和抽取,并将数据存储到本地数据库供用户分析和研究。本文提出了基于WordNet的本体的构建方法并成功应用到了安全领域当中,该方法同样也适用于其它领域。对于其中的关键技术,如语义相似度算法以及基于Markov的概念抽取算法等都进行了性能测试与比较,显示出较好的性能,这些关键技术也可以应用到其它如自然语言理解、网页分类等其它应用当中。因此,本文的研究成果具有较大的实用价值。
其他文献
从产权关系、财务关系、关联交易、会计关系等四个方面入手 ,剖析了国有铁路与合资铁路经济关系中存在的主要问题 ,提出了一系列政策建议和看法。
山东枣庄市红山峪村一户周姓人家至今仍保存着16张地契, 当地人将地契俗称为“地约”。16张地约均为周家与卖方的买地契约,其中9张产生在民国年间,另外在1950年和1960年各3张
目的探讨人文关怀护理在胃癌围手术期患者中应用的临床效果及价值。方法针对本院2013年4月~2017年4月收治的100例胃癌患者为研究对象,在患者围手术期间给予人文关怀的护理措
<正> 解不等式 ax~2+bx+c+sum from i=2 to n-1(d_i)|a_ix~2+b_ix+c_i|>0。(或<0)其中a、b、c、a_i、b_i、c_i、d_i、i=2,3,…,n-1均为常数。简捷的解法是:先令 y=ax~2+bx+c+
考虑制造过程高排放的两级供应链系统,基于Stackelberg博弈和收益共享契约,建立碳税政策下生产商投资碳减排技术前后供应链的收益模型,探讨碳税及碳减排率对供应链最优决策及收
脑梗死是造成神经功能缺损的常见疾病,积极有效的促进脑梗死缺血恢复期神经功能的恢复,依然是目前脑梗死研究的重点。神经干细胞的发现打破了成年中枢神经损伤后不能修复的观
深圳平南铁路公司是全国第一家由中外合资建设和经营铁路的运输企业。结合平南铁路在产权改革中的经验和教训 ,分析合资铁路存在的共性问题 ,并阐述了进行产权体制改革的必要
幼儿园活动设计者对教学活动设计的反思能够有效促进教学活动的设计和实施。反思的三维框架包括时机、客体和层次三个维度,其目的是解决反思什么和怎么反思等诸多问题。提高
本文首先论述了距离保护的基本原理和动作特性,基于输电线路单相接地故障分析过渡电阻对单侧电源和双侧电源系统距离保护测量阻抗的影响。介绍了自适应距离保护的基本概念,并
本文基于中国情境阐述了跨境风险资本联合投资、本土伙伴和联合投资网络位置特征与投资绩效的内在关联和作用路径,并对其关系进行实证检验。研究发现:(1)跨境风险资本联合投