基于本体和规则的受控自然语言系统模型研究

被引量 : 0次 | 上传用户:felltwo23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从20世纪50年代至今,自然语言处理作为人工智能的一个重要分支有很大发展。但是由于自然语言本身的特性,目前计算语言技术还不能像人一样处理自然语言,从而限制了自然语言在智能系统中的应用。受控自然语言是自然语言的一个子集,以语言学、逻辑学、知识分类理论、心理学和信息学等为理论基础,在一个领域内限制自然语言的词库、语法及意义,减少或者消除语言的歧义性和复杂性的目的,从而提高了自然语言在智能系统中的应用性。语义网是目前被广泛用于知识表示的一种技术,目的是构造一个以本体为核心的语义网络。目前,由W3C组织提出的OWL本体和SWRL规则技术规范已经广泛用于构造各种知识库系统。本文在对受控自然语言、本体及规则的相关理论进行深入研究基础上,提出了基于本体和规则的受控自然语言系统模型,主要工作包括以下几个方面:首先,建立了基于WordNet的受控自然语言本体词库模型CNLNet,采用本体论描述领域概念及概念之间的关系,便于受控自然语言系统进行歧义消解处理。WordNet是一个规模最大并且使用最为广泛的在线英语语义词典。WordNet把同义词集合作为基本元素按照一种系统化结构进行组织,每个同义词集合代表一个词汇概念,语义之间的关系通过概念之间的关系体现,包括同义关系、反义关系、整体与部分和上下位关系等等,形成一个完整的词汇语义网络。本体是从哲学范畴借用的一个概念,是语义网体系结构中的重要内容,具有强大的语义描述能力,采用形式化和结构化的方式从不同的层次对本体及本体之间的关系进行语义描述,便于计算机可以识别并且对其进行解释和处理。其次,提出了基于本体词库的下文无关文法理论的受控自然语言解释器CNLInterpreter。CNLInterpreter有两部分组成:句法剖析器和语法树解释器。句法剖析器以概率词条化上下文无关文法理论为基础,结合CNLNet本体词库,把受控自然语言句子剖析成抽象语法树;语法树解释器把抽象语法树解释成中间表达语言篇章表述结构,篇章表述结构描述了受控自然语言句子的语义信息。实验证明该解释器具有较好的句法剖析和语义解释能力。然后,提出了基于本体和规则的受控自然语言系统的推理机CNLReasoner。CNLReasoner的逻辑基础是语义网OWL本体公理和SWRL规则公理。受控自然语言句子经过语言处理部分生成篇章表述结构,然后通过知识转换工具转换成语义网OWL本体和SWRL规则知识,最后通过Jess规则引擎对知识进行推理。实验证明了该推理机的正确性和有效性。最后,建立了基于本体和规则的受控自然语言的用户接口系统模型。基于逻辑的受控自然语言具有形式逻辑的基础,除了可以用于描述知识外,还可以作为计算机系统的用户接口与用户进行交互。受控自然语言句子通过语言处理部分生成篇章表述结构,通过基于本体和规则的知识库系统识别用户输入的关键语义信息,提交给应用系统执行相关操作,并返回执行结果信息。通过以上工作,本文详细讨论了基于本体和规则的受控自然语言系统模型。本文在本体和规则的理论基础上提出了两种受控自然语言应用模型:一是基于本体和规则的推理系统,结合语义网本体和规则公理进行推理,构建知识库系统;二是基于本体和规则的用户接口系统,通过本体与规则分析受控自然语言的语义信息,提交给应用系统,执行系统动作,完成业务操作。这两个系统模型基本实现了本体、规则和受控自然语言的有机结合,为受控自然语言在相关领域范围内应用提供技术支持框架。实验表明,本文提出的基于本体和规则的受控自然语言系统模型不仅具有重要的理论意义,而且具有实用价值,本文研究结果可以作为受控自然语言相关应用研究的参考和应用基础。
其他文献
《天朝四亩制度》不只是一个土地纲领,而是尽力描绘了创建一个理想国家的蓝图。这个理想国家是以平分所有土地为基础,“两司马”做为一个基本单位,13156家建立一个基层行政区域,将全国
“亚健康状态”(sub-health state,SHS)是指介于健康与疾病之间的一种中间状态,指主观感觉不适而临床未能查出明确病因或诊断为疾病的临床前期阶段。目前研究多围绕中青年亚
腰椎小关节紊乱症是引起急慢性腰痛较常见原因,多见于青壮年。笔者运用腰椎侧旋复位法治疗腰椎小关节紊乱症患者306例,取得满意的效果。现报告如下。
随着偏瘫患者数量的逐年增加,患者运动功能的康复越来越多地引起人们的重视。运动功能的恢复对患者的日常生活能力影响很大,也是康复治疗中难以解决的问题之一,已成为现代康
当前环境资源问题日益突出,其中石化工业废水是加剧环境破坏的一项重要因素。如何充分开发污水处理技术,以达到更高效的处理石化工业废水,成为目前一项重要课题。笔者以辽宁
到2017年底,我国电气化铁路营业里程达到8. 7万公里。电气化铁路是用电大户,而且用电量大。为降低电气化铁路用电成本,此文对采用从发电厂直接供电、铁路企业参股建设电厂进
“得很”由来已久,虽尚未成词,但两者之间的粘合性十分紧密,并出现了附缀化的倾向。作为表示高程度主观评价的黏合式补语,被使用的频率极高,因为“得很”所具有的鲜明的主观
吉安被誉为“文章节义之邦”,是和宋代庐陵几位杰出的历史人物欧阳修、杨邦父、胡铨、周必大、杨万里、文天祥的爱国精神、民族气节、道德文章和高尚人格分不开的,他们被合称为
爆破理论作为一门理论和实践并重的学科,涉及的内容多、范围广,其发展的不同阶段在时间上不容易划分清楚。但是,随着起爆器材、炸药的发明和广泛应用,爆破测量技术的进步以及
经济的迅速发展使得网络购物成为了大势所趋,越来越多的人尤其是年轻人,将网络购物作为主要的消费模式。本文在分析了消费者网购“后悔权”制度的相关内容后,又对当前茶叶消