事件本体构建中几个关键问题的研究

被引量 : 18次 | 上传用户:jyd965243
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体作为“共享概念模型的明确的形式化规范说明”在信息处理、自然语言理解等人工智能应用领域发挥着越来越重要的作用。目前,大部分的本体都被构建成概念与概念之间的关系体系。这样的体系不能明确支持空间和时间的关系分析,存在“网球问题”。事件本体以事件作为知识表示单元,更加符合人类认识世界的规律,而且能表示动态的变化,为克服传统本体的缺陷提供了新的解决思路,事件本体的构建研究具有重要的学术和应用价值。在事件本体中,“事件”这一概念不再仅仅作为一个静态概念或是概念与概念之间的关系来表示,而被视为一个包括动作、对象、环境、时间等信息的知识表示单元。作为一种大粒度的知识表示单元,事件本体中的“事件”不但要描述事件之间的关系、参与事件的人与物之间的关系,同时还要表示这些参与者在事件中所扮演的角色以及事件的动态过程等内容。本文在事件六要素表示模型的基础上,围绕事件本体构建中的关键问题展开深入细致的研究,主要的内容和创新点包括:(1)基于概念代数理论的事件中实体概念的重用以及事件动态过程表示方法:事件中的对象要素与环境要素等均为现有领域本体中已描述的实体概念,本文对认知信息学中的概念代数操作进行扩展,添加时间与信息量标记,通过扩展后的概念代数操作实现从现有本体中重用事件表示所需的实体概念。此外,事件动态过程的描述,即将事件过程中不同时间标记的事件状态描述清楚,而事件状态的表示即为事件断言要素的表示实质。运用扩展后的概念代数操作(继承、部分继承、扩展及替换)来改变不同时间标记处的事件状态。扩展认知信息学中概念代数的应用,提高了事件本体的构建效率。(2)事件框架表达式及其概念运算解析:本文在事件六要素表示模型的基础上,提出了基于Nilsson概念代数框架表达式的事件表示方法,并对事件框架表达式的概念运算进行解析,同时划分了事件本体的上层事件类。这样的事件框架表达式既能表示事件类,又能表示事件实例,同时也可以描述事件动态过程、事件之间分类与非分类关系、事件要素与事件之间的关系、事件要素之间的关系等信息。事件框架表达式具有灵活、适用范围广、表示能力强等特点,非常适合事件知识的表示,它的提出为事件本体的存储与后期推理等应用服务提供了理论支持。(3)基于事件结构的中文语句分析方法与面向事件的中文语料标注方法:本体的构建离不开领域知识语料库的构建,同样事件本体的构建也离不开面向事件本体构建的语料库。本文在分析了现有中文语句分析方法的不足,以及面向事件本体构建的需求后,提出一种基于事件结构的中文语句分析方法及其标注方法。该方法改进了原有CEC(Chinese Event Corpus)语料的标注方法,为事件的自动识别与分类、事件要素和事件关系的自动获取等应用提供语料信息。主要扩展的功能包括:①对非事件成分(介词、连词等)的语义功能进行分类与标注;②最大限度的涵盖了语句中的各类事件;③可以分析与描述嵌套的事件层次结构;④指明语句中各事件所对应的对象、环境、时间等信息。(4)事件自动识别与分类策略:本文采用词典方法,从文本中识别出事件指示词共计8858个,并对识别出的事件指示词进行手工分类,构建事件指示词分类训练语料。在训练语料的支持下,运用一对一支持向量机SVM(SupportVector Machine)多分类方法对事件指示词进行分类。针对事件知识的特点,在SVM机器学习算法构建特征向量时,加入了词汇特征、词法特征、语法特征、语义特征;实验结果表明,随着有效特征的加入,事件指示词分类的效果随之提高,而将多种特征融合在一起时,特别是随着语义特征的加入,事件指示词分类效果最好,其Precision达到81.85%。在事件本体的构建过程中,事件自动识别与分类将显著降低人工处理的工作量。同时事件自动识别与分类也为基于事件本体的事件语义理解等应用打下基础。可以依据事件自动识别结果,查询事件本体中相匹配的事件类,填充自然语言中缺失的事件信息,帮助事件语义理解。
其他文献
<正> 水杉(Metasequia glyptostroboides):杉科落叶乔木,枝叶对生。为我国仅存的珍贵孑遗树种,一类保护植物,产于湖北利川、四川万县,现各地广为引种栽培。 池杉(Taxodium as
物理层安全技术利用无线信道的差异性和短时互易性来保障无线通信的安全,其安全性能很大程度上依赖于假设的理想条件:发送端已知完整准确的信道状态信息(ChannelState Informat
近些年来,大连市长海县政府始终坚持抓好产业结构调整,积极引导鼓励企业和业户进行品种结构调整,提升传统产业发展质量。今年上半年,小长山乡养殖企业从大连地区采购大菱鲆鱼
无线协作中继技术作为第四代移动通信关键技术之一,具有抗干扰能力强、系统通信速率高、通信质量好等优势,在提升无线通信的有效性与可靠性方面性能优越。但无线通信的高度开放
无线多播系统利用信道的广播特性,能同时为多个多播组提供差异化服务,因而具有较高的通信效率,在移动通信网中有着广阔的应用前景。多播物理层安全技术基于通信双方的信道互易性
根据人社部等制定、国务院通过的的《促进就业规划(2011-2015年)》,“十二五”时期我国城镇将新增就业4500万人,转移农业劳动力4000万人,城镇登记失业率控制在5%以内。我国新时
全文共由五章内容和结论组成。第一章为论文的绪论。主要介绍了历史文化名城研究的背景及相关概念,通过对祁县古城的价值、内涵研究,提出选择祁县古城作为研究对象的原因。另
物理层安全是利用无线信道的差异性和互易性,实现信息安全传输的技术手段。传统物理层安全主要研究相对稳定场景下的单一主体最优化策略,当场景改变或者具有多个研究主体时,
目的:对比研究单纯口服药物与中医多途径疗法治疗盆腔炎性疾病后遗症的疗效。方法:通过观察收集的2011年9月至2013年2月,云南中医学院第一附属医院妇科门诊及住院部60例盆腔炎性
随着国际金融市场的不断发展,商业银行面对的市场竞争日益激烈。加上人们对银行提供服务的要求越来越高,商业银行已经很难在传统的经营模式下生存。为了能够在竞争中赢得优势