基于条件随机场的句法语义自动标注探索

来源 :山西大学 | 被引量 : 3次 | 上传用户:zhouxiaoqing1003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义角色标注是目前语义分析的一种主要实现方式,它也是近年来自然语言处理领域的一个研究热点,是信息抽取、信息检索、阅读理解、问答系统等多种自然语言处理技术的重要基础。目前,语义角色标注的研究才刚刚起步,对语义角色标注的研究尚少,其研究水平也有待进一步的提高。本文研究的语义是基于山西大学开发的汉语框架语义网。本文主要完成了以下几方面工作:1、汉语框架语义网简介。汉语框架语义网是以Fillmore的框架语义学为理论基础,参照FrameNet,以汉语真实语料为依据而构建。汉语框架语义网中定义的框架元素就是通常所说的语义角色,汉语框架语义网为语义角色标注提供了非常好的语料资源。。2、仿照英语框架元素自动标注的方法进行汉语框架元素自动标注。英语框架元素标注是先进行句法分析,把句法信息作为特征进行框架元素自动标注。因此,本文对汉语句法分析和浅层句法分析进行比较,确定在浅层句法分析基础上进行框架元素自动标注。3、提出汉语框架语义自动标注的方法和步骤。本文提出了一种基于条件随机场模型进行框架语义自动标注方法。该方法以词作为标注的基本单元,在低层条件随机场模型中解决了框架元素识别,将识别结果传递到上层短语类型识别的条件随机场模型,然后再将识别结果传递到上层句法功能识别的条件随机场模型。选用汉语框架语义网中“陈述”、“包含”、“拥有”、“文本”、“艺术制品”框架句子库中的句子作为语料,用上述方法实现了这些框架句子库中句子的自动标注,其框架元素自动标注结果的召回率58%-75.7%,准确率66.1%—83.9%,F值61.8-79.6%。最后,对本课题研究进行了总结分析,指出其中存在的不足。
其他文献
随着信息社会的飞速发展,信息的安全性越来越受到人们的关注。传统的软件加密技术已经越来越不能满足信息安全对运算速度和系统安全性的需求。在信息安全系统中,普遍趋于采用硬
图像分割是一种重要的图像处理技术,在理论研究和实际应用中都得到了人们的广泛重视,是进行图像分析的前提和关键之一。因此,图像分割的研究具有重要的意义。   遗传算法是一
名实体识别是自然语言处理领域的研究热点之一,在信息抽取、自动问答等信息处理任务中都有十分重要的意义。随着现代科技的高速发展,除人名、地名、机构名之外,其它类别的名
近年来,随着空间测绘技术的发展,地形数据在精度和广度上不断深化,出现了覆盖全球的地形数据。如何有效地组织地形数据,对大规模地形进行内外存建模,实现无约束全景漫游,是当
中医是我国的瑰宝,对名老中医经验的总结不仅能丰富中医学的理论体系,还能对中医学的学术进步产生巨大的推动作用。大量宝贵的中医经验数百千年来都是靠手工的文本记录来传承的
连铸生产跟踪系统是钢铁信息系统的一个实例,目标是实现连铸生产线的生产自动化管理。本文以此开发为基础,研究和应用MDA模型驱动架构相关技术,作为系统设计开发的指导思想来实
传统的基于关键词的信息检索不能理解用户的需要,仅仅对关键词进行简单的匹配,其结果往往包含大量与用户实际需要毫不相干的没有价值的信息,同时却丢失用户实际需要的信息,其检索
制造执行系统(Manufacturing Execution System,MES)是位于上层的计划管理系统与底层的工业控制之间的面向车间层的管理信息系统,在企业信息化中发挥着重要作用。随着企业信息
现代软件企业面临着巨大的开发压力。在软件工程中,科学的软件度量可以在预研,开发和评估阶段提供数据支持。因此,软件度量是软件工程的必要环节。而在软件度量中,软件功能规模度
网格计算是近年来新兴的一种技术,它的目标是资源共享和分布协同工作。网格环境下的数据传输有带宽高、容量大等特点,但是目前这方面的研究并不多。人们对于网络带宽的需求日益