汉语核心框架语义分析技术研究

来源 :山西大学 | 被引量 : 2次 | 上传用户:pinxue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分析作为现阶段自然语言处理研究领域一个重要的研究课题,近年来备受关注。然而由于目前准确、深入的自动语义分析技术发展受到限制,在一定程度上遏制了自然语言处理技术进一步投入到实践应用领域中。本文借助汉语框架网语义知识资源,以Fillmore的框架语义学理论为支撑,从框架语义学角度出发,研究了通过抽取句子的核心框架语义表示结果,获取汉语句子核心语义的技术方法。本文针对汉语核心框架语义分析研究任务,将其分为核心目标词识别、框架排歧和框架元素标注三个子任务,并研究了这三项任务具体实现的关键技术方法,对本文提出的语义分析模型性能进行了验证。本文主要研究内容和研究成果如下:(1)针对核心目标词识别问题,分别结合《同义词词林扩展版》的词条类别编码特征和依存句法特征,结合本文提出的基于互信息的自动特征选择算法,提出了一种规则与统计相结合的核心目标词识别方法。(2)针对框架排歧问题,选取汉语框架网中47个常见的歧义目标词元作为研究对象构建实验数据集,并通过选取最优特征模板,建立最大熵分类器框架排歧模型,为歧义目标词分配合适的框架。并通过设立对比实验,验证了本文方法的有效性。(3)针对框架元素标注问题,将框架元素依存填充项看作是词序列的组合,把框架元素标注任务转化为词序列标注的问题,并结合开窗口策略,设置词层面和依存句法层面特征模板36组,构建了最优框架元素标注模型,通过多角度分析影响框架元素标注模型性能的因素,总结了下一步对框架标注模型的改进方向。本文针对汉语核心框架语义分析研究,在汉语真实语料构建的测试集上对本文核心框架语义分析模型整体性能做了测试,实验结果验证了本文方法的有效性。本文的研究成果为实现汉语句子语义分析理解提供了一种新的技术思路,为框架语义分析技术进一步应用于自动问答、文摘等领域奠定了基础。
其他文献
随着计算机与互联网的日益普及与应用,在10年左右的时间里互联网上至少产生了50亿的网页,浩如烟海的互联网信息极大地促进了搜索引擎技术的蓬勃发展,诞生了我们所熟知的Google、
弹性分组环(Resilient Packet Ring)做为一种新兴的城域网传输技术,和MPLS并称为城域网传输技术的两个奇葩,实现了城域网、大型专网建设的一个技术上的革新,为用户提供高质量
计算机视觉和机器智能的一个主要目标就是对形状进行灵活有效的描述。一个表示形状结构的重要方法,就是对物体的骨架化。骨架化是包含物体拓扑结构特征的压缩表示,它在形状匹
Peer to Peer即对等计算或对等网络,通常简称P2P,可以简单地定义成通过直接交换来共享计算机资源和服务。通常这些资源和服务包括:信息的共享与交换、计算资源、存储资源等。
随着互联网上数据量爆炸式的增长,搜索引擎技术得到广泛的研究,并且出现了一批非常优秀的搜索引擎。但是,现有的搜索引擎只是将返回结果简单地进行线性排列,用户想要的信息可
学位
分类作为数据挖掘领域中最为活跃的分支之一,被广泛的应用于模式识别、图像识别、机器学习等领域。而且,分类在现实社会生活、生产实践中也有着广泛的应用场景,比如医疗图像
随着互联网及相关技术的发展,越来越多的人通过网络进行信息互通、知识传播和文化交流。网络学习(E-Learning)也逐渐成为人们获取知识的重要方式。E-Learning是指通过Interne
数字图像配准是计算机视觉中的一个基本问题,它在三维图像重构、目标识别、对象分类、相机自校正等方面都有广泛的应用。数字图像配准通常是数字图像处理的一个预处理阶段,比
随着光纤保护系统在通信领域的广泛运用,建立一整套软、硬齐全的光层保护监控系统尤其重要。此种系统不仅可以实时监控光线路状态,对各种现象给予及时处理,还可以很好的管理