框架元素语义核心词自动识别研究

来源 :山西大学 | 被引量 : 5次 | 上传用户:bababa666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
框架语义依存图是基于汉语框架网,对汉语句子进行形式化表示的一种有效方式,而框架核心依存图是抽取框架语义依存图中的核心成分,来达到对句子的深层语义理解。本文研究从框架语义依存图中提取框架元素的语义核心词,得到框架核心依存图。本文的研究内容主要包括:(1)系统地描述了框架元素语义核心词的识别问题,并提出了利用统计机器学习方法:条件随机场模型、最大熵模型和SVM模型进行框架元素语义核心词的识别。(2)针对三种不同模型,对特征集选择进行了分析。在所选基本特征的基础上,构造不同的组合特征模板进行对比实验。通过实验结果分析,选取其中较优的特征模板和模型作为框架元素语义核心词识别的研究方法。(3)实验改进。为了进一步提高识别效率,本文在CRF模型的特征选择上进行了改进。在选择上下文信息的时候,选取了远距离实词这一信息。采用这种方法,使得识别效率得到了一定的提高。实验结果表明,在三种机器学习模型中,针对框架元素语义核心词识别任务,CRF模型具有较好的识别性能,其中对简单型和复合型短语类型框架元素语义核心词识别的平均正确率分别达到了97.34%和94.03%。
其他文献
近年来在线社交网络(Online Social Network,简称OSN)飞速发展,用户数量不断增加。在线社交网络以用户为中心,每个用户和网络中的其他用户成为朋友,形成人际关系网络,用户之间通过
近年来,随着各种数据获取技术与影像技术的逐渐成熟,三维标量场可视化技术已经成为科学计算可视化领域中的研究热点。体绘制作为一种重要的三维标量场可视化技术,在科学计算、医
数据驱动的人体动画合成采用捕获的真实人体运动数据驱动虚拟人体模型来产生动画,该方法由于动画制作效率高,所得结果真实感强,在近年来得到了广泛应用。但是由于运动捕获数据只
物种的鉴别与分类是生物学等科学领域中一项较为常见的科学研究内容。传统的基因鉴别、形态学鉴别等物种鉴别方法都需要专业的数据库支持,并且需要专业人员对样本的基因、形态
随着web2.0技术的产生和发展,用户产生的内容(User-Generated Content,UGC)成为互联网中资源的重要来源之一。YouTube、YouKu等UGC视频系统近年来取得了重大的成功。YouKu,作为
蛋白质功能是由其三维结构决定的,因此研究蛋白质的功能的前提是深入了解它的结构。实验测定结构昂贵的花费,加上高通量测序技术的驱动,使得预测方法的地位愈显重要。蛋白质结构
野外车辆定位监控系统作为车辆自组网的重要应用系统,正面临着车辆组网结构灵活化,系统功能丰富化和通信手段多样化等新挑战。军警、勘探等行业的野外车辆具有分级编组特点,车辆
近些年来,视频编码技术得到了迅速发展,视频压缩效率的不断提高使视频编码技术得到了广泛应用,主要包括数字电视、IPTV和网络视频等。H264/AVC、AVS以及可伸缩视频编码(SVC:Scala
在线关键字营销基于搜索引擎而发展起来,目前已渗透到各类互联网应用中,形成了以网页文本、图片、视频和手机等为基础的众多新广告形式。关键字广告因其众多优良特性(如目标
随着电子计算机的普及和信息化的迅猛发展,许多医院都建立了自己的医院信息系统(Hospital Informatiaon System, HIS)。医院信息系统的普及,使医院每天产生大量的业务数据,数