中文子句语义角色标注系统实现研究

被引量 : 4次 | 上传用户:virtualboxscdl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,大量的研究开始关注浅层语义分析,也就是语义角色标注(SRL)。中文语义级手工标注语料的稀缺,以及中文句子结构的复杂性,都成为中文语与角色标注任务面临的重要问题。然而,目前较少有中文语义分析相关研究来解决这些问题。在本论文中,我们将给出第一个中文语义角色标注系统的全方面性能结果。而只利用了一小部分的已标注语料以及大部分的未标注语料。已有的语义角色标注系统都直接面对语料库中的所有句子进行处理,我们的系统则被设计为只处理单VP中文子句(只含有一个动词短语的子句)。含有多于一个动词短语的子句会被转换成单VP子句的句式形式,使得可以被我们的语义角色标注系统处理。该系统处理单VP子句的性能被作为系统的基本性能。当处理复杂中文子句时(也即我们所说的多VP子句),很难识别子句中的主谓词以及其相关的(尤其是较大的)功能块,于是语义角色标注系统的性能将会因此而严重恶化。作者在该论文中提出了一个新颖的方法,来替换对于多VP子句组块的自动组块器。通过这种方法,多VP子句将被较好的转化成单VP子句的形式,从而被语义角色标注系统处理。在论文中将会证明,转化后的多VP子句的语义角色标注性能与单VP子句标注的基本性能十分相近。作者关于建立了一个完整的半监督语义角色标注系统的工作,将对未来中文语义分析工作起到很大的帮助作用。对于该系统的细节描述以及实验分析结果将在本论文中一一给出。
其他文献
目的:观察电针配合阳经加运动点、电针配合阳经加阴经及抗痉挛药物巴氯芬等三种治疗方法对中风后痉孪性期患者的痉孪程度、日常生活能力(ADL)及肌电图H反射的潜伏期、波幅、H
黑龙江农垦北大荒商贸集团有限责任公司是黑龙江农垦系统在流通领域的龙头企业,负责垦区及周边市县大宗农业生产资料、粮油及农副产品的市场销售,其农资分销业务占有集团较大
"90后"大学生的心理行为特点具有独特性,即自我意识显著化,价值观念多元化,人际交流网络化,生活环境社会化。这既有社会原因,也有家庭和个人原因。加强高校教育管理工作,必须
本文就计算机远程网络通讯技术内涵原理,探讨了其科学应用价值以及具体应用实践。对提升计算机远程网络通讯技术水平,扩充应用服务范畴,发挥综合效用价值,促进计算机、通讯领
针对现代公民权的起源,主要有两种解释框架:一种是以查尔斯.蒂利为代表的战争谈判论,另一种是以马克斯.韦伯为代表的城市类型论。在结合两种观点的基础上可以得出一个有关公
<正> 放射性物品主要是指对带有α射线、β射线、γ射线及中子流射线的物质。这些射线照射人体外部时,β、γ射线和中子流射线对人的危害很大,剂量大时易使人患放射病,甚至死
彩色图像在生成和传输过程中,经常会受到脉冲噪声的干扰。而图像去噪的目的也就是削弱噪声对图像的影响,提高图像的质量,这样不仅可以改善图像的视觉效果,而且会对后续的图像
新闻媒体的舆论监督功能受到广泛关注,在西方国家的新闻实践中已经取得了良好的效果,并且大多数西方国家通过完善的法律体系进一步保护和规范舆论研究。在我国,无论是学术界
网格系统将地理上分散、系统上异构和动态变化的各种资源,通过互联网络连接起来,向用户提供可靠的、非集中管理的通用计算环境,在网格内进行并行程序的开发和运行是网格技术
IMS(IP Multimedia Subsystem)即IP多媒体系统,是一种全新的多媒体业务形式,它能够满足现在的终端客户更新颖、更多样化多媒体业务的需求,现在IMS虽未大规模商用,但一些知名