基于结构学习的语义角色标注

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:liuleismx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来对自然语言进行浅层语义分析逐渐兴起,它已成为自然语言处理应用的重要组成之一。作为其具体实现,语义角色标注是一项定义完整,有着充实工作内容和可比较评测的任务。语义角色标注就是为句子中谓语动词的论元及附属成分标上其担任的语义角色,如施事、受事、时间和地点等等。目前英语语义角色标注已经取得了一定的成果,但大多基于要求大量标注语料的监督的机器学习算法。但汉语语义角色标注的研究才刚刚起步,可利用的语料资源非常有限。为此,本文采用半监督机器学习方法,以期在资源有限的情况下能取得比较好的标注性能。结构学习算法是一种通过多任务学习得到“共同结构”,并利用其来提高目标任务分类器性能的一种机器学习算法。ASO算法是最近提出的一种线性的半监督结构学习算法,能够利用大量的未标注语料,通过辅助问题抽取“共同结构”,来提高分类准确性。本文构建了一个基于ASO结构学习算法的中文语义角色标注系统,并在Chinese Proposition Bank语料上进行了实验,取得了比较好的结果。本文构建的语义角色标注系统不是传统的基于句法树的系统,即对句法树上的节点进行语义角色识别和分类,而是以组块为基本标注单元。这一方法由于避开了句法分析这个阶段,使得语义角色标注摆脱了对句法分析的依赖,从而突破了汉语语法分析器的时间和性能限制。另外构建合适的辅助问题是ASO算法性能的关键,我们分析了构建辅助问题的原则和方法,并进行了一系列实验。实验结果表明,结构学习算法可以有效地利用未标注语料,提高系统的性能。
其他文献
通过对微元井段压降的分析,考虑了壁面入流的影响,那么根据质量守恒,动量守恒定理可以推导变质量流动模型.由于油气水三相变质量流动分散流的混合程度均匀,因此在研究的时候
本文的主要工作是对车牌自动识别算法进行了深入地研究,重点研究了车牌定位、倾斜校正和字符分割算法。在牌照定位之前,本文采用多种方法对汽车图像进行预处理,得到了比较突
为了快速测定卷烟烟丝中1,2-丙二醇和丙三醇的含量,通过气相色谱-质谱联用仪(GC-MS)结合内标法建立了上述两种保润剂的定量分析方法.结果 表明:1,2-丙二醇和丙三醇的相对标准
LM-Q4井是渤海湾盆地辽河坳陷西部凹陷兴隆台潜山南部一口深定向井,由辽河油田设计中心进行总体设计,并由长城钻探钻井一公司组织现场实施,长城DD-2队定向服务施工.该井的定
介绍了利用蛇纹石制取氧化镁和白炭黑的原理、方法和工艺过程,指出中国蛇纹石资源丰富,从中提取氧化镁和白炭黑是其合理利用的重要途径。 The principle, method and process
在湖北省脑科中心主任兼省新华医院神经外科主任孙荣君的抽屉里,收藏了一幅小学生的绘画作品.画上一个小学生举起手面朝一位医生伯伯敬队礼,旁边配着一行小字:医生的伯,谢谢
油气管道系统主要包括油气管道以及站场两部分,因此本文针对油气管道和站场的风险管理的现状进行了综述,并提出了相关结论和展望.
在公共建筑中配置智能化系统对于更好的发挥建成后大楼的功能有重大意义。通常在实际项目中,通过有线传输网络实现智能化系统的数据传输,但是当今建筑结构愈加复杂,传统的有
75岁的张婆婆5年前就被诊断为帕金森病,开始时双手发抖,需要靠吃药来控制.近年来病情逐步发展,药物已无法控制病情,右脚变得发硬,双手抖得越来越厉害,生活自理都很困难.家人
一问题缘起:专业建设之反思  建国初,我国模仿前苏联建立了政府集权控制的高等教育专业制度,由政府统一颁发具有法令性质的高等教育专业目录,体现着计划经济体制的特征:专业类型、数量、规模、层次乃至教学大纲、课程设置等都由政府提出统一要求,高校仅仅是政府专业政策和制度的执行者,专业建设的自主权非常有限。高校专业以培养各行业人才为主,专业分类以行业部门为标准,强调与行业对接,专业教育侧重于职业所需的知识和
期刊