基于条件场的语义角色标注

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:pengsuli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语义角色标注在信息检索、问答系统等自然语言处理领域应用越来越广泛,但是大部分的研究主要针对于英文,其它语言由于缺少良好的标注语料,其研究相对较少。不久前,宾夕法尼亚大学发布了人工标注的汉语语料Chinese Propbanko本文中,我们尝试使用条件随机场的机器学习算法对Chinese Propbank1.0进行有监督的学习。在研究中,除了使用已有的一些基础特征之外,我们还提出了四个新特征,并通过大量的实验验证了特征的有效性,从最终的结果来看,每一个新特征都对实验结果起到正向作用。为了缩短训练时间,提高实验结果,我们采用两阶段分类的方法。在第一阶段先进行二元分类,判别一个句法成分是否为语义角色,然后对第一阶段中的语义角色再进行多元分类,给其分配具体的语义角色。由于考虑到第一阶段二元分类的准确率,召回率问题,我们选取相应的值作为门限概率以进行非语义角色的过滤,这在一定程度上召回了部分被错误判断的句法成分,提高了最终的实验结果。最终,我们选取了大量的门限值,从结果来看当门限值为0.5时,其实验结果可以达到最好,其准确率超过80%,F-score也将近80%。这在中文语义角色标注领域是令人满意的结果,我们相信,如果后期能加入更具有区分性的特征,实验结果一定会进一步得到提高。
其他文献
期刊
期刊
一、新形势、新任务、新要求 近几年来,我省棉花生产在各级党委的坚强领导下,获得了迅速的恢复和发展,并且出现了不少的棉粮双丰收、双高产的先进典型。这是我省棉花生产战
多智能体系统可以完成个体智能难以胜任的任务,它通过智能体之间协作来实现。多智能体协作控制研究的是大量只具简单功能的个体如何通过分布式的控制,相互合作,产生复杂的群体行
期刊
近年来,随着分布式多智能体系统的迅速发展,分布式协作控制成为控制领域研究的一个热点。多智能体协作控制研究的是大量只具简单功能的个体如何通过分布式的控制,相互合作,产
大脑是目前最高效、最复杂、最稳定的系统之一,复杂网络已经成为研究大脑神经元连接和脑区连接的新手段。现有研究已经证明大脑网络具有小世界特性,其同时具备较短的平均路径
期刊
期刊
新洲县幸福公社八大队是棉麦两熟的平原地区。常年小麦栽培面积占夏粮作物面积的80%左右,产量占夏粮总产量的90%以上,棉花的前作有80%左右是小麦。该大队近几年来,在党和政府的