汉语句子骨架成分识别

来源 :中国人工智能学会第12届全国学术年会 | 被引量 : 0次 | 上传用户:shuiwadandan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种利用统计学习算法进行汉语句子骨架成分识别的方法。骨架成分识别基于短句进行,包括主语、核心动词短语、宾语等。骨架成分的单位是基本短语。利用IOB模型编码,将骨架成分识别作为分类问题处理。在两个方面对概率多分类器用于该任务时做了改进:一是在分类判别时,对每一种成分的N-best分类结果缓冲,将概率最高的作为结果输出;二是利用语序对分类结果进行修正。实验数据是宾州中文树库5.1(CTB5.1),共提取了55,614个短句进行训练和测试,主要骨架成分识别的F<,1>值分别为:主语88.22%,核心动词短语94.46%,直接宾语83.57%,间接宾语18.18%,补语81.85%。
其他文献
近年来随着情感信息处理的研究不断深入,语音信号中的情感转换的研究越来越受到人们的重视。本文首先探讨了情感的分类、建模,接着将语音情感转换系统分为特征提取、参数转换
辽东省辽原市立医院,由于卫生科罗铭科长的正确领导,将原市立中医院合并在市立医院一起成立市立医院的「中医部」下设三科(一)内妇科、(二)小儿科、(三)外科,每一科室医生二
语义角色标注是为句子中谓词论元及附属成分标上其担任的语义角色,如施事、受事、时间和地点等等。汉语语义角色标注的研究才刚刚起步,可利用的资源还很有限。本文采用半监督
随着网络信息资源迅速增加,如何及时准确地获取所需的信息,是现代网络信息过滤技术需要解决的主要问题。本研究针对经常在某个领域检索的用户需求,利用元搜索的理论及优势,完
会议
在建筑师勒·柯布西耶一生的诸多旅行中,一次名为“东方之旅”的旅行,日后成为其最为珍视的经历.文章旨在回溯关于此次旅行的图文并构的语料库,借此探究建筑师“建筑散步”观
本研究针对汉语外国译名识别的难点,基于最大熵算法提出了一种基于规则与统计相结合的识别方法,充分考虑了外国译名的内部特征(小颗粒特征)和人名的语境信息。本文的主要贡献
会议
文本语义倾向识别是指识别某一特定主题的文本所具有的主观态度倾向性。本文基于词汇本身的语义倾向信息,提出了一种基于词汇的向量空间模型(VSM)表示算法。该算法综合利用文
为了实现基于内容的文本集主题描述,本研究提出了一种新的文本集表示模型。该方法将文本中项的频率、项的共现频率以及它们在文本集中的分布情况有机结合,构造了一种新的文本
本研究在“全信息自然语言理解”理论的基础上,运用多Agent技术研究实现了面向多领域的短文本倾向分类系统。针对特定领域,利用包含语法、语义、语用信息的领域全信息知识库,