CRFs融合语义信息的英语功能名词短语识别

来源 :第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD | 被引量 : 0次 | 上传用户:LOVEmayicomein
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
名词短语识别在句法分析中有着重要的作用,而英汉机器翻译的瓶颈之一就是名词短语的歧义消解问题.研究英语功能名词短语的自动识别,则将名词短语的结构消歧问题转化成名词短语的识别问题.基于名词短语在小句中的语法功能来确定名词短语的边界,选择商务领域语料,采用了细化词性标注集和条件随机域模型结合语义信息的方法,识别了名词短语的边界和句法功能.在预处理基于宾州树库细化了词性标注集,条件随机域模型中加入语义特征主要用来识别状语类的名词短语.实验结果表明,结合金标准词性实验的F值达到了89.04%,改进词性标注集有助于提高名词短语的识别,比使用宾州树库标注集提高了2.21%.将功能名词短语识别信息应用到NiuTrans统计机器翻译系统,英汉翻译质量略有提高.
其他文献
据台湾报纸报道,日本旭化成、三菱嫘萦等大型化纤企业决定从4月1日起将腈纶棉价格上调20%,腈纶纱价格上调10%.这是日本大型化纤公司一年半以来首次调高腈纶价格.调价的原因,
本文介绍了费用低的样品处理方法和气相色谱-质谱的仪器分析方法测试电子产品中的多溴二苯醚。保留时间锁定(RTL)技术帮助快速定性单个的同分异构体。选择离子监测模式(SIM)保证
测试媒体是媒体设备测试的重要工具.本文以DVD、CD-R、和CD-W媒体设备为例,论述了测试媒体在测试机械性能、光学性能、电子性能方面的测试方法和功能.
本文阐述了铁路信号系统的工作状况以及如何采用EVOC的EIP平台,利用现有的工业控制技术,实现对铁路信号设备进行全面、自动的实时监控。
2016年8月3日,美国《大西洋月刊》的网站上发布了一篇题为《脸书并非科技公司》的文章。事情起因是8月1日美国股票交易收盘时,全球市值最高的五家全是美国科技公司:苹果、Alphab
《最蓝的眼睛》是美国黑人女作家托尼.莫里森的第一部小说,描述了11岁黑人小女孩佩科拉的悲惨人生。从文本的角度分析,以异化社会中的"窥视"现象作为基石来解读该小说。
本文通过对TL431精密可调基准电源常规测试出现问题的解析,找出了不良品TL431产生的原因,通过增加脉冲响应时间的测试,达到筛选出不良品的目的。
在世界纺织业投资出现衰退之际,南朝鲜政府却在积极拟定一项长远计划,欲使其纺织业在2000年时,生产量达到世界产量的10%,成为世界最大的纺织品生产国。 根据纺拓会最新商情资
期刊
讨论了氧化锌避雷器性能参数的检测方法,提出了虚拟式氧化锌避雷器性能参数的在线测量方案及系统组成,对测量数据进行了分析与处理.虚拟式检测系统具有体积小、重量轻、数据