【摘 要】
:
本文提出一种基于语言现象的文本蕴涵识别方法,该方法建立了一个语言现象识别和整体推理判断的联合分类模型,目的是对两个高度相关的任务进行统一学习,避免管道模型的错误传
【机 构】
:
广东外语外贸大学语言工程与计算实验室,广东省广州市510006
【出 处】
:
第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD
论文部分内容阅读
本文提出一种基于语言现象的文本蕴涵识别方法,该方法建立了一个语言现象识别和整体推理判断的联合分类模型,目的是对两个高度相关的任务进行统一学习,避免管道模型的错误传播问题并提升系统精度。针对语言现象识别,设计了22个专用特征和20个通用特征;为提高随机森林的泛化能力,提出一种基于特征选择的随机森林生成算法。实验结果表明,基于随机森林的联合分类模型能够有效识别语言现象和总体蕴涵关系。
其他文献
In this paper,we propose a neural graph-based dependency parsing model which utilizes hierarchical LSTM networks on character level and word level to learn
Traditional Mongolian Unicode Encoding has serious problems as several pairs of vowels with the same glyphs but different pronunciations are coded different
This paper describes an approach to identify suspected cybermob on social media.Many researches involve making predictions of group emotion on Internet(such
在利用大规模双语语料获取复述知识方面,传统的基于"枢轴"方法只能考虑两步以内的复述现象.本文针对已有方法的局限性,对不同语言之间互为翻译的短语对构建翻译关系图,提出基于随机行走N步的复述获取算法,改进已有方法以获取更多潜在的复述知识.本文描述了由汉英短语翻译表构建翻译关系图的方法、基于N步的随机行走算法和基于期望步数的复述短语可信度计算方法.同时,本文提出面向多语言对的翻译关系图扩展方法.在NTC
Most researches to SRL focus on English.It is still a challenge to improve the SRL performance of other language.In this paper,we introduce a two-pass appro
Sentiment analysis on social media represented by Weibo is one of the hotspot research problems in NLP.A comprehensive and systematic fine-grained annotated
近年来基于矩阵分解的协同过滤算法在评分预测上取得的显著成果,但冷启动、数据稀疏等问题仍然未能得到很好的解决,因此如何将评论信息引入推荐系统以缓解上述问题,开始成为
Topic-sentiment mining is a challenging task for many applications.This paper presents a topic-sentiment joint model in order to mine topics and their senti
统计机器翻译模型,特别是基于句法的翻译模型,其翻译单元在保留足够的翻译信息以及翻译单元在翻译新句子时的泛化能力上始终存在着一个平衡.神经网络被成功用于统计机器翻
At present,Tibetan information is quickly connected with modernization and information,which results the expansive development of Tibetan information on the