跨语言细粒度情感分析技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ykl122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析主要研究如何识别和分析文本中包含的主观性情感信息在粗粒度的句子文档级文本倾向性判断问题上,相关的技术日趋成熟在此基础上,主观情感表达的细粒度分析,即情感的发出者和评价对象识别问题也逐渐成为了新的研究热点基于机器学习的细粒度情感分析,特别是基于序列标注模型的分析方法需要大量包含细粒度标注信息的训练语料而这些语料由于建设困难,往往规模不大因此,本课题研究跨语言细粒度情感分析方法,将在其他语言建立的细粒度情感标注语料跨语言映射到目标语言,丰富目标语言训练集,进而提高目标语言上细粒度情感分析的性能通过对相关技术的回顾,课题进一步分析了细粒度情感分析在使用跨语言标注资源面临的主要困难,包括机器翻译错误,翻译乱序和跨领域差异等针对上述问题,课题系统地提出一个基于子结构传递的跨语言细粒度情感分析方法本文主要的工作有:1.提出一种基于子结构的跨语言标注映射方法,利用机器翻译系统的短语对齐信息以及统计对齐工具实现标注语料的翻译和细粒度标注信息的映射2.提出和实现一种基于多核支持向量机的细粒度情感分析方法通过结合基于句法特征的树核,基于语义信息的多项式核以及本课题新提出的基于词义近似度的轴函数建立多核支持向量机提高细粒度情感分析的性能3.提出了一种改进的迁移自训练方法,通过对跨语言训练语料进行优选使用,进一步提高多核分类器的性能本课题工作的主要贡献包括:1.提出了一种新的基于子结构的跨语言标注信息映射方法,较好解决了机器翻译结果乱序问题的影响,首次实现了细粒度情感标注语料的跨语言复用2.提出了一种新的基于多核支持向量机的细粒度情感分析方法其中树核克服了传统序列标注模型对翻译结果乱序敏感的缺陷,基于词义近似度的轴函数则通过词语扩展提高了对候选子结构的覆盖精度3.提出了一种异于传统迁移学习的方法,对于句法信息和语义信息使用不同的核函数表达,在迁移的过程中有选择的使用不同的核函数,从而达到整体分类结果最优,有效降低了机器翻译错误和跨领域差异的影响在相关数据集上的实验结果显示,本课题提出的方法明显优于传统的基于序列标注模型的方法,接近了基于人工建立模板方法的性能
其他文献
<正> 脑卒中是重要的致残原因,脑卒中患者的康复需耗费相当大的社会资源,虽然绝大多数的脑卒中患者接受治疗后其功能得到改善,但其改善的速度及质量却大不相同。为了最有效地
<正>角的度量这一单元是"图形与几何"的基础性内容,主要研究的是线与角这两部分具有高度关联的知识。以往的教学,教师通常更关注学生"量角""画角"等技能的程序性知识教学,强
针对养猪场废水CODCr高、氨氮高、SS高的特点,采用A2/O-混凝组合工艺处理养猪场废水。介绍了处理系统的工艺流程、主要构筑物及设计参数、工程调试运行情况。结果表明,经过约
纪念曹禺同志●英若诚1996年12月13日凌晨,我得到消息,经过长期治疗之后,曹禺同志终于离开了我们,去世了。在悲痛之余,我心里一幕一幕地出现了他平日的言谈笑貌,在一些场合他的态度和为人,这
提出将相干检测技术和偏振光时域反射技术POTDR(Polarization Optical Time Domain Reflectometry)相结合,利用相干检测技术的高探测灵敏度和偏振光时域反射技术中偏振态对外界
刑事案件现场勘查是侦查破案的首要环节,现场勘查获取的痕迹物证,不仅影响到案件能否成功破获,同时也关系到案件诉讼能否顺利进行。随着社会主义法治建设不断完善,公安机关开
在小学阶段,把计算机作为信息技术教学的工具,使学生掌握这种工具并借助于它进行文字输入。对学生来说,键盘显得枯燥无味。但键盘是重要的文字输入工具,对学生的发展起着重要
<正>2017年4月14日,春风送爽、春意盎然,时值绿叶集团获得国家商务部直销经营许可证一周年之际,绿叶集团在苏州总部隆重召开"新直销、新零售、新电商"媒体见面会,来自中国直
目的:研究单侧颈内动脉(internal carotid artery,ICA)重度狭窄或闭塞性脑梗死患者的梗死模式特点及侧支代偿情况。方法:回顾性分析了112例急性缺血性脑梗死患者,分为ICA病变组、大
目的:对高水平女子足球比赛中运动员比赛跑动能力与技术、进攻效果的关系进行研究。方法:通过time-motion分析、符号分析等方法对30场世界女子高水平足球国际比赛进行研究,获