面向评论文本的迁移学习研究及应用

来源 :大连理工大学 | 被引量 : 8次 | 上传用户:heiefei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将在一个场景中学习到的知识迁移到另一个场景进行应用一直是人工智能研究领域的热点问题。迁移学习的目的是将已有的知识进行迁移来解决目标领域中仅有少量有标注数据甚至没有的学习问题。本文面向评论文本中评论者和评论内容两方面的迁移学习研究任务开展工作,具体内容包括:1、针对评论者声誉度度量问题,本文提出基于情感距离和领域自适应的评论者声誉度评估方法。为解决评论者发表评论的跨领域情感倾向性分析问题,本文首先提出一种基于两层卷积神经网络的情感分类迁移学习框架。该框架比较适合后续领域种类繁多且随机、需实时处理的情感倾向一致性分析工作。其次,通过度量待评估评论者发表的商品评论与该商品其他评论者的情感距离、情感倾向一致性,从而衡量该消费评论者在评价商品时的客观性以及与大众情感极性的一致性。在亚马逊产品评论语料上的实验结果表明了本文方法的有效性,该方法为评论者声誉度研究提供了定量分析的新思路,对评论文本有效性研究以及规范电商平台消费评论者行为具有重要意义。2、针对评论内容情感分类迁移学习的特征不匹配问题,本文提出对应不同领域相似语义特征的迁移学习方法。将形容词作为特征,通过词向量和枢纽特征,构建不同领域之间语义相似但表达形式不同的相似枢纽特征对。最后,通过枢纽特征对对齐不同领域之间的相似情感特征。该项工作从词语语义角度减小了领域间的特征不匹配和情感表达差异,通过在亚马逊产品评论上进行实验表明,本文提出的方法适用于面向产品评论文本的情感分类迁移学习任务,并能在一定程度上提高迁移准确率。3、针对评论内容中表达的疑惑、疑惑亟待关注的紧急程度以及情感倾向三方面的迁移学习问题,本文提出了一种基于卷积-长短期记忆模型的深度神经网络迁移学习框架。卷积操作可以学习到考虑了局部上下文特征的特征表达,然后将其作为输入,输入到能够捕获长期依赖语义关系的长短期记忆模型。最后,再将源领域课程训练得到的模型参数迁移到目标领域课程并进行微调。通过在斯坦福大学的慕课论坛评论上进行实验表明,本文提出的迁移学习框架可以有效的学习对分类任务有用的特征表达并在不同课程之间迁移。该项研究能够解决大规模在线课程论坛评论有标注数据缺失以及不同课程论坛评论数据存在偏差的问题,有利于提高慕课论坛的实时监测能力。
其他文献
硫丹是一种能耐环境中完全分解的有机氯杀虫剂,不会在食物链中积累,是一种非内吸性杀虫剂,对作物天敌和益虫具有选择作用,是新的优良杀虫剂。国内生产该产品的企业并不多,根
文章从教育信息能力培训的目标、培训课程的内容、实施的方法以及实施过程四个方面分析比较了各国、地区教师教育信息能力培训标准。通过四个方面的分析比较我们得出各国、地
哲学是思想所把握到的时代。现时中国人所生活的年代,正在发生空前的变化,主要表现在方兴未艾的全球化浪潮和中国特色社会主义伟大实践的高歌猛进。全球化浪潮不仅仅表现在经
本次模拟口译实践报告中的分析均以平顶山市2017年政府工作报告为例,研究了政府工作报告的口译过程中遇到的问题及相应的处理策略。文章共分为六章,第一章是关于此次模拟口译
利用射频磁控溅射镀膜技术,采用不同的衬底温度及射频功率在玻璃衬底上制备了非晶硅薄膜;利用X射线衍射仪、拉曼(Raman)散射仪、台阶仪、紫外-可见光-近红外分光光度计及SPSS
随着经济的发展、社会的进步,人们对可再生环保能源的渴求越来越迫切。可再生能源中,太阳能以其环保、安全、价廉、可循环利用和取之不尽等显著优势获得了人们的普遍关注和重
红外搜索和跟踪系统(Infrared Search and Track,IRST)是一种被动的信息获取和处理系统,它通过接收目标及其背景的红外辐射来搜索和跟踪来袭的导弹、飞机等威胁目标。它具备
<正>《中华人民共和国继承法》(以下简称《继承法》)第十条规定,第一顺序法定继承人包括了"有扶养关系"的继子女和"有扶养关系"的继父母。实践中,司法人员对如何理解继子女与
肝硬化属于一种临床常见慢性肝病,此病致使大量干细胞坏死及残余干细胞结节再生,而后形成一种结缔组织增生与纤维隔现象,最终造成肝小叶结构被破坏形成了假小叶,让肝脏慢慢变
为更准确地研究桥梁风振特性,提供更可靠的设计方法,文章以连续钢箱梁为工程背景,基于谐波合成法,采用MATLAB自主编程进行桥梁振动特性分析和脉动风场模拟,并通过功率谱及相