基于深度学习的线上课程评价情感分析算法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:diahou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,基于互联网的电商平台如雨后春笋般涌现,用户在这些平台上发表意见、抒发个人情感已经成为一种习惯,海量的评论数据随之产生,发掘出用户的情感倾向已经成为产品售后信息反馈的重要途径。目前文本情感分析任务中研究的对象主要是微博评论、电影影评、电商评论,针对线上课程评论进行情感分析的相对较少。但是线上教学已经成为我国中小学教育和普通高等院校教学中的重要组成部分,针对线上课程评论进行情感分析,可以了解学生对课程的评价进而分析出学生的需求,从而更好地为老师提供个性化导学,同时还可以帮助学生选择最适合自己的课程。因此将线上课程评论作为情感分析任务的研究对象对教育事业的发展能发挥一定的促进作用。深度学习是目前情感分析任务中的主流方法,常用的有卷积神经网络(Convolutional Neural Network(简称 CNN))、循环神经网络(Recurrent Neural Network(简称 RNN))、双向长短期记忆网络算法(Bidirectional Long Short-Term Memory network(简称Bi-LSTM)),但这些算法存在着以下不足:1.在词向量的转换上不能解决一词多义的问题,导致算法最终精确率不高;2.在特征学习网络的设计上采用的结构比较单一,导致提取出的特征不全面;3.缺乏对不同特征重要性的区分。本文针对以上问题设计了一个新的情感分析模型,新模型是在深度学习技术的基础上,研究了目前流行的情感分析算法,再针对线上课程评论这个特定的研究对象对相关算法进行改进,使改进后的算法在进行情感分析任务时主要性能有所提高,本文的主要工作如下:(1)本文对CNN和Bi-LSTM网络进行了研究,发现CNN在特征学习方面有出众的表现,但是因为该算法在文本分析中不能结合上下文的信息,导致最终的结果不是很理想;Bi-LSTM网络在分析目标词时可以将上下文的信息联系起来,但是该网络是按文本的序列顺序处理语句,得到的是全局的语义信息,挖掘更高级特征的能力远不及卷积神经网络。本文希望设计出一种能够将以上两种网络的优点相结合特征提取网络,用以提高特征的广度。为此首先提出了 CBi-LSTM模型,该模型中将Bi-LSTM和CNN网络通过串联的方式相连接,用以挖掘更高级的特征。经实验验证,该模型没有达到预期效果,分析总结原因后,提出了 CNN-Bi-LSTM模型。CNN-Bi-LSTM模型采用的是并联的方式,让两个网络分别进行特征学习,再将输出的结果相结合,提高特征学习的广度。经实验验证该模型的F1值是明显高于CNN网络和Bi-LSTM网络,验证了该模型的有效性。(2)本文采用的数据集是从中国大学MOOC(慕课)国家精品课程在线学习平台上获取,通过研究发现这些评论普遍比较简短,言语表达上偏口语化、年轻化,所用的词语中常常出现一词多义的现象。普通的情感分析任务中常常通过Word2Vec进行训练、学习得到词向量,但是经过Word2Vec模型得到的是词语的静态表示法,不能解决一词多义的问题。为了使本文的数据集在词向量的表示上准确度更高,本文利用Bert语言预训练模型进行词向量的训练,实现词语的向量表示。(3)本文为了提高带有极大情感倾向的特征在句子中的权重,在前面提出的CNN-Bi-LSTM模型的基础上引入了注意力机制,并将其放在卷积神经网络和双向长短期记忆网络特定的位置,让特征提取网络在进行特征学习的同时还能根据其重要性重新调整权重。实验结果表明改进后的Bi-LSTMA-CNNA模型在线上课程评论的情感分析任务中具有较好的分类效果。本文提出的Bi-LSTMA-CNNA算法模型在对线上课程评论进行情感分析任务时,性能上较于传统算法有了一定的提升,为线上教育平台收集用户反馈,提升课程质量提供了有效的技术支持。
其他文献
计算机信息技术发展日新月异,其开发应用百花齐放,深入各行各业。计算机视觉技术对图像和视频的处理水平也日趋成熟,尤其是人脸检测和识别技术发展迅猛,在人机交互、身份验证和视频安防等领域均有一定的研究成果。卷积神经网络是深度学习的代表算法,因其良好的鲁棒性和较高的准确率,广泛应用在目标检测和模式识别领域,逐渐成为工程应用的主流选择。人机交互技术使人与机器建立连接,实现机器为人提供更加优质的服务。这些技术
伴随着互联网的发展和普及,以MOOC为代表的在线学习已成为一种新型的学习方式。在新冠肺炎疫情期间实施的“停课不停学”活动,进一步推动了 MOOC学习的应用广度和深度。虽然MOOC学习具有不受时间空间限制、受众门槛低、学习资源丰富等优势,但也存在学习者被淹没在海量的资源中、难以找到符合自身需求的学习资源以及退课率高等诸多问题,所以如何为在线学习者提供个性化的资源服务是当前在线学习领域亟需解决的问题。
从工程领域到经济学领域,大量问题都存在多个需要优化的目标,而且各个目标之间相互制约、彼此冲突,此类问题被称为多目标优化问题(Multiobjective Optimization Problem,MOP)。与传统数学方法相比,进化多目标优化算法(Evolutionary Multiobjective Optimization Algorithm,EMOA)不需要了解问题的数学特性,而且在一次运行中
随着“互联网+”教育和智能技术的不断融合,智慧课堂场景下的多屏多点触控教学模式应运而生,教学内容及教学活动表现形式将更加丰富多彩。然而,以教师为主体的填鸭式教学模式将不适用于新时代背景下的师生互动关系,不利于教学效果的提升。为引导学生成为教学活动中的主体,掌握教学过程中的学生学习状态、感兴趣情况是非常有必要的。课堂学生注意力将能够客观真实地反映教学活动中学生的兴趣热点、知识盲区以及积极状态,是提高
单细胞RNA测序(scRNA-seq)技术是研究基因与表型之间的关系的利器,同时也是当前生物医学研究中最重要的技术之一。然而多种因素导致单细胞RNA测序数据中存在噪声,如Dropout现象等。这些噪声可能会阻碍单细胞测序的部分下游分析问题。为此研究人员提出多种计算方法用以填充或补全单细胞测序数据,以减少数据噪声。单细胞RNA测序数据会因为Dropout现象等原因导致测序数据矩阵具有极高的稀疏性,针
随着我国大学入学人数的逐年递增,高校教学质量受到了社会各界人士的广泛关注;而学业成绩作为衡量学生一段时间学习成效的重要指标,成为评价高校教育水准的重要指标之一。同时,各高校借着物联网、云计算和大数据迅猛发展的东风,纷纷建立了数字化校园环境。在此进程中,海量学生行为数据在校园内生成并不断积累。这些数据涵盖了学生日常学习和生活的全过程,不仅是研究人员当下关注的重点,也受到了高校管理人员的关注。但在实际
《:塑料成型工艺与模具设计》是模具与机电相关专业的必修课程,其课程思政教学改革是专业建设的重要内容,也是人才培养的重要环节,针对该课程内容庞杂、系统性和实践性强的特点,通过发掘课程蕴涵的“思政元素”,对《塑料成型工艺与模具设计》的课程思政教学进行有益的探索,并取得较好的教学效果。
《1000以内数的认识》是学生在认识了100以内数的基础上教学的,旨在认识"千位"及其计数单位——"千",初步建立四位数的整数数位顺序,进一步体会相邻单位之间的十进制关系,并在此过程中有意识地培养学生的数感。这是教材第一次正式介绍"比100大的数",对于二年级学生来说,在生活中其实已普遍接触过,且绝大多数学生会读会写即将要学的"1000以内的数"。在这样的学情下,加之"数的认识"本身又有些枯
期刊
互联网的飞速发展,既孕育着机遇,又带来了挑战。一方面,许多网络社交媒介涌入人们的生活,如微信、微博、贴吧等,使得人们在发表自己的言论时不受时间空间的限制,互联网俨然成为了人们思想文化信息的集散地。另一方面,正是由于人们在互联网上发表的言论存在自由性强、受众面广、传播速度快和超越时空性等特点,为虚假违法消息的传播提供途径,容易导致舆情负面危机,互联网因此成为社会舆论的放大器。因此,如何用科学的方法预
人机对话,主要目标就是希望机器能够与人类进行流畅、自然的对话,从而便利人类的生活,满足人类的需求。为了增强对话质量,使机器生成的语句更像人类发出,涌现出了各种各样的人机对话系统。但是,在开放域中,如何能让机器清楚理解人类意图,明确对话目标,仍是一直在攻克的难关。因此,本文主要关注在开放域中的对话生成,该任务旨在生成更符合逻辑,与上下文衔接更紧密,更具有主题性和多样性的回复内容。本文的主要工作如下: