基于深度学习对中文影评的情感分析研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:one_tester
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,越来越多的人选择在网络上分享自己的观点和看法,这些网络评论蕴含着发布者的情感倾向,如何有效的利用这些具有高潜在价值的文本,探索文本中的情感倾向是目前的研究热点。但随着网络上的文本数据呈现爆炸式发展,更具无规则、内容多样性等数据特征,对情感分析任务提出了更高的要求,传统的情感词典、机器学习等方法显现明显的局限性。与此同时,伴随着我国大力推进文化体制建设,国民提高了对精神方面的追求,电影行业在此阶段得到飞速发展,电影购票平台、影评平台相继完善,大量的网络电影评论触手可得,为影评的深入研究提供依托;与此同时,其他用户的评论在观众选择是否进行购票行为时,起着关键性指导作用,这些评论也可以帮助电影制片方改进制作内容。因此,本文将利用深度学习的相关方法,探索在中文影评情感分析任务上的效果。本文选择豆瓣电影网、猫眼电影上的用户评论文本,按照电影票房以及受欢迎程度,借助Python软件爬虫获取爱情类、动作类、奇幻类、喜剧类、战争历史类五种电影类型下共20部电影的评论,经过数据预处理,得到24000条影评数据用于分析。首先,本文介绍了Text RNN、Text CNN、注意力机制、BERT模型的相关网络结构和特点,分析Text RNN模型对文本端点位置的词信息获取度更高,但文本关键信息可能在任意位置;Text CNN模型利用卷积核提取信息,却忽略了词汇的位置特征;注意力机制通过给予较高权重可以很好的关注重点特征。因此,针对单一模型无法有效获取文本倾向的问题,提出了融合注意力机制的R-ACNN模型以及BERT-RCNN模型,分析在多类型影评下模型的效果,同时分别验证在不同类型影评下模型的稳定性。其次,将单一模型设置为对比实验,保证超参数设置一致的同时,从多个分类效果指标上,验证了本文提出的两种模型对比单一模型,都可以更有效的提升文本情感倾向的预测效果,其中,BERT-RCNN模型的效果最佳,准确率、精准率、召回率、F1值都达到0.86以上,AUC值达到0.97。最后,本文对不同类型下不同倾向影评进行分析,通过绘制词云图,了解观众的主要关注点以及不满之处,同时利用LDA主题模型,探索用户的偏好主题分布,为电影制片方提供一定参考性意见。
其他文献
分拆上市属于资产重组的一种方式,国外相关研究已经较为丰富。长期以来,我国证监会对分拆上市管控较为严格,指导文件和合适的分拆地点在以往也相对较少,所以,我国证券市场以往分拆上市的案例并不多。2019年7月,我国科创板正式开放,并且我国开始逐渐完善分拆上市相关的政策,在同年12月,正式出台了关于分拆上市相关的政策,这吸引了很多想要分拆上市的公司。而且,科创板在很多方面都具有自己独特的优势,比如制度、政
学位
重庆三峡水利电力(集团)股份有限公司(以下简称“三峡水利”)是一家集电力开发、多种经营为一体的企业集团,积极响应国家电力体制改革和推进落实混合所有制改革试点方案,2020年5月10日三峡水利的控股股东—三峡集团开始主导进行三峡水利的资产重组。三峡水利的资产重组主要由三峡水利向长江电力、新禹投资、涪陵能源、两江集团等相关企业采用发行股份及支付现金的方式,收购作为混合所有制改革试点的重庆长电联合能源有
学位
目的:基于质谱技术建立针对高尿酸血症的蛋白质组学和代谢组学检测方法并筛选其特征组学标志物。方法:使用MB-WCX去除研究对象血浆标本中的高丰度蛋白后,结合基质辅助激光解吸电离飞行时间质谱(MALDI-TOF MS)技术进行检测,获得高尿酸血症患者血浆多肽/蛋白图谱,构建其质谱诊断模型并进行检测方法学优化。通过纳米液相色谱结合四极杆飞行时间质谱(nano-LC-Q-TOF MS/MS)技术对上述标本
学位
互联网时代的到来使商业环境不断变化,目前,企业更注重选择合适的运营模式,以此来应对复杂的市场变化,提高企业的整体价值和竞争力。因此,轻资产运营模式逐渐出现在人们的视野中,该模式将非核心业务进行外包,借助财务杠杆原理整合企业现有的资源,打造优势品牌、创新研发技术以及完善供应链。财务战略对企业来说也是至关重要的,它是轻资产运营模式的核心战略之一,将财务战略结合轻资产运营模式共同运作,企业就能发挥竞争优
学位
目的:通过Meta分析综合对比局部晚期宫颈癌患者新辅助化疗(Neoadjuvant Chemotherapy,NACT)联合根治性子宫切除术(Radical Hysterectomy,RH)与单纯根治性子宫切除术(RH)的临床疗效和病理因素,为局部晚期宫颈癌患者治疗提供理论依据。方法:全面检索英文数据库(Cochrane Library、Pub Med、Web of Science、Embase、
学位
目的本实验旨在研究外源性二氧化硫预处理对大鼠肾缺血再灌注损伤的保护作用,并探究其相关机制。方法实验动物选用30只SPF级SD雄性大鼠,随机分为3组,每组10只,分别为假手术组(Sham组)、模型组(IR组)和二氧化硫预处理组(SO2组)。实验开始前24小时给予大鼠禁食不禁水的处理。其中,Sham组仅在开腹后分离双侧肾蒂,术后24h经腹主动脉采血,注射过量麻醉剂后取肾;造模时使用无创血管夹夹闭IR组
学位
目的:研究缺血性脑卒中易感基因的SNP位点与患者预后相关性,并结合遗传背景、临床信息、影像和检验指标建立缺血性脑卒中三个月短期预后评价体系。方法:纳入2020年12月至2021年12月在兰州大学第二医院登记入院的缺血性脑卒中患者433例。收集患者入院后初次血液样本、临床基础资料、NIHSS评分、影像学及血液学检查结果,使用改良的m RS评分评估三个月短期预后结局。采用实验室自建的PCR-HRM分子
学位
企业从设立之初,生命周期就开始按照特定的轨迹持续变化发展。制定合理的财务战略可以为企业总体战略的有效实施提供可靠支撑,提升企业的价值创造能力。但是现在我国大多数企业仍旧选择采用传统的财务管理模式,这种模式往往由于过度重视利润而忽视企业的成长指标,使企业缺少对未来的预见性,因此解决这类问题刻不容缓。利用生命周期理论对企业进行动态研究,根据企业现阶段的特征,从全局角度出发及时找出现行财务战略中存在的不
学位
随着经济全球化的发展,家电行业的市场竞争压力逐渐增加。近些年来,消费偏好的转型升级和消费水平的逐渐提升,家电行业面临更加多元化的市场需求。并购重组作为一种能够快速高效整合资源的手段,受到越来越多公司的重视。当前我国正在面临产业结构优化和经济现代化加速转型的关键阶段。实体经济进一步加速发展,产业结构调整进一步发展,大多数公司为了加快发展步伐、优化资源配置、实现公司战略纷纷将视线转移到并购重组,部分公
学位
目的:建立11个模式识别受体基因单核苷酸多态性(SNP)位点的分子诊断方法,探讨11个SNP与感染性疾病严重程度之间的相关性。方法:应用在线Primer-BLAST软件针对11个SNP位点(rs606231248、rs3211938、rs3775291、rs4986790、rs4986791、rs2072493、rs5744174、rs5744168、rs3796508、rs5743845和rs5
学位