基于文本挖掘的电影网络口碑与电影评分和票房关系研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:tanxiaoxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展,学者对网络口碑的研究不断深入,在实践中越来越多的消费者查阅网络口碑辅助其完成消费决策。电影行业中,观众有观影后撰写影评并在网络上分享的习惯,文本长度和质量俱佳,影评作为消费者对电影的口碑是理想的网络口碑分析对象。同时对于电影作品来说,高票房佳作频出,但是影片叫好不叫座、叫座不叫好的现状仍然存在。针对这一问题,本文通过文本挖掘方式提取电影网络口碑特征。利用口碑文本挖掘的结果,完成对电影评分和票房的分类,构建电影口碑与电影评分和票房之间的关系。本文首先爬虫获取14万余条电影评论,将word2vec算法与领域内专业知识结合,提出了一种效率优于完全依赖专家知识构建词表的方式。其次,利用构建的关键词表对分词处理后的网络口碑打分,完成口碑文本在电影要素赏析数量、效价和观众情感唤起三方面的定量转换,将构建的变量作为机器学习的特征,验证电影的评分和票房表现。最后,利用自然语言处理后的口碑文本特征,构建了口碑文本和电影评分和票房三者之间的定量关系。结果显示,首先,通过文本挖掘对口碑构建的变量,相较于过去仅通过数量和效价构建的变量,能够更加有效的预测电影的评分和票房表现;其次,在拍摄和情感唤起口碑数量正向影响电影评分,演员口碑数量和故事口碑的负效价负向影响电影评分,故事和情感唤起口碑数量以及演员口碑负效价正向影响电影票房。本文在网络口碑研究的基础上,结合机器学习算法,通过词向量编码构建词表降低了专业领域的文本挖掘难度。为口碑内容的研究做出了积极的探索,拓宽了 口碑内容研究的维度,构建了电影网络口碑文本对电影票房和评分之间的关系。
其他文献
<正> 随着前苏联和中东欧国家指令——控制型经济的崩溃,与此相对的是政府在东亚经济“奇迹”中发挥了重要作用,发达工业国家政府面临财政危机,以及另一些国家陷入解体和混乱
在软件工程领域中软件缺陷预测技术能有效地辅助软件测试、保障软件产品质量和增强软件的安全性。本文结合软件度量方法和集成学习算法对缺陷代码进行研究,提出了基于不平衡率阈值移动的异质集成算法和基于递归特征消除的极端随机树特征选择算法来预测软件源代码的缺陷,主要内容如下:首先,分析了软件缺陷预测的研究现状,对软件安全缺陷库中不同类型的缺陷进行了研究,采用结构化的软件度量方法预测软件缺陷,结合集成学习方法研
缺铁性贫血(Iron Deficiency Anemia,IDA)是由于各种不同原因引起体内储存的铁缺乏进而导致的,治疗缺铁性贫血的方法多为采用补铁剂。然而,补铁剂会引起恶心、腹痛、腹泻或便秘
目的:评价经颈内静脉肝内门体分流术这一术式在门静脉血栓伴海绵样变的患者群体中可行性、有效性及安全性。方法:检索PubMed、Cochrane library、Embase、Web of Science、中国知识网医学库(CNKI)、万方、维普数据库中相关研究文献,提取数据资料,使用RevMan 5.1软件对数据进行meta分析。结果:根据纳入和排除标准,最终纳入了9篇研究,共有患者188名,均为门
2018年我国资本市场出现重要股东股权质押问题,一些上市公司重要股东质押率高达99%,风险承受能力弱。经济下行,民营上市企业面临巨大挑战。政府层面不断地出台救市行动,释放
<正> 近期我国经济经历了严峻的考验,亚洲金融危机的影响进一步深化,日元不断贬值终于导致日本首相换人,俄罗斯政治、经济都动荡不安。7月17日,国家统计局宣布,我国上半年经
<正> 一、从“知识经济”说起——一种新型经济 九十年代以来,世界经济正在从工业化向信息化时代迈进,这一时期的经济由第三次科技革命推动而追求无形质量——即附加值的提高
<正> 从一九九七年下半年开始到一九九八年初,日本经济陷入了比石油时期更严重的危机之中。一九九七年春,日产生命保险公司倒闭,接着,三洋证券公司以及有着百年历史的山一证