票房预测中的社交网络评论情感挖掘技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:pengpenghu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,电影艺术已经深入大众的学习娱乐生活中。电影市场每一年都会经历大起大落的票房战争,有些影片能够从观众挑剔的审美观众脱颖而出,有些即时请了高流量的明星却依然收获惨淡的票房,不得不说的是,或许是因为近两年票房整体的不尽如人意。电影制作方与影评媒体的矛盾不断地被摆在大众面前,似乎一些电影票房失利,直接因素就是由于观众的执白影评导致的。随着社交媒体的兴起,电影评论的发布者不再局限于电影研究员或专家学者,各大电影评分类网站、影评类自媒体、观众本身迅速占据舆论的风口浪尖,或是为喜欢的影片发生或是提出尖锐的批评。影评对于电影市场票房到底有多大影响力,以及能从影评中挖掘出多少有价值的信息服务于电影的票房预测,这是本文主要探究的问题。本文从构建多关系主题模型开始,将短影评中涉及的所有电影关注点挖掘出来。另一方面,利用已有的数据训练情感分类的LSTM模型。将短影评汇聚利用人名识别算法提取所有主创的短句,然后利用与训练的情感分类模型对这些短句提取情感特征。将所提取的正负面情感占比的变化情况作为特征加入到预测模型之中,利用生命周期构建多阶段的电影票房预测模型。最后得出结论,在首周使用非线性的SVR模型而接下去的周次使用Lasso模型做票房预测的工作。本文的主要究工作可以概括为以下几个方面:(1)使用主题建模的手段,将影评过滤后提取特定词语组成的主题对象,创建这些对象的属性概念,将评价的关注点以一种主题的形式展现出来,结合影评短文本的特征提出一种多关系主题模型MRTM,实验分析结果表明其有效提高短文本挖掘的主题质量。(2)在传统的口碑、主创等电影本身因素的分析上加入了情感特征,使用基于LSTM的情感分析模型量化主创的情感倾向和变化,这些信息以电影外部特征的形式丰富特征构造过程,旨在分析观众的观感情感态度上的变化和给后续票房预测工作提供有力的变量特征支持。(3)结合电影生命周期的特点,提出一种阶段性的电影票房预测模型和衡量动态变化的主创影响力的方法。结合实验分析,本文最终给出的策略是针对票房预测问题的不同阶段使用不同的预测模型,具体来说,在首映周使用非线性SVR预测方法,在后续周使用Lasso模型。这种方案能有效提高票房预测的精确度和可解释性。
其他文献
目前,随着计算机技术的发展,PC集群在航空、国防、气象等高性能运算领域飞速发展,特别在石油勘探地震资料处理领域,越来越发挥着重要的作用。但是,对于一个大规模计算中心,面
研究了应用现代最优化理论对弹药系统进行全弹道多目标优化设计的基本方法和步骤,选用约束变尺度法对高膛压滑膛配备尾翼稳定脱壳穿甲弹的装药结构和弹体结构参数进行了全弹道
武汉青山长江公路大桥主桥为主跨938m的双塔双索面全飘浮体系斜拉桥,北塔采用A形钢筋混凝土结构,塔高279.5m,由下塔柱、中塔柱、上塔柱、上横梁及塔冠等部分组成。北塔塔柱分
许多疾病都与视网膜血管形态结构的改变密切相关,如糖尿病、高血压、心血管等常见的疾病,其中糖尿病视网膜血管病变占据的比例最大。传统的人工对视网膜血管图像的检测,工作量很大且耗费时间过长,虽然医生能够以较高的精度对视网膜血管图像进行分割,但是花费过多精力会导致医生工作负担加重。随着数字图像处理技术在医学图像领域广泛使用,在计算机系统上实现对视网膜血管的自动分割已经成为一种趋势。目前,在视网膜血管提取等
随着学前教育理论与实践研究的不断深入,儿童早期阅读受到越来越多的关注。然而在一些基本问题上缺乏共识,导致出现了各种误解。早期阅读是幼儿语言学习的有机组成部分。因此
对从豌豆和赤豆分离的黄瓜花叶病毒P1和RB分离的生物学,血清学及外壳蛋白基因序列进行了比较,两分离在豆科的豌豆,蚕豆,豇豆和菜豆上的症状完全不同,P1为系统症状,而RB为局部枯斑,因此将P1和RB分
构建社会主义和谐社会,是党中央从全面建设小康社会、加快推进社会主义现代化建设的全局高度做出的重大战略决策。努力构建和谐大学校园,促进学校全面、协调、可持续发展,是构建
利用两曲面间速度和姿态约束推导出了机器人手指和物体之间的纯滚动约束运动方程;讨论了手指所具有的自由度数对纯滚动操作的影响;发现为了使手指能以纯滚动的方式操作物体实现
现在在一些发达城市的高档楼盘或别墅群,你可能经常遇到这样的景象:走进房间,看不到空调却能感觉凉风习习;找不到热水器,却能冲凉洗澡;甚至,你还会经常听到从天顶传来的悦耳
期刊
本文主要介绍了深矿井开采地压大、地温高、瓦斯大等几个特点,指出如何利用深矿井井田开拓,以及如何掌握深矿井地压规律,利用支护强度大、可伸缩性好、封闭性好的支护结构和支护