基于微博数据的电影票房预测

来源 :河北大学 | 被引量 : 0次 | 上传用户:xszr1112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从全球范围来看,电影行业是增长最迅速的产业。每年都有成千上万部的电影上映,电影市场年均复合增长率也在逐年增长。然而人们的喜好是非常难预测的,一部电影上映之后,能够满足自负盈亏的平衡点具有相当高的风险,所以,电影票房预测一直是电影行业非常关注的问题。电影票房的研究在经历“观众研究”和利用元数据、多因子的方法进行模型改进和影响因子的研究阶段之后,研究者们充分利用了网民在线生成的海量内容作为预测的主要信息来源,建立了更加高效、准确的票房预测模型。预测算法都是在电影上映之前进行的,预测进行的越早价值越大,但是由于互联网数据的滞后性,是电影上映之前和发布之后的微博数据量差距特别大,电影上映之前的微博数据量占总量的一小部分,大多数的微博数据都集中在电影上映的第一天或者是第一周,模型预测的性能和准确性一般都不高。为了尽量的消除互联网数据的滞后性对预测结果的影响,本文提出了一种新的基于微博数据的预测模型来预测电影票房,我们提出将整个预测过程分为三个时间阶段,使用预测算法构建了3个在时间维度连续的模型,即电影上映之前、电影上映一周以后、电影上映两周以后分别预测电影上映后第一周的票房、电影上映后二周累计票房、电影上映后三周累计票房。将模型变量分为两类,一是实际票房数据,二是微博数据。在预测电影上映两周、三周累计票房的时候,已经有了第一、二周的实时票房数据,可以将实际票房也加入到预测模型中。在参考前人研究模型变量基础之上,我们对微博数据做出提及、情感提及、积极情感、消极情感四个维度特征,并在这四个维度之上派生了十二个维度。3个预测模型都是通过遗传算法优化的支持向量回归机进行构建的,通过仿真实验得到了各个模型的最佳参数,并通过绝对误差值指标验证了该模型的科学性和合理性,并且预测的时间越晚,准确率越高。
其他文献
月光溶溶,晚风轻拂,我在灯下码字.“笃笃笃!”听到敲门声,我下意识地看了看手表,22:50.谁会这个时候来?文友应该都在爬格子,亲戚更少来往.想到这里,我套上汗衫,去开门.
期刊
随着科学技术突飞猛进的发展,技术创新逐渐成为国家、地区、企业发展的动力和源泉。自主创新因其在人力、物力、财力资源等方面的限制,使得越来越多的企业认识到通过合作创新进行研发活动时共享资源、共担风险的有效途径。然而,目前研发联盟的失败率高达40%-70%,其中知识溢出、联盟结构以及不恰当的利益分配方式都是重要的影响因素。本文以研发伙伴为研究对象,即几个独立的企业为了实现共同的目标而结成研发伙伴关系。基
他们正在探索老矿转产的新路──关于开滦嘉盛实业总公司(原唐家庄矿)实行老矿转产的调查煤炭部政策法司综合处年初,江泽民总书记在考察煤炭行业时,提出一个尖锐的问题:"有的煤矿已
期刊
本文介绍的梯段硐室组合爆破,对改善爆破效果,满足堆石坝对石料开采的级配要求,作了有益的实践尝试。 The blasting chamber chamber combination blasting introduced in this
山西省介休市机械厂在有关部门的大力支持下,最近试制成功煤泥分选精煤回收系统,并通过中国统配煤矿总公司发展局组织的技术鉴定,填补了我国煤炭深加工设备的一项空白,目前
随着我国城镇化水平的加快和基础设施建设的提速,我国工程建设行业迎来了一个高速发展的时期。在城市、乡镇随处可见热火朝天的建设工地。但在建筑行业欣欣向荣的背后,一个个
期刊
马鸣高考落榜后,成了猪倌。他起初办养猪场时,父亲并不赞同。父亲老马希望他走出村庄,到更远的大城市去发展。而马鸣执拗的性格,老马用尽八匹马的力气也拉不回来。  要办养猪场,那就得老马拿出积蓄出来支持儿子。老马就这么一个儿子,老伴又去得早,他能不拿出他那點可怜的积蓄吗?  养猪场办起来了。马鸣把养猪场建在一座废弃的荒山上,这些荒山早年前是砖瓦厂。山上山林茂密,土地植被肥沃,猪在山上还可以天然放养,肉质
期刊
那年冬天特别寒冷,隔个三五天便下一场雪.我们这些拆旧房子的农民工,白天在冰天雪地里磕钢筋,捡砖头,晚上睡在露风漏雨的棚子里,碰到这样的天气,真是够惨的了.这种恶劣的天气
期刊