论文部分内容阅读
进入21世纪后,随着我国经济高速发展和人民生活水平显著提高,人们追求生活品质的方式仅限于物质生活的需要,还有精神生活的需要。这给了文化、文创产业高速发展的巨大空间。而电影产业无异是整个文创产业极为核心的组成部分。 作为文创产业的中流砥柱,电影不仅仅带来了积极的社会效益,同时也随着近几年中国电影市场的飞速发展,大大带动了相关产业经济的发展,成为我国国民经济重要的组成。2015整年,中国电影总票房收入就已经达到了440亿元,成为仅此于美国的全球第二大票房市场。中国电影市场已经成为全球票房的重要增长极,发挥着至关重要的作用。 伴随着电影项目的高收入现状的是其高投入高风险的特征,作为策划和投资人难以仅凭经验对一个电影项目做出较准确评估,因为这涉及到太多影响因素。这样的现状使得中国电影产业难以进入优质资金和优质项目互相匹配的良性循环,热钱争先恐后赌上烂片,好的项目却要制片人下跪求支持。这也造成了中国电影虽然市场大,但行业专业水平低,观众满意度低。2016年全国票房增速的暴跌根本原因更是在此。所以从观众角度出发,在电影项目策划融资早期的时间节点,预测电影最终表现的有效方法势在必行。这是确保电影市场价值,控制项目风险以及优化资源配置的重要手段。若能较好在早期,例如电影上映半年前,就能一定可控精度地预测电影项目的最终表现,对电影项目的策划者和投资人无疑是一剂强力定心丸。 国内外目前对于电影商业价值的预测研究多大集中在票房预测或电影上映前很短时间内的精准预测(例如Google基于搜索量票房预测),但是对于中国电影市场,由于票房管理制度不健全,电影成本信息缺失,样本类型不完全等原因,票房预测具有先天的不足。精准预测由于缺乏时效性,无法应用于投资阶段,缺乏实用投资参考价值。 本文在参考国内外学者研究成果基础上,立足于中国电影市场的实际情况,充分利用百度指数这一创新的数据工具,选择以电影热度的预测作为主要研究方向。这样做的原因是电影热度能更加全面地反应电影真实收益,包括直接收益(包括票房收入)和间接收益(例如人在囧途、小时代等影片利用其累积的人气后续开发多部续集)。而且与以往研究票房不同的是,本文使用的电影热度的相关影响因素数据均来源于互联网共享平台,由海量用户自生成,排除了各种干扰因素,即使缺乏影片成本数据也能进行预测。同时,电影热度也能更好地反应电影其他发行渠道的商业表现。 本文通过训练神经网络模型来对电影热度进行预测,所选用的数据来自国内在影视方面最具有影响力的用户参与价值共创平台——豆瓣网,包括2012-2016年5年共计322部华语电影的电影导演,前四名演员,类型和评分,以及能够反映电影热度的电影打分人数和短评数,并创造性的利用百度指数的相关数据来衡量电影主创人员的热度,以此来量化主创人员热度对电影热度的影响。神经网络的输入部分共有包括导演平均搜索指数,导演最大搜索指数,四名主要演员平均搜索指数,前四名主要演员最大搜索指数,电影类型,电影经模糊化的豆瓣评分,以及该导演前一部作品的电影打分人数和短评数等共计20维度的向量,输出项包括该电影的打分人数和短评数。 利用并行运算加速对神经网络前后进行了上百万次训练,模型最终实现了利用电影上映前半年的数据预测电影上映后热度(评分人数和短评数),并将预测相对误差控制在85%。对2017年1月上映的四部人气电影(功夫瑜伽、大闹天竺、乘风破浪、西游伏妖篇)进行预测,更是将误差控制在55%。为电影投资前的决策提供了参考。