论文部分内容阅读
在电影产业迅速发展的同时,大部分电影处于亏损状态且票房收入差异大,给电影投资者投资造成极大风险。电影投资方若能在电影首轮融资时预测电影票房,对保证电影投资方盈利及电影产业的长远发展都有非常重要的意义。以往电影票房预测研究集中于电影即将上映或电影上映后,未发现对电影首轮融资时影响因素的研究。将电影首轮融资时与电影即将上映、电影上映后对比发现,首轮融资时可获得的电影票房影响因素更少,无法精确预测电影票房,因此,可用机器学习方法进行分类预测。BP_Adaboost算法是常用的分类预测方法,其广泛适用于医疗诊断、环境检测、故障诊断等各领域的预测中,但还未运用于电影票房分类预测。BP神经网络有着学习效率低、收敛速度慢及易陷入局部最优值等不足,BP神经网络也是BP_Adaboost算法的弱分类器,亦存在上述问题。针对上述不足,本文主要研究三个问题,探究电影首轮融资时票房影响因素,提出BP_Adaboost算法的三种改进算法,进行首轮融资时总票房分类预测研究并找出最优方法用于首轮融资时总票房分类预测。具体进行了如下工作。首先,探究BP_Adaboost算法在首轮融资时总票房分类预测的适用性。探究电影首轮融资时电影票房的影响因素,构建并验证基于BP_Adaboost算法的电影首轮融资时总票房的分类预测方法。然后,提出三种BP_Adaboost改进算法,用思维进化算法(MEA)、列文伯格-马夸尔特法(LM算法)和两种算法相结合等三种算法改进BP_Adaboost算法。之后将改进算法应用于首轮融资时的总票房分类预测中,用电影样本数据集验证三种改进算法的有效性,并对比得到电影首轮融资时总票房分类预测的最优预测方法。最后,比较改进BP_Adaboost算法与其他算法的整体性能,将BP、BP_Adaboost、MEA-BP、LM-BP、MEA-LM-BP、MEA-BP_Adaboost、LM-BP_Adaboost、MEA-LM-BP_Adaboost等8种预测模型在模型准确率、模型稳定性、模型K折交叉验证等三个方面进行比较。结果显示,BP_Adaboost算法可用于电影首轮融资时的电影总票房分类预测,得到了电影制片方、主创方、发行方、剧本等四类影响因素下的共11个变量,将此11个变量作为输入变量,将电影总票房分类成四个等级,将分类值作为输出变量。经MEA、LM算法、结合MEA和LM算法改进的BP_Adaboost算法预测准确率均得到提升,证明三种改进算法均有效。其中结合MEA和LM算法的BP_Adaboost算法的总票房分类准确率可达73.3%,可用作首轮融资时总票房分类预测方法。将8种预测模型进行整体性能比较,比较结果发现本文提出的结合MEA和LM算法改进的BP_Adaboost算法模型的整体性能最好。另外,LM算法对提高模型预测准确率的效果好,MEA有提高模型稳定性的作用。