基于K-means聚类和BP神经网络的电影票房预测研究

来源 :武汉理工大学 | 被引量 : 6次 | 上传用户:ychhe123yang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国民经济的飞速发展,人民生活水平不断提高,娱乐需求也不断上升。越来越多的观众选择走进电影院感受电影带来的视觉冲击和精神愉悦。国内电影市场因此极速扩张,吸引了越来越多的资本进入这一领域。但是电影作为文化产品,影响票房的不可控因素很多,投资回报率难以估计。因此提前预测一部电影的票房,并帮助电影相关方合理配置资源,降低投资风险具有重要的意义。互联网的飞速发展产生了大量和电影相关的网络数据,用其预测电影票房是票房预测领域结合信息技术领域的一个研究热点,也是本文的研究出发点。首先,文章在分析了国内外大量关于电影票房预测研究的基础上,提出了电影票房预测的基本流程和概念模型,并在此基础上研究了票房预测所需的相关理论与关键技术,包括常用预测模型、数据约简方法、聚类算法、数据获取技术,为之后的研究提供了理论以及技术指导。其次,在分析了票房影响因素以及新浪微博、百度搜索引擎、豆瓣电影网站三个网络平台特征的基础上,依据指标设计原则,建立了包括2个一级指标14个二级指标的票房预测指标体系,并逐个研究了指标的量化方法。再次,在分析了现有人工神经网络票房预测模型存在的问题之后,提出了RST-K-means-BP预测模型。该模型集成使用了BP神经网络、粗糙集理论和聚类分析三种数据处理方法,首先将通过粗糙集约简后的指标作为神经网络输入层节点,然后使用K-means聚类分析将样本数据分类,最后再针对不同的类别分别建立BP神经网络模型进行预测。这种结合删除了冗余属性,简化了神经网络结构,提升了网络的训练速度以及模型的预测精度。最后,文章使用从网络中获取的200条真实数据对RST-K-means-BP预测模型进行了实证分析,实验结果证明了RST-K-means-BP预测模型在预测精度和效率两方面较单一的BP神经网络模型都有了很大程度的提升。同时文章以某部未上映的电影为例,预测其最终票房,并对电影前期运营宣传工作提出了建议。应用实例表明本研究能够为电影相关方提供一定的决策支持,在预测领域具有较好的研究前景和应用价值。
其他文献
目的探讨分析小儿柴桂退热颗粒联合头孢克肟颗粒治疗儿童上呼吸道感染疾病的疗效。方法 200例上呼吸道感染患儿,随机分为观察组和对照组,各100例。两组均给予常规对症治疗,在
帖木儿帝国与奥斯曼帝国在对外扩张中的相互抗衡,旨在争夺小亚细亚的霸权,两国关系的演变,安卡拉战役,对世界历史发展的进程产生了不容忽视的影响。
军队人员生活福利待遇货币化改革必须适应社会主义市场经济的发展和新时期军队建设的要求,以国家收入分配政策和军队后勤保障社会化改革目标为依据,以改善军队人员生活福利待
《绍兴日报》'画里有话'专栏针对社会热点和舆论焦点刊发新闻漫画,以幽默诙谐、主题鲜明、生动形象等特点引导舆论,受到读者的肯定与好评。本文以《绍兴日报》'
<正>1不饱和脂肪酸与饱和脂肪酸的平衡有人早在1963年就已确定,一般不饱和脂肪酸比饱和脂肪酸更易消化吸收(椰子油例外),2者呈明显的线性关系。脂肪的消化率取决于整个日粮中
<正>嘉峪关市小额贷款公司业务开展基本情况截至2013年12月末,嘉峪关市有9家小额贷款公司,注册资本共2.54亿元,共有从业人员110人。小额贷款公司业务运作主要有以下几个特点:
试验旨在研究不同纤维直径的细毛羊皮肤组织中毛囊差异表达的蛋白质,探讨与羊毛细度相关的蛋白质功能。应用双向凝胶电泳技术建立细毛羊皮肤组织中毛囊差异表达蛋白质图谱;运
为了探索抑制素α基因(inhibin-α,INHA)与从江香猪繁殖性状之间的相关性,试验采用特异性聚合酶链式反应(PCR)技术克隆从江香猪INHA基因,测定其核苷酸序列,通过等位基因特异
文章对现行军人退役安置制度存在的问题进行了分析,并提出对策建议。认为,完善我军军人退役安置制度,一要加快军人退役安置工作的法治化步伐;二要建立健全退役军人社会保障制