基于用户评论情感分析的电影票房预测研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:tt77uu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电影作为娱乐服务业的重要领域,丰富了人们的生活,为人们提供高质量的精神食量的同时,也逐步成为了我国经济市场中的一个重要部分。然而我国电影行业起步晚,发展慢,国内市场的营销机制并不完善,对电影票房进行预测可以帮助影院提前布局,增加票房收入,因此论文研究如何利用影评预测电影票房。本文主要内容如下:(1)本文从电影票房影响因子的研究和电影票房预测模型的研究两个方面,详细地介绍了电影票房预测的国内外的发展,并介绍了现在主流的电影票房预测方法。(2)针对CHI算法可能会产生多余无关特征问题,本文提出了一种CHI-SVD的特征提取算法,该算法在CHI提取出的特征的基础上用SVD算法进行降维处理,从而能够保留原始特征的基础上再降维处理,能够有效地减少时间成本。通过实验发现,CHI-SVD算法性能比CHI算法要好。(3)为了提高情感词典的质量,从而更好的进行情感分类,本文将基于情感词典和基于统计信息的情感分类方法相结合,减小情感分类会被情感词典构造所影响带来的缺点,从而使得情感分类的效果更好。(4)为了进一步对电影票房进行准确预测,本文提出了一种融合SVR和多元线性回归算法的随机森林回归算法,并将情感特征和观众对于电影的评分相结合,引入到本文提出的随机森林算法中。此外,本文还将电影相较于同类型其他电影用户喜欢程度的排名相结合代替难以量化的电影类型特征,引入到本文提出的随机森林算法中。通过实验验证了该随机森林回归算法的有效性。
其他文献
对嗜麦芽假单胞菌P2菌株的质粒pSH1进行了限制酶切分析,确定了Bg1 Ⅱ,EcoR Ⅰ,Pst Ⅰ,Xba Ⅰ,BamH Ⅰ,Bgl Ⅰ,及Pvu Ⅱ共7种限制性内切酶在pSH1,质粒上的切割位点,前4种酶均为单一切点,后3种依次为2,7,5个切点。通过双酶切
著作权集体管理组织最初是作者为保有自行支配作品的权利并从中获得经济利益而自发成立的维权组织,至今发展已有两百余年。纵观集体管理组织的发展历程,从帮助作者进行维权诉
随着基因组时代到来,涌现出海量基因数据,仅依靠传统过量表达、RNA干扰(RNAi)等手段难以满足大量基因功能分析的需求。依赖于微生物的CRISPR/Cas系统依靠其操作简便、基因编
作为政府管理的一种方法,行政审批在我国的发展中发挥了重要作用。随着中国社会经济发展的步伐不断加快,当前的行政审批方式已经与社会经济发展的势头不相匹配,改革迫在眉睫
近年来,信息技术的飞速发展将多模态交际推向了新的高度,不同体裁的多模态文本成为语言学研究的热点。以往从系统功能语言学视角和认知语言学视角出发的多模态转喻和隐喻研究
常德市星火计划继1993年3月下旬在该市举办的全国星火计划成果展销洽谈会之后,取得长足进步。不久前,又编制出《常德市1996~2010年星火科技发展规划》。该《规划》介绍了该市
本刊讯10月15日,我校召开了全省电大分校校长座谈会。10个地市分校的校领导参加了会议。会议由省校党委副书记、校长王振龙主持。座谈会就全省电大系统建设、当前我校在管理中
近几年中国在线旅游市场发展迅速,旅游产品由于其无形性、生产和消费的同时性等特点,使旅游业和信息通信技术可以很好地结合,旅游业被认为非常适合发展电子商务。在线旅游购
党的十八大以来,我国始终蹄疾步稳地深化全面改革,逐步破除各方面体制机制弊端对经济社会发展的桎梏,取得了重大突破和突出成绩。其中,政府职能转变作为贯穿改革整体的关键内
随着科学技术的进步,我国越来越和国际社会融为一体,汉语言文学作为我国传统的文化,越来越受到国际友人的喜爱。那么全球化背景下汉语言文学会怎么发展呢?本文就具体实例谈谈