豆瓣电影评分预测研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:xblxr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电影起源于19世纪的欧美国家,经过多年的发展,电影已经成为了人们日常娱乐生活中的一部分,不仅丰富了人们的精神世界,更是加深了国际之间的交流。随着互联网时代的到来,电影评分网站也开始快速的发展,电影口碑开始慢慢成为观众是否到院线购票观影的依据。电影评分与票房之间存在着较强的相关性,且关于电影评分的预测,学者们开始引入了较为智能的机器学习算法,因此,有关电影评分的预测具有较高的研究价值。国内最具权威的电影评分网站为豆瓣电影网,该网站基本能代表国内观众对于电影的态度和喜好程度。因此,本文的研究对象为豆瓣电影评分。本文选取2000年1月1日到2019年4月25日上映的电影,利用python软件爬取电影的相关信息,筛选出评论大于1000条的数据。对数据进行处理后,构建演员合作网络,分析演员合作现状,比较不同地区的演员合作网络结构,将由合作网络衍生出的指标作为量化演员变量的依据。再对其余特征进行筛选和处理,并对这些特征与电影评分之间的关系进行初步的探索。再使用梯度渐近回归树对电影评分进行预测,并将其预测结果与使用其他方法预测的结果进行对比。最后,将是否考虑演员合作效应的模型预测结果进行对比,验证演员合作网对于电影评分的预测是否有影响。研究结果表明,整个演员合作网络呈现出低密度、高连通的特征,且具有小世界效应,演员之间的合作还有很大的空间;相比其他地区,中国电影业的演员与周围演员联系更紧密一些,尽管越来越多的港台演员开始往大陆发展,中国电影业的佳片还是不多;使用梯度渐近回归树对电影评分进行预测,要优于决策树、支持向量回归机以及随机森林;在对电影评分进行预测时,将演员合作效应纳入模型,有助于提高模型的预测精度。针对研究结果,本文提出以下三点建议。第一,演员应注重提高自身业务能力,把演员当成一个职业,而不是当成获取名利的手段。第二,电影投资方在进行投资决策时,可以利用梯度渐近回归树对电影评分进行预测,同时在预测时考虑演员合作的效应。第三,电影制片方在制作电影时,需要注重演员的演技、演员之间合作的默契、剧本的内容以及电影的类型。
其他文献
背景:先天性心脏病是最常见的先天性畸形之一,发病率在足月活产婴儿中高达6‰-8‰。圆锥动脉干畸形(Conotruncal Heart Defects,CTD)是一类由心脏流出道发育异常所导致的复杂先天性心脏病的总称,在非综合征型先天性心脏病中占25-30%,目前对其致病基因仍知之甚少。Notch信号通路在胚胎心脏流出道的发育过程中起重要作用,该通路上关键基因NOTCH1、NOTCH2和JAG1的变
学位
目的探讨儿童视网膜母细胞瘤的临床及MRI表现,优化眼眶扫描的序列参数,提高对视网膜细胞瘤的诊断水平。方法回顾性分析新华医院近五年392例经病理或临床诊断为视网膜母细胞瘤的临床资料,并对其中170例应用3.0T MRI检查患者进行影像分析。结果392例中,男216例,女176例,发病年龄20.5±16.3个月(1天~108个月),3岁以内占86.0%,5岁以内占98.0%;双眼发病91例(23.2%
学位
【背景】环境内分泌干扰物(Environmental endocrine disrupting chemicals,EDCs)三氯生(Triclosan,TCS)和双酚A(Bisphenol A,BPA),作为广谱抗菌剂、防腐剂以及塑料制品添加剂,广泛添加于日化用品中。越来越多的证据表明环境内分泌干扰物可对性激素产生干扰作用,并影响女性生殖健康。颗粒细胞是卵巢的主要功能细胞,可分泌性激素及多种调节
学位
研究背景与目的:视网膜色素上皮细胞转分化为肌成纤维细胞是增殖性玻璃体视网膜病变发生与发展中的一个核心事件。N-乙酰半胱氨酸(N-acetylcysteine,NAC)能够通过抑制TGF-β1诱导的细胞内活性氧的产生和MAPK蛋白的磷酸化进而抑制多种细胞向肌成纤维细胞的转分化,但是NAC对TGF-β1诱导的人视网膜色素上皮细胞系ARPE-19细胞向肌成纤维细胞转分化的影响及其潜在的分子机制尚不清楚。
学位
冠状动脉疾病的基因治疗是临床医学研究的热点,而mi RNA是很有临床应用前景的一类基因。研究发现:mi RNA-1在心肌缺血性损伤中发挥重要的调控作用,mi RNA-1抑制剂在体外可有效减少心肌细胞凋亡。但由于其在体内的稳定性差且无心肌靶向性,极大地限制了疗效,近年新兴的纳米载体有望解决mi RNA-1抑制剂在体内治疗中存在的问题。研究表明,血管紧张素II受体1(angiotensin II ty
学位
研究目的:阿帕替尼(Apatinib)是具有抗血管生成作用的小分子靶向药物,它虽然可以明显改善胃癌晚期患者生存期,但其作用相关的并发症可能限制Apatinib更好的应用于晚期胃癌的治疗。纳米载药系统具有生物安全性、靶向性、缓释性等特点,可用来改善Apatinib的剂型。本研究旨在合成单甲醚聚乙二醇嵌段聚己内酯载Apatinib纳米胶束,研究其特点并通过体外实验研究评价该载Apatinib纳米胶束对
学位
目的探讨体外受精(in vitro fertilization,IVF)/卵细胞胞浆单精子注射(intracytoplasmic sperm injection,ICSI)及冷冻胚胎移植周期(frozen-thawed embryo transfer,FET)中胚胎发育日龄与异位妊娠发生的关系。方法回顾性分析2003年3月~2015年5月期间于上海交通大学医学院附属第九人民医院辅助生殖科接受IVF
学位
先天性甲减(CH)是新生儿内分泌代谢最常见的遗传性疾病,患儿出生后若不及时治疗,将会导致智力障碍及身材矮小。目前,尽管有一些基因被报道与CH有关,但对其致病基因进行系统全面的筛查研究还是很有限。本课题组前期收集了91例CH患者的血样及临床资料,通过查阅文献找出了21个与CH有关的致病基因并采用靶向二代测序的方法在91例患者中对这21个基因进行二代测序,然后进行一代验证并构建三联家系,以此阐明中国人
学位
目的筛选呼吸道合胞病毒(RSV)诱发哮喘中差异表达的长链非编码RNA(lnc RNAs)并研究其相关机制。方法设立HDC-BEAS+RSV组、HDC-RSV组和HDC-CONTROL组三个实验组,使用人类全转录组芯片Affymetrix Human Transcriptome Array 2.0对树突状细胞(DCs)总RNA进行检测,对表达差异的基因和lnc RNAs进行聚类分析和功能分析。挑选6
学位
目的制备培美曲塞脂质体,作用于乳腺癌细胞以及裸鼠荷瘤模型,初步探讨其逆转ATP-binding cassette sub-family C,member 5(ABCC5)介导的乳腺癌耐药影响。方法应用薄膜分散法制备培美曲塞脂质体,测量其特性。应用激光共聚焦显微镜,分别观察MCF-7细胞对培美曲塞以及培美曲塞脂质体的摄取能力;用细胞计数试剂-8(Cell Counting Kit-8,CCK-8)、
学位