基于随机森林算法的IMDB电影评分预测研究

来源 :现代计算机 | 被引量 : 0次 | 上传用户:peking521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文采用“数据世界”官网的IMDB电影数据集,该数据集涵盖66个国家、跨越100多年的5000多部电影,含有影片时长、导演、票房、成本等28个变量,其中“imdb_score”为响应变量,其它为预测性变量.本文针对上述数据集通过数据分析处理,采用数据挖掘技术中的随机森林算法以及BP神经网络进行评分预测和性能检验.最后,基于最优的随机森林预测模型对15部新电影评分进行预测,预测结果良好.在IMDB电影排行榜中,得分越高(满分10分)则代表影片越精彩,值得观看.本文研究目的是预测精彩有意义的电影,节省时间满足大众观影者的观影需求,同时为电影推荐系统提供可行性建议.
其他文献
在我国经济不断发展的过程中,中小学等基础教育设施和理念也有所改变.目前,缺乏完善的中小学公共接送制度,都是家长接送学生,在上下学的时候校门口与周边人流量、车流量比较大,从而导致出现交通拥堵,造成资源浪费和社会消极影响.通过对中小学接送车辆的需求进行分析,提出校园交通组织管理的对策.
在石料丰富的地区进行公路建设时,为节省成本,往往会采用浆砌片石挡土墙进行支挡防护.与混凝土挡土墙不同,浆砌片石由于是将块石和水泥砂浆砌筑而成,其施工进度及安全控制一般比混凝土挡土墙要难.为保证浆砌片石挡土墙施工质量及安全,在浆砌片石挡土墙施工过程中,应重点对原材料、挡土墙基础基坑开挖及地基处理、挡土墙砌筑、施工质量等四方面进行重点控制.
通过以如何为“十四五”交通运输高质量发展人才提供智力支撑为切入点展开分析,先分析了“十四五”期间国家和社会对高质量发展人才培养的需求,然后再有针对性地从人才选聘标准、人才培养方向、人才培养体系以及人才培养模式等四个层面提出人才培养的策略,期待能够对相关工作人员有所启发.
锚杆是巷道支护的重要组成部分,能够实现围岩加固,提升支护效果,保障工程安全.为了确保锚杆构件在支护过程中不会发生结构破损、变形等不良现象,围绕锚杆构件的相关力学性能进行分析讨论,通过将理论与实验计算进行有机结合,深入研究锚杆构件在受力状态下的应力分布,切实消除影响其结构稳定性的不良因素.
伴随着人工智能、物联网以及通信技术的发展,自动驾驶汽车也被提上日程.传统汽车的测试工具和方法已不能满足自动驾驶技术升级带来全新的测试需求.基于交通场景数字孪生的测试方法在测试效率、测试成本和安全方面具有巨大的优势,是未来自动驾驶测试的重要手段,并成为自动驾驶领域的一个重大研究方向.在调研大量文献的基础上,首先从测试安全的角度,阐述虚拟交通场景对自动驾驶测试的重要性;其次,对数字孪生技术进行综述,主要包括数字孪生的概念介绍、数字孪生技术的主流应用、数字孪生技术与传统仿真的区别;再次,将数字孪生应用于自动驾驶
无线电信号与光信号在水下通信过程中衰减严重,因此,水下主要通过声信号来进行通信.水声网络具有高能耗、高拓扑移动性、低可用带宽等固有特性,这些特点给水下MAC协议的设计带来了一定的挑战.本文对水声网络MAC协议进行综述,介绍水声信道特点与衰减.除此之外,阐述水声网络中存在的隐藏终端、暴露终端等五种问题给MAC协议的设计所带来的困难;分析水声网络MAC协议的分类及相应的优缺点;比较近年来典型水声网络MAC协议的性能.目前有许多优秀MAC协议解决了隐藏终端等问题,但实际水下环境中存在的拓扑移动性和时间同步问题仍
现阶段,我国的居民用车数量持续快速增长,居民对城市道路的需求也与日俱增,我国城市交通还存在很多问题,其设计规划需要更加合理,并需与我国道路交通的可持续发展理念达成高度统一.针对城市道路交通设计中存在的问题进行分析和研究,从而得出有效的问题解决对策.
为研究集料波动对沥青混合料水稳定性的影响,通过浸水马歇尔试验和冻融劈裂试验对沥青混合料的水稳定性进行评价,在此基础上采用灰色关联分析法评价集料的针片状颗粒含量、砂当量、粉尘含量、4.75 mm通过率、2.36 mm通过率和0.075 mm通过率6种因素对沥青混合料水稳定性的灰色关联度及其排序情况的影响.结果 表明,对沥青混合料水稳定性影响最为显著的为4.75 mm通过率,其余依次为2.36 mm通过率、砂当量、0.075mm通过率、粉尘含量和针片状颗粒含量.
道路交通的规划建设在城市规划中至关重要,从广州西华路与东华路的建设历史切入,通过西华路和东华路的变迁,探析西关和东山的发展历史及其繁盛兴衰的原因,由此挖掘道路交通规划与城市发展的关系.
针对配对交易策略目前存在的套利空间小、投资收益低等问题,本文基于强化学习算法构建配对交易策略,并以2010-2016年期间美国公共事业股的收盘价作为研究对象,验证配对交易策略的投资绩效.研究结果表明,相较于传统的配对交易策略,基于强化学习算法的配对交易策略避免了经验参数对于交易结果的不利影响,可以更好的捕捉潜在的交易机会,在夏普比率、年化收益率等指标上表现更加优异,因而将强化学习算法引入配对交易当中可以为投资者提供一种有效的套利手段和风控工具.