基于用户复购行为的个性化电影推荐算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:wpaghq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,推荐系统因为其给用户带来的便捷性,而越来越受到研究人员的关注。但是现存的推荐算法,在提取数据特征,特征向量编码等方面存在着诸多问。针对以上若干问,本文广泛参考了当前主流推荐算法,并分析他们的优势和不足,分别利用逻辑回归提出了一种融合用户偏好的协同过滤算法,一种深度学习神经网络与Adaboost相结合的推荐算法,用于实现不同类型数据集的推荐功能。本文主要研究内容如下:(1)针对传统协同过滤存在的隐藏特征利用不足的问,本文提取了用户对相同类别项目的评分次数作为特征。使用用户的历史评分信息构建基于皮尔逊相似度的用户相似度,使用用户特征向量构造关于用户属性的余弦相似度,最后将两种相似度进行混合。此外,本文使用对类别的平均评分降低计算皮尔逊相似度时使用的评分矩阵的稀疏性;提出特征缩小指数降低特定列对用户特征相似度的影响;提出基于杰卡德的动态相似度混合代替线性相似度混合;最后,使用逻辑回归对用户的项目偏好倾向作出预测,使用评分放大指数来对模型预测出的评分进行分数修正。(2)针对大数据量的数据集,本文选择使用深度神经网络进行数据拟合。但是神经网络具有对大数据集的良好拟合能力的同时,也具有不稳定性,如有可能造成局部最优解等。Adaboost可以将若干个弱学习器通过一定的方式组合起来,最终形成一个性能良好的强学习器,提升预测的准确度。针对神经网络的缺点,本文将深度神经网络与Adaboost结合起来,将深度神经网络作为Adaboost的基学习器。既可以发挥Adaboost的优点,也可以避免深度神经网络训练不稳定的缺点。针对项目类别特征向量稀疏性过的问,本文使用词向量对类别特征编码进行优化,使用一个单独的神经网络将项目类别编码转换为稠密向量,然后输入Adaboost的神经网络之中,有效降低了向量的稀疏性。针对激励函数tanh存在的梯度弥散问,本文使用Leaky Relu函数对其进行优化,既可以实现非线性的要求,又可以实现梯度的微小更新。将所提的两种推荐算法与几种效果良好的算法进行对比实,对实的结果进行分析,结果显示基于用户复购行为的协同过滤推荐算法的平均绝对误差约为0.705,与原始的基于用户的协同过滤算法相比,误差降低了约1.4%,而基于神经网络的Adaboost推荐算法的误差降低到0.686左右,明显优于其他算法,也验证了所提推荐算法的优越性。
其他文献
在当今的信息战争中,电子对抗越来越重要,其中最关键的环节就是电子侦察,它是电子战攻击和防御中的基石。在电子侦察中,雷达信号分选至关重要,是整个雷达侦察系统发挥作用的先决条件和保证。随着雷达通讯技术的发展,雷达的种类变多和雷达信号干扰和抗干扰技术的进步,导致雷达侦察系统所在的电磁环境日益繁杂。如何从稠密的雷达脉冲流中分选出不同雷达信号源的脉冲信号成为电子侦察领域备受关注的技术问题。雷达信号包含多种参
学位
<正>在解决大量就业岗位的同时,新就业形态也面临着一个异常复杂却又非常重要的议题——社会保险。7月13日,全国首份外卖平台企业全网集体合同在上海签订,共覆盖全国1.1万个配送站点、超过300万名外卖骑手。随着平台经济的发展,新就业形态劳动群体极速扩充。根据全国总工会的最新调查,这些与平台密切绑定的新就业形态劳动者已达8400万人。
期刊
研学旅行是当下很受欢迎的旅游业态,是乡村振兴需要的产业支撑和文化支撑。永州市文化底蕴深厚,非遗资源丰富,禀赋优异。但将非遗资源转化为经济优势还不够,非遗研学旅行发展不足,对乡村振兴的贡献不多。基于RMP理论梳理永州非遗研学旅行发展的现状,对非遗研学旅行产业发展认识不够、非物质文化遗产资源保护传承不力、非遗研学旅行产品内容设计和市场推广不足、非遗研学旅行评价和保障机制不完善、非遗研学旅行社区居民参与
期刊
目的:研究分析彩色多普勒超声诊断脑血管病患者颈动脉硬化的效果。方法:选择2018年12月~2019年12月本院收治的脑血管病颈动脉硬化患者50例作为观察组,同期选择到本院健康体检且结果没有脑血管病颈动脉硬化的志愿者50例作为对照组。同时给予100例研究对象彩色多普勒超声诊断,分析两组研究对象的颈动脉内膜中层厚度以及颈动脉硬化斑块情况,判断彩色多普勒超声诊断在临床中的使用价值。结果:观察组患者的左颈
期刊
当前,各高校不断创新文化育人方式,从文化自觉视野下重新认识高校文化育人的内涵,积极探索高校文化育人的实施路径。在新形势下,高校文化育人要为培育社会主义核心价值观服务,以立德树人为目标,从发扬大学精神、树立文化品牌、加强新媒体建设三个方面加快推进。
期刊
互联网中时时刻刻产生了海量的数据,其中产生的大部分是文本数据,具备丰富的信息。使用深度学习技术对文本数据进行挖掘、对文本中蕴含的情感进行预测和分析具有显著的商业价值和社会价值。细粒度情感分析是情感分析领域中的一个重要分支,在细粒度情感分析研究中,一条文本评论中包含多个评价对象(也称为方面),对不同方面进行情感极性的预测,可以形成对文本评论数据更精准、多维度的认知,应用前景广阔。准确判断句子中不同方
学位
遥感技术因其观测范围广、可周期重访且不受国界限制等特点,已成为对国内外重点关注地区进行常态化监控的重要手段。舰船作为海上重要运输载体与特殊军事力量,在促进经济发展、维护国家权益等方面发挥着非常重要的作用。利用遥感技术特有优势,对舰船目标开展检测识别与运动监测,无论是在渔业管理、航运安全、失事救援等民用方面,还是在监视敌方舰船兵力部署、掌握舰艇编队动态、评估战时海上毁伤效果等军事方面,均有着重要的现
学位
近年来,生物医学领域的大量研究成果推动着该领域飞速发展,与此同时,生物医学领域文献的数量也以惊人的速度增长。作为展示专家科研成果的重要途径,文献中蕴藏着许多有价值的生物医学知识。帮助科研人员从繁杂的非结构化文本中有效获取需要的信息,对于构建生物医学FAQ库,辅助科研人员的后续研究工作具有广泛的应用价值。传统解决问答任务的检索匹配方式存在无法捕获段落的上下文语义信息、领域适应性欠佳等缺点,不适用于科
学位
在医疗大数据的时代中,癌症无疑是最令人沉重的疾病之一,它带给社会巨大的负担和伤痛,但是癌症病理的成因机制仍然未知,所幸的是大数据时代积累了大量的基因表达数据。但是这些数据普遍存在着存在着高维小样本的特点,过高的维度在增加了计算复杂度的同时也影响着机器学习算法的性能,继而导致维数灾难,样本数过少则容易引发过拟合和样本不均衡分布的问题。研究表明,在基因组中往往只有一部分的基因亚群在总体表达水平上发挥了
学位
要实施全民健身计划,就要使所有小学高年级女生都可以达到包含体育在内的全面发展的要求,小学体育教学工作者,就一定要帮小学高年级女生扫清心理障碍。针对女生的心理和生理特点改进教学手法,提高小学高年级女生学习的积极性。根据小学高年级女生现实情况,尽可能采用形式多样的教学方法,让课堂灵活生动。
期刊