度量分解推荐算法改进及应用研究

来源 :西安石油大学 | 被引量 : 0次 | 上传用户:cyfzyzclwhzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息的快速增长,用户无法快速获取个人所需的信息,推荐系统的出现,有效的解决了这一问题。推荐算法是推荐系统的核心,研究推荐算法对于提高推荐系统的性能和用户的满意度具有重要的意义。
  度量分解推荐算法的提出,解决了矩阵分解推荐算法因向量点积而导致模型出现次优解的问题,其用欧氏距离代替向量点积的思想,为近几年推荐领域提供了新的研究方向。但是,该算法也会受到用户兴趣随时间变化和冷启动问题的影响,另外其只考虑了单一的评分数据,使得模型无法学习到更多的特征信息。为了提高度量分解算法的推荐准确性,并解决冷启动问题,本文提出了如下的改进策略:
  (1)针对信息单一和用户兴趣漂移的问题。首先本文考虑用户行为信息,挖掘用户行为隐反馈信息对模型本身的影响;其次考虑到用户兴趣会随着时间的改变产生漂移的问题,本文利用艾宾浩斯遗忘曲线拟合用户的兴趣变化趋势,描述用户在不同时段评分的不同比重以解决用户兴趣漂移问题,提出了TFML++算法。在MovieLens数据集上的实验结果表明,TFML++算法相比于其他算法在评分预测任务中的预测准确率有明显的提升。
  (2)针对冷启动问题。本文在使用TFML++算法进行推荐的基础上,首先利用社交正则项和用户信任关系的隐反馈信息对用户位置向量进行约束;其次,通过关联规则构建项目之间相似度的度量方式,挖掘项目之间的关系,并根据相似度为每个项目筛选出Top-K个近邻集合,用正则项对项目的位置向量进行约束,建立了TFMLReg++模型。通过在CiaoDVD数据集上与其他算法的实验比较,验证了改进后的算法能够有效缓解冷启动问题,并具有更高的推荐准确度。
  最后,本文将上述改进之后得到的TFMLReg++算法应用到Yelp提供的餐饮相关数据集的推荐中,实现对用户的个性化推荐。
其他文献
学位
学位
学位
学位
随着人们生活质量和要求的不断提高,对石油和天然气的需求量也不断增加,易于开采和探明的油气藏早已探明或开发,因此需进一步探究蕴含在致密砂岩中的油气藏。苏里格气田处于鄂尔多斯盆地,其产气层主要为致密砂岩。由于地层岩石的微观结构决定着油气藏开采所呈现出的宏观性质,因此对致密砂岩宏观结构的了解和微观结构的研究对地质人员的后续开采气藏有着一定的帮助。本文的主要工作如下:为了将密度聚类算法更好的应用到岩石图像
学位
石油产业是国民经济的支柱产业,对我国经济和社会发展起着重要作用。在石油开采过程中,油井沉没度是衡量油井生产状况的重要指标,其高度直接影响抽油泵的工作效率。当抽油速度与沉没度不匹配时会降低油井生产效率,导致电能浪费。因此,实时掌握油井的沉没度状态,为制定合理的抽油方案提供理论依据,对提升我国油田国际竞争力及可持续发展能力具有重要意义。本文综合利用油井油层渗流特性等因素,构建了反映油层渗流状况的油井沉
学位
聚类是数据挖掘和知识发现中的重要且有用的工具。由于层次聚类算法的运算速度快,输出结果容易解释,已在各种领域中广泛应用。本文针对层次聚类的不同使用场景(静态数据和流数据)对层次聚类算法提出优化改进方法。静态数据层次聚类方法中,应用最广泛是凝聚型层次聚类(AHC)。现有的基于距离度量的AHC方法存在一个关键问题:无论采用何种从树状图提取聚类结果的方法,都难以将具有不同密度的相邻簇分开。本文针对静态层次
学位
石油钻井作业具有高投入、高风险的特点,在作业的各个阶段均存在不同程度的作业风险,严重影响钻井的质量和效率。石油钻井和完井作业是多专业、多技术、多软件综合作业工程体系,多种专业软件数据之间没有实现数据融合互通,制约了数据间综合利用,不能对钻井作业进行更充分的指导。在钻完井数据综合集成的背景下,将地质数据和工程数据综合集成,实现对钻完井数据的统一检索,可以提高用户对数据的有效利用。通过对钻完井作业中潜
学位
油田生产指标预警可以帮助油田工作人员及时发现油田开发过程中生产指标的异常,为后续工作人员调整油田开发方案提供支持,保证油田开发工作的稳定进行。本文建立基于人工神经网络的油田生产指标预警模型和系统,对长庆油田某采油厂油田生产指标数据进行预警分析,有效帮助油田管理人员及时发现并处理警情,减少油田开采过程中因预警不及时带来的损失。本文首先对油田生产指标数据使用KNN算法进行数据填补,采用灰色关联分析方法
学位
随着我国社会经济的飞速发展,能源资源供需矛盾和生态环境恶化问题日益凸显。环境信息的检测对解决这一问题起到了至关重要的作用,而现阶段的环境检测系统仍有应用场景受限、传输距离短、成本过高等问题。本文首先根据对无线传感网的研究结合无线传感网对节点能量的需求,利用蚁群算法对AODV路由进行改进,达到均衡网络能耗的目的,并使用MATLAB对算法进行仿真。然后对现有信息传输方案进行对比,讨论各种方案的优缺点后