【摘 要】
:
在互联网技术和普适计算快速发展的时代,推荐系统因其能够帮助用户做出合适的选择而变得越来越重要。协同过滤是最成功的推荐技术之一,它根据志同道合的用户过去的评级向活跃用户推荐项目。然而,用户-物品评级矩阵(user-item rating matrix),即推荐算法的输入之一,往往是高度稀疏的,因此会导致协同过滤的推荐效果并不理想。同时随着推荐技术的发展,当算法的准确性进一步提高时,用户更多的会接收到
论文部分内容阅读
在互联网技术和普适计算快速发展的时代,推荐系统因其能够帮助用户做出合适的选择而变得越来越重要。协同过滤是最成功的推荐技术之一,它根据志同道合的用户过去的评级向活跃用户推荐项目。然而,用户-物品评级矩阵(user-item rating matrix),即推荐算法的输入之一,往往是高度稀疏的,因此会导致协同过滤的推荐效果并不理想。同时随着推荐技术的发展,当算法的准确性进一步提高时,用户更多的会接收到他们之前感兴趣物品的推荐信息,而失去了接收新推荐信息的机会。针对这两个在推荐过程中的问题进行研究,具体的研究工作和创新点如下:1.使用社交网络来提高推荐的准确性。将个人对不同项目群体的兴趣偏好、用户与用户间的交互关系和项目的增强相似度关系,三者作为约束,提出了一种利用社会交互因子进行个性化推荐的增强混合概率矩阵分解模型,命名为EMPMF(Enhance Mixed-Probability Matrix Factorization)。在本模型中,首先利用项目类别划分社交群体,通过分析用户对不同子社交群体的青睐程度修正社交矩阵,并设计一种新的项目相似度计算方式,最终提出了一种新的概率矩阵分解模型。该模型能够一定程度上能够缓解数据稀疏性导致的推荐精度下降问题。2.通过平衡准确性和新颖性的方式来提升推荐的质量。具体来说,定义了一个概念,意外性(Serendipity),由高满意度和低兴趣进行定量描述。将推荐分为两个阶段。Serendipity预测和个性化的推荐。在第一阶段中,使用多层感知机模型(Muti-Layer Percetron)和矩阵分解算法(Matrix Factorization)分别对推荐结果进行基于新颖性和准确性的预测,第二阶段然后通过加权选择过滤器来获取最终的推荐项目,完成个性化推荐。其次,提出了一个评估推荐结果的新指标,并论证了该指标的合理性。最终,提出一种融合神经网络和矩阵分解的混合推荐模型,该模型能够在保证推荐结果准确性的同时提升推荐的新颖性,从而提升推荐质量。综上所述,通过对社交信息的挖掘和平衡推荐结果的准确性与新颖性两个方面的研究,阐述了推荐系统中的高质量推荐方法。
其他文献
时间序列是将某种统计指标的数值,按时间先后顺序排列所形成的序列。时间序列存在于众多领域之中,对其进行数据挖掘分析也是当今的研究热点之一。在对数据进行聚类,分类和回归等常见的时间序列数据挖掘任务之前,通常都会计算时间序列之间的相似度,计算结果在后续挖掘分析中起到了很大的作用,但时间序列相似性度量方法的设计与具体的应用密切相关。动态时间弯曲算法DTW(Dynamic Time Warping)是时间序
主要回顾正念自我照护和专业生活品质的概念、测量工具和理论机制,介绍安宁疗护从业人员正念自我照护与专业生活品质的研究现状及相关干预方案,在此基础上,对正念自我照护在专业生活品质的研究方向提出展望,以期提高安宁疗护从业人员专业生活品质,为引导其用积极、有效的应对方式面对同情疲劳提供参考。
联盟链,是由多个组织共同管理维护的去中心化的分布式账本。由于记录在链表上的数据具有透明性和不可篡改性等性质,工作节点能够快速验证交易的合法性,同时用户的身份信息和交易细节也被暴露给参与者。环签名作为一种特殊的数字签名,它将签名者的私钥隐藏在公钥列表中,实现匿名签名的效果,适用于对隐私需求较高的多方协作场景。因此,本文基于环签名对联盟链当前存在的用户身份隐私和可监管问题展开相关研究,主要研究工作如下
随着卫星遥感系统的快速发展,遥感图像在灾害预警、森林植被监测、军事探测等方面得到了广泛应用。然而,由于技术的限制,单个传感器无法同时获得具有高分辨率光谱域和空间域的遥感图像。因此,在实际应用中,需将光谱分量和空间分量进行组合处理,通过全色锐化获得高空间分辨率的多光谱图像。近年来深度学习已经被广泛应用于全色锐化任务,并取得了显著的成果。但大多数方法无法有效地寻求图像间的映射关系,亦或缺乏针对整体网络
随着城市信息化进程的加快,路网中传感器逐年增多,交通数据呈现爆炸式增长。但由于建设成本的限制和建设时间的不同,路网中的传感器质量参差不齐,在数据的采集、传输和存储的过程中不可避免的存在数据丢失的问题。高质量的交通数据是智能交通系统(Intelligent Transportation System,ITS)构建的基础,数据的缺失为后续的工作带来极大的挑战,是当今智能交通系统构建及智慧城市发展亟需解
区块链技术因为具有去中心化、安全可靠的特点正在被广泛应用于社会生活的各个领域中。共识算法作为确保区块链系统中各个节点行为达成一致的底层关键技术,其性能直接影响着区块链系统的运行效率。当共识网络中的节点数目增加时,各个节点间的通信量也会增加导致系统的效率降低。为了提升联盟区块链系统的运行效率,本文研究了实用拜占庭容错算法的运行机制并进行了改进,主要研究内容和创新如下:1.针对现有的共识算法没有考虑到
在市场经济下,工业生产企业自负盈亏,各单位管理人员将利润提升问题作为管理工作重心。因此会计工作,就从最单纯的记账、会计核算,提高到为生产企业管理人员提供令人信服的决策数据,该过程涉及了企业的成本管理和产品销售价格。本量利分析方法是企业经营管理会计工作的一个基本方式,一般运用在企业生产经营管理工作决策中。文章以非标机械制造企业为例,首先介绍了本量利分析方法的定义以及包括的重要工作内容,并剖析了它在企
个性化新闻推荐是网络新闻服务的一项重要任务。随着深度学习的发展,以端到端的方式直接从原始数据中学习关于新闻内容和用户兴趣的向量表示逐步成为研究热点。得益于各种有效的表示学习方法,基于神经网络的新闻推荐模型层见叠出,成绩非常出色。然而当焦点集中在如何构造或应用更加先进的神经网络模型时,许多研究忽略了对新闻内容信息的充分探索。经调查,现有方法在学习新闻表示时没有对正文文本进行有效利用,并且在利用主题信
随着信息网络的飞快发展,人们每天通过网络传输着海量的隐私数据,数据传输的安全等问题也随之产生。信息隐藏技术通过隐藏隐私数据的存在,实现隐私数据传输的安全性保护。而文本作为日常生活中信息传输的载体,使用深度学习语言模型,实现文本隐写,对信息隐藏领域的发展具有重大的推动作用。然而现有的文本隐写方法生成的短隐写文本隐藏容量较小、多样性较差、使用场景有限。为了解决文本隐写所存在的问题,本文从多组主题约束和
在房价预测技术研究和应用中,由于房价交易数据获取的不确定性,导致在构建等间隔时序序列时会出现数据缺失问题,而现有的研究并未过多考虑这些缺失问题所带来的影响。同时,现有的研究通过集成学习的方式让预测模型可以提取更多的特征,但都未过多考虑政策和经济因素所带来的影响以及多个模型的训练问题。因此,针对构建时序序列时所出现的数据缺失问题、政策和经济因素的影响以及多个模型的训练问题,本论文提出的解决方案如下: