基于度量分解和深度学习的推荐系统的研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xinwei313624094
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息技术的不断向前发展,人们所要面对和处理的数据信息也日益增多,大量且繁杂的信息阻挠了有效信息的传递,在互联网中找到自己感兴趣的内容宛如大海捞针。对于用户和商家而言,推荐系统可以有效地将物品和用户的信息关联在一起,从而实现高效的推送,创造价值。传统的协同过滤算法中所采用的矩阵分解方式在构建用户物品交互矩阵上存在一定的局限性,导致算法限制了矩阵分解的表现力。本文通过采用度量分解与深度学习相结合的方式构建推荐系统的离线算法模块,主要对不同种类的场景下的用户物品评论数据集进行数据处理。通过设计实验探究不同数据下该方案相对于传统算法在推荐指标上的提升,以及度量分解算法与深度学习推荐算法相结合的可能性。本文以Amazon评论数据为主要场景对推荐方案进行研究和实验,分别根据不同类型数据下用户和物品的关系以及对应的评论、评分等信息对数据进行处理和研究。本论文的工作如下:1.在推荐系统的离线算法模块构建过程中,许多经典的推荐算法采用了矩阵分解和度量空间学习的方式。在推荐过程中处理用户和物品之间的交互关系,但是这两种方法或多或少都存在一些缺陷。本文在以基于内容推荐的深度学习模型基础上,探讨和研究度量分解方式与基于内容推荐模型结合的可能性。2.使用度量分解的方式对基于内容大的推荐模型进行改进,提出了一种基于度量分解的深度学习推荐改进方案,解决了原有模型在矩阵分解在推荐过程中存在的局限性。3.在原有模型中损失函数中引入了置信机制进行修改和优化,通过该机制为不同数据分配不同的权重,从而可以通过调整参数在不同的数据集上获得相对较好的推荐效果。4.对数据进行相关处理,对用户和物品所具有的评论信息进行筛选,将评论信息通过过滤和分词后进行数字化和索引构建操作,为后续模型的处理和推荐平台的构建做准备。对Amazon评论数据集进行下载、收集和处理,为模型的实验和后续推荐展示平台的构建提供数据来源。5.推荐系统展示平台:设计并实现基于度量分解的推荐系统展示平台,通过推荐计算模块结合处理后的数据对用户与物品之间的评分进行训练和计算预测,将推荐结果通过前端界面展示给用户。最后,在Amazon Instant、Amazon automotive和Amazon Video Games三个用户物品评论数据集的推荐指标中改进模型都取得了提升,其中MSE指标相比较于其他推荐模型至少取得了2.1%、1.2%和5.4%的提升,证明了本文提出的改进方案的有效性。并且在Amazon Instant和Amazon Automotive两个评论数据上使用不同的置信值进行实验,通过MSE指标的变化证明了置信机制在评论数据上的有效性。
其他文献
推荐技术可以发掘用户感兴趣的商品,已经被应用到了互联网的各个领域。一般的推荐系统,通常基于用户的完整个人信息和历史行为做出推荐决策。但在某些情况下,用户的登录和访问是匿名的,其个人信息和长期配置文件往往不能直接获取,并且用户的兴趣又是动态变化的,具有较强的即时性,因此,需要考虑基于用户当前正在进行的会话(Session,又称匿名会话)做出推荐决策,即会话推荐(Session-based Recom
同步理论的起源来自于17世纪C.Huygens发现的单摆同步现象,在这之后的数百年里,同步现象被大量的学者发展和完善,并在众多领域中展现了其应用价值。近些年来,研究人员在微观尺度下观察到了类似的同步现象。依托量子力学的独特性质,使经典同步理论很难准确的描述和分析量子系统的同步现象。所以,量子同步理论成为了一个新的研究热点。量子同步理论作为量子力学、信息学与控制论的交叉学科,其主要研究目标使给出量子
建立可以与人类进行自然交流的智能聊天机器人一直是人工智能领域的巨大挑战。特别是开放域对话系统长期受到语料库和建模方法的限制,难以实现没有任何场景及话题约束的自由聊天。随着深度学习与大数据技术的发展,一种基于深度学习的回复生成方法被提出。该方法建立的聊天机器人可以与聊天者就任意感兴趣的话题进行聊天,具有良好的扩展性。然而这种基于深度学习模型的序列到序列的建模方法利用的是最大似然概率来生成回复语句的每
精神分裂症(Schizophrenia,SCZ)是一种具有严重危害性的慢性精神类疾病,可能给个人及家庭甚至社会带来沉重负担。目前,SCZ的病因和发病机制不完全清楚,临床主要依靠医生经验及患者与家属的病情陈述进行诊断与疗效评估,缺乏客观的评判指标。因此,寻找SCZ的客观电生理标志物以改善SCZ诊断及疗效评估,具有重要的临床意义。临床治疗SCZ主要以抗精神分裂症药物为主。本文针对服用氯氮平的SCZ患者
为了实现半实物射频仿真系统中近场效应误差更高效与更高精度的修正,获得三元组单元馈电的精确控制参数。本文系统的分析了已建立的修正流程和相关原理,针对现行方案存在的优化精度有限且计算效率低的问题提出对应的改进思路,从高精度智能反演算法和高效电磁正演建模两方面对修正方案进行了系统的优化设计和验证考察。对于修正方案中初始幅、相参数提取所涉及的反向优化算法,结合坡印廷矢量公式分别研究了基于PSO算法和PSO
无监督域适应(Unsupervised domain adaptation,UDA)是一种通过从有标注的源域里获得知识,并把知识迁移到缺乏标注的目标域上的机器学习方法。现主流域适应研究关注于对齐两个域的特征分布,借此希望在源域训练的分类器能适用于目标域数据。但这些方法通常存在两个缺陷:(1)分类器偏向源域数据:大部分UDA方法只考虑最小化两个域的差异和源域的分类损失,而不对分类器施加其他约束。所以
目前,人们对于情感的表达尤为重视,中老年人喜好看新闻短评,时不时会发表自己的态度和观点;年轻人喜好在微博、知乎等平台分享所见所闻。以及一些短视频社交软件的不断涌现,比如抖音、Vlog等,人们表达情感的欲望更加强烈,情绪在生活中的作用也越来越不容忽视。良好的情绪,能帮助自己更好地完成工作;消极的情绪,对身体机能有一定伤害的同时,甚至还会影响健康人格的形成。随着疫情防控常态化,人们对心理健康的关注度上
社交网络信息传播速度快、范围广、即时性强,吸引海量用户通过社交网络分享社会消息、讨论现实事件。社交网络事件通常是现实事件在网络空间的映射,因此研究社交网络热点事件预测具有重要意义与价值。例如,预测热点事件能够辅助相关部门管控谣言传播,避免社会恐慌,维护公共安全。用户在社交网络发布的信息以文本内容为主,文本与事件热度相关性高,并且相较其它事件相关数据更易获取,是事件预测的重要数据基础。然而文本数据价
机器学习是人工智能研究中的关键技术,在医学健康方面有着广泛的应用前景。心血管疾病(Cardiovascular Diseases,CVD)是目前世界上对人类社会造成严重健康威胁的疾病。采用机器学习方法对CVD风险进行精确地预测,可以有效识别高风险患者及危险因素,及时采取相应的干预措施并帮助医疗机构优化资源分配,具有重要的现实意义。针对CVD风险预测,本文进行了以下几个方面的研究工作:(1)研究了基
随着我国社会智能化进程的不断推进,人工智能被应用到越来越多的领域和应用场景,同时由于自动化识别需求的提升,手写汉字图像的自动化识别成为了当下计算机视觉领域的研究聚焦点。本论文针对手写汉字由于字符疏密不同和连笔交叠导致的检测定位困难问题,完成了基于深度学习的离线手写汉字检测算法的构建;同时由于汉字数量过于庞大,且手写字形复杂多变导致的识别分类困难问题,完成了基于深度学习的离线手写汉字识别算法的构建;