基于监督学习的多样化推荐算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:juyexia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着大数据时代和移动互联网时代的来临,人们之间的交流更加频繁,关系更加紧密,信息匮乏的时代一去不返,信息过载的时代接踵而来。电子商务网站出现"井喷式爆发",人们的购物和生活方式发生了翻天覆地的变化。在这样的网络时代,传统的搜索算法不能为用户提供个性化的搜索列表,用户和市场的需求无法完全得到满足。因此,推荐系统作为一种个性化搜索工具应运而生,用于帮助用户对购物做出选择。推荐系统根据用户以往的查询历史、交易记录、用户资料或产品内容等信息,帮助用户对物品进行筛选、过滤,选择消费者最可能感兴趣的产品作为返回结果。这种方式一方面缩短了系统运行的时间,另一方面大大提高了用户获取信息的效率。当前的个性化推荐系统和相应算法更多地把目光投向于提高推荐系统的精确度,然而单纯考虑精确度的推荐算法往往将更多的流行物品推荐给用户,使得推荐列表变得单调,用户的视野变得狭窄,不能得到有价值的推荐信息。因此,推荐系统多样性作为推荐列表中物品丰富程度的代表,相关的研究越来越受到广泛的重视。提高推荐系统的多样性可以带来双赢的效果:一方面,依靠推荐系统的帮助,用户可以开拓视野,发现对自己有价值的商品;另一方面,商家企业可以利用推荐系统增加冷门商品的销售额并提升用户的满意程度,从而培养客户的忠诚度。现有的算法大多利用特定的多样性评价指标,采用启发式策略对物品进行重新排序,从而得到新的推荐列表。首先根据传统的基于精确度的算法选择一个用户偏爱的物品集合,然后通过最大化选定的多样性指标产生前k个物品的推荐列表。然而这些算法将推荐系统的精确度和多样性分成独立的两部分考虑,分别优化精确度和多样性两个目标函数造成问题求解效率下降,并不能很好的定义和解决监督学习问题。为了解决上述问题,本文利用监督学习方法在保证精确度的前提下研究推荐系统多样性的问题。其主要贡献有以下三个方面:(1)本文基于监督学习方法探究一个在保证精确度的前提下提高推荐系统多样性的算法。随后定义了一对耦合的优化问题:参数化矩阵分解问题和结构化支持向量机学习问题。(2)本文提出多样化协同过滤算法用以解决上述耦合问题,其中,结构化支持向量机学习得到一个推荐模型,用来生成每个用户的推荐列表。在模型学习的过程中,参数化矩阵分解算法贯穿在每一步优化过程中,用来生成最适合结构化支持向量机的用户和物品的潜在向量表示。(3)本文提出了新的基于集合的评价推荐系统精确度和多样性的测度:成对精确度和归一化主题覆盖多样性,并分别验证了新评价指标与基于排序的精确度和多样性评价指标之间的一致性。最后本文在不同数据集上进行大量重复的实验,通过分析实验结果来验证本文提出的算法在不同评价指标上的有效性并进行显著性检测。
其他文献
在互联网高度发达的今天,信息技术渗透到了日常生活中的点点滴滴,互联网上几乎拥有人们所需要的全部信息。对于如何在海量的互联网信息中找到不同个体、单位所需要的知识提出了
基于摄像头的视线估计技术作为人机交互领域的一个重要分支被广泛的应用于各个领域。目前,大多数视线估计技术采用瞳孔角膜反射向量法,使用时需要额外的辅助光源,并且用户在
无线传感器网络的数据溯源是对数据包从源节点经多个转发节点最终传至基站的完整传输路径的记录、追溯与展示。为保证传输路径的可溯源性,现有的无线传感器网络数据溯源主要
近年来,无线传感器网络逐渐成为一个热门的研究领域。它的发展主要得益于无线通信技术和传感技术的发展。无线传感器网络是由大量的微传感器组成的,这些传感器节点能自组织地构
随着科技的日益发达,曾经只有电视台才能完成的视频制作因为各类视频剪辑工具的产生而变得简单且易于使用。从有人使用基于PC的视频剪辑工具开始,到基于Web的在线编辑工具的
随着信息技术的飞速发展以及各种数字技术的普及,用户对数据高可靠性、高带宽的要求进一步推动的存储技术的发展。传统磁盘阵列技术在带来高带宽的同时也很好的解决了因磁盘硬
在信息技术飞速发展的今天,企业的信息平台也越来越倚重网络,而Java Web应用系统也逐渐成为企业处理日常业务的中心平台。在Web系统的开发过程中,Web系统的访问控制尤其是Web页
随着半导体制造工艺技术的发展,DRAM与闪存的尺寸已经缩小甚多,但进一步缩小的空间不大,且其存储性能随着密度的提升而受到严重影响。在此背景下,研究开发理想的半导体存储器来解
当前计算机制造工艺的飞速发展以及多核CPU芯片技术的日趋成熟,让我们进入了高速计算的多核时代。同时,在并行计算领域上,也由以往的多机并行慢慢转到多核并行上来,即多核计算的
对图像的识别、理解和处理方法,具有重大的社会应用价值,也是一个极为重要的学术理论热点。识别和理解图像首先需要提取出图像中重要的、人类感兴趣的区域——即图像显著性检