协同过滤在视频推荐中的应用及优化

来源 :南京大学 | 被引量 : 0次 | 上传用户:west_fox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络传输技术的快速发展以及移动设备的大量普及,视频流量呈现指数级增长。这种视频大数据给我们带来众多机遇,除了传统各类视频门户网站(如优酷、NetFlix),各类自媒体平台也大量涌现(如YouTube,用户同时作为内容消费者和提供者)。推荐系统作为连接视频和用户的桥梁已成为每个视频服务公司的核心竞争力所在。然而如何从视频大数据中挖掘出有效信息以提升个性化服务能力对推荐系统提出新的挑战。协同过滤作为一种与视频内容无关的个性化推荐技术近年来得到学术界和工业界广泛研究,其基本思想就是历史偏好相似的用户其未来偏好依然相似。同时,基于推荐方式的内容无关性,相比基于内容的推荐,其无需耗费人力、物力进行用户信息搜集、视频特征标记等工作。协同过滤推荐精度及求解复杂度作为评估推荐系统的两个性能指标一直为研究的热点。模型精度对于正确刻画用户偏好从而进行精准化的推荐至关重要,而求解复杂度决定了大数据量背景下推荐系统的可实施性及快速上线的能力。就协同过滤而言,其模型精度与复杂度通常是一对矛盾,如何在两者之间取得折中是其所要面临的技术难点。本文在分析现有协同过滤推荐相关工作基础之上,针对隐反馈场景下的视频协同过滤分别从推荐精度以及计算复杂度两个方面展开了相关研究。在提升推荐精度方面,通过对用户偏好随时间动态变化的特征分析,本文提出基于时间信息的视频协同过滤排序模型,从而改进了静态协同过滤模型无法动态刻画用户偏好的局限。在优化计算复杂度方面,本文通过对现有协同过滤排序模型优化目标及相应学习算法的分析,从理论上得出现有学习算法存在无效优化的原因:梯度“抵消”。针对问题形成原因,本文提出了通过改进学习算法的抽样方式以缓解梯度“抵消”造成的学习缓慢。本文的主要工作如下:1.通过分析用户偏好随时间变化的特征,即长期演变,局部稳定,本文提出基于偏好局部相似性稳定的动态协同过滤推荐模型。这一隐式刻画时间的方式不仅提高用户偏好预测精度而且有效控制了模型的计算复杂度。同时,为防止模型发生过拟合,本文提出将贝叶斯个性化排序模型集成到所提时间感知的协同过滤模型之中。基于此集成模型,本文提出两阶段学习的近似求解算法;2.通过分析基于贝叶斯个性化排序的协同过滤模型优化目标及相应的随机梯度下降学习方式,本文推导出此学习算法训练过程中发生梯度“抵消”原因的数学形式。基于此形式,本文提出基于用户分簇视频热门度采样算法以缓解梯度“抵消”引起的无效优化,从而提高了模型学习的效率。
其他文献
聚类分析作为一种无监督学习方法,是机器学习领域重要的研究方向之一,已经成功应用到金融、商业、社交网络、生物信息学等领域。目前存在大量成熟有效的聚类算法,其中基于图
在智能交通系统中,短时交通流预测能有效改善交通拥堵,提高出行效率,具有重要的学术价值和现实意义。针对交通流预测问题,大部分现有模型仅考虑当前预测路段的历史交通流数据
颤振是大跨度悬索桥设计的控制因素之一,如何有效提高大跨度悬索桥颤振稳定性是其抗风设计的重点。影响桥梁结构颤振稳定性的主要因素有桥梁结构体系、加劲梁气动外形和气动
轨迹规划是机器人高性能运行的重要前提和保证。连续轨迹对精度要求较高,现有连续轨迹规划算法计算量大,针对连续轨迹的规划算法仍有待研究和发展。现有最优轨迹规划算法依赖
负虚性质广泛存在于各种工程应用中,吸引了广大控制领域学者的关注。目前对于负虚系统理论的研究局限于负虚系统定义和性质的延伸推广和线性系统稳定性理论部分。在实际场景
在构筑密集的城市修建地下隧道时,隧道穿越毗邻结构对既有结构桩基础的影响是工程人员亟需研究的问题。本文采用室内模型试验和有限元分析方法探究了盾构法隧道掘进对单桩和
近年来,多标签分类技术快速发展,但也面临着很多困难和挑战。首先,多标签分类的输出空间随着标签数量的增大会面临指数级的扩展。大多数研究者尝试挖掘标签之间的关系解决这
本文以新疆老爷庙口岸新区外来从业人员为研究对象,运用民族学、社会学、人类学的有关理论,使用田野调查法、文献研究法、定性分析和定量分析法、个人生活史调查法等研究方法
油浸式变压器是电力系统中不可或缺的重要组成部分,随着电力变压器单台容量和电压等级的升高,对于工程人员,变压器的损耗升高而使得变压器温升超高已经成为难题。而且,因为油
在喷气发动机的发展历程中,通过增大级负荷来减小压气机的级数,从而提高整个发动机的推重比是一个重要的发展方向,随着高负荷压气机的叶尖来流相对马赫数的进一步提高,利用复