论文部分内容阅读
随着移动互联网时代的到来,人们接触的信息内容无限扩大,渠道无限便利。短视频作为新的媒体形式呈现在用户面前,并且迅速拥有巨大的用户规模。短视频所具有信息呈现维度更高,而且它更加易于人们接受和传播。目前,互联网上出现了海量的短视频信息,这些短视频信息给用户带来了严重的信息过载问题,给短视频运营商、视频编辑也带来了巨大的挑战。因此,短视频的个性化推荐技术成为了当前的热门研究课题。传统的推荐过程往往是利用协同过滤推荐或者是基于内容向用户推荐,但是这些方法存在一定的局限性。短视频的传播很快,它具有很强的时效性与热搜性。传统的推荐方法无法推荐出关注度高、热度高的短视频。为此,本文在提取短视频特征的基础上加入了外部指数特征,提出了基于指数特征的短视频推荐方法。本文主要开展了以下几个方面的研究工作:(1)设计了网络短视频的推荐框架。该推荐框架给出了从短视频日志预处理到特征分析提取再到推荐模型建立的整体推荐流程。(2)分析了短视频的特征,提取了短视频的显性特征和隐性特征。研究了用于短视频推荐的特征构造方法,提出了将短视频自身的特征融合外部指数特征的短视频主题特征构造方法。(3)研究了基于二分类的短视频推荐方法。本文将短视频的推荐抽象为一个二分类问题,采用了三种不同的分类算法实现短视频推荐:因子分解机、梯度迭代决策树和逻辑回归。本文首先详细阐述了三种不同的分类算法的短视频推荐方法,然后通过实验验证了不同分类算法在短视频推荐中的性能。本文的实验数据来自国内知名聚合视频——百度视频的日志数据,在此基础上进行了实验与对比分析。首先验证了本文使用的三种分类算法的推荐性能,实验表明因子分解机的性能表现最好。其次实验验证本文所提出的短视频的显性特征、隐性特征和指数特征都是有效特征。并且,融合了指数特征的短视频主题特征提升的效果最大。最后本文还给出了利用LDA构建主题特征时,选取主题数目的实验。