论文部分内容阅读
随着互联网中视频资源量的快速增长,信息过载问题日益突出,虽然各大视频门户会利用视频特征与用户数据特征向用户推荐视频,但仍存在以下两个问题:第一,缺乏完备且规范的视频语义特征标引标准,且常用的特征自动提取算法对视频的语义特征提取不够充分,导致视频推荐效果不佳;第二,传统单一的视频推荐算法难以结合视频特征和用户特征,虽然深度学习算法可以部分解决该问题,但是在分析上述两种特征的隐式关系方面仍存不足。针对上述问题,本文借助具有丰富语义特征的统一内容标签(Uniform Content Label,UCL),对视频UCL自动标引及智能化推荐技术进行研究,提出基于特征灵活采样与注意力机制的视频UCL自动标引方法AUIMV-FFSA(Automatic UCL Indexing Method for Video based on Flexible Feature Sampling and Attention mechanism)和基于自注意力机制与模型融合的视频推荐算法RAV-SAMF(Recommendation Algorithm for Video based on Self-Attention mechanism and Model Fusion),在此基础上,设计视频自动UCL标引及智能化推荐系统,对本文所提的AUIMV-FSSA方法及RAV-SAMF算法进行验证。本文主要研究工作如下:1)针对视频推荐系统存在视频语义特征提取不充分、缺乏规范化标引的问题,提出一种基于FSSA的视频UCL自动标引方法AUIMV-FSSA。首先,将注意力机制引入至视频语言描述模型SV2T(Sequence to Sequence-Video to Text)的各个模块中,利用低层语义特征之间的余弦相似度灵活采样的视频特征,优化SV2T模型的输入,生成SV2TFFSA(Sequence to Sequence-Video to Text based on FFSA)模型;随后结合语音自然语言描述特征与SV2T-FFSA模型生成的视频自然语言描述特征,生成视频关键词高层语义特征;最后,利用UCL对视频视觉特征及上述方法提取的视频语义特征进行标引。2)针对目前视频推荐算法不能有效发掘视频语义特征及用户特征间隐式关系的问题,本文提出一种基于SAMF的视频推荐算法RAV-SAMF。首先,提取视频UCL中的视频语义特征,并对视频语义特征和用户特征进行预处理;随后,将自注意力机制引入到传统的多层感知机模型(Multi-Layer Perception,MLP)中,生成新的模型MLPSA(MLP based on SA),利用该模型分析特征之间的隐式关系;最后,融合MLPSA模型与xgboost模型,生成新的模型XGB-MLPSA,利用该模型预测用户对视频的评分与喜恶,提高视频推荐算法的精确率与召回率。3)基于上述方法,本文设计视频UCL自动标引及智能化推荐原型系统,并通过实验对本文所提的AUIMV-FSSA方法以及RAV-SAMF算法进行验证。实验结果表明,AUIMV-FSSA方法相较于传统的SV2T方法,在视频语言描述的各项指标上均有较大的提高;RAV-SAMF算法相较于其它常用的视频推荐算法具有更高的精确率与召回率,同时验证了UCL在视频推荐算法中的有效性。