基于多源数据的视频语义分析与推荐技术研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:zhangtaozheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,网络上出现了越来越多的视频。在科学研究以及商业领域对视频信息的需求也愈发强烈,对于普通用户而言,能快速准确地从海量的视频库中找出感兴趣的视频并不容易,因此,视频推荐成为了一个热门的研究方向。并且,随着越来越多的用户上传自己拍摄的视频,各大视频网站越来越重视这些自创视频。然而,传统的基于协同过滤的推荐系统在面对这些无标签、无文字描述信息的视频时并不能取得很好的效果。所以,本文旨在从视频语义角度出发,通过发掘视频所表达的语义,完成基于视频语义的推荐,并通过结合视频多源异构信息,实现基于多源数据的视频推荐。本文的主要工作概况如下:  本文首先明确了视频语义结构的定义(在本文中,主要研究体育类视频)介绍它们在视频检索以及视频推荐中的重要作用。接着,本文提出了两种视频语义提取方法,第一种是基于监督学习的视频语义提取方法,该方法使用3D卷积神经网络(C3D)提取视频帧的静态语义和连续帧序列的动态语义,然后使用连续时序分类(CTC)算法完成对视频语义的整合,将视频语义提取问题转化为了视频语义序列解码的问题,并通过实验证明该方法提升了3D卷积神经网络在视频语义提取上的准确度。第二种是基于非监督学习的视频语义提取方法,该方法同样使用C3D提取视频帧序列的语义,为了解决C3D-CTC对未标注视频语义提取准确度低的问题,本文使用递归自编码器对C3D提取出的帧语义序列进行压缩整合,得到视频的语义特征,并通过实验证明该方法比基于关键帧语义提取的方法在聚类结果上效果更好。  基于以上两种视频语义提取方法,本文提出了一种基于视频语义相似度的推荐算法,以解决传统协同过滤算法无法解决的冷启动问题。接着,本文研究了视频描述信息在解决冷启动上所具有的优点,将视频描述信息与视频语义相结合,提出了一种基于多源数据的视频推荐算法。最后,本文分析了推荐系统的设计与实现方式,并通过实验证明了该方法在推荐准确率上比传统方法有了一定的提升。
其他文献
文章首先对数学模型和计算机模型进行了阐述,对两种不同的建模方法分别作了详细的描述。构建了一个基于数学方程模型的实例,并求出其迭加解,较好地体现了数学模型的特征及应用。
二十世纪七十年代,Intel公司推出了第一颗微处理器芯片,嵌入式系统的概念也随之产生。随着芯片技术的飞速发展,各大公司都逐步推出了各具特色的处理器来抢占嵌入式芯片市场,A
网格是近年来迅速兴起的一个新的研究领域,它的出现标志着网络技术进入了一个崭新的时代。网格的实质是共享与协作,即在动态的、可扩充的虚拟组织中可控且平等地使用和共享资
随着网络应用的普及,网上信息量以惊人的速度增长,并且更新频繁。人们面对的问题不再是缺乏有用的信息,而是如何找到自己需要的信息。传统的通用信息检索技术满足了人们的一
语义Web服务是用本体来描述的Web服务,它的目标是使得计算机系统可以理解并解释Web服务的内容,满足智能Agent对万维网上Web服务的自动发现,调用和复合。Web服务采用SOAP(Simp
随着多媒体技术和计算机网络的迅速发展,越来越多的数字信息产品通过网络广泛传播。在给人们带来便利的同时,由此而引发的非法拷贝和恶意篡改等侵权行为也引起了人们的关注。
形式概念分析自1982年由德国的Wille教授提出以后,近年来被广泛用于软件工程、知识发现、信息检索等领域。形式概念分析中的核心数据结构——概念格通过Hasse图来表现出概念
当今社会,随着信息化与网络化的高度发展,信息安全显示出前所未有的重要性。因此,作为其中一个分支的身份识别技术也就具有相当高的研究价值与广泛的应用前景。其中,生物特征
非平衡混合数据分类处理在现实应用中非常普遍,该数据具有分布不均匀,属性多样等特性。传统的分类学习方法在处理该类型数据时有效性不高,而且在少数类样本足够重要时,甚至会
情感计算是国际上近几年刚刚兴起的、试图使计算机(机器)能够像人类那样具有理解和表达情感能力的一个多学科交叉的新研究领域,在智能人机交互中起着重要作用。由于人的情感