基于图嵌入的相似视频推荐

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:wxws008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着移动互联网的普及,中国网络视频行业迈入了发展的快车道,行业规模的高速增长。据中国互联网协会发布的数字,2018年中国手机网民达到8.17亿,占全部网民的98.6%,同时网络视频用户达到创纪录的6.12亿人,在线视频行业市场规模达2016.8亿元,同比增长39.1%。对于网络视频平台来说,日益增长的用户量和播放量,在带来更多的经济效益的同时,也对推荐系统提出了更高的要求。相似视频推荐是视频推荐系统中的一个重要的落地应用,常见于各大在线视频网站,当用户点击进入一个视频的播放页面后,无需返回即可以沉浸式浏览与当前视频最相似的视频。相似视频推荐大大提高了用户体验,同时也是用户在视频网站消费的主场景之一。相似视频推荐的主要目标是计算视频之间的相似性,也即如何将与特定视频最相似的视频推荐给用户。推荐的过程主要分为两步,第一步是生成视频的嵌入向量,如何让向量最大程度上保留视频的特征是视频相似推荐最关键的问题,第二步是进行相似性搜索,最常见的做法是基于余弦相似度搜索得到相似性最高的数个视频,作为推荐结果返回。对于在线视频来说,有两类重要的信息,一类是播放记录,它记录的是用户与视频之间的互动,由于短时间内用户的兴趣相对稳定,所以如果两个视频在播放序列中先后连续出现,那么这两个视频就很可能存有一定的相似性;另一类是视频本身的属性,其中一个重要的属性是视频的标签,它类似论文的关键词,每一个标签都是视频内容的写照,如果两个视频有着相似的标签,那么它们在内容上就会有一些相似之处。目前的研究大多独立地利用以上两种信息进行推荐,而不能很好地将其联系在一起使用。基于以上思考,本文提出了一种基于图嵌入的相似视频推荐方法,它可以很好地利用用户播放记录信息和视频标签信息来生成视频向量,得到视频的向量表示后再使用基于余弦相似度的k近邻搜索进行推荐。为了更好地融合标签信息,模型拆分成两个子模型,第一个是基于深度游走的标签向量化模型,对过往从文本挖掘角度难以处理的标签特征,巧妙地用图嵌入方法进行建模。第二个是融合了前者输出的视频向量化模型,它在接受视频序列信息之外,还能够接受输入视频的任意数量的标签信息。最终,两类信息互为补充,在提升模型效果的同时还可以一定程度上缓解新视频的冷启动问题。
其他文献
在世界高速发展的今天,石油作为战略资源其重要性不言而喻。因此确保石油高效、稳定的开采有着重要的意义。在石油开采过程中,结蜡问题一直是一个挑战。数据显示我国原油含蜡量高,据统计,含蜡量超过10%的原油几乎占所有产出原油的90%,而且大部分超过20%。高含蜡量也就意味着更高的结蜡风险,以及更高昂的清蜡成本。因此有效的预防结蜡对原油开采公司有着重要的意义。为帮助原油开采公司探索结蜡规律,预防结蜡问题,节
学位
随着互联网及其相关技术的发展,人们在享受网络带来的便利的同时,也面临着严重的信息过载问题,在面对海量信息的同时,不仅难以获得对自己有用的信息,也降低了自己的浏览体验。推荐系统是解决信息过载问题的有效手段,它能从用户的历史记录里学习到用户的偏好信息,并基于此预测用户在未来的信息获取需求,做出个性化的推荐。推荐系统不仅大大提高了用户获取有效信息的效率,提高了用户的使用体验,也给使用了推荐系统的企业带来
学位
在信息检索系统中,当用户输入查询后,需要快速返回相应的信息。在类似于知乎、百度知道等问答社区中,当用户提问时,若能快速匹配到最为相似的问题,并返回已有的解答给用户,可以防止重复提问的同时,也可以提高用户的体验。在智能客服或问答系统中,需要对用户的意图进行准确地识别,有效地解决用户的诉求。在上面举的例子中,都绕不开一个最为基础且核心的问题,就是文本语义的相似性判别。以人工智能技术为基础的智能客服系统
学位
随着科技的进步,新闻可以在很多途径下进行传播,大家可以通过各种社交工具以及新闻网站查看到最新的资讯。在这些社交网站上,用户还可以在推送的新闻底下发表自己对此事的看法。发表者有时会用匿名方式进行消息的发布,这就导致了目前网络上各种虚假新闻的出现。这些虚假新闻有如下一些特点:规模大、传播速度快、造假手段多种多样等。对于一些恶意的虚假新闻严重时会造成大众的的恐慌,对企业也会带来一定程度的危害,甚至会造成
学位
近年来自然语言处理技术受到了学术界及工业界的广泛关注,人机对话技术作为自然语言处理技术中重要的应用之一,不断有学者对其进行研究。人机对话系统中一个关键的任务为意图识别,该任务要求聊天机器人能够对用户的输入内容进行语义理解,并将输入内容分类到正确的类别当中。意图识别模块的性能优劣将直接影响人机对话系统的质量好坏。提高人机对话系统对用户输入文本的意图识别能力,能更准确、更高效的服务用户,同时减轻人工客
学位
机器阅读理解是自然语言处理领域中问答系统任务的主要研究方向之一,其目标是结合给定的文本来得出所提问题的答案,属于监督学习任务。由于在传统的问答系统中,答案的提取方法过于繁琐,大量的信息无法得到有效利用,多数情形下难以高效地从原始文本中提取结构化的信息。而机器阅读理解技术则可以更好地提取原文中与问题有所关联的内容,从而较为精确地给出与问题匹配的答案,不仅可以促使问答系统变得更加健全,同时还能为实现高
学位
基于L.S.Vygotsky提出的“中介”概念,通过对亲子阅读死亡教育绘本的过程进行观察和对死亡教育绘本进行图文分析,探究绘本中“死亡”意义的多模态建构对儿童认知和情感的调节作用。研究发现,绘本中的“死亡场景”有助于儿童了解死亡的生物属性,并影响他们的死亡话语实践;“死亡”的呈现方式引起孩子对死后世界的疑惑,但多数故事类绘本对死亡的社会文化实践介绍甚少;绘本图文间关系及其建构的“感情”避免儿童出现
期刊
在当今的信息时代,推荐系统在各行各业都扮演着一个重要的角色。实现精准营销,是推荐最终的目的。根据用户的历史活动记录,尽可能地挖掘出用户相关的行为模式以及商品表现出来的某种特性等信息,构建相应的用户画像,精准的定位用户的兴趣所在,根据用户的兴趣所在为用户匹配其最可能感兴趣的商品,从而实现为最合适的人推荐最合适的商品。以中国为代表的电影强国,推荐系统的研究在电影行业领域也相当重要。本文关于电影推荐系统
学位
随着计算机技术与互联网的不断发展,人们之间的社交以及人机交互方式也逐渐发生着变化,由文字的单一交流方式逐渐转变为文字、音频及视频的多种方式。交互方式的转变给人们日常生活带来了更多的便利,同时也为人类技术的更新迭代带来了挑战。例如,近年来新兴的社交软件中的语音社交方式,这种方式通常是将语音信号转变为文字信息,然后将文字作为信息传递的载体呈现给我们。然而在多数场景中,通过特定算法得到的音频至文本转化结
学位
波动率是对资产收益的不确定性的一种度量,在很大程度上对期权的定价具有重要影响意义,而波动率在时间维度上本身也具有不确定性,如果不能很好的理解和把握这种不确定性,那么将会造成很高的模型风险。本文将从波动率的不确定性出发,来考虑其对资产收益的影响,并使用波动率的波动率(VOV,Volatility of volatility),来度量波动率的不确定性。当波动率的不确定性增大时,会给波动率的估计的稳定性
学位