基于深度学习的舞蹈微视频推荐系统设计与实现

来源 :西北民族大学 | 被引量 : 0次 | 上传用户:a4951660
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,在网上欣赏和学习舞蹈成为一个必不可少的途径。然而,由于舞蹈视频网站的快速发展,信息过载的问题也日益突出。因此,在这种情况下,使用推荐系统来进行舞蹈推荐是一个有效的解决方案。深度学习技术作为一种有效的工具,可以解决传统推荐模型中的复杂特征提取和特征交叉问题。越来越多的研究开始重视召回阶段的重要作用,从而提升推荐系统的效率。因此,把推荐系统划分为召回和排序两个阶段,以期望在短时间内,尽可能多地召回到与用户相关的物品;而且,在排序层采用基于深度学习的复杂模型,以提高模型的准确性,从而达到更好的推荐效果。研究内容主要包括以下四个方面:(1)收集并处理课题所需要的数据。本课题一共收集三类数据,包括舞蹈视频的详细信息、用户的信息以及用户的交互信息,介绍三类数据的具体情况以及进行预处理的具体步骤。(2)多路召回模型构建。通过快速筛选全量舞蹈微视频,将数据集缩小至千百级,并将多路召回算法模型合并,从而获得最终候选集。该多路召回算法模型使用Word2vec模型提取文本特征向量,利用基于物品的协同过滤算法、因子分解机模型以及基于深度学习的双塔模型和You Tube DNN模型进行推荐召回,这四种不同算法模型产生召回候选集,形成最终召回列表供后续模型使用,可以有效地解决传统召回方式单一导致召回率较低的问题。(3)排序模型构建。本文提出将大规模预训练模型Bert用于文本特征提取,作为模型的补充特征输入,并与基于深度学习的XDeepFM模型结合,降低用户和物品特征获取的难度,同时与其他主流推荐模型在该数据集下进行实验对比,结果表明本文提出模型的推荐效果能够有效地利用舞蹈和用户的特征,提升推荐的效果。(4)实现舞蹈微视频推荐系统。结合用户实际需求,将多路召回模型和融合Bert与XDeepFM模型应用在舞蹈微视频推荐系统中。基于系统架构对推荐系统进行开发,实现推荐系统所设计的功能,将经过模型筛选出的推荐舞蹈微视频展示给用户。
其他文献
电商领域细粒度情感分析主要是针对每条电商平台评论文本中各个属性,即方面的情感倾向进行分析,不再是对整条评论文本进行情感倾向分析,更贴近于用户的实际需求。本文围绕中文电商评论文本对细粒度情感分析进行研究,并在此基础上设计并实现了电商评论细粒度情感分析系统。本文所做的具体工作如下:(1)针对方面情感三元组提取任务中缺乏中文电商评论数据集的基础问题,本文从某电商平台爬取了笔记本电脑领域的5602条评论,
学位
近年来,随着元宇宙如火如荼的发展,虚拟数字人研究也获得了飞跃式进展,并被广泛应用至各个领域。语音驱动的虚拟人脸动画生成技术,旨在给定任意一段语音,生成逼真自然、唇音同步的虚拟人脸动画。一段高质量的虚拟人脸动画的生成需要考虑数据精确度、面部表情的真实性、唇部运动与语音的一致性、视频帧的质量等多方面因素。因此,本文提出了一种基于运动捕捉数据的国家通用语虚拟人脸动画生成方法,通过引入面部捕捉技术获取高精
学位
阅读理解不仅需要理解文本中所阐述的内容,还需要理解字里行间的内容。在自然语言处理领域,诞生了诸多预训练模型,这些模型从开放的语料库中学习到了渊博的知识,从而提升了如问答、智能对话等多领域数据集上的表现。然而,让机器能够理解生活情境常识时,效果却不理想。这是因为现有的模型未能引入、融合常识知识实现机器本身的自我理解。针对这一问题,本论文开展基于生活情境常识的机器阅读理解研究。作为实现机器智能理解常识
学位
由于深度神经网络的出现,自动语音识别技术取得了重大进展。目前最先进的语音识别系统,在某些场景下的识别正确率,已经接近人类水平。然而,这类系统需要大量有标签数据进行训练,限制了语音识别技术在低资源语言上的应用。最近,自监督语音表征模型的研究变得火热,它仅使用音频数据进行预训练,无需配对的文本标签,在各种下游任务上取得了出色的表现。在此背景下,本文工作基于目前最流行的wav2vec2.0和Hu BER
学位
近年来,环境问题日益严重,事故灾难给全世界人民带来了巨大的生命和财产的威胁。我们需要在事故灾难发生的第一时间及时获取第一手的事故灾难信息,作出相应的应对策略,减少损失。事件抽取是信息抽取的一种,对于事件信息的挖掘与抽取具有极为重要的意义。在进行事件抽取任务中,中文的短文本信息在各个词语之间没有自然的停顿,并且中文词语还存在一词多义的现象,因此在抽取的过程中存在触发词与事件类型不匹配和一个触发词对应
学位
随着互联网的不断发展,社交网络已变成网民分享信息、共享知识的首要渠道。社交网络中的信息传播,极大的方便了新技术与新思想的推广。在交互过程中,一个人可以同时隶属于多个群体,这个人作为社区间的枢纽节点,会对信息的传播起到十分关键的作用,进而使网络拓扑结构发生改变。因此,基于社区结构的影响力分析在理解节点的行为特征、揭示网络传播动态以及分析网络拓扑结构具有至关重要的作用。下面为本文主要贡献:(1)在社交
学位
新型冠状病毒肺炎(COVID-19)的快速蔓延导致全球健康危机,给医疗卫生、经济、安全等各方面都带来了巨大的危害。新型冠状病毒的高度传染性、变异性和隐蔽性大大增加了疫情预防和控制的难度。快速检测并且对可能感染的患者进行隔离治疗是抑制COVID-19传播的有效途径。深度学习和医学成像的最新进展表明,计算机从医学图像中提取数据的信息能力取得了进步,进而通过构建计算机辅助诊断系统可以在对抗疾病的检测工作
学位
各大新闻网站、社交平台的文本信息数量与日俱增,自动文本摘要技术可以解决人们面临的信息冗余与快速阅读之间的矛盾,节省时间,提高效率。目前自动文本摘要技术主要分为抽取式和生成式,抽取式自动文本摘要对长文本比较友好,但缺少语义信息,生成式自动文本摘要可以生成新的句子,比抽取式摘要更灵活,但对于较长的文本,可能会因为截断而导致信息损失。本文针对以上问题,分别对抽取式和生成式自动文本摘要进行了研究,同时设计
学位
文本复述任务使用基于深度学习的自然语言处理技术,可以为生成出来的文本赋予多样性和创造性。其任务目标是让机器使用不同的措辞、表达,将原先的文本复述出来,该过程需要最大程度地保留原文本中的核心语义,并且保证生成的语句通顺。本文提出结合同义词词林和依存句法的词语复述生成以及基于命名实体识别和Laser Tagger的短句复述生成方法,通过学习数据样本之间的多样性及语句流畅度,在最大限度保留原句语义的情况
学位
随着语音识别技术的快速发展,端到端语音识别框架已经成为主流。但是,这种框架需要大量的标记数据进行训练,这对于低资源语言情况下是非常困难的。为了解决低资源语言训练不足导致模型性能下降的问题,本文基于半监督语音识别方法在藏语数据上开展了研究。主要的工作如下:(1)基于半监督学习方法的藏语语音识别研究。本文首先使用藏语数据训练基线模型,以确保半监督模型的可靠性。然后,利用半监督学习方法,充分利用无标签数
学位