基于词向量的LSTM网络在音乐推荐中的应用研究

来源 :江苏大学 | 被引量 : 2次 | 上传用户:lgwll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以数据为驱动、以机器学习为核心的推荐技术可有效提高信息服务的精准性、提升用户体验,一直是近几年信息处理技术的研究热点。论文以媒体推荐中的典型应用音乐推荐为研究对象,将当前机器学习中常用的分布式词向量表示与LSTM神经网络模型应用到推荐算法设计中,以有效提高推荐效果和效率。论文的主要研究内容包括两方面,一是基于Word2Vec的音乐会话记录分布式表示词向量学习,二是结合长期偏好的LSTM音乐推荐算法建模。论文基于很多推荐场景下用户会话行为之间极强的关联性,提出基于会话记录的音乐推荐设计,利用目前最常用的文本词向量神经网络Word2Vec框架,生成会话记录的分布式词向量表示,以有效降低音乐词向量表示维度,同时获得相似场景下音乐之间的相关性,实现音乐特征的有效提取。论文基于条件概率对所构建的词向量学习模型进行了可行性理论推导,并使用Last.fm真实数据集对所构建的模型进行了实验训练。实验的主要设计为模型窗口值设定、词向量维度选择及实验结果的可视化。实验结果直观显示了相似‘语义’音乐在二维空间上紧密相连,由此说明了所获取到的音乐词向量的合理性和有效性。论文基于音乐爱好同时存在的短期连贯性及长期稳定性,提出了结合长期偏好的LSTM音乐推荐算法建模,以有效解决RNN神经网络时间跨度加大时远程信息学习能力丧失的问题。论文这部分的主要研究特色包括:第一,以历史向量的平均值表征用户长期偏好作为模型初始输入,一方面考虑了音乐爱好的长期稳定性,同时也缓解了会话冷启动问题;第二,统一了会话序列长度,以利于并行运算,与此同时采用动态更新思想解决补零过后所带来的误差增大问题;第三,在模型嵌入层引入Dropout技术以类似集成学习方式进一步提高模型泛化能力;第四,针对个性化推荐问题通过二分类形式定义损失函数,即推荐与否。论文在验证集上通过选取合适的隐层节点数、学习率、批量值等超参,在通用指标体系下与session-Word2Vec、W-LSTM等多种推荐算法进行对比,实验结果表明论文提出的模型具备较好的动态意图提取能力,同时长期偏好的引入也一定程度上改善了会话冷启动问题。
其他文献
安全管理是小学教育管理的重要组成部分,也是全面实施素质教育的前提和保证。本文主要探讨学校的安全管理工作,提出加强校园安全管理的政策和措施,提高学校工作人员的安全管
对循环冷却水排污水进行再生回用,既可以节约淡水资源,又可以减少废水排放。结合某石油化工企业循环水排污水再生回用的工程实例,介绍了循环水排污水再生处理采用预处理+超滤+反渗
环境风险感知是养猪户对农村环境风险的态度和直觉判断,是风险应对行为的基础,而生计资产又是养猪户抵御风险、提高脆弱应对能力的保障。为研究规模养猪户生计资产与环境风险感
量子关联是比量子纠缠更为广泛的是一种量子特性,是量子信息处理的重要资源,因而是量子信息中一个非常热门的研究课题.Bender等人于1998年发现并不是所有量子系统的哈密尔顿
提高课堂教学效率的方法很多。其中,自主、合作、探究就是提高语文课堂教学效率的重要方法之一。传统教学主要以教师单向的传授知识为主,学生的依赖性强,学生很少有机会去开动脑
高温高压气井测试具有高温、高压、流体含砂、振动以及容易生成水合物等特点,相对于常规井测试,高温高压气井测试有很多风险,具有很大的挑战性。因此,要求必须熟练掌握该项技术,以
为实现可持续发展型社会,对环境的可持续发展应该更加重视。植树造林作为解决环境问题的最直接方法,在实施过程中简单方便,但忽视了造林绿化后的植被能否高质量存活。因而,要保障
在企业运行发展过程中想要保持自身竞争力与活力,就需要不断提高企业资金利用效率,这也是企业发展运行过程中的根本所在。应收账款作为企业资金管理中的重要组成部分,只有资
中国工会十七大的胜利召开,明确了中国工会的基本职责。习近平总书记同全总新一届领导班子成员集体谈话,对'竭诚服务职工群众'提出了具体要求。这是中国工会的基本职