面向信息流数据的多样性推荐方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ppt20041
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断进步以及互联网技术的快速发展,人类社会已经进入了大数据时代,如何从海量物品中给用户推荐合适物品已经成为推荐领域的研究挑战。不同于传统推荐问题,面向信息流数据下的推荐问题主要存在推荐不公平性和推荐收敛性问题。首先要面对的挑战是大规模信息流数据数据不平衡所导致的推荐不公平问题。其次是推荐收敛性问题,主要源于信息流数据下“用户兴趣多样性”和“用户兴趣演化”的特点。上述两个问题目前并没有得到很好的解决。因此,设计一个新型的模型来平衡推荐中的准确性和多样性实现推荐公平性,以期提高用户满意度,仍具有很大的挑战。本文针对这两个问题展开研究,分别提出了基于辅助信息的向量学习模型(word2vec E)和多兴趣时序模型(MIGRU-TDPP)。针对推荐不公平问题,本文打破常规样本分布约束,结合数据的辅助信息,在物品图网络中构建关系边,从而有效缓解信息流数据“二八分布”问题。具体地,本文在构建关系样本的基础上提出融合wor2vec和trans E的word2vec E模型来学习物品表示。针对推荐收敛性问题,本文提出MIGRU-TDPP模型。通过研究用户行为在兴趣层面的表现,平衡推荐多样性和准确性。该模型包含四个模块:(1)聚类GRU4Rec模块,学习物品兴趣标签;(2)多兴趣MIGRU模块,通过用户的行为序列来学习用户多个兴趣表示;(3)时序点过程LSTMTPP模块,刻画用户每个时刻兴趣倾向概率;(4)行列式点过程DPP模块,通过结合物品相关性及用户兴趣概率做出最终推荐物品列表。最后,本文在一个大规模真实场景,多个公开数据集上进行了实验验证。实验结果表明,本文所提的两个模型在用户满意度上都得到了一定的提升。其中,word2vec E方法对稀疏数据有很强的适应性,MIGRU-TDPP在推荐多样性和准确性上达到了很好的效果。
其他文献
序列模式挖掘是从序列数据库中挖掘重要的子序列模式,模式的重要度通过表征频繁出现的支持度这一客观指标来衡量。然而,现有的序列模式挖掘算法无法考虑用户主观的兴趣度并自定义模式重要度,难以实现个性化挖掘。因此,研究人员在序列模式挖掘的基础上使用效用来衡量模式的重要程度,提出了高效用序列模式挖掘问题,其需要根据用户预定义的效用计算规范从数据库中挖掘重要的高效用序列模式集合。本文将效用计算规范抽象为效用函数
学位
目的:制作并分析梅尼埃病快速诊断问卷,为了简化梅尼埃病患者就诊流程及降低花费,同时减轻临床工作者负担,节约医疗资源。方法:将2020年8月至2021年3月就诊于复旦大学附属眼耳鼻喉医院和安徽医科大学第二附属医院并且确诊的429例耳源性眩晕患者纳入研究,完成专家制定的眩晕问卷。通过分析问卷,制作并提炼出MD的快速诊断问卷。采用受试者工作曲线(ROC)的研究方法,确定出MD快速诊断问卷的截点,同时使用
学位
背景:阻塞性睡眠呼吸暂停低通气综合征(Obstructive sleep apnea hyponea syndrome,OSAHS)是目前世界主要的公共卫生难题之一,被认为是心脑血管疾病、神经系统损伤、机体代谢功能损伤的独立危险因素,其神经精神症状主要表现为焦虑、抑郁以及阿尔兹海默症。此外,还可引起认知障碍。慢性间歇性缺氧(Chronic intermittent hypoxia,CIH)是OSA
学位
目的青光眼是一种常见的不可逆视神经损伤的致盲性眼病,目前认为病理性的眼压升高是其主要危险因素。其眼压的升高与小梁网的功能密切相关,随着对青光眼发病机制的深入研究发现,小梁网细胞氧化应激可引起细胞外基质发生退行性变,造成细胞自噬和衰老,进而破坏小梁网细胞功能,最终导致房水外流障碍,是青光眼发展过程中的重要作用机制。因此抑制小梁网氧化应激有望成为治疗青光眼的新靶点,本文旨在探索小梁网细胞发生氧化应激和
学位
随着信息技术的飞速发展,以智能设备为主要载体的社交媒体应用逐步成为人们沟通交流、意见表达的重要渠道。社交媒体应用中每天生产数以亿计的内容,基于这些内容开展命名实体识别研究对信息抽取、内容理解等下游任务有重要意义。仅根据纯文本信息进行实体识别因信息不足难以识别某些,因此近年来不少学者关注利用多模态信息来进行命名实体识别。现有研究采用基于序列标注的方法,提取图像特征增强文本表征进行命名实体识别。然而由
学位
背景耳鸣被描述为在没有真正的声音刺激的情况下感觉到声音或噪音。针对这种潜在的、异质性的症状,已经尝试了许多治疗策略。耳鸣的治疗包括药物治疗、心理咨询、经颅磁刺激治疗耳鸣、习服治疗、声治疗等。声治疗是耳鸣治疗的常见组成部分。通过使用发声器或助听器等发出的宽带噪音、环境声音等声音部分或全部掩盖耳鸣,每天持续数个小时。几个月后,多数患者会报告耳鸣对他们的生活质量的影响开始降低,耳鸣的声音相对治疗前可以更
学位
随着互联网、智能设备和社交媒体的飞速发展和深刻影响,各种形式的多媒体数据呈现爆炸式增长。如何从大规模、海量多媒体数据资源中快速地查找和检索关键信息,成为了当前学术界和工业界共同面临的难题之一。得益于在存储开销、计算速度和检索性能上的综合优势,深度哈希技术为解决当今大规模多媒体检索提供了切实可行的方案,近年来一直是多媒体领域中的研究焦点。然而,近期的研究表明,深度哈希模型不可避免地继承了深度神经网络
学位
指纹检索技术是广泛使用的个人身份认证技术之一。目前的指纹检索技术主要基于指纹图像的细节点特征,它具有检索速度快,精度高等优点。但是,基于细节点的指纹检索技术出现了一定程度的安全隐患,例如它容易被仿制指纹所破解等。相较于细节点特征,高分辨率指纹图像的汗孔特征同样区分性强,并且汗孔特征还具有活体检测和安全性更高等优点,更能满足广大用户对指纹检索安全性的需求。然而,在现有的大部分工作中都是利用高分辨率指
学位
目的:本课题组临床上发现对脑卒中患者偏瘫侧上肢实施指部感觉刺激能即时、明显降低患指屈指肌痉挛,并促进其主动伸指。探讨指部感觉刺激对脑卒中偏瘫患者上肢运动功能的影响。方法:收纳符合纳排标准的40例卒中患者,采用随机数字表,随机分为治疗组和对照组各20例。其中对照组仅进行常规康复治疗,包括常规药物、常规康复护理等;治疗组在常规康复基础上,研究者分别对患者偏瘫侧上肢各手指的甲床、远节指骨末端及两侧进行指
学位
目的脑梗死后大部分患者遗留有运动功能障碍,现有的康复治疗方法疗效极其有限。有研究表明神经炎症反应参与脑梗死后的神经修复过程,为脑梗死患者功能的恢复提供了新的线索。本文的研究旨在深入了解脑梗死患者急性期和恢复早期血浆中细胞因子肿瘤坏死因子α(Tumor Necrosis Factor alpha,TNF-α)、血管内皮生长因子A(Vascular Endothelial Growth Factor
学位