基于聚类和神经网络的个性化推荐研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:fengyaoying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化推荐技术是解决信息过载问题的有效方法,能够根据用户喜好给出推荐结果,提高获取信息的效率,因此个性化推荐的研究是数据领域的研究热点。然而在真实的推荐场景下,由于用户和项目数量巨大,而反馈数量较少,数据矩阵有较高的稀疏性,从而影响推荐的效果。针对上述问题,提出基于聚类加权的协同过滤和神经网络的融合推荐算法,并通过马尔科夫链蒙特卡洛快速采样提高种子用户选取的效率。该方法旨在提高数据稀疏情况下的推荐精度。模型引入了用户和项目的侧信息,提高了特征表示的抽象程度,并且聚类结果中同类用户的相似度计算也不易受到稀疏数据的影响。同时利用神经网络能捕获更多高阶特征的优势,和基于聚类加权的协同过滤相结合,进一步缓解数据稀疏性的影响。本文的主要工作和创新如下:1.提出了一个融合聚类加权的协同过滤和神经网络的推荐算法,首先利用堆叠降噪自编码器对用户项目历史数据和侧信息建模,得出用户特征的隐向量表示,而后依照低维稠密的特征向量通过聚类模块给出聚类权重,再结合基于用户的协同过滤根据不同的相似性度量给出综合的预测结果,最后同全连接的神经网络做模型融合,得出最终的预测结果。2.对上述算法中的聚类模块的运行效率问题,提出了基于马尔科夫链蒙特卡洛快速采样的优化算法,以用户为状态构造马尔科夫链,基于用户表示向量的距离构造接受率,通过链上状态的转移得出种子用户的采样结果,在结果精度有保证的同时可以大幅提高模型的训练效率。3.在实验中揭示了本文所提出的算法在推荐场景中产生效果。在具有显著稀疏性,用于公开评测的真实数据集上的实验结果表明,本文提出的算法优于基线模型。
其他文献
随着机器学习的迅速发展,卷积神经网络(convolutional neural network,CNN)作为最受欢迎的算法之一,在图像处理、语音识别、数据挖掘等等众多领域得到了广泛的应用。近年来,人工智能物联网(Artificial Intelligence&Internet of Things,AIo T)的迅速崛起对边缘设备的实时性和智能性提出了越来越高的要求,促使卷积神经网络算法硬件化成为了
学位
时间序列预测是人们组织和利用信息的一种重要手段。预测可以提前获知事物在未来一段时间的发展趋势,并为之后的应用提供参考和指导。随着物联网时代的到来,在智慧交通、智能电网等代表性应用中,人们借助“物联网+”技术能够采集到大量数据,并通过分析数据来得到服务。深度学习方法能够由数据驱动来构建统计模型,并利用模型对数据进行分析。近几年,语言模型Transformer被很多工作迁移到时间序列预测任务中,并有着
学位
报纸
蛋白质的稳定供应是保障人民健康和国家安全的重要基础之一,作为传统农业种植生产模式的补充或彻底替代方案,微生物蛋白制造能够通过高时空生产效率、不依赖耕地的车间制造方式,生产供应蛋白质原料.本文描述了发展微生物蛋白的需求,综述了微生物蛋白制造的发展,介绍了主要的生产菌株,并以3种大宗原料类型食品工业与农业副产物、能源化工品、二氧化碳及其衍生富能化合物为主线,阐述了主要的微生物蛋白生产路线,分析了不同生
期刊
<正>安检法小区是沈阳市和平区南湖街道文安路社区所辖小区之一,始建于2000年,共有居民400余人。2006年,小区遭遇物业弃管,一时间,垃圾随便扔、东西随便放、外人随便进、车辆随便停,盗窃案时有发生,居民怨声载道……为了有效走出治理困境,文安路社区党委创新推出了“党建引领居民参与”的新模式,并通过17年不懈努力,成功破解了安检法小区治理难题,使这个无物业老旧小区重新焕发生机。
期刊
目的:探讨抗阻运动加速导管相关性血栓(CRT)溶解再通作用效果,为抗阻运动辅助治疗CRT提供理论依据。方法:144只SD雄性大鼠随机分为CRT对照组、CRT+抗阻运动组、CRT+血红素氧合酶-1(HO-1)激动剂钴原卟啉(COPP)组、CRT+HO-1抑制剂锡原卟啉(SnPP)组,每组36只。构建大鼠CRT模型,置管10天后进行抗阻运动、腹腔注射COPP及SnPP处理,CRT对照组不做处理。干预后
期刊
目的 探讨增强CT在儿童肾透明细胞肉瘤(CCSK)与肾母细胞瘤(WT)鉴别诊断中的临床价值。方法 选60例疑似CCSK/WT患儿均进行增强CT、病理学检查,对比2项检验结果,并分析增强CT的检查征象。结果 经病理切片免疫组织化学染色法诊断,CCSK患儿有23例(38.33%),均为单侧发病,左侧17例,右侧6例,瘤体昀大径5.26~15.62cm,未发现转移病灶;WT患儿有37例(61.67%),
期刊
近些年,深度学习在计算机视觉、语音识别、自然语言处理等领域取得了令人瞩目的成就。特定的深度学习模型在特定任务取得了成功,这种成功体现在两个方面,一是其热门且应用广泛,二是其泛化性能较传统机器学习方法表现优异。尽管这种基于深度神经网络的模型效果非常好,但其模型复杂度高,缺乏可解释性,缺乏完备有效的模型选择方法,是一个黑盒模型,理论分析和实证研究表明深度学习模型的VC维渐进无穷大、拉德马赫复杂性渐进趋
学位
知识库问答是自然语言领域非常重要的任务之一,它显著降低了用户访问知识库内容的难度。使用知识库问答使得回答更加精细化准确化,但知识库问答相比于传统的基于关键字的搜索方式来说,也面临了新的问题,即空结果问题。为了避免空结果问题,从而提高知识库问答的准确率,我们提出了一种基于SPARQL推荐的知识库问答方法。语义解析与信息抽取是实现知识库问答系统的两种主要方法。现有KBQA方法大多属于这两种类型。它们有
学位
机器翻译技术在全球化中扮演着十分重要的角色。随着全球化推进,机器翻译技术也在不断地进步,尤其是近些年来神经机器翻译技术的出现,将机器译文质量提升到了新的高度。尽管如今机器翻译技术达到了较高水平,但不少机器译文仍存在着错译、漏译、过译等问题。因此,机器翻译系统用户对实时掌握机器译文质量存在着较大需求。机器翻译质量自动评估(又称机器翻译译文质量估计,Machine Translation Qualit
学位