基于矩阵分解的推荐算法研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:zhefen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的飞速发展,人们的生活方式发生了显著变化,互联网方便了我们生活的同时也造成了“信息过载”问题,为了解决这一问题,研究者们把目光投向了推荐系统。推荐系统中应用最为广泛的是基于协同过滤的推荐系统,协同过滤推荐算法作为推荐系统的核心虽具有其自身的优势,但是仍然存在数据稀疏性和可扩展性等问题,影响着算法的推荐精度。本文针对传统推荐算法中存在的数据稀疏性和可扩展性问题从不同的角度做出改进。主要工作内容如下:(1)为了解决数据稀疏性和可扩展性问题,提出了一个基于非负矩阵分解和密度峰值聚类的推荐算法。该算法首先对用户项目评分矩阵进行非负矩阵分解,得到项目和用户的特征表示,然后通过密度峰值聚类算法对不同类型的用户做出划分,缩小寻找最近邻的范围,提高算法的效率。其中引入奇异值分解和信息熵的概念分别对非负矩阵分解和密度峰值聚类进行了改进。(2)针对社会化推荐中存在的数据稀疏性问题,构建了一个融合概率矩阵分解和图神经网络的推荐算法。该算法首先对原始用户项目评分矩阵进行概率矩阵分解,得到用户特征和项目特征,然后利用图神经网络对用户从社会聚合和项目聚合两个方面来学习其潜在向量,最后将得到的用户潜在向量集成在概率矩阵分解模型中,得到评分预测。在对上述所提算法给出必要的理论分析的基础上,本文在公开的数据集上进行了实验,包括美国明尼苏达大学提供的Movielens-100k和Movielens-1M数据集,以及包含社交信息的Ciao和Epinions数据集,选取MAE和RMSE为本文的评价指标。理论分析和实验结果均表明,本文提出的算法可以改善数据稀疏性问题,使算法精度有所提升。
其他文献
孤独症谱系障碍(Autism Spectrum Disorder,ASD)是一种神经发展障碍性疾病,目前其发病原因还不明确,至今仍然没有有效的诊断手段和治疗方法。ASD患者在社交和行为等方面异于常人,康复训练费用昂贵,严重影响了患者及其家庭生活质量,同时对社会和国家造成了负担。ASD的早期诊断可以使病情在发展初期得到有效干预,因此寻找一种客观的诊断方法有着重要的现实意义。随着医学影像的发展,研究人
学位
据统计,目前心血管疾病是我国城乡居民致死率最高的疾病,并且近年来患病率持续上升。心血管疾病的发病具有隐秘性和突发性的特点,因此对心血管疾病及时预警显得尤为重要。心室的复极过程反映在心电图上即T波,当心室复极过程出现异常时,心电图T波会相应的发生形态改变,因此监测T波的形态变化可以提早发现心脏的病变。但心电图连续监测所获得的心电信号数据量庞大,医生的诊断任务会相当繁重。因此,为了辅助医生阅读心电图,
学位
窄带物联网(Narrow Band Internet of Things,NB-IoT)依靠其广覆盖、低功耗、低成本、大连接等优势,成为被广泛应用的物联网技术。小区搜索作为NB-IoT下行接收机中的关键过程,是终端和基站进行通信的保障。小区搜索需要检测两种同步信号,而NB-IoT和传统的LTE(Long Term Evolution,长期演进)相比,两种同步信号的结构和功能都不同,同时NB-IoT
学位
脑肿瘤分割对于脑肿瘤放射治疗计划的制定和疗效评估具有重大意义。由于脑肿瘤的大小、形状各不相同并且位置难以确定,常用的手动分割方法耗时耗力,分割结果也会受到专家个人经验的主观影响。卷积神经网络(Convolutional Neural Network,CNN)中的U-Net网络使用编解码结构,并且在编码结构与解码结构的同一层使用了跳跃连接,可以将编码部分与解码部分的特征融合,常被用于脑肿瘤图像的分割
学位
随着互联网和电子信息产业的不断发展和进步,互联网逐渐成为人们获取信息的主要手段,人们能够获取的信息量剧增,随之产生信息过载问题,解决信息过载的一个有效手段是推荐系统。推荐系统的核心是推荐算法,其中协同过滤推荐算法深受瞩目,它通过分析用户的历史评分信息为用户进行个性化推荐。但是该方法仍存在数据稀疏性问题和冷启动问题,导致推荐系统的准确度不高。因此针对协同过滤的局限性,本文尝试加入辅助信息,做出了以下
学位
我国作为世界人口第一大国,截至2021年年末,我国受到视力障碍影响的人数已多达1700余万,视力的受损甚至丧失使他们的正常出行受到了严重的影响。为了解决视力障碍者出行不便的问题,研究人员设计出了各种导盲设备。但是现有的一些导盲设备普遍以检测道路水平面以上的正障碍物为主,却往往忽略了视力障碍者出行时对他们威胁更大的坑洞等水平面以下的负障碍,同时这些导盲设备普遍存在功能不全,无法实时预警,携带不便等问
学位
忆阻器因具有存储大量信息和模拟神经突触功能的特性,已成为一种受到广泛关注的纳米级器件。然而,忆阻器还存在一些不足:一方面,忆阻器中导电细丝的随机形成导致器件参数分布具有一定弥散性,增加了误读可能性,因此优化忆阻器性能是其发展过程的一项重要任务。另一方面,在忆阻器功能层中掺杂金属量子点是提高器件性能的可行方法,但是金属量子点会发生聚集现象,不利于器件的稳定,解决金属聚集问题也是提高器件性能的有效方式
学位
由于传统的冯·诺依曼计算机中的计算和存储是分离的,因此数据的访问和处理需要更多的能量和时间。忆阻器(Memristor)作为一种新型的存储器件,能够解决上述冯·诺依曼的瓶颈问题,它能够模拟人脑兼具存储和计算的功能,其应用前景不可估量。然而,传统的忆阻器存在着开关电压分布离散,不稳定和与CMOS不兼容等问题。经研究发现铁电忆阻器和基于量子点材料的忆阻器可有效改善上述问题。一方面,在外加电场的调控下,
学位
阿尔茨海默症(Alzheimer’s Disease,AD)是一种不可逆的神经退行性疾病,俗称老年痴呆,患者群体主要是老年人。轻度认知障碍(Mild Cognitive Impairment,MCI)是阿尔茨海默症患者早期的病理状态。传统的诊断方法对医生要求较高,误诊率也相对较高,易导致患者错过最佳治疗时间,及时准确地诊断对缓解AD和MCI患者病情具有重要的临床意义。磁共振成像(Magnetic
学位
肺癌是死亡率最高的恶性肿瘤,严重威胁人类的生命健康。计算机断层扫描技术(CT)能够实现对肺癌快速、有效的检测。基于CT图像的计算机辅助诊断技术能够识别和分割CT图像中的肺肿瘤,为肺癌的精确放射治疗提供重要参考信息,如何高效、准确对肺肿瘤进行分割仍是计算机辅助诊断领域内的研究热点。而在各种类型的肿瘤分割问题中,血管黏连型肿瘤由于肿瘤与血管的黏连处在CT图像中没有明显边界,极大的增加了计算机识别肿瘤与
学位