【摘 要】
:
随着互联网技术的飞速发展,各类数据飞速增长,然而过多的信息带来了过多的选择。为了解决信息过载的问题,推荐系统应运而生,其中协同过滤是推荐系统中相对成功的技术,然而也面临着数据稀疏性,可扩展性等挑战。为了解决传统算法的不足,改进基于用户的协同过滤算法,本文从对高维矩阵降维和改进用户相似度计算方法两个角度进行深入分析和研究,建立一种融入信任因子的二阶段聚类推荐模型。对较为稀疏的原始用户评分数据进行预处
论文部分内容阅读
随着互联网技术的飞速发展,各类数据飞速增长,然而过多的信息带来了过多的选择。为了解决信息过载的问题,推荐系统应运而生,其中协同过滤是推荐系统中相对成功的技术,然而也面临着数据稀疏性,可扩展性等挑战。为了解决传统算法的不足,改进基于用户的协同过滤算法,本文从对高维矩阵降维和改进用户相似度计算方法两个角度进行深入分析和研究,建立一种融入信任因子的二阶段聚类推荐模型。对较为稀疏的原始用户评分数据进行预处理。先根据项目之间的相似性初步预测用户对未评分项目的评分,以此来填充矩阵空缺值,使其变为可以进行SVD降维的稠密矩阵。接着通过SVD方法得到低维度的用户隐式特征空间,以此提高计算效率。在缩小的空间上构建融入信任因子的二阶段聚类协同过滤推荐算法模型。得到用户隐式特征空间矩阵后,利用模糊聚类方法,初步确定每个用户的邻居用户簇;再将信任传递因素加入到本地信任的度量中,挖掘出用户间的潜在关联,缓解了可用信息不足的问题。同时考虑了用户在整个网络中的被信任程度,计算了用户的全局信任度。并将两者结合起来,得到综合信任度的度量方式。通过二阶段的邻居查找,提高了邻居查询的准确度;最后,基于可信邻居群中用户的项目评分,来预测目标用户的未评级项目,从而提高了推荐的准确度。结合前两个研究点使用经典数据集设计实验,首先通过实验找出算法的最优参数,然后将其代入到改进算法中,计算三种经典协同过滤算法与改进算法的MAE值,通过比较得出,改进算法的准确度比另外三种算法都高。再将改进算法应用到搭建的电影推荐系统中去,实现该系统的推荐功能,验证了算法的可行性。
其他文献
D2D传输是允许终端设备不经基站而直接进行数据传输的短距离通信技术,具有减轻基站负荷、减小设备能耗、降低通信时延等优点,近年来成为移动通信领域的研究热点之一。为了进
研究背景:妊娠糖尿病(Gestational Diabetes Mellitus,GDM)是指怀孕期间发生或初次发现的不同水平的糖耐量受损,其患病率高达6.9%-24.5%。多项的研究表明GDM能导致多种近期及远期的母儿并发症,虽然是于妊娠中期(24-28周)进行的葡萄糖耐量试验而诊断,而其时高血糖对母儿不良影响已经产生。同时,由于二胎政策的实施和生活方式的改变导致高龄孕妇和肥胖孕妇增加,使得GD
随着社会的发展,越来越多的摄像头被安装到商场、地铁、校园、港口和飞机场等公共场所,从而形成了一个大型的视频监控网络。行人重识别就是判断在不重叠摄像头下的行人是否是同一行人的技术。由于不同摄像头所具有的参数、安装角度和周围环境不同,使得在不同摄像头下的行人很容易受到视角、光照和姿态等因素的影响,从而出现同一行人不相似而不同行人更相似的问题。为了解决上述行人重识别中可能出现的问题,本文从特征提取和度量
忆阻器作为新兴的基础信息器件,在非易失性高密度存储、类脑神经形态计算、可重构逻辑运算等领域具有广泛的应用前景,受到学术界和工业界广泛关注。通过调控忆阻器中金属导电通道的稳定性,可以实现非易失性记忆开关和易失性阈值开关行为,前者可以作为嵌入式存储器、非易失逻辑功能的物理基础,而后者则可应用于构建选通管、人工神经元、随机数产生器等。本文系统研究了Cu导电通道型忆阻器的非易失性记忆开关和易失性阈值开关特
本文以2,3-二甲氧基-1,4-苯二醛或2,3-二羟基-1,4-萘二醛为基础原料,以苯基或萘基对其末端基进行修饰,合成了四个Salamo型荧光化学传感器,并通过紫外-可见吸收光谱、荧光光谱
锂离子电池具有比能量值高、循环寿命长和无记忆效应等优点,被广泛应用于电动汽车、航空航天和电力储能等领域。随着锂离子电池的反复充放电,电池容量会逐步下降,循环寿命衰
随着计算机视觉的快速发展,人们对图像的视觉要求越来越高,高质量、信息丰富的全景图也成为人们的日常需求。图像拼接是一种将同一场景下的数幅有序且包含重复区域的图像拼接
随着人类现代生活和生产活动的日益丰富,诸如演唱会、集市、大型招聘会等社会活动变得越来越多。人群聚集活动多发生在城市广场、学校、大型超市等公共场所,随之导致了群体性异常事件的频发,严重威胁到了社会公共安全和稳定,所以基于视频监控下的人群研究有着重要的意义。行人统计研究作为人群研究中重要的课题之一,越来越受到广大研究者的青睐。然而,监控场景中不可避免的会受到诸如物体阴影、光照变化和遮挡等因素的影响,使
随着计算机科学技术的发展,图片数据的数量正急剧上升,与此同时,视觉是人类感官信息的主要来源,计算机视觉通过模拟人类视觉系统进行计算、感知、认知,逐渐成为重要的研究方
近年来,我国企业通过海外并购等形式“走出去”已经成为重要的发展趋势,许多企业更是试图利用海外并购提升自身的研发能力。现有理论认为,由于无法从国内获得提升竞争力所需