面向稀疏数据的协同过滤技术研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:hebeihuazi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展和移动设备的普及,信息呈现爆炸式的增长,出现了“信息过载”和“信息迷航”的问题,如何快速准确的帮助用户挑选出其感兴趣的物品成为大数据时代面临的一个难题,推荐系统应运而生。协同过滤技术是推荐系统中应用最为广泛、成功的推荐算法之一,分析用户的历史行为,对用户提供个性化推荐服务。随着商业网站规模越来越大,用户评分的项目通常只有很少的一部分,用户评分矩阵非常稀疏,推荐质量下降。为了缓解稀疏性带来的影响,现有的解决方法主要是空值填补技术和使用新的相似性计算方法。空值填补技术的思想主要是利用已有的评分数据填充用户的评分缺失值,这种方法使用简单,不会给用户使用系统带来额外负担。但空值填补技术本身是对评分缺失值的一种人工预测,预测值不能完全代表用户的真实偏好。新的相似性计算方法利用用户评分数据中包含的各种信息,比如用户的共同评分项目、评分众数等计算用户之间相似性,这种计算方法具有较高的稳定性,但仍然是基于用户已有的有限评分数据进行的计算,对系统推荐质量的改善程度有限。针对以上问题,本文主要工作如下:(1)提出基于稀疏聚类和用户信任度的协同过滤算法。针对在数据稀疏情况下聚类效果不理想、在维度约简时舍去了过多有用信息的问题,采用稀疏子空间聚类算法对用户进行聚类,保留更多有用的信息;在相似度计算中结合用户信任度进行计算:首先计算用户在数据集的有效、公正评分,为每个用户建立用户的可信任度矩阵,然后将改进的基于评分众数的用户信任度融合进去,结合传统的相似度量方法进行相似度计算。在电影数据集上的实验结果表明,算法可以积极缓解在数据稀疏情况下查找近邻不精准的问题,提高推荐质量。(2)提出基于用户共同喜好评分和基于评分时间差的协同过滤算法。在电影推荐领域,针对现有的推荐算法在共同评分项目上未考虑评分差异性的问题,将用户共同评分中差值不大的数据设置为共同喜好评分集,用传统相似算法计算相似度时,结合喜好评分进行相似度的改进;针对电影推荐系统现有算法未考虑电影上映时用户评分时间(观影时间)对用户相似性影响的问题,提出了基于用户评分时间差的算法,在电影上映阶段,计算用户和用户之间对项目的评分时间差值,然后对传统的相似度计算方法进行改进,在共同评分项目上评分时间差值越小的用户,用户相似度相应越高。在电影数据集上的实验结果表明,算法可以提高推荐的质量。
其他文献
我国水能资源蕴藏量与可开发量均高居世界第一,对水能资源的有效利用与开发需要大量的水力机械设备,然而空蚀磨损一直是制约我国水力机械发展的主要因素,已经成为当前我国水
目的:自杀是抑郁症最严重且危害最大的问题之一,目前病因机制不明。影像学研究发现抑郁症自杀未遂患者(depressed suicide attempter,DS)存在结构和功能上的损伤,但结论不一,且结构与功能的关系不明。本研究利用结构及功能影像学技术,从多模态角度探索和验证DS患者额顶网络内部结构和功能的改变以及二者间关系,以期阐明DS的神经病理基础,为自杀的早期临床干预提供帮助。方法:招募187
目的:(1)了解Burkitt淋巴瘤在人群中的临床特点及预后。(2)了解Burkitt淋巴瘤患者的生存情况,分析影响预后的因素。(3)比较儿童与青少年生存预后的差异并探讨其成因。研究方法:回顾性地分析了2010年1月至2018年9月南京医科大学附属儿童医院与南京医科大学附属第一医院收治的82名Burkitt淋巴瘤患者的临床资料。包括发病初期的临床症状与体征,实验室指标,生存预后情况。总结其临床表现
随着经济社会的发展,城市现代化建设的步伐加快,人们的日常生活、工作模式和思想观念都发生了革命性的转变,居民更加渴望能够接触到大自然、希望能够拥抱大自然。居住区绿化从注重景观设计的理念和发展方向逐渐转变为给人们可以提供“诗情画意”的休闲栖居和生活环境,新中式风格应运而生。新中式风格作为一种新的景观设计风格,它将一种源于中国的传统园林文化的精髓充分运用到现在的园林景观设计中,以更好的满足于当代人的居住
骨肿瘤术后易复发,磁性骨水泥可在骨修复的同时磁热疗以辅助治疗肿瘤,防止其复发与转移。但是目前所研究的磁性骨水泥,居里温度(Tc)高,在交变磁场下,材料生热会易过度生热而造成灼伤的风险。本研究针对目前磁性骨水泥热疗风险过高的缺陷,用居里温度(Tc)可进行调节的纳米Mn-Zn铁氧体为磁性功能相,以由固相和液相调和而成、在固化前可任意塑形的磷酸钙骨水泥做基体,将纳米Mn-Zn铁氧体引入磷酸钙骨水泥中,制
目的描述盐城市核技术应用机构辐射防护现状、放射工作人员职业暴露水平及健康状况,识别放射防护薄弱环节,降低职业性放射相关疾病和健康损害的发生风险。为探讨长期低剂量辐射的健康损害、改善放射工作人员的职业健康管理提供科学依据。方法通过分层随机抽样方法,于2018年在盐城市选取33家放射诊疗机构和10家工业核技术应用机构为研究现场,机构内全部放射工作人员为调查对象。对医疗及工业核技术应用机构的140个放射
目的本研究通过对江苏省基层医疗卫生机构改革现状进行研究,了解基层医务人员、患者及卫生部门管理人员对基层医改的认知情况,分析基层医疗卫生机构在运行发展中存在的问题,针对问题提出具体的完善策略,为促进基层医疗卫生机构的有序发展,有效缓解“看病贵、看病难”提供参考。方法本研究采用文献研究法查阅文献及相关资料,经过课题组讨论后制定调查问卷和访谈提纲。通过典型抽样、偶遇抽样相结合的方法进行现场调查,按照经济
目的:探讨血管内介入治疗颅内大动脉闭塞所致急性缺血性卒中术后颅内出血转化的影响因素;并探讨机械取栓失败后补救性支架植入的有效性和安全性。方法:收集并回顾性分析2017年1月至2019年9月间我院收治的94例接受血管内介入治疗的AIS患者的临床资料,所有患者均接受机械取栓,取栓再通失败者行补救治疗。根据术后是否发生颅内出血转化分为两组,出血转化组(HT组)31例,未出血转化组(非HT组)63例,采用
可逆信息隐藏技术是一类具有特殊性质的信息隐藏技术。不同的是,它不会对载体图像造成永久性失真,能够在提取秘密信息后无损重构出载体图像。该特性使得可逆信息隐藏技术在一
在现代企业经营管理过程中,全面预算管理体系在企业内部控制甚至战略发展方面地位显著提升。伴随着我国外部市场环境的不断改善和企业组织形式的多样化,公司价值最大化逐渐成为公司追求的财务管理目标,最大的优点是其考虑了创造的利润和投入资本之间的关系。不同于传统全面预算管理中的会计利润指标,EVA指标考虑到了资本费用这一影响企业价值的因素,能够较好地体现企业的价值创造能力和提高企业的经济效率。同时将其运用到全