推荐系统中协同过滤算法关键问题研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:hcjw248
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Wleb技术在互联网中发展,用户不再是简单地从网络中获取信息,而是采取更加主动的方式产生信息。由于用户数量的急剧增长,以用户为中心的信息产生模式,导致了互联网信息量呈现飞速增长,这种现象被称为“信息过载”。该现象是指在海量信息面前,人们无法迅速准确地获取对他们有用的信息。为了解决“信息过载”问题,推荐系统由此而产生。推荐系统不要求用户提供准确的需求,而是根据对用户的过去行为进行分析,从而推测出用户在将来可能需要的信息。当前,在众多推荐技术中,协同过滤推荐技术由于它独特的优点,在电子商务中取得了广泛应用。虽然协同过滤推荐算法的研究工作已经取得许多成果,但依然存在很多问题亟需解决。比如“冷启动”、“可扩展性”、“数据稀疏性”等问题,这些问题的存在,对算法的准确性造成了影响。如何解决上述问题,改进协同过滤算法性能,一直是推荐系统中重点研究的课题。论文主要工作如下:第一,针对协同过滤技术中存在的“冷启动”、“可扩展性”问题,提出了结合用户属性聚类的协同过滤推荐算法ID-CF。该推荐系统通过加入权重的方法,将基于项目的协同过滤算法与K—means算法相结合,显著提高其推荐准确度。在算法中,由于项目之间的相似性和用户聚类可以离线计算,这样可以解决推荐系统的可扩展性问题。当一个新用户加入系统时,通过使用聚类算法,可将新用户添加到最相近的用户集,这样可以快速预测用户对项目的评分,冷启动问题也可较好地解决。第二,由于“数据稀疏性”问题对协同过滤算法的准确性有较大的影响,提出了一种结合图模型的协同过滤推荐算法NG-CF,该算法提出一种新的相似性度量标准,即用户或者项目之间的相似性,可以通过图中顶点之间的关系来获得,然后使用K-近邻算法产生预测。实验表明, 即使改变数据稀疏性,预测结果也具有较好的稳定性。“冷启动”、“可扩展性”、“数据稀疏性”等问题是协同过滤推荐算法研究的热点问题,论文是在前人的工作的基础上,仅仅做出一些探索和分析,还有许多问题需要改进。
其他文献
在现代处理器开发中,早期空间探究设计是一个重要的因素。多核处理器的趋势导致了大规模体系结构底层的复杂性和异构性。随着多核处理器时期的到来,体系结构的设计、评价和最
随着网络的不断发展,安全的重要性越来越突出,原有的防火墙已经难以单独保障网络的安全,入侵检测系统开始发挥出不可替代的作用。然而,现有的入侵检测系统在有效性、适应性和
无线传感器网络从概念出现开始就引起人们广泛关注并被寄予厚望,在最近的几年内,各种无线传感器网络产品不断投入到生产、生活、科研等应用中,尤其近期温家宝总理关于“感知
IEEE 802.15.4标准是提供给低速率、低功耗和低成本设备使用的短距离无线通信协议并定义了低速无线传感器网络的MAC层和物理层规范。本文通过深入研究该协议标准,在低功耗的
汉字是历史悠久的中华民族文化的结晶,闪烁着中国人民智慧的光芒。汉字识别是一种难度非常大的模式识别。其中脱机手写汉字识别是目前最为困难也最具挑战性的研究课题。在办
随着Web技术的发展,非关系型数据库已经成为国际数据库界研究热点。同时,伴随着XML技术的发展,XML正逐渐成为Web上数据表示与交换的统一标准。因此,有关XML数据管理技术的研
电力变压器作为电力系统中最重要的输变电设备之一,它的性能直接影响到电力系统运行的安全和可靠。及时、准确地掌握其运行状态和故障情况,并采取相应的处理措施,对于提高电力系统运行的安全性、可靠性和经济性具有重要的意义。针对变压器的故障诊断,前人提出了很多的解决方法,但都有这样或那样的缺陷,不能迅速、准确的做出判断。本文针对目前变压器故障诊断技术在实际应用中所存在的主要问题,引入神经网络理论,将改进的粒子
学科建设是高等学校建设和发展的核心,是高等学校长期而艰巨的任务。学科建设的状态体现高等学校的整体办学实力、学术地位和核心竞争力,其内容涉及到学科队伍建设、科学研究、
由于互联网资源的“成长性”、“自治性”和“多样性”,传统的C/S模式的资源搜索方法逐渐不能满足发展需求。近年来,人们提出建立基于DHT(distributed Hash table)的对等网络实
虚拟化技术凭借充分利用宿主机资源、快速部署、高可用性等优势在企业中得到了广泛应用。近几年,随着企业信息化规模的不断扩大,虚拟服务器的部署规模也在不断扩大,相对于传