基于用户兴趣子类的协作过滤研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:xxzxzzm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务规模的进一步扩大,用户数目和文档资源急剧增加,导致用户数据的极端稀疏性和系统扩展性问题。传统协作推荐算法都无法完全解决这些问题,针对Web个性化信息推荐(Web Personalized Information Recommendation:WPIR)面临的主要挑战,本文以用户兴趣子类为线索,以基于用户兴趣子类的协作推荐算法实现为目标,对WPIR系统的设计及关键技术进行了有益的探索和研究。论文所做的工作主要有以下几个方面:①提出了将用户兴趣描述细分为多个兴趣子类的思想,给出了基于用户兴趣子类的协作推荐系统框架,并对其主要组成部分的作用及完整的信息推荐过程进行了较为详细的描述。②针对用户兴趣描述问题,给出了一种基于兴趣子类的用户兴趣表示模型,有利于对用户兴趣描述向量降维、发现最近邻和提高推荐效果。然后,研究给出了一种基于ICT(Interests Category Tree)的用户兴趣分类方法,用于用户兴趣描述文件的自动生成。进而,通过对Rocchio反馈算法改进,提出了基于VSM相关反馈的词条权重调整算法,用于用户兴趣描述文件的自动更新。③研究给出了基于用户兴趣子类的协作推荐算法。通过子类处理思想的引入,使得某两个用户即使整体不相似却因为“局部点”相似,从而使“最近邻居”的发现变得更容易、更准确。该算法能够较好地解决数据的极端稀疏性问题,有利于更好地发现新信息。④此外,我们还对网页特征词权重计算方法从词位置和语义两个方面进行了改进,以便更准确地描述用户兴趣子类(3.4节);通过将数目巨大的文档分类,实现了对传统的用户-项矩阵降维,有利于系统扩展性问题的解决(5.2节)。⑤最后,通过与传统基于用户的协作推荐算法进行多个角度比较,对新的用户兴趣表示模型及相应的协作推荐算法进行了有效性验证。实验表明,本算法能够较为有效地解决数据极端稀疏性问题和扩展性问题。在同等条件下,相对于传统面向用户的协同过滤推荐算法[8]有更好的推荐效果。该论文研究提出的基于兴趣子类的用户兴趣描述模型及基于用户兴趣子类的协作推荐算法,对于用户个性化信息服务领域、客户信息管理、电子商务、以及数据挖掘领域有很好的学术意义和应用参考价值。
其他文献
近年来,随着计算机应用的普及和不断发展,对于一个建立在集群技术之上,能够实现企业内部网络资源优化利用的作业管理系统的需求变得日益迫切。本文所研究的网络作业管理系统(
近几年来,随着因特网的普及和发展,数字图像的版权问题越来越引起人们的注意,其中数字水印作为版权保护的一种有效手段得到了广泛的关注。按检测时是否需要原始作品或其它辅助参
物联网系统的更新成为物联网广泛应用后的一个突出难题,人工到达安装现场逐个对节点进行更新的传统手段不仅耗费大量的人力与物力,而且是不切实际的,一种远程自动的、支持范
当前,急剧变化的市场环境使得制造企业必须以高度敏捷性来赢得竞争优势。由此,动态调度技术成为调度领域的研究热点,其理论价值和现实意义日益显著。本文以基于知识的动态调
近年来,手机和PDA(PersonalDigitalAssistant,个人数字助理)等无线终端越来越普及。支持KJAVA技术和具有GPRS无线上网功能、大容量存储、高运算能力和宽屏幕的智能手机不断推陈
聚类分析(Clustering Analysis)是数据挖掘研究中一个十分重要的研究方向,数据对象的聚类过程是一种无监督自学习的数据分类过程,聚类分析算法研究是一个极具挑战性的研究课
词语处理技术是基于词一级中文信息处理应用的重要基础,也是中文信息处理技术的瓶颈。词语处理首先需要解决的是词语切分问题。目前自动分词系统性能,在歧义切分处理方面已经达
车载自组网(Vehicular Ad Hoc Network, VANET)属于一种特殊的Ad Hoc网络。VANE T不仅可以应用在行车安全方面,而且在导航和智能交通领域表现出色。未来在新闻、视频会议等以
数据密集型应用对存储系统的性能和可靠性都有着非常高的要求,但长期以来人们使用的硬磁盘(Hard Disk Drive, HDD)由于其物理结构的限制,不能很好的满足这两个要求。而基于NA
目前,人们已将信息管理技术应用到岩土工程中来,开发了许多具有可视化查询分析特征的信息管理系统和稳定性评价系统。这些系统的开发建设为岩土工程信息化起到了很大推动作用