论文部分内容阅读
随着电子商务规模的进一步扩大,用户数目和文档资源急剧增加,导致用户数据的极端稀疏性和系统扩展性问题。传统协作推荐算法都无法完全解决这些问题,针对Web个性化信息推荐(Web Personalized Information Recommendation:WPIR)面临的主要挑战,本文以用户兴趣子类为线索,以基于用户兴趣子类的协作推荐算法实现为目标,对WPIR系统的设计及关键技术进行了有益的探索和研究。论文所做的工作主要有以下几个方面:①提出了将用户兴趣描述细分为多个兴趣子类的思想,给出了基于用户兴趣子类的协作推荐系统框架,并对其主要组成部分的作用及完整的信息推荐过程进行了较为详细的描述。②针对用户兴趣描述问题,给出了一种基于兴趣子类的用户兴趣表示模型,有利于对用户兴趣描述向量降维、发现最近邻和提高推荐效果。然后,研究给出了一种基于ICT(Interests Category Tree)的用户兴趣分类方法,用于用户兴趣描述文件的自动生成。进而,通过对Rocchio反馈算法改进,提出了基于VSM相关反馈的词条权重调整算法,用于用户兴趣描述文件的自动更新。③研究给出了基于用户兴趣子类的协作推荐算法。通过子类处理思想的引入,使得某两个用户即使整体不相似却因为“局部点”相似,从而使“最近邻居”的发现变得更容易、更准确。该算法能够较好地解决数据的极端稀疏性问题,有利于更好地发现新信息。④此外,我们还对网页特征词权重计算方法从词位置和语义两个方面进行了改进,以便更准确地描述用户兴趣子类(3.4节);通过将数目巨大的文档分类,实现了对传统的用户-项矩阵降维,有利于系统扩展性问题的解决(5.2节)。⑤最后,通过与传统基于用户的协作推荐算法进行多个角度比较,对新的用户兴趣表示模型及相应的协作推荐算法进行了有效性验证。实验表明,本算法能够较为有效地解决数据极端稀疏性问题和扩展性问题。在同等条件下,相对于传统面向用户的协同过滤推荐算法[8]有更好的推荐效果。该论文研究提出的基于兴趣子类的用户兴趣描述模型及基于用户兴趣子类的协作推荐算法,对于用户个性化信息服务领域、客户信息管理、电子商务、以及数据挖掘领域有很好的学术意义和应用参考价值。