论文部分内容阅读
随着计算机技术和网络技术的发展,Internet上的信息量以指数规律迅猛地增长和扩展,而且其信息的组织是异构的、多元的和分布的。一方面是人们对有用信息需求的紧迫性与日俱增;另一方面,人们面对由于信息不断地更新和增加形成的“信息爆炸”,如何从中得到自己想得到的知识,却感到束手无策。对于普通的用户来说,Internet上的“信息迷航”和“信息过载”已经成为日益严重的问题。因此如何使用户快速有效的获取感兴趣的信息,如何将用户感兴趣的信息主动推荐给用户的服务方式,已经成为许多用户和网站经营者共同关心的问题。解决问题关键在于将Internet从被动接受浏览者的请求转化为主动感知浏览者的信息需求,实现Internet系统对浏览者的主动信息服务。本文从信息个性化服务研究入手,在阐述信息个性化服务研究现状、研究内容的基础上,对信息个性化服务的相关理论、采用的关键技术及个性化服务评价进行了研究,并将两种新的算法带入到个性化服务“冷启动”问题的研究和解决中。目前基于网络的信息个性化服务所采用的各种推荐技术中,基于协同过滤的推荐技术是应用最广泛也最成功的,该技术相对于诸如基于内容过滤的推荐技术、基于知识的推荐技术等等在技术的实现难易程度、算法的时间复杂度、空间复杂度等内容上都有较大的优势,然而它也有其自身的不足,如:精确性问题、稀疏性问题、“冷启动”问题、扩展性问题等一直在困扰着协同过滤技术的进一步发展。其中的“冷启动”问题是指在数据稀疏的极端情况下,一个新的项目首次出现,没有用户对它作过评价,或者一个新用户没有对任何一个项目做过评价,那么基于用户的协同过滤算法根本无法进行。“稀疏性问题”和“冷启动问题”直接影响到个性化信息服务系统推荐的正常运行,本文对“冷启动问题”进行了深入的研究,创新点在于针对“新用户”和“新项目”的“冷启动问题”提出了新的解决算法,设计了个性化服务的一种评价方法,采用两种权威数据集对新算法进行了试验,并且根据试验结果给出结论。