论文部分内容阅读
随着Internet的不断发展,全球的网站数量也在急剧增加,随之增加的页面数量更是不可胜数。因此,信息过载和资源迷失己经成为制约人们高效使用Internet信息的瓶颈。信息过载是指用户面对太多的信息难以及时地消化、吸收;资源迷失是指用户不知道如何确切地表达对网上资源的需求,也不知道如何准确有效地寻找资源。而个性化推荐系统能够根据用户的兴趣偏好主动推荐他所需的资料,它的出现解决了人们寻找信息难的问题。
Web个性化系统的目标是为用户提供他们想要的或需要的信息,而不必明确询问用户的需求。传统推荐系统的方法是直接收集服务器日志作为Web使用数据,通过分析用户的行为模式,挖掘出用户的兴趣、偏好,然后将系统认为是与用户相关的网页链接向用户推荐。本文应用新的方法--远程代理收集Web使用数据,为数据预处理提供了方便,并提出了精确序列模式的方法进行Web页面推荐,扩展了N-Gram,从而分别提高了网页推荐的准确率和覆盖率。并且在推荐系统实时运作的过程当中实时抽取有价值的用户访问模式,不断的调整结果页面推荐集合以适应网站的不断发展,避免了网站在精力一段时间的服务后不得不得在离线状态下重新进行模式发现。