论文部分内容阅读
自上世纪90年代以来,互联网已经迅速发展成为我们生活、工作和学习中一个不可或缺的重要组成部分。如何从这个巨大信息海洋中寻找所需的信息资源或定制自己的服务成为人们迫切关心的问题。同样,作为互联网服务的提供方,Web站点的重要性也日益提高,如何合理设计网站布局以方便用户浏览成为Web站点优化工作的重点。与此同时,电子商务也在以令人难以置信的速度蓬勃发展着,在这样一个全新的商业环境中,怎样吸引新的客户并通过自身提供的资源和服务进一步留住这些客户,成为众多开展电子商务企业所面临的一个难题。为解决上述三方面问题,研究人员提出了相应的Web推荐技术,包括:Web搜索推荐、站内导航推荐和电子商务推荐。基于搜索推荐技术的搜索引擎很好地迎合了普通用户的查询需求,成为用户查询互联网信息,进行信息检索的一个重要手段。而基于Web使用挖掘技术的站点优化技术也是目前研究的一个重要方向,它在完善自身站点设计的同时能进一步提供站点导航服务。此外,个性化推荐服务成为了建立个性化电子商务站点的一个重要途径。但是,随着互联网的不断发展,一些新的特征也随之出现,其中最大的变化就是它的“增量动态更新”。Web上日益增加的数据导致了对这些数据使用方式亦发生着快速变化,它所带来的问题是Web服务提供者如何能适应这样的变化,为用户使用互联网提供更好的服务。这些变化给现有Web信息、服务推荐技术带来了诸多挑战。为此,本文提出了基于Web挖掘的信息推荐技术研究,针对上述三类推荐技术中存在的类似问题进行了有益的探索。论文的主要工作包括以下几个方面:(1)Web搜索推荐:针对目前搜索推荐研究中存在的“权威偏见”问题,提出基于页面更新的主题关注算法(Topic-Attentive Page Ranking Algorithm,TAPR),从各主题受关注程度的角度来改进页面排名评分计算,以改善新加入的重要页面排名低的现象。(2)站内导航推荐:针对网站导航推荐研究中日志增量更新、用户兴趣不断变化的问题,提出基于蚁群聚类的用户访问模式增量挖掘算法,首先利用蚁群聚类分析方法实现用户模式的聚类,然后引入一种类解体机制,使之能不断随着用户兴趣度的变化而形成新的类别,从而实现用户访问模式挖掘的增量式更新,以