论文部分内容阅读
Internet网站正在从“以网站为中心”向“以用户为中心”发展,因此Internet网站的发展趋势是个性化网站(Personalization Web Site)。个性化网站应尽可能地迎合每个用户的浏览兴趣并且不断调整自己来适应用户浏览兴趣的变化。具体的说就是,任何一个网站的老用户,当他在访问个性化网站的时候,总有一种感觉,那就是:好象整个网站都是为他设计的,一切都是那么熟悉,而且都是自己感兴趣的东西。任何一个网站的新用户,当他在访问个性化网站的时候也有一种感觉:网站特别友好,很容易找到自己感兴趣的东西。针对目前Web站点多、信息量大而杂的特点,如何使用户在庞大的网络数据资源中很容易地找到自己真正需要的东西成为当前研究的重点和热点。由于Web资源的爆炸性增长,对于已经把Web转化为关键发展工具的信息网站(特别是电子商务网站)来说,运用数据挖掘技术获取用户的访问模式对于网站的生存是十分有利的。本文把数据挖掘技术应用于信息化网站,得到Web用户访问模式,并利用用户访问模式及时地对网站的内容和结构进行完善和改进,以满足用户的个性化需求。目前,国内外对Web用户模式挖掘的研究主要集中在对用户浏览路径的研究。而本文是从另一个角度(用户访问过程中关注的内容)进行考虑,将每个网页细分为一个或多个概念(用户关心的通常是其中很少的一个或几个概念)。论文中首先根据网站拓扑结构生成网站的概念树。其次,引入一种从事务的浏览路径页面序列到事务的浏览路径概念序列的转换方法和根据页面浏览时间估算概念浏览时间的方法。再利用基于粗糙集理论中的可变精度模型(VPRS)的兴趣识别算法获得用户概念模式,并将其转换为用户的兴趣概念树,从而为网站的个性化推荐服务。最后,初步实现了一个个性化网站模块的设计。