论文部分内容阅读
当今互联网的发展和应用日益广泛,各类网站所提供的功能和服务也越来越丰富。上网的用户和网上的信息飞速增长,网上的数据资源也是空前的丰富。然而当单个用户面对整个互连网的海量信息时,用户往往感到很难找到其真正需要的有用信息,且信息的访问路径也没有考虑到信息的重要性和普遍关注性。并且现有的各种网络数据管理方案都不能有效的满足当前数据统计及管理的需要,所以将多Agent系统(MAS Multi-Agent System)应用于网络是构造新一代网络以及Web数据挖掘的全新思路。Web日志中积累了大量的有用信息,从Web日志中发现有用的信息是非常必要的。该文分析了Web日志的结构,同时提出了通过访问路径挖掘来发现用户的浏览模式的方法。通过对用户访问记录的数据挖掘,对已存在的Web站点的结构及站点内的页面进行调整和改善,优化网站的结构,提高网站的服务性能和服务质量,使其各类信息和服务以更有效的方式提供给用户。多代理的特点在于多个Agent之间相互对话和协商工作,有效地完成共同任务。由于把Agent本身的特点自然地引入到数据挖掘过程中,使数据挖掘系统具有了自治性、自动反应性、交互性及适应环境性等特点。利用此数据挖掘的方法,可以通过一个网站主页的访问记录以及该用户从当前主页连结出去的几个页面的访问路径数据对用户访问的一般模式进行挖掘,从中发现用户感兴趣的东西,及时调整网站结构及站点内的页面,无疑将会极大的方便用户。
本文完成的系统是在JADE(Java Agent Development Framework)平台上开发的。JADE是一个软件开发框架,用于开发多Agent系统和符合FIPA标准的智能Agent应用程序。它包含两个主要的产品:一个符合FIPA标准的Agent平台和一个开发JAVA Agent的包。本论文首先具体地介绍了Agent的技术,以及多Agent系统的特征和体系结构。在这些理论的基础上,着重研究了多Agent系统中各代理Agent间交互合作的通信方式。其次,我们讨论了一个用于创建多Agent系统的平台一JADE的特点,以及JADE为程序员提供的各种功能。在对所介绍的知识有了详尽了解的基础上,本文提出了一个基于多Agent技术的WEB数据挖掘系统。文中对该原型的实现、以及对数据的预处理和挖掘算法都给出了一定的论述和见解。