蚁群算法在Web挖掘中的应用研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:mugua220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文比较系统、完整地分析和论述了Web挖掘中的各项技术,总结了现有的Web挖掘中的聚类技术和分类的研究成果。结合蚁群优化算法,将一种基于蚂蚁“相容理论(colonial closure)”原理的聚类算法应用于Web使用挖掘的页面聚类中;并引入一种基于“蚂蚁觅食”原理的分类算法应用于Web内容挖掘的页面分类中。实验结果表明:与传统算法相比较,基于蚂蚁的聚类和分类算法在Web挖掘中具有一定的优势。 论文首先对Web使用挖掘的四个过程:数据预处理、模式发现、模式分析和模式应用进行了详细地论述、并对在Web挖掘中进行聚类和分类的现有技术的优缺点做了综述性的评价。介绍了蚁群算法的起源、蚁群算法的原型以及为了借鉴蚂蚁行为而建立的人工蚂蚁概念与真实蚂蚁的异同,且给出了蚁群聚类算法的基本思想。在给出了必要的背景知识之后,本文将一种基于蚂蚁“相容理论”原理的聚类算法应用于Web使用挖掘的页面聚类中,对Web日志进行了根据目的而需的预处理工作。实验结果表明:较传统算法,该聚类算法对Web页面进行聚类时,无需先验知识的支撑,并能够聚出各种大小的簇、且聚类结果能够很好地被解释。 然后,论文提出一种蚂蚁分类算法Ant Miner3应用到Web
其他文献
随着数据库的不断增长,自动从数据库中获取有用的知识成为人们日益迫切的需要。粗糙集理论(Rough Sets)就是在这样背景下不断发展起来的一种用于不精确、不确定数据挖掘与处理
三维地质建模是将科学可视化技术与地学研究特点结合,通过可视化技术的研究,实现面向地学应用的三维GIS,以图形图象形式逼真再现三维地质实体,以便真实重建地下目标的结构,描
近年来,随着网络带宽、计算机处理能力和存储容量的迅速提高,以及各种视频信息处理技术的出现,视频监控进入了全数字化的网络时代。随着微电子、通信以及计算机技术的迅速发展,传
以P2P技术为核心的软件产品越来越为人们所接受和喜爱,但是现有的P2P系统缺乏有效的机制以提高系统的安全性,这是P2P应用没有被广泛采用的一个主要原因。如何在P2P各个对等点
移动视频流终端的解码计算量大,能耗高,成为严重制约用户体验的最重要因素之一。而在云媒体服务环境下,云端服务可为终端提供所需要的服务,前提是移动终端解码器能够提供系统的运
分布式事务的提交和恢复机制是分布式数据库研究中的一个重要方面。提交协议负责事务的正确提交,恢复处理则是在事务处理系统发生故障后,使数据库恢复到某一个一致的状态,它们在
随着零售业竞争的加剧,企业之间的竞争演变为供应链之间的竞争。信息共享是供应链管理的首要条件。当前我国零售业信息化程度参差不齐,各零售企业的采用的信息系统千差万别,
相关反馈技术是信息检索技术研究的热点。目前常用的相关反馈技术依然是基于关键词匹配的方式,在检索的过程中一是没有包含语义信息,二是仅从系统的角度进行信息反馈,没有包
随着网络应用的普及,企业依赖信息化的程度逐渐加深,使信息安全显得越来越重要,为了解决分散环境下的统一用户认证,许多企业和组织对单点登录技术(SSO)进行了大量研究。SSO的
桥梁健康监测系统是通过对桥梁结构状态的监测与评估,为大桥在特殊气候、特殊交通条件下或运营状况严重异常时触发预警信号,分析评估桥梁使用寿命,并为桥梁的养护、维修与管