基于蚁群算法的Web挖掘技术的设计与实现

来源 :长沙理工大学 | 被引量 : 4次 | 上传用户:cwhgh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文通过研究现有的Web挖掘中聚类和分类技术的基础上,将一种基于蚁群优化的分类算法应用于Web内容挖掘的页面分类中:并引入一种基于改进的蚁群算法应用于Web使用挖掘的用户事务聚类中。实验结果表明:与传统算法相比较,基于蚂蚁的聚类和分类算法在Web挖掘中具有一定的优势。 本文首先在对Web挖掘过程进行分析的基础上,详细地分析了Web挖掘中聚类和分类的现有技术的优缺点。深入讨论了几种改进的蚁群算法,在分析了现有算法应用于Web挖掘技术上的不足之后,本文将一种基于蚁群优化的分类算法Ant_Miner3应用到Web内容挖掘中的页面分类上,并进行了非结构化数据集的处理。通过实验分析,得出了分类规则的准确率和简洁性同传统分类算法C5.0进行了对比:Ant_Miner3算法的分类规则在准确率和简洁性方面更优。 最后,引入了一种改进的蚁群算法(Ireproved Ant Colony Algorithm,IACA),并给出了基于IACA的聚类分析模型,继而对相应的算法进行实现,并应用到Web使用挖掘的聚类模型上。通过实验仿真,该聚类算法在聚类过程中,能够很好地避免算法出现停滞,并且较好地解决了全局优化的问题,使聚类的整体性能达到最优。
其他文献
图像去噪算法的研究是一切图像处理的前提,具有重要的意义。任何一个良好的图像处理系统,无不把图像去噪作为首要任务,去噪处理已成为图像处理中极其重要的步骤。本文对异形
供应链管理系统是企业信息化建设的一个重要组成部分。有效的供应链管理可以提高材料利用率、减少资金占用、降低生产成本、提高生产效率,从而提高企业的经济效益。所以研究
综合化航空电子系统具有资源高度共享、信息快速传输和系统软硬件集成度高等特点,这些特点要求航电系统具有高度的安全性和可靠性。资源非法访问、虚假或恶意信息注入、关键
经济的快速发展,城市化日益加剧,商业竞争日趋激烈。因此,给安全监控部门和商业决策部门提供准确的客流信息成为一个亟待发展的科研领域。同时,随着计算机技术的快速发展,双
随着多媒体技术和Internet技术的不断进步,网络多媒体的应用正日益融入人们的日常生活,并发挥着越来越重要的作用。然而,由于当前的IP网络仅能提供一种“尽力而为”的服务,无
如今,小波技术和分形理论逐渐成为图像压缩方向的两大研究热点。虽然起源于JPEG(Joint Photographic Experts Group)的JPEG2000被业内视为图像压缩的国际标准,但是其较低的压
生产与运作管理的核心是车间作业调度问题能否高效地获得优化解,因此,车间调度策略一直是制造业研究的重点之一。有效的调度方法与优化技术的研究和应用,对于制造企业提高生
当前基于文本的检索技术和基于内容的检索技术广泛应用于多媒体资源检索领域。然而,基于文本的检索技术采用手工标注,自动化程度低,标注质量因人而异,不但费时费力,而且难以
众所周知,使用图论来构建网络拓扑结构是建模常见的形式,而且已经被越来越多的学者应用到研究之中。泛圈性和路径嵌入作为衡量网络拓扑结构容错性的一项重要指标,变得越来越
电力变压器是电力系统的枢纽,为保证电力系统安全、经济、稳定运行,电力设备的故障诊断越来越重要。电力变压器作为主要的电力设备贯穿于整个运行过程,起着至关重要的作用。本文根据油浸式电力变压器的特点及故障诊断的原理,采用面向对象技术开发专家系统来解决变压器故障的智能诊断问题。本文介绍了基于关系数据库记录的知识表示形式和基于关系数据库记录的推理机制,设计并实现了变压器故障诊断的知识库,给出了该数据库的表图