蚁群聚类算法在WEB使用挖掘中的应用研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:sidney1221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet在全球范围的迅速普及和应用,Web信息量正以惊人的速度增长。如何快速、有效地发现有用的信息资源已成为急待解决的问题。Web挖掘作为一种以从Web的海量信息中挖掘有用知识为目标的技术,从一出现就受到了广泛的关注。Web使用挖掘是Web挖掘的三个主要分支之一。其以Web的使用数据为挖掘对象,期望挖掘出有兴趣的使用模式。Web使用挖掘已经成功应用于个性化服务、提高系统性能和商业智能等领域。本文首先介绍了Web使用挖掘的框架:数据预处理、模式发现、模式分析和模式应用,详细地分析了目前应用于模式发现的各种方法及其存在问题。接下来介绍了基于群体智能的蚁群聚类算法的四种模型,并将最有优势的基于蚁堆聚类的蚁群算法引入Web使用挖掘。然后本文针对Web数据呈现的高纬、方向特性,将方向相似性度量与蚁群聚类算法相结合提出一种基于方向相似性的蚁群聚类算法。实验结果表明,改进后的蚁群聚类算法的聚类效果比经典的LF算法要好,特别地,在方向性数据的处理上,改进后的算法具有明显的优势。最后,将改进的算法应用于Web用户聚类,针对Web的动态性,引入了用户兴趣更新和簇解体机制,实现了增量式用户聚类。实验结果表明,该算法能动态有效地实现增量式用户聚类。
其他文献
数据挖掘是从20世纪90年代以来迅速发展起来的一门新兴技术.其处理对象是大量的日常业务数据,目的是将隐含的、尚不为人知的,同时又是潜在有用的信息从数据中提取出来.机器学
当前数字信息技术和网络高速发展,嵌入式系统已经广泛地渗透到科学研究、工程设计、军事技术、各类产业和商业、文化、艺术以及人们日常生活等方方面面。随着嵌入式系统应用
数据流是一个按时间到来的有序的项集。和传统静态数据库中的数据不同的是,数据流是连续的、无限的、通常以很高的速度到来的并且数据分布随着时间而改变。由于数据流的特点使
随着存储容量和CPU的处理能力的快速增长,磁盘带宽能力却没有得到相应的提升,I/O已经成为影响计算机性能的瓶颈。并行文件系统和并行I/O成为解决磁盘数据处理能力和CPU计算能
目前网络上分布着海量的空间地理信息,这些信息以诸多的格式存储,由不同的个人和单位维护。信息之间的互操作性已成为近年来业内关注的热点问题。然而,传统的方法比如数据格
随着互联网的快速发展,网络上汇集了包括网络新闻在内的大量的信息。网络新闻已成为当今社会重要的信息载体和人们获取信息的重要渠道。由于网络新闻内容丰富多样,情感倾向也
自然语言处理是计算机科学领域中的一个重要研究方向,是人工智能的一个重要分支。汉语自动分词是中文信息处理的重要基石。困扰汉语自动分词发展的原因有很多,对歧义字段的排
在视频通信中,视频编码和视频传输是两个重要的组成部分。本文研究的重点是在视频压缩技术,目的是利用基于ROI(Region Of Interest)视频编码技术来解决网络容量和视频通信质量
随着油田开发进入中后期,油井采出液含水率越来越高,产出水的处理问题越来越严重,突出表现在:经济上,产出水的举升、存储和处理费用,水处理设备投入和操作费用等不断增加;环境方面,产
教学质量测评是高校的一项常规工作,开展这项工作经历了人工处理与计算机处理两个不同阶段。利用人工开展这项工作存在工作周期长、工作量大、统计信息准确率低等一系列问题,