基于群体智能算法的聚类挖掘方法研究

被引量 : 1次 | 上传用户:JK0803_zhouli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘的目的是从海量的数据中提取人们感兴趣的,有价值的知识和重要的信息。聚类分析是数据挖掘的一个重要研究领域,它在商业、生物、医学、地质、Web文档等方面都有重要的应用,是当前的研究热点之一。群体智能是一种新的人工智能形式,目前正在成为人工智能领域及其相关领域的一个研究热点。目前,研究得较多的群体智能算法主要有粒子群算法和蚁群算法二种,本文针对这二种群体智能算法存在的一些问题进行了研究,并将其应用到聚类分析:(1)从粒子群算法的参数设置上改进了算法,并将其应用到聚类分析中,提出了一种自适应惯性权重的并行粒子群聚类算法。该算法改善了基本粒子群算法的全局寻优能力、收敛速度和运行效率,通过理论分析和实验表明,相比k-means聚类算法、遗传聚类算法、基本粒子群聚类算法,本文算法更具优越性。(2)在Deneubourg的蚁群聚类基本模型、Lumer和Faieta提出的LF基本蚁群聚类算法和刘波等提出的利用信息熵理论的聚类算法的基础上,对蚁群聚类算法进行改进,提高了聚类速度和质量,解决了LF算法参数设置多,不适用连续属性等问题。相对传统的k-means算法,本文算法不仅具有能有效地处理孤立点,有较好的抗噪声能力,而且不需要设置簇(聚类中心)数目的特点。
其他文献
为推进体育政府信息化工程和发挥对体育产业的引导作用,加快体育产业电子商务的进程,采用文献资料法、Internet检索法,提出出台体育电子商务的法规,规范体育电子商务行业;充
泥石流的容重是泥石流的最重要的参数之一,用简单易行的方法获得泥石流的容重因泥石流灾害的评估和泥石流的防治的需要显得日益重要。分析了泥石流的组成颗粒中3个分别代表粗
通过查阅2003-2004年全国男篮甲A联赛技术统计资料,对广东队的投篮技术、得失分、篮板球、抢断、助攻、犯规和失误等指标与其他队伍比较,分析广东队存在的优势和不足。结果显
<正>【课前思考】教学"近似数",我们会很自然地想到这样几个问题:为什么要认识近似数?怎样认识近似数?认识近似数有什么用?思考基于以上问题展开。我以为,本课预期想达成的教
在经济全球化、企业之间竞争无国界的现实下,本文提出建设中国优秀企业文化的命题。论文首先阐释了企业文化概念,剖析了企业文化层次和作用机制,对企业文化理论加以综述,奠定
<正>头发与人体健康的关系极为密切,很多问题都可以从头发的状态上表现出来。生活、工作压力的加大,使得头发亚健康状态的人群迅速增加,洗发、护发类产品随之广受追捧,而在零
数据元标准化是卫生信息标准化的基础,是实现信息共享和利用的重要保证。元数据提供的是理解和精确解释数据元所需要的信息,是数据元标准的载体。根据相关元数据规范和国际标
办公建筑是一种历史久远、应用广泛的建筑门类。自从人类社会形成了固定的居民点以来,就有了原始办公建筑的雏形。从原始部落的议事建筑到奴隶社会、封建社会的宫殿、署衙、
利用2002年抽样调查的220个烤烟样品,对我国烤烟中的氮、钾、磷、钙、镁、锰、铜、锌、硼、钠、铁、氯、烟碱、还原糖等14个指标 的含量特征进行了分析。结果表明:1)除钙、钠
可持续发展是人类在经历了伴随经济高速增长而来的资源耗竭和环境退化之后所作出的明智选择。在“可持续发展”由理论到实践的进程中,一个亟待解决的中心问题就是对可持续发