数据挖掘聚类算法研究

被引量 : 0次 | 上传用户:wsq27028320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据挖掘获得了快速发展,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。国内主流的网站评比的未来十大热门技术中,数据挖掘占了一席,而且现今世界几大超级公司也早早地投入数据挖掘的研究,这其中包括IBM、MicroSoft等。数据挖掘技术集数理理论、专家系统、人工智能、神经网络、图形图象设计等多门学科于一身,其发展速度必将大大影响全球信息化的进程,对其进行系统、深入、全面、详尽地研究是信息化发展的客观需要。本文对数据挖掘技术,尤其是聚类分析进行了较为系统地分析和研究,提出了一些改进的算法,主要包括以下一些内容: 数据挖掘技术的概述。对数据挖掘技术的产生进行了简要的回顾,对数据挖掘的发现模式和常使用的技术进行了详细地分类、归纳和总结。对数据挖掘技术的应用进行了归纳,为本文的全面展开奠定了基础。 聚类分析的概述。聚类分析是数据挖掘的一个重要的研究方向,是一种无监督学习的方式,在许多方面发挥着重要的作用。对聚类分析的定义、使用的数据类型和主要的算法等进行了简要的介绍。 蚁群算法的概述。群体智能是模仿自然界昆虫行为的一个研究领域,同样也在许多领域取得了较为突出的成绩,而且有了一定的发展。蚁群算法是群体智能的一个典型代表算法,而且应用面比较广。对基于蚂蚁寻路和蚂蚁聚类的算法分别进行了简要介绍。 基于阈值的T-Value算法及蚁群聚类组合算法的研究。在研究了基本蚁群算法的基础上,结合蚂蚁寻路和觅食的习性和聚类的思想,提出一些想法和改进。首先把蚂蚁觅食原理结合k-means提出了一种基于信息素的k-means改进算法;根据密度聚类的思想,提出一种基于阈值的算法-T-Value算法,同时引入ε邻域到T-Value中,结合基于信息素的k-means算法提出了一种T-Value聚类组合算法;结合LF算法和基于信息素的k-means算法,提出另一种聚类组合算法-蚁群聚类组合算法。最后对各种算法进行数据测试和性能分析,并把蚁群聚类组合算法用于移动客户的消费行为分析。
其他文献
自2002 年9 约中国质量协会六西格玛管理推进委员会成立以来, 六西格玛管理在全国各大、中型企业中开始实施, 由于不同企业企业文化不同,人员素质不同,管理水平不同,其六西格
介绍了如东县60年来小蚕共育的发展历程与公助民营、集体共育和商品化饲育等3个阶段共育的主要设施和技术方法,分析了该县目前小蚕共育的现状和特点,并就该县稳定小蚕共育提
本研究以清华大学英语教学改革为主要研究对象,旨在从英语教学法理论的角度出发,对于各种英语教学法理论,以及清华大学英语教学改革中藉以总结出来的背后的理论框架,运用在本
2001年诺贝尔经济学奖获得者是约瑟夫·斯蒂格利茨、乔治·阿克尔洛夫、迈克尔·斯彭斯,表彰他们70年代在“使用不对称信息进行市场分析”领域所做出的重要贡献,理论揭示了由于
卵巢成对位于子宫两侧的上角,是女性非常重要的生殖器官,具有排卵和分泌激素两种功能正常的排卵功能是养育聪明、健康的下一代的必备条件之一,而卵巢分泌的性激素(主要是女性
目的探讨彩色多普勒超声检查在甲状腺癌诊断中的临床应用价值。方法对38例经超声诊断手术病理证实的甲状腺癌患者的超声检查作回顾性分析,分析甲状腺癌的超声图像特征。结果3
该文对华山松疱锈病的分布与危害、发病规律、发病机制、防治措施等的研究现状、研究进展等做了综述性介绍。
该文从中医未病学角度出发,以未病先防与既病防变为宗旨,阐述了各发病层次包括健康、亚健康、潜病、前病等与重大疾病发生的关系,介绍了各发病层次防止重大疾病发生的原则与
如何有效地对水资源进行管理是当前学术界关注的热点问题。本文从制度经济学的分析视角,在对我国建国以来的水权制度、水管理政策导向、水资源管理体制、水资源制度文化等制
<正> 世界文学史不乏这样的现象:天才的诗人和作家,往往能够比同时代的人更早、更深刻地感受到社会的某些本质的东西,因而在其作品中,自觉或不自觉地表现出超越时代的因素。