基于组合优化的聚类算法及应用

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:llll9909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来聚类分析在数据挖掘中的应用越来越广泛,它可以作为独立的工具来分析数据的分布情况,也可以作为其它算法的预处理方法,还可以作为离群点的检测等。在本文中阐述了一些经典的聚类方法,如划分方法,层次分析方法,基于密度方法和其它一些聚类方法。在此基础上,以组合优化中的选址问题的理论与算法为基础,结合聚类分析中的K-means算法,提出了两个数据挖掘中的聚类方法:KCG-KM算法和HS-KM算法。然后从数值模拟的角度对这两个算法进行了性能分析,数值模拟结果说明在聚类效果上这两个算法比K-means算法好:HS-KM算法较K-means算法的平均DI提高了12.9%,KCG-KM提高了7.32%,平均CS值HS-KM算法较K-means算法降低了4.95%,KCG-KM算法较K-means算法降低了4.53%。在运行时间上,KCG-KM算法较K-means算法下降了26.6%。由于聚类分析中的层次分析方法中由上而下的分裂是较少的,本文从最大割问题中引入了两个新的分裂方法-MCG算法和GW算法。分析了MCG算法可以在O(n2)运行次数内输出一个划分而GW算法却是一个指数算法。通过数值模拟也验证了MCG算法远快于GW算法,并且MCG算法适合大规模数据的聚类分析。但在分裂效果上,GW算法可以较好的对多种结构的数据集区分出不同分布上的数据点。最后,本文应用KCG-KM算法与GW算法对银行客户进行分类,将客户分成了8类,并对这8类客户进行分析。最后提出适合这8类客户群的资产配置和适合该类客户群交叉销售的产品。
其他文献
二阶功能性的反应系统是近年来生物数学领域内一个较为热门的课题,它主要适用于脊椎动物的研究.该文主要研究的内容是Ⅲ类功能性反应系统、群体防御模型的分析与控制问题,通
非线性系统是现代科学的核心.大量的数学,物理,力学问题都可以归结为非线性微分方程.因此,对非线性系统及其相关性质的研究就具有十分重要的理论和实际意义.该文主要讨论了求
柳加志是镇赉县到保镇到保村党支部 书记,曾被评为白城市学习实践“三个代 表”重要思想优秀基层干部标兵、市优秀共 产党员标兵。他真心实意带民富、解民难、 安民心的一片
假设A是一个结合代数,对任意的x,yA,我们定义运算x,yxyyx和xyxyyx,那么A,,构成一个李代数,而A,构成一个Jordan代数.研究A的结合代数、李代数、Jordan代数这三种结构的关系和
该文研究了高维对称正定核本征值的收敛速率问题.假设x,y∈R(m≥1是整数),G=[0,1],连续积分核k(x,y)是1-周期的,在区域G×G上对称正定,并且对于重指标α,β,|α|≤r,|β|≤r(
对于带约束的非凸优化问题,逐步二次规划法(SQP)是十分有效的方法,但仍有一些 不足之处,例如要求Hesse矩阵正定等.且具有很强的收敛性.该文研究求解等式约束非凸 优化问题的
该文是偏微分方程方法、概率方法上特殊养老金形式的定价中的应用.文中所建立的模型,克服了传统精算方法中关于对利率、工资确定性假设的限制,从而更加准确的描述了养老模型.
该文着眼于单群刻划这一研究较早,成果丰富的重要课题,参考了许多有关单群数量刻划的研究成果,包括用群的阶,元的阶,共轭类长度,素图阶分量等作为条件刻划单群.同时在前人有
文章主要讨论了可控阵的三个基本性质:可控阵的图论特征、可控阵的收敛性、可控阵幂敛指数的上界.可控阵的图论特征是文章的出发点,并为后面的研究提供了理论基础.全文共分四
排队在生产、生活、科技和计算机等方面广泛存在,随着时代的进步,网络队列更是应用到各个领域。本文主要研究到达率随时间变化的网络队列模型。顾客到达的规律与系统服务台的配