基于势博弈和属性的聚类算法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:youhayou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析(Cluster Analysis)可以在无监督的情况下,将大量的样本数据归类,从而得到样本数据中隐藏的信息,以便于人们更好的生产生活。但是,在聚类过程中使用的聚类算法会直接影响运行时间和聚类结果的质量。因此,研究各类聚类算法优缺点,以及如何改进现有算法具有重要的现实意义。本文主要研究了几种常用的聚类算法的优缺点,针对这些缺点,详细地给出了两种改进的聚类算法。研究的主要内容如下:1.研究且论述聚类中目前较为流行的五类算法,分析了常用的K-means、模糊(8均值(Fuzzy C-means,简称FCM算法)、DBSCAN等算法的优点与不足,总结并概括出现有算法存在的五个重要的问题,研究并给出了相应的改进方向。2.针对聚类算法中易陷入局部最优的缺点,通过构造效用函数证明聚类可看作是策略势博弈寻找纳什均衡问题,提出一种基于势博弈的聚类算法。该算法认为势博弈的纳什均衡对应于稳定的聚类结果。进而给出了解决这种基于势博弈模型的聚类的算法,即迭代的最佳响应算法。接着在已有的一般初始化算法基础上,以模糊(8均值算法产生初始聚类,并将其运用在迭代的最佳响应算法上。最后将该算法在两个数据集上测试并实现。3.针对FDP算法的时效问题,通过研究该算法的思想、步骤和优缺点,给出减少运算量,提高计算效率的思路,提出一种基于属性的改进FDP算法。考虑多属性数据样本,利用欧氏距离公式计算数据点间的距离。为优化算法,提出属性纵向相似度的概念,通过计算各属性下数值方差来判定属性纵向相似度,认为方差小于给定的阈值,则该属性对聚类结果没有影响。进而可减低欧氏距离公式复杂度,从而提高FDP算法的时效。最后给出所提算法的模型,并在实例中验证该算法的可行性。
其他文献
钢筋锈蚀会造成钢筋混凝土结构的性能退化。相较于未锈蚀钢筋,锈蚀钢筋的表观特征具有明显的不均匀性,使得钢筋本身的各项力学性能出现不同程度地退化。本文在原有研究成果的基础上,采用HRB335钢筋,通过3D激光扫描以及实体模型建立中获取的锈蚀钢筋表征指标数据,定义能够反映钢筋锈蚀不均匀性的随机变量(不均匀锈蚀系数Rλ)作为研究对象。然后对其产生影响的因素进行分类,通过数理统计分析的方法对各个因素对Rλ的
学位
钢管混凝土组合结构因其优异的力学性能广泛应用于各类工程中,如大跨建筑、高层建筑、市政工程及桥梁工程等。随着高强混凝土和高强钢材的研究与推广应用,薄壁钢管组合结构的研究与应用广受关注。但由于薄壁钢管在轴向力下容易屈曲,薄壁钢管混凝土组合柱中薄壁钢管处于的受力状态不同,对组合柱的性能影响较大。通过试验和数值模拟方法研究了两种形式的薄壁钢管混凝土组合柱的受力性能、工作机理及其影响因素。一种是薄壁钢管与混
学位
保险公司的再保险和投资策略一直是精算研究的热点.因此,本文研究了金融市场中合作和竞争两种关系下保险公司和再保险公司的鲁棒最优策略问题.一方面,我们考虑一家包含保险公司和再保险公司的一般保险集团,并研究这两家公司的联合利益最大化问题.由于管理者是模糊厌恶的,他将寻求一种稳健的最优投资再保险策略.假设保险公司将部分保险理赔风险通过比例再保险转移给再保险公司.同时,保险公司和再保险公司都可以投资无风险资
学位
Toeplitz算子、Carleson测度和逆Carleson测度是全纯函数空间与算子理论研究领域的重要组成部分,有着深刻的数学物理背景,且与调和分析、算子代数、偏微分方程、量子力学等学科密切相关,是当代复分析、泛函分析、算子理论领域中的热点方向.本文在经典Bergman空间的研究基础上,进一步讨论了四种不同加权Bergman空间上的Toeplitz算子、Carleson测度和逆Carleson测
学位
混凝土结构经常会遭受疲劳荷载和冻融循环的损伤作用,这些损伤会降低混凝土结构的耐久性,目前,学者们将研究目光放在掺加纤维和纳米材料对混凝土耐久性的影响,本文将研究掺加PVA纤维(聚乙烯醇纤维)和纳米SiO2对混凝土抗疲劳性能和抗冻融性能的影响。本文以243个混凝土棱柱体试件为主要研究对象,开展了PVA纤维混凝土(P组)、纳米SiO2混凝土(S组)和PVA-纳米SiO2混凝土(SP组)分别经历疲劳荷载
学位
钢管混凝土系杆拱桥作为一种刚度大、跨越能力强、造型优美的桥梁结构,在公路、铁路及城市桥梁工程中的应用越来越广泛。钢管混凝土系杆拱桥的支架设计与施工作为整个工程的基础,它的安全性和可靠性决定了系杆拱桥能否顺利竣工。对于采用“先梁后拱”施工方法的钢管混凝土系杆拱桥而言,考虑拱桥系梁与支架的协同受力可以有效控制施工成本,优化施工方案。本文以某高速铁路钢管混凝土系杆拱桥为依托工程,从理论分析与有限元分析两
学位
光正交码是一种具有良好自相关和互相关特性的二元序列码,被广泛地应用于光纤信道上的码分多址系统.根据码字重量的不同,可以将光正交码分为常重量光正交码和变重量光正交码.变重量光正交码不仅扩大了码字容量,而且应用于光码分多址系统后可使其满足多种服务质量的需求.最优循环填充设计与最优光正交码密切相关,可以将最优光正交码的存在性问题转化为对应的最优循环填充设计的存在性问题.而且循环填充设计本就是组合设计理论
学位
经验风险极小化问题是机器学习研究中的一类重要问题.随机梯度下降算法(SGD)是求解该问题最常用的算法之一.SGD作为梯度下降算法的一个改进,利用随机梯度代替全梯度,大大减少了计算量,因此被广泛研究.SGD由于随机性产生方差导致在求解强凸问题时仅可以达到次线性收敛速率,因此出现很多改进的方差缩减算法,包括随机方差缩减梯度法(SVRG)、方差减小的随机梯度下降法(VR-SGD)等,SVRG和VR-SG
学位
设0<p<+∞,f(z)为圆盘|z|<R上的解析函数,令Mp,φ(f,r)是解析函数f关于加权面积测度φ’(|z|~2)dA(z)的面积积分平均.关于面积积分平均的凸性和对数凸性,目前已经有一些相关的结论.在此基础上,本文主要研究当函数f与φ满足什么条件时,函数(Mp,φ(f,r))1/p是凸的.更一般地,定义(?)本文研究当函数M与φ满足怎样的条件时,函数H(x~2)1/p和H(x)1/p是凸函
学位
随着全民健身运动和各项体育赛事的开展,体育馆建设成为满足人们体育运动需求及高水平城市建设的重大需求。近年来,斗屏这种柔性悬挂在场地中央的大质量显示屏设备在体育馆中的应用显著增多。经调研和分析,空间网格结构是主要用来承载斗屏的体育馆屋盖结构类型。空间网格结构具有跨度大、自由度多、频率密集的特点,地震反应较为复杂。关于空间网格结构地震反应分析的现有文献主要是针对无斗屏的情况,而柔性悬挂大质量斗屏对空间
学位