概率K均值模型及其非线性规划求解

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:zonsun168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是一种无监督的机器学习方法。其由于不需要后验知识(即不需要人工标记),在机器学习领域中一直占据着重要位置。K均值聚类是聚类算法中最为经典的模型,同时它也有许多重要的变种模型,例如模糊C均值模型。模糊C均值模型与K均值聚类模型的原理相同。模糊C均值模型的模糊参数m的取值范围为1到正无穷,当m接近1时,模型的性能提升。理论上,其模糊参数m取值为1时,模糊C均值模型等价于K均值聚类模型(即模糊C均值模型与K均值模型在理论上应可以统一于一个框架之中),但是模糊C均值在参数m取值为1时的求解问题自1981年以来一直没有得到解决。模糊C均值在参数m取值为1时的性能同样也无法得知。针对此问题,本文进行了以下研究:1.提出概率K均值模型和快速最大步长梯度投影法。针对模糊C均值模型在参数m取值为1时的求解问题,提出了一种新的概率K均值模型。求解概率K均值模型是一个带有线性等式和线性不等式约束的非线性规划问题,理论上可以利用积极梯度投影法(下文简称梯度投影法)求解,但缺乏效率,所以为了高效地求解该问题,本文又提出了最大步长梯度投影法(下文简称大步梯度投影法)及其改进版本快速大步梯度投影法。实验结果从初值鲁棒性、聚类性能、下降稳定性、迭代步数和收敛速度五个方面验证了所提方法求解概率K均值模型的能力。2.在概率K均值基础上,提出P范数概率K均值模型和逆递归大步梯度投影法。针对P范数模糊C均值算法在参数m取值为1时的求解问题,提出了一种新的P范数概率K均值模型。概率K均值模型是P范数概率K均值模型的一种特例。P范数概率K均值模型同样是一个带有线性等式和线性不等式约束的非线性规划问题,利用梯度投影法求解该模型存在效率较低的问题,所以为了高效地求解该问题,本文又提出了逆递归大步梯度投影法。实验结果从初值鲁棒性、参数P影响、聚类性能、收敛速度4个方面验证了提出的方法求解P范数概率K均值模型的性能。3.以概率K均值为基础,提出核概率K均值模型。概率K均值模型有着划分聚类算法中的常见问题——难以识别非线性数据集中的簇。在划分聚类中,核方法通常用于解决此类问题,因此,将核方法引入概率K均值模型中。核聚类模型是原模型的一种扩展,同时原模型也可以视为核聚类模型的一种特殊情况。引入了核函数的核概率K均值聚类模型可以处理非球形数据集的聚类问题。实验证明了算法的有效性。4.在快速大步和递归大步梯度投影法基础上提出分块大步梯度投影法。在处理大数据集时,快速大步梯度投影法与原梯度投影法相比,提升了效率,但是仍可能会出现所需时间过长的问题,而逆递归大步梯度投影法需要维护一个大规模逆矩阵,这个矩阵所需内存可能超过最大内存,一旦算法所需内存过大会导致算法中断。针对这些问题,提出了一种新的分块大步梯度投影法,专门用于解决大数据集的聚类问题。实验证明,分块大步梯度投影法可以保证算法在大数据集上顺利运行。5.提出迭代最小切算法。对非线性可分数据集(即线性不可分数据集)进行聚类一直是聚类分析领域的一个重要问题,基于图论的聚类算法可以有效解决此类问题,但是图切模型的求解是一个NP hard问题。针对此问题,提出了一种迭代最小切算法,所提算法利用非线性规划中的梯度下降法求解。迭代最小切算法仅采用一个公式就可以将线性不可分数据集映射到一个线性可分空间,从而最终得到聚类结果,算法效果在人工生成数据集和真实数据集上得到了证明。
其他文献
目的:探讨银杏叶提取物对后循环缺血性眩晕患者脑血流量及内皮功能的影响。方法:选取2018年1—12月我院收治的后循环缺血性眩晕患者80例,采用随机抽签法分为对照组(40例)和观察组(40例)。两组均给予常规治疗,对照组采用前列地尔治疗,在此基础上观察组采用银杏叶提取物治疗。对比两组临床疗效及不良反应发生情况,观察两组治疗前后脑血流量及内皮功能指标(血管性血友病因子、内皮素-1、血栓调节蛋白)变化。
水文地质参数场的刻画是建立地下水流数值模拟模型的关键问题和难点问题。通常来讲,参数场合理性程度越高,模型拟合精度越高。本次研究将随机方法和参数空间分布表达进行结合,提出了趋势化随机参数场的构建方法。以渗透系数为研究对象,首先利用MCMC采样和样本数据特征确定水文地质参数的基本数据结构,进而根据样本空间分布特征对其进行趋势化处理,最终形成趋势化的渗透系数场。通过算例分析,利用趋势化处理后的渗透系数场
为了识别会计师事务所数字化转型的影响因素、稳定策略和内在规律,本文构建了异质双会计师事务所群体交互博弈模型,并运用复制动态方程和数值仿真方法,详细探究了各因素对转型的作用规律。研究发现:会计师事务所转型过程中存在五种稳定策略,对应着大型事务所间“强强竞争”、大型事务所产生“溢出效应”、部分中小事务所“边缘化”、中小事务所间“竞合博弈”四种竞争局面;会计师事务所自身的初始市场份额、内部协同能力、数据
工业固废和矿山尾矿是生产发泡陶瓷的主要原料,生产配方中必须添加特殊的发泡剂产生发泡作用,再经过高温烧结,在烧结体内部形成大量均匀的闭口气孔结构,这类闭口硅酸盐陶瓷烧结材料和开口气孔技术的蜂窝陶瓷烧结材料结构完全不同。本文通过对工业固废的定义及分类、工业固废处理现状存在的主要问题、可用于生产发泡陶瓷的固体废弃物、发泡陶瓷产业发展现状的阐述,详细说明了发泡陶瓷的工艺制备现状。
背景肠缺血再灌注(ischemia reperfusion,I/R)损伤是一种临床中常见的器官损伤,可导致多器官功能障碍,围手术期发病率和病死率极高,但目前尚缺乏有效的防治措施。研究表明,自噬在肠I/R损伤的发生发展中扮演重要角色,但是其确切作用仍有争议。miR-146a-5p近来被证明可以调控肠I/R时的细胞炎症反应,减轻肠I/R损伤;同时miR-146a-5p参与了多种细胞自噬的调控,但其是否
地理课程是初中阶段的一门基础学科,主要是培养学生怎样认识自然、了解世界,开阔他们的眼界,促使他们形成正确的人文观念和社会意识。读图能力是学生必须掌握的技能之一,对他们掌握地理知识有着较大的帮助作用。所以,教师在开展教学中,需要主动梳理自己的教学思路,探索出各种各样的教学方式,避免墨守成规,紧跟社会发展的趋势,创设生动的情境,更好地对学生的读图能力进行培养。
大豆原油在储存两年的过程中,受光、热等环境因素的影响发生氧化反应,稳定性下降,酸值增加,过氧化值呈阶段性变化,油色深暗,形成较稳定的胶体层,增加精炼的难度和炼耗,精炼成品油出现返色返味,白土等辅料消耗增加。采用化学精炼对储备轮换大豆原油进行精炼,对精炼工艺操作要求和注意事项进行阐述,并进行应用效果分析,发现相比单纯精炼储备轮换大豆原油,将浸出大豆原油和储备轮换大豆原油按35∶65比例混合进行精炼,
语文教材中的每一篇小说都蕴含着丰富的文学知识,是文学中的经典作品,经过历史的沉淀,彰显出博大精深的文化和意蕴深远的思想价值。小说教学的过程肩负着指导学生人生发展,滋养学生精神成长的使命。由于受到教育环境紧张,升学压力大;教育者自身素质欠缺;学习者学习习惯欠佳等多方面因素的影响,小说教学止步于教材,止步于课堂,且出现课堂教学公式化、学习动机功利化,理解文本表面化等现象,致使学生无法从小说教学中高效地
伊朗作为一个民族国家,具有强烈的独立自主民族个性,并在伊斯兰革命后着力释放,成为中东地区秩序演变的重要影响因素。从伊斯兰革命到鲁哈尼任期结束,中东地区秩序经历了两极争夺、美国单极和美国单极弱化(地区大国崛起)等发展阶段,伊朗在地区秩序演变中的角色经历了从有限革命者(1979~1989年),到低调接受者(1989~2000年)和被动获益者(2001~2008年)的转换。以2009年美国总统奥巴马实施