基于雅克比矩阵的软划分聚类算法分析

来源 :北京交通大学 | 被引量 : 7次 | 上传用户:a1402070128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究软划分聚类算法分析中两个重要问题:参数选择和收敛性质分析。大部分软划分聚类算法中均存在参数选择问题,参数的选择直接影响聚类算法的速度和精度。讨论软划分聚类算法的收敛性质,例如EM算法的自退火性质,可以帮助我们更好的理解这些聚类算法。除此之外,聚类算法的收敛速率可能会影响算法处理大数据的能力。本文提出一种基于雅克比矩阵的软划分聚类算法分析框架,在此框架下对软划分聚类算法参数的上下界、算法的收敛性质以及收敛速率等问题进行了讨论。本文取得的主要研究成果如下:(1)本文提出了基于雅克比矩阵的软划分聚类算法分析框架。建立该软划分聚类算法分析框架的基本假设是:重合类是大部分软划分聚类算法的不动点,但为了避免聚类算法输出重合类结果,重合类不能是软划分聚类算法的稳定点。在这个基本假设下,我们将软划分聚类算法重写为差分方程形式,通过分析软划分聚类算法差分方程的雅克比矩阵,从而对聚类算法的参数选择和收敛性质分析等等问题进行讨论。与其他软划分聚类算法分析方法相比,基于雅克比矩阵的软划分聚类算法分析方法可以用于分析一般具有隶属度和聚类中心迭代更新过程的算法,而不要求聚类算法有明确的目标函数。(2)本文在基于雅克比矩阵的软划分聚类算法分析框架下,从理论上分析了基于混合高斯模型的最大期望(EM)算法和确定性退火最大期望(DA-EM)算法的性质。一方面,我们通过分析DA-EM算法差分方程的雅克比矩阵,提出了一种选择DA-EM算法确定性退火参数理论下界的方法。另一方面我们在基于雅克比矩阵的软划分聚类算法分析框架下证明了 EM算法具有自退火性质,也就是说重合类不是EM算法的稳定点。因为DA-EM模型在确定性退火参数等于1时等于EM模型,因此我们将EM算法作为DA-EM算法的一个特殊形式,利用DA-EM的雅克比矩阵对EM算法进行理论分析。(3)GK算法是在FCM的基础上改进的一种模糊聚类算法。与FCM算法等软划分聚类算法一样,GK聚类算法的结果也会受到模糊指数m参数值的影响,然而文献中缺乏对GK聚类算法的参数选择问题的讨论。我们在基于雅克比矩阵的软划分聚类算法分析框架下,建立GK聚类算法的稳定点和样本数据间的关系,从而给出选择模糊指数m的理论根据。同时,我们研究了模糊指数m的取值对聚类算法的收敛速率的影响。最后,我们通过实验证明了理论结果的正确性。(4)模糊指数m值会严重影响GK聚类算法的聚类结果。因此,本文我们提出了一种新的基于确定性退火机制的GK聚类算法,以减小参数选择对聚类结果的影响。我们在GK聚类算法的目标函数中加入隶属度的香农(信息)熵约束,并且用确定性退火机制调节退火参数。与此同时,我们分析了确定性退火GK(DA-GK)聚类算法退火参数取值理论下界。除此之外,我们比较了 DA-GK聚类算法和其他聚类算法的聚类结果,并分析了 DA-GK聚类算法的计算复杂度。实验结果表明DA-GK算法具备良好的聚类性能。
其他文献
桂枝汤具有调和营卫、调和阴阳、调理中气、疏肝理脾等诸多功效,概括为扶正祛邪,更加侧重于扶助正气,"祛邪"则是在"扶正"的过程上所形成的"正气存内,邪不可干"的一个自然结果。临诊
<正>2016年美国心脏病学会和中华医学会心血管病学分会联合论坛现场报道,中国冠心病负担逐年加重,蒋立新教授及其课题组最新China PEACE-CathPCI研究成果表明:因冠状动脉介入
电子商务行业的发展,需要一大批高素质技能型劳动者,他们除了需要具有娴熟的操作技能,还要有良好的职业道德、正确的职业意识等,这些都是职业素养的具体体现。本文从中职电子商务
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着虚拟现实与多媒体技术的快速发展,人机交互与立体视频能够模拟出真实、流畅、自然的景物在人眼中呈现出来,很大程度上满足了人们在浏览视频时的实时逼真的视觉需求。近年
随着云计算、大数据等新兴信息技术的广泛应用,各领域的数据急剧增长,这其中结构化数据仍然是数据的主要表现形式之一。在这些数据中往往含有大量冗余的与不确定性数据,从而
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
信息安全是推动信息化发展的前提条件,密码系统是信息安全的基础。传统基于复杂计算的经典密码算法在后摩尔时代的量子计算等超强新技术下破解变得更加容易,甚至“不堪一击”
随着科技进步,虚拟现实与数字城市的应用越来越广泛且日新月异,而建筑物作为城市地区的最主要的地物要素之一,是摄影测量与遥感等领域中地物信息提取和建模研究的主要对象。