【摘 要】
:
作为众多分类、聚类分析方法的一种,基于模型的聚类己越来越广泛的应用于各领域。如果某种特定的分布能够较好的刻画某一数据集,那么,基于模型的聚类方法比其他聚类方法要好
论文部分内容阅读
作为众多分类、聚类分析方法的一种,基于模型的聚类己越来越广泛的应用于各领域。如果某种特定的分布能够较好的刻画某一数据集,那么,基于模型的聚类方法比其他聚类方法要好。混合高斯模型由于计算上的便利使用的最多,但它极易受到噪声点的影响。混合t-分布模型具有厚尾特性,比混合高斯模型具有更好的稳健性,因此在图像处理、生物学、医学领域颇为常用。因此,研究混合t-分布模型及其参数求解方法来进行聚类和分类,是一项很有意义的工作。首先,我们分别研究两总体、三总体一元混合t-分布模型,利用EM算法分别求解模型参数的极大似然估计,该过程克服了多元混合t-分布模型中协方差矩阵向一元混合t-分布模型中尺度参数的转变过程中参数推导的困难;在迭代求解过程中,如何初始化参数是一个关键的问题,本文将k-means算法应用于一元混合t-分布模型参数初始值的选取,收敛速度快,大大提高了计算效率。对于混合高斯和混合t-分布模型,在混合高斯数据、混合t-分布数据以及含噪声的混合高斯数据下,将两种模型的拟合数据能力进行了对比分析。实验表明,三类数据下混合t-分布模型的拟合效果都比较可观。对于混合高斯数据,本文研究的模型并不比混合高斯模型拟合效果差;对于混合t-分布数据,该模型优于混合高斯模型;对含噪声的混合高斯数据,该模型拟合的效果几乎均比混合高斯模型好。这体现了混合t-分布模型在处理重尾数据中的优势。
其他文献
在经济增长、管制放松与竞争加剧的共同作用下,近十年货运航空业务在我国取得了前所未有的发展,货运航空系统的健康快速发展对我国交通运输和经济发展发挥着重要的作用,在这
就被开挖探讨了重新编号和虚拟单元两种模拟方法,提出用逆序编号来模拟被开挖单元,以此研究虚拟单元弹性模量对有限元计算精度的影响。结合算例得出:虚拟单元计算弹性模量值对计
中南、西南地区水利水电学校第十四届协作会于十二月六日至十一日在湖北省宜昌市水利电力学校召开,18所水利水电学校的代表出席,丘振域、汪进同志参加了会议,年会上广泛就如
后勤工作是学校工作中的重要组成部分,后勤工作水平的高低,直接影响学校教育的质量和教育效果。我校后勤工作,经过四十年努力,已经有了一个良好的基础。我从1988年主管后勤工
本文主要分析了“9318”号台风在东深供水工程有关流域产生的暴雨洪水特性。
共振柱试验是测定土在小应变(10-~6至10-~4)下的剪切模量G,阻尼比D%。我所1988年购进南京自动化研究所研制的GZ—1型共振柱仪,先后对几个工程进行了100多个不同土类的原状土和
黄委会科技管理工作座谈会于1月23日~25日在我校召开。参加会议的有来自山东,河南河务局、金堤河管理局主管科技管理工作的领导、各基层河务局的科技管理人员及黄校、黄技校的
选取长江下游世业洲的第四纪钻孔资料,研究了重矿物的垂向分布特征,以此探讨长江镇江段第四纪以来的沉积类型以及物源演变。结果显示,该区自中更新世开始接受沉积,依次形成河
利用从1973年至193年美国陆地卫星MSS4TM数据影象等不同片种、20多个不同时期的伶仃洋遥感资料,结合同步或准同步水文观测数据,通过计算机、光学图象处理和遥动态信息分析,获得对伶仃洋水少输移
目的:分析影响肾活检后发生出血并发症的危险因素,为肾活检术前风险评估提供临床依据。方法:选取2006年1月至2016年12月于中国医科大学附属盛京医院南湖院区肾内科病房,符合