基于混合模型的聚类算法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:xiang879154
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是一种在缺少先验知识的条件下将一个数据集分成多个更小的更相似子群或簇的方法。近几年来,混合模型作为聚类分析的基础,在聚类过程中发挥着重要的作用。其中有限混合模型已逐渐成为多元统计分析的得力工具。基于高斯混合模型的密度估计和聚类在众多方面都有着出色的效果。在这种方法中,数据被看作来自一个混合分布,每个分布代表一个不同的类。本文提出一种新的基于混合高斯分布的聚类方法,在聚类过程中用最大后验估计(MAP)来代替极大似然估计(MLE),从而避免了协方差矩阵在迭代中陷入奇异。同时,我们将一种改进的贝叶斯信息准则(BIC)与模型参数估计同时处理,这样就扩大了模型选择的搜索范围。本文有以下几个部分。第一章简述聚类分析的研究现状。第二章介绍了有限混合模型的基本概念和EM算法。第三章提出了基于高斯混合模型的聚类方法,其中包括模型分支的个数及结构的估计。第四章提出一种基于最大后验估计的无监督的聚类算法,这种算法不但能有效防止协方差矩阵陷入奇异,同时在模型选择上也有很好的表现。
其他文献
识字教学是小学低年级语文教学的重点、难点,也是阅读教学和作文教学的基础。识字能力是学习能力的基础。《语文课程标准》指出低年级段要求学生喜欢学习汉字,有主动识字的愿望
本学位论文中,我们主要研宄解析函数半群(ψt),解析Qp空间上的复合算子半群(Ct)以及其上的Volterra型算子,旨在揭示满足(ψt)能够在Qp的某一子空间给上生成一个算子半群的最大子空
网络结构的拓扑性质直接决定了互连网络的性能和效率.在实际运行中,互连网络中处理器或通信链接出现故障是无法避免的,这就要求选择的网络拓扑结构具有良好的容错性质.本文主要
在几何和物理模型中,共形映射有着非常重要的作用。现在存在的方法只能解决拓扑结构比较简单的曲面,如单连通亏格为0的曲面。我们的方法可以解决拓扑结构较为复杂的曲面。通过
本文引入了几类新的广义凸集、广义凸函数和广义预不变凸函数.讨论了各种广义凸性和研究了它们在数学规划中的应用,给出了单目标和多目标的广义凸规划的最优性条件以及对偶理
工业CT,即工业计算机层析成像(Industrial Computerized Tomography),是指在工业中用射线扫描待测物体,获得物体断层的投影数据,经重建后得到一系列能够反映待测物体内部结构
不论是确定通风机的工况点,掌握通风机的实际工作状态,还是解算通风网络,都需要准确绘制通风机特性曲线,并求其模拟方程。风机厂家提 Whether it is to determine the opera
非线性共轭梯度法是求解一些大规模非线性无约束优化问题的基本迭代方法,具有算法简单、存储空间需求小的特点。随着计算机的飞速发展和实际问题中大规模优化问题的不断涌现,这
学位
R.W.Yeung、R.Ahlswede等人在2000年首次提出网络编码的概念。网络编码一改以往store-and-forward的路由方式,允许中间结点对输入信道的输入信息进行编码后再传输出去。通过
以"自强""求富"为宗旨的洋务运动叩响了我国近代化的大门,而随着社会发展向前推进,今天来重新审视历史,从媒体的有关报道上可以看出,我们今天对洋务运动有了新的认识与反思。