基于物理模型的聚类方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:nimashabi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为数据挖掘的重要技术,在网络分析、市场营销以及医学图像自动监测等领域被广泛应用。聚类就是将物理或者抽象的集合分组成为由类似对象组成的多个类的过程,同一个簇的对象具有相似性,不同簇中的对象具有相异性。目前,国内外研究者提出了多种聚类算法,这些算法从不同的角度进行设计的,但是依旧不能满足人们对聚类分析的要求。经典的聚类算法虽然被广泛使用,但是大多数都单纯地将距离或者角度作为聚类的标准,因此这些算法都存在着局限性。本文中,将一些物理学背景知识引入到聚类分析中,将一些物理特性与聚类算法充分结合,形成了几种基于物理模型的聚类算法。这里,将万有引力定律和Potts模型引入到聚类分析中,形成了基于万有引力的聚类算法和基于Potts模型的聚类算法。基于万有引力的聚类算法的原理是假设数据集中的数据对象具有自然界物质的特性,即数据对象也具有引力;数据引力定律的内容是数据对象之间存在着引力,其引力大小与数据质点的质量成正比,与数据质点间的距离的平方成反比;数据对象之间的引力越大则表示相似度越大,反之,引力越小表示相似度越小。使用数据引力的好处有以下几点:第一,力是矢量,可以进行合成与分解,这样就很容易将多个关系转化为单一关系;第二,将数据引力作为相似度的一种度量,不仅包括了距离还包括了聚类中的对象数目,更有利于聚类。基于Potts模型的聚类算法是利用磁性材料在不同温度下会出现不同的状态的性质设计的,而Potts模型是模拟磁性材料的一种有效模型;在低温和高温之间,会出现一个超顺磁相,在超顺磁相里,距离较近的自旋子对间耦合力大于热运动,磁子指向趋于一致,形成“颗粒”磁体;而距离较远的自旋子对间热运动大于耦合力,磁子指向趋于随机;这样,超顺磁相里的自旋子就组合成了大大小小的若干个“颗粒”磁体。利用这个特性可以来比拟数据点的聚类。本文从交叉学科的角度给出了两种不同的聚类算法,为人们提高聚类分析效果提供了一个思路和途径,因此本文具有一定的理论和实践意义。
其他文献
传统的实体定位技术仅可以提供已知确定物体的位置信息,而物联网中布设的各式传感器网络实时监测着其周边环境,其信息资源丰富、分布广泛,可以利用这些传感器采集的数据,借鉴Web
支持向量机是在统计学习理论基础上发展起来的一种性能优良的新型机器学习方法。它具有坚实的理论基础,巧妙的算法实现和卓越的性能。当支持向量机应用于实际问题时,首先面临
本文首先系统地介绍了国内外关于本体论知识的不同见解和观点,主要涉及本体论的概念、类型、作用、结构、构造原则、开发方法及其应用研究等,尤其指出了其在相关领域中在知识表
随着芯片集成度的不断提高,功能验证已成为集成电路设计流程中时间耗费最大的环节,尽早且快速地发现集成电路设计中的错误,对于缩短验证周期具有重要意义。目前,功能验证方法主要
在信息网络技术不断发展的今天,融合网络已经成为当前最活跃,最具创新性的领域之一。网络的融合使得原有电信服务的种类和内涵都有了新的扩展,具有异构网络智能协作,资源共享
随着计算机软硬件的发展以及应用水平的提高,事件流应用越来越多的出现在网络安全、金融分析、传感器网络等领域中。目前已用于国家网络安全监控应用的DBroker系统作为一种基
随着信息技术的快速发展,人们收集、存储和传输数据的能力不断提高,各类应用领域产生海量的数据,数据挖掘与机器学习成为了数据分析和知识发现的重要工具。频繁模式挖掘是数据挖
在模式识别、机器学习以及数据挖掘中,分类是一个基本而又重要的问题。作为模式分类的研究方法之一的支持向量机技术近来也得到广泛的研究和应用。进行分类时,我们必备的两个
由于互联网的优越特性,在其上发布信息极为便捷,这就使得互联网上的信息数量以近乎爆炸的速度增长。如此多的信息即使浏览一遍都无法做到,用户希望能找到感兴趣的部分更是不
人脸识别作为最自然、最友好的生物特征识别方法,在安全、金融等领域均有重要的应用价值。经过近四十年的发展,传统二维人脸识别在限定性条件下已经获得很大进步,但在光照、姿态