【摘 要】
:
聚类是一种重要的无监督数据分析技术,它主要用于将数据对象分块,并生成簇集。簇集内,簇内对象比簇间对象更相似。在数据聚类中,一个主要的问题是估计数据内蕴含的簇的数量。因为很多常用的聚类技术需要簇数目参数。在对包含着大量簇的高维数据聚类时,这个问题变得更具有挑战性。这是因为簇数目参数可以反过来作用到聚类结果。我们将在本文内提出GMM-Tree,来估计簇数目和初始的簇中心。这个名称是Gamma Mixt
论文部分内容阅读
聚类是一种重要的无监督数据分析技术,它主要用于将数据对象分块,并生成簇集。簇集内,簇内对象比簇间对象更相似。在数据聚类中,一个主要的问题是估计数据内蕴含的簇的数量。因为很多常用的聚类技术需要簇数目参数。在对包含着大量簇的高维数据聚类时,这个问题变得更具有挑战性。这是因为簇数目参数可以反过来作用到聚类结果。我们将在本文内提出GMM-Tree,来估计簇数目和初始的簇中心。这个名称是Gamma Mixture Model Tree(伽玛混合模型树)的简写。除此之外,我们还将提出几个使用GMM-Tree来解决聚类、分类问题,和处理带有大量簇或类的高维数据的方法。在实验过程中,我们使用了合成和真实的两种数据集,这些数据拥有不同数目的簇、类、特点和对象。据实验结果显示,我们的方法比当前常用的几种方法在找到簇数目和初始的簇中心上使用时性能更好。除此之外,实验结果证实了基于GMM-Tree的SSS-GMM带监督方法在对分类拥有大量类的高维数据上的运行结果比其它常用的技术要性能更好。
其他文献
空芯纯石英光纤以其优良的耐高温特性和独特的空气孔微流通道结构在高温高压传感、气体及微流体传感领域具有重要的研究意义与应用价值。温度和压力作为反映工程结构健康状态的重要参量,其测量在工程领域至关重要。随着科技发展和工业技术的进步,高温和高压的测量在航空航天、石油化工、深海探测、冶金工业等领域愈加重要。光纤传感器以结构小巧、灵敏度和集成度高以及在线分布式测量等特点被广泛应用于温度、压力及其他物理、化学
微结构光纤具有丰富的内部结构以及各种新奇的光学特性,近年来被广泛应用于光纤传感器的设计和制作,基于微结构光纤的传感器主要可分为四种类型:光栅型、干涉仪型、SPR型和材料填充型。材料填充型微结构光纤传感器通过全填充或者选择性填充的方式将各种新型功能材料集成到微结构光纤内部,这便于功能材料和光纤内传输的光产生强烈的相互作用,同时功能材料本身对外界环境的高敏感性赋予了这种传感器更优良的传感性能。依据当前
社交媒体是指一组基于互联网的交互式在线社区,它使用互联网和移动平台来支持用户生成的内容的创建和交换。实际上有数百种不同的社交媒体平台(例如,博客,微博客,社交网络,文本消息,共享照片,众包)。Facebook,Twitter,YouTube和Instagram等各种公司都在这些平台上运作。这些平台的使用在全球范围内的广泛受众中呈指数增长。迄今为止,在发展中国家使用SM的历史一直是赋予个人权力。它已
家庭是人类社会最基本的结构细胞,亘古已有、绵延至今,家庭的经济活动构成国民经济的基石。在家庭金融领域中,家庭负债关乎国计民生,已经被愈来愈多的研究所关注。在微观上,家庭通过借贷债务可以优化家庭消费、提高家庭成员的福利;在宏观上,家庭负债的总规模不仅左右金融市场的稳定性,更决定一国的经济波动与长期增长。有鉴于此,家庭负债既是一个引人入胜的理论研究主题,更是现实世界中不可回避的家庭金融焦点。家庭究竟怎
隧道是公路和轨道交通的重要基础设施,其运营及维护关系到国计民生与人民的生命财产安全。隧道衬砌的裂缝、变形等表观病害是隧道运营的重大安全隐患,使得病害快速检测与处理成为隧道安全运营的重大技术需求。当前,隧道检测依然以人工现场作业为主,效率低、安全隐患大,难以满足我国大量隧道普查检测需求。因此,研究高效可靠的隧道病害快速自动化检测方法,具有重要的研究意义和应用价值。本文对隧道表观病害快速检测方法开展了
海上红外目标检测作为海洋图像分析的核心技术之一,在海洋智能化防卫上有着重要的应用,已成为计算机视觉领域的研究热点和重要分支。尽管在红外目标检测领域,人们已提出大量的检测算法,但海上红外目标检测仍然充满挑战。由于海浪的运动性及时间方向上海波形态、亮度的差异性,局部空间内海波灰度分布的差异性,以及风速、光照变化、摄像机抖动、天气等因素的存在,加之目标材质、大小及数目的多样性,使得海上红外目标的准确检测
享有“世界历史文化遗产”称号的敦煌壁画由于承受着各因素带来的威胁,已变得十分脆弱。近年来,数字化修复已逐渐取代传统的人力手工修复,使得快速的无损化修复正变为可能。传统的壁画修复算法,由于没有将相应的手工线描图作为修复时的结构指导,所以在修复一些破损较为严重的壁画时,常常会出现结构纹理都不连续的错误填充现象,而现今主流的方法,尤其是在填充步骤时,都是从待修复图像中的非破损区域处选出最“特殊”最相似的
随着人工智能技术的不断发展,许多行业孵化出了与人工智能相关的应用。人工智能+医疗就是其中很重要的一个研究方向,人工智能在医疗健康领域的应用前景也正吸引着越来越多的关注。以此为契机,也孕育出了许多利用人工智能技术以医学影像数据为研究载体进行具体的医学领域任务的应用,如早期筛查、辅助临床诊断等。深度学习作为人工智能的一个代表性技术,在学术界和工业界得到了广泛使用,致力于具体实际应用的关键技术突破。在医
高光谱图像描述是对高光谱图像进行有效分类和目标探测的基础。成像设备技术的发展,使得高分辨率高光谱图像的空谱域局部特征能够提供更丰富的图像信息。本文结合高分辨高光谱图像的特性,对基于空谱域局部特征的高光谱图像描述的关键技术展开深入研究,并将其应用于高分辨率高光谱图像目标探测。主要工作包括以下四个方面:(1)提出了一种基于几何代数的高光谱图像空谱域SURF特征检测和描述算法。特征点检测是高光谱图像描述
条纹管激光成像雷达是一种基于变像管扫描测量技术的新型激光三维成像雷达,在军事领域有着非常大的需求。研制条纹管激光成像雷达是国家战略高技术领域的需求。传统意义上的激光雷达很难对有一定景深而对比度小的目标进行识别,而条纹管激光成像雷达的每个激光脉冲覆盖面积大,其搜索效率远远高于非成像激光雷达,是一种可以在探测器和目标物同时移动的情况下进行瞬时成像的系统。可以对丛林和夜幕掩护下的目标进行有效识别。论文以