基于流形学习的数据聚类与可视化

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:woshichuanqi007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据采集技术、通信技术和网络技术的迅速发展,人们在实际获取的数据维数越来越高,如何有效的描述高维数据,实现数据分析,如聚类已成为一个热点研究方向。论文借助流形学习的思想对数据进行约简处理,将高维数据映射到维结构空间,然后在低维空间实现数据聚类。论文的主要内容和创新如下:1.针对LPP算法不能有效的保留数据间的多样性信息,受启发于PCA和流形学习,利用邻接图描述数据的内在几何结构,较好的刻画了数据的相似几何属性和多样性几何属性,给出了分别度量相似性和多样性的离散度矩阵,提出了一种基于最小化相似离散度和最大化多样性离散度的准则的聚类算法(LocalSimilarity and Diversity Preserving Projection Clustering, LSDPC),该算法首先对数据进行降维,然后在投影空间中,使用k-means算法对数据聚类,和传统的聚类算法相比,LSDPC克服了数据维数的影响,且能够得到能有效的代表高维数据的低维表示,实验验证了该算法的有效性。2.基于半监督的聚类算法只适合于低维数据,导致实际效果不好,提出一种基于判别分析的半监督聚类算法(Local Discriminant EmbeddingSemi-supervision Clustering)LDESC来解决高维数据的聚类问题。该算法首先构造两个邻接图,同类局部邻接图和不同类类间邻接图,其中同类局部邻接图主要包括描述同类局部相似几何信息和同类局部多样性几何属性的邻接图,然后给出了分别度量同类局部信息和不同类判别信息的离散度矩阵,最后建立一个特征提取准则,实验验证了所提供算法的有效性。
其他文献
针对目前配电系统运行效率研究方面缺少评价手段且缺少内在原因的探究方法的问题,提出了一种基于Apriori算法和卷积神经网络的配电设备运行效率主要影响因素挖掘方法.首先,提
甩挂运输作为网络化、信息化、组织化的现代物流新形态,与传统运输相比,可提高车辆运行效率30%-50%,降低成本30%-40%,降低油耗20%-30%,提高运输能力30%-40%。对于面临节能减排、发
人脸检测作为自动人脸检测识别系统中的第一步,如何快速准确的检测出一张图片中的人脸直接关系到后续的人脸应用研究。因而在计算机视觉和模式识别领域中,人脸检测的研究一直都
当单波长速率达到40Gb/s及以上时,现有的各种编码格式均出现了不同程度的信噪比下降、误码率增大及光谱效率低下等问题,寻找更有效的新型编码格式已成为当前光纤通信领域一个迫
1.联系实际,引发学生的兴趣 数学为其他学科提供了语言、思想和方法,是一切重大技术发展的基础;数学在提高人的推理能力、抽象能力和创造能力等方面有着独特的作用;数学是人类的
期刊
随着WEB应用逐渐普及,这提升了用户的使用体验,但是随之而来的安全漏洞时刻威胁着服务提供商与用户,引起人们对网络安全问题的关注。本文以"跨站"脚本攻击为例,首先对CSRF攻击技术的基本概念进行介绍,分析"跨站"请求伪造攻击原理,复现攻击场景,剖析该类漏洞的利用方法与触发条件。根据"跨站"请求伪造攻击的特点提出三种防御策略,为服务器安全体系结构的设计提供思路。
激光熔覆是在基体表面形成与基体相互熔合且具有完全不同成分与性能的合金覆层的先进技术。激光熔覆技术在新材料制备、金属零部件快速直接制造、失效金属零部件绿色再制造等
近年来移动网络发展迅猛,各种智能终端更是如雨后春笋般呈现,互联网的浪潮正向我们涌来,国家在2015年的《政府工作报告》中提出了“互联网+”的战略。将某些基于传统PC平台的
伴随着计算机技术的快速发展,计算机仿真技术研究水上交通流已经成为交通领域的新热点。目前水上交通问题日益增多,已经对人类的经济和安全造成了严重的影响,船舶数量的增加和船
在天基空间监视系统相关课题的研究过程中,为了解决目标识别、确认与跟踪算法的仿真与验证、可见光相机的可行性分析和相关参数的选取等关键技术问题,需要获取可见光相机对空间