基于概率重构和图距离近邻网络的数据可视化算法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lijws
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息探索的时代,现实生活中的数据往往具有成千上万的维度,所以处理和分析这些高维数据是迫切需要的。如果高维数据可以在二维或者三维的图上得以展开,那么我们就可以直观地了解数据的主要结构,这将极大地有利于数据探索和模式发现。数据可视化算法正是基于上述的目的被提了出来,它旨在揭示嵌入在高维数据中的低维流形,是处理高维数据问题的有效手段和重要工具。同时数据可视化在诸如机器学习和数据挖掘等许多领域中是一项十分重要的研究课题。本文首先系统地介绍了数据可视化的基本内容,包括数据可视化的背景,以及一些经典的数据可视化算法。在此基础上,本文提出了一种新的数据可视化算法,称为基于概率重构和图距离近邻网络的数据可视化算法(PR-GDNN)。PR-GDNN算法构建近邻网络并计算图距离,然后基于近邻关系进行概率重构,最后极小化KL散度得到低维表示。通过这些操作,PR-GDNN算法比经典的可视化算法能更好地揭示高维数据的内在结构,展现出更好的可视化性能。通过在四个标准数据集上定量和定性的对比实验,表明了文章所提出算法的优越性。同时为了拓展PR-GDNN算法的可视化性能,本文在PR-GDNN算法的框架下,给出了预聚类和特征提取两个可行的优化方向,相应地提出了基于Louvain的PR-GDNN算法和基于PCANet的PR-GDNN算法,并结合实验说明了它们作为提升PR-GDNN算法可视化性能的可行性。
其他文献
看过本期“花季故事”里迈克·佩勒姆的事迹,你有否萌生出海远航的想法?帆船运动是依靠自然风力作用于帆上使驾驭船只前进的一项水上运动,是人、船、水、风之间获得平衡的体
“畅所欲言”开放投稿啦!欢迎大家与我们分享你的人生点滴——无论是校园生活、日常感悟,还是英语学习经验谈、你与CT的故事……文章或画稿要求原创,500字以内,中英文皆可,
目的探讨盐酸氨溴索辅助治疗毛细支气管炎的临床疗效,方法95例毛细支气管炎患儿随机分为治疗组50例和对照组45例.两组均给予常规综合治疗,治疗组加用盐酸氨溴索15mg静脉推注,1次/d
介绍了已运行燃气管道与新建聚乙烯燃气管道的连接技术.工程实践表明,实施带压不停气连接作业技术可行,效果良好.
教师节又到了。今年你准备以什么方式为老师们庆祝呢?CE:Teens决定为大家送上几部感人肺腑的教师电影,祝所有老师节日快乐!
期刊
历史上很少有作曲家仅因为一部作品就被世人记住,法国作曲家乔治·比才就是其中一个。除了《卡门》外,比才还创作了其他音乐作品,而且如果不是36岁英年早逝的话,他肯定会写出
做好机能综合实验教学准备 ,首先明确综合实验内容 ,精心计划周密安排 ;其次抓好细微环节 ,保证实验质量 ,还要充分利用先进实验设备 ,半开放实验教学 ;同时应严格管理制度 ,
期刊
在全球可持续发展和绿色低碳理论的推动下,我国逐渐将绿色发展作为新时代改革的重要目标。港口物流在现代物流体系中处于核心战略地位,因此必须融入国际化的绿色发展模式,丰富国内较为匮乏的理论基础和实践经验,加快港口物流绿色化转型的脚步。基于我国港口现有的发展模式,政府是引导和推动港口转型的重要角色,如何合理制定宏观调控手段从而加快推动港口绿色发展将成为重要研究内容。本文根据现代港口物流发展模式、可持续发展
复杂产品的设计过程中普遍存在由材料特性和制造公差等诸多因素导致的不确定性,其可能对产品的性能和可靠性产生较大影响。因此,研究不确定性优化方法具有重要意义。由于这些不确定性因素的上下界往往是已知信息,可以使用区间数对其进行描述,进而将不确定性优化问题转换为区间不确定性优化问题。解决此类问题需要多次调用计算密集的工程仿真模型(源模型),从而导致优化效率较低。基于响应面的区间不确定性优化方法在一定程度上