基于SOM的多维数据可视化研究与实现

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:youki2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的飞速发展和数据仓库的大规模应用,科学、工程、商业等领域的多维信息日益增多。由于人类认知能力的固有局限性和信息的复杂性,多维数据可视化技术作为有效的抽象信息展现工具被广泛地用来辅助知识工作者理解和分析海量多维数据集。   多维数据可视化技术的基本思想是利用计算机图形学和图像处理技术,将数据库或数据仓库中的多维数据转换为图形或图像在屏幕上显示出来,并进行交互。多维数据集的可视化方法主要有两类,一类是对数据的各维进行映射,另一类是对数据进行降维处理。针对多维数据可视化和可视化结果聚类分析的相关问题,本文在综合分析各种多维数据可视化方法的基础上,对自组织映射(SOM)方法展开研究。主要工作包括两个方面的内容:   (1)SOM降维可视化的研究。针对SOM方法仅适用于数值型数据的不足,提出了一种基于新相似性度量函数的SOM-M方法,该相似性度量函数结合了数值和分类两种数据类型的度量方法,可以同时计算数值与分类型数据;采用马氏距离代替传统欧式距离,消除了数据之间的相关性。实验证明,改进后的算法能有效地处理多维混合型数据,获得更准确的可视化效果,成功地解决了多维混合型数据的可视化问题。   (2)SOM聚类分析的研究。SOM方法除了具有多维数据可视化功能,还可以有效地进行大规模的聚类分析,其特点是自动聚类,但缺点是分类的精度不高。本文提出了将SOM-M与K-Prototypes算法结合的方法,该方法首先利用SOM-M算法获得输入数据的大致聚类情况,然后利用这些信息来初始化K-Prototypes算法,以此得到优化的聚类结果。实验结果证明,改进后的算法较之改进前具有较高的聚类精度。   本文最后完成了多维数据可视化系统的设计与开发,该系统包括数据可视化和聚类分析两个模块:数据可视化模块实现了多种可视化技术,包括平行坐标图、雷达图和SOM技术等;聚类分析模块可以对可视化结果进行聚类分析,更有助于人们掌握信息之间的联系。通过简单的交互操作,用户可以获取感兴趣的信息。
其他文献
4G时代无线通信技术传输速度得到了巨大的提升,基于频分多址技术的LTE无线通信系统传输速率理论峰值能达到150Mbps,为了支持更高质量的数据传输需求,减少冗余数据传输,提升无
在网络信息复杂,视觉信息膨胀的当今时代,图像,视频等视觉信息有着传播速度快,传播范围广的特点。如何从庞大的信息库中提取有效信息,并利用这些信息创造价值是一个值得研究
随着工业生产技术的不断进步,对工业生产中各类测试仪器的要求也不断提高,现场测试从人工手动测试向自动化测试发展,从本地测试向远程测试发展。LXI总线技术是适应这种测试模式转变的一种新的测试总线技术。因此,如何实现多功能电参量测试仪的LXI总线接口设计已经成为目前亟待解决的问题。本文首先介绍了测试仪器的发展历程以及未来的发展趋势。同时,介绍了LXI总线的发展历程。根据LXI总线标准的相关规定,给出了多
目前,我国大部分的跑运输的车辆由于货源不固定,导致运输成本过高;另外,生产制造企业的运输业务是我国物流总量的主体,企业专注于核心竞争力的研究,不得不将物流业务外包给专
智慧旅游在近些年发展迅速,一些智慧旅游产品也不断在市场出现,但是就目前来看,使用智能手机应用在景区导航体验以及定位精度都还有很大改进空间,所以本文将GPS地图匹配技术引入
随着通信技术的飞速发展,无线网络正逐渐成为未来网络的发展趋势。传统的无线网络已经无法满足人们高速增长的网络需求,无线Mesh网络作为一种新型的高带宽低成本的无线网络接入
油藏数值模拟是当前石油工业中分析油藏复杂流体的有效工具之一。一个油气藏在现实中只能开发一次,如何选择最好的开发方法是油藏工程师需要考虑的首要问题。应用油藏数值模
在数字化信息时代,面对庞大的数据,检索成为提取有效信息的重要手段。图像检索是一种广泛应用的技术,百度,谷歌最早进入了这一领域。早期图像检索以人为方式对图像进行语义分
随着信息化技术在企业生产和管理过程中的重要性不断提高,越来越多的企业开始将信息化技术应用到企业中的各种业务流程中去。通过信息化技术将企业内部松散凌乱的信息融合到
无线Mesh网络一般不是作为一个独立的网络形态存在,它更多的担负提供宽带无线接入的任务,为用户提供高速的Internet接入。因此在WMN中,网关节点的处理能力将制约整个WMN网络的性