基于四叉树网格的快速层次聚类热图可视化研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:huangcui8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图作为反映数据中携带信息最重要的一种表达方式,在许多领域得到广泛的应用。而热图是超越传统图形意义的一种新型的信息可视化方式,在现代的可视化领域中,热图的使用更加广泛。然而随着大数据时代的到来,数据不仅在多元素、多维度等数据属性上剧增,尤其是在数据规模上急剧增加,使目前的方法在大规模数据进行热图可视化绘制上效率大大降低,甚至超过机器的负载,导致程序崩溃无法进行数据可视化的绘制。针对这一问题,本文提出一种基于四叉树网格的快速层次聚类热图可视化方法,通过对大数据进行聚类预处理,进而利用可视化技术将预处理数据信息采用热图的形式进行展现。首先,针对大规模数据进行预处理时选择合适的聚类方法从数量级上减少数据,通过对现有的多种聚类方法进行仔细研究和分析,综合各个聚类方法的优缺点,提出了一种基于四叉树网格的快速层次聚类算法。该算法适用于大规模数据的聚类,避免多次聚类造成数据信息的丢失,且聚类后的数据质量较高,并在最大程度上保留原数据的特性。其次,根据预处理后的数据,计算数据热点产生的热值。将预处理后新的数据中心点看作热点,通过高斯函数拟合计算每个热点(多条数据)对周围地域产生的作用值,将所有热点对区域的作用值累加。计算结果作为最后的热度值,利用可视化技术进行三维热图的绘制。再次,根据三维热图的体数据的特点,提出一种简化的光线投射方法,利用GPU强大的并行处理能力和着色器可编程的特性,直接在着色器中计算经纬度对应热值,把热值按比例转换成高度再根据比例值赋颜色值进行三维热图的绘制,相比于传统的光线投射算法,减少相交测试的计算和反复采样,提高热图的绘制帧率。最后,设计和实现可视化程序框架,并通过实验对提出的方法进行验证和对比分析,证明了本文算法的可行性和有效性。
其他文献
随着计算机技术的迅速发展,计算机在教育中的应用已经成为改革我国教育方式和教学方法的重要手段。计算机辅助教学就是利用计算机强大的信息处理、显示、控制和传输功能,特别
传统审计方式很难发现隐藏于海量数据中的各种财务问题,本文以学科交叉的思维,综合运用数据挖掘技术、基于专家知识的故障诊断理论和财务审计理论,开发出了一个能够处理多种数据类型、自动发现审计线索的智能化财务审计系统。本文主要研究内容如下:(1)财务报表审计分析模型研究。将基于专家知识的故障诊断理论运用于财务审计领域,通过建立整体审计分析模型发现重点审计对象及疑似故障点,结合重点分析模型和个体分析模型对财
学位
本文选择TI CC2530设备为实验平台,且设计和实现作物环境信息参数监控软件。为降低数据冗余带来的网络流量,本文在终端节点实现自适应加权数据融合算法,并给出严格的推导过程
运动捕捉(Motion Capture)是计算机视觉领域的基础研究课题之一,旨在基于多个不同视角的同步相机阵列恢复人体运动过程中的三维模型和细节特征,在虚拟现实(Virtual Reality)
因特网的发展使得人们可访问的信息资源越来越多,远远超过了人工筛选的处理能力,人们迫切的需要一种能够快速准确地为其找到所需信息的手段。信息检索这个研究领域正是应此需
反病毒厂商每天都要收到数以万计的可疑程序样本,工程师需要从海量可疑文件中找出真正的恶意程序,以提取病毒特征码,从而更新病毒特征数据库。本题的目标是开发出一套基于程
随着实时计算在众多领域中的渗透,嵌入式实时操作系统的使用越来越广泛,其安全性与可用性也越来越受关注,特别是在对安全性与可用性有着高要求的航空航天领域。传统的嵌入式
近几年来,关于微电网技术方面的研究是国内外电力系统研究的热点和重点,而控制问题是微电网在实际运行中需要解决的关键问题之一。本论文的研究主要是围绕着微电网的控制问题而展开的。本文论述了国内外微电网的发展情况,微电网概念和结构,以及微电网的一些关键技术。多智能体技术具有自治性、社会性、反应性、协调性,并且具有很强的推理能力,以及自组织能力和学习能力,可以很好的解决微电网控制中的问题,所以本文提出了基于
在网络图像资源呈爆炸式增长的今天,如何有效地管理这些资源并让用户可以方便地访问其所需要的图像成为众多研究的焦点。基本方法主要包括图像检索和图像浏览,而图像标注则是
随着计算机技术和移动通讯技术的迅猛发展,建立在移动通信技术基础上的一种新的计算模式—移动计算(mobile computing)模式获得了飞速发展。目前以广播模式发布数据来支持并