多层面数据可视分析

来源 :浙江大学 | 被引量 : 0次 | 上传用户:QQQ16416
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代给数据可视化带来新的挑战,这不只体现于数据的海量特征,更体现于数据的复杂性特征,也就是数据的异构性:数据可能带有时空属性和多元属性(多元性),数据的来源和表现形式可能是多样的(多模态性),数据的处理可能有多种方法(多模型性),数据的显示可能有多个尺度(多尺度性),数据可能是经过多次计算得到的(集合性),数据之间可能存在相互关系(关系性)。数据的复杂性和不确定性说明从一个角度分析数据是远远不够的,实际应用场景中往往需要从多个角度去观察和分析数据的不同层面。这就要求多层面的数据可视分析,利用数据分析的多种手段,考察数据的多元性、多模态性、多模型性、多尺度性、集合性和关系性。  本研究主要内容包括:⑴提出一种新的数据结构化和探索模式,利用信息熵理论构建数据维度之间的关系,并将这种关系通过四元组方法转化为数据维度分类树。将设计与该数据维度分类方法配套的交互式探索系统,交互设计帮助用户观察单一变量、探索并验证多变量关系、标注并概括用户发现。⑵以监控应用场景为例,完成多数据集整合后的多层次跨粒度分析,发挥计算平台性能监控的作用,将系统性能对比和系统性能均衡分析定位到单个机器的层面。本文将提出一系列的多视图可视化设计,从平台层面、集群层面、机器层面三个粒度监控一个计算平台的性能,分析系统的性能瓶颈,给出系统升级意见;分析系统性能均衡状态,定位问题机器。⑶以城市数据中的真实人际关系探索场景为例,完成由多个数据集共同组合完成任务的识别、探索、补充和验证的完整过程。本文将为多源异构的城市数据构建了一致的时空存储结构,使城市中人和车的轨迹有了统一的可根据时长或次数加权的匹配方法(即查询方法)。基于这种时空存储结构,将实现带语义的人、车的轨迹分析,和定制化的人际关系探索与验证。⑷以时序排名分析场景为例,完成从一个数据集的探索分析到另一个数据集的解释验证流程。以维基百科排名数据为例,将借助格式塔原则设计时序排名数据的可视编码,使之能表达排名项的排名变化趋势并有效规避可视混杂。针对某一排名项的排名变化,利用时序数据相似性建模方法提取出与之相似的排名项,并构建相似排名项之间的关系,使排名变化更具有可解释性。排名关系数据挖掘并解释了时序排名数据的相似起伏趋势,时序排名数据则表现了维基读者对排名关系的共同关注情况。
其他文献
传统的集中式移动网络协议,以基于用户的移动网络协议第六版(Mobile Internet Protocolversion6,MIPv6)和基于网络的代理移动网络协议第六版(Proxy Mobile Internet Protocolve
学位
学位
一个成熟的科学领域,一般应有一个统一的、通用的理论描述模型。目前在计算机图形学中所使用的几种常见矢量图描述规范,都有各自的侧重点,且未有一种可以涵盖各类矢量图类型的统
论文在分析和总结国内外网络安全态势感知技术及应用基础上,针对网络攻击主题进行了研究和探索,给出了基于网络攻击主题的网络安全态势感知模型和网络安全态势量化评估方法,对安
学位
学位
随着数字化的进一步普及以及信息技术的迅速发展和广泛应用,需要传输、存储、处理的数据量急剧增加,对传输带宽、存储容积和处理速度造成巨大压力,因而产生了对数据压缩的强劲客
学位
学位