【摘 要】
:
随着数据爆炸时代的到来,各个领域普遍存在海量具有复杂属性的数据,其中很大一部分是时变数据。数据可视化能够以图表的方式直观地展现数据,帮助用户更好地进行数据分析,目前已有很多研究人员对时变数据可视化方向展开了研究。国家人类遗传资源中心面向人类遗传资源和人口健康数据,需要通过可视化来帮助科研人员探索数据的时变趋势和内在联系。但是,当前时变数据可视化系统仍然存在一些问题:(1)对高维时间属性的处理和展示
论文部分内容阅读
随着数据爆炸时代的到来,各个领域普遍存在海量具有复杂属性的数据,其中很大一部分是时变数据。数据可视化能够以图表的方式直观地展现数据,帮助用户更好地进行数据分析,目前已有很多研究人员对时变数据可视化方向展开了研究。国家人类遗传资源中心面向人类遗传资源和人口健康数据,需要通过可视化来帮助科研人员探索数据的时变趋势和内在联系。但是,当前时变数据可视化系统仍然存在一些问题:(1)对高维时间属性的处理和展示比较困难;(2)可视化效果不够准确清晰,有适用于系统级别的时变数据可视化方法不能同时满足较高准确度和易于被用户理解操作的要求;(3)缺乏面向时变数据处理并可视化的专一性系统,在生产环境中时变数据可视化缺乏有效的数据可视化方案。为满足上述需求,解决上述问题,本文依托国家人类遗传资源中心数据服务平台,对时变数据的可视分析进行了深入的研究。本文主要研究内容包括以下几点:(1)在保留数据趋势特征的基础上,针对高维时间展示的困难,改进了时间序列近似表示算法,综合考虑拟合误差和序列长度,提高了分段效率,准确而高效地减少了时间维度;(2)在探讨时变数据间关系的基础上,针对聚类精度不足导致可视化效果一般的问题,提出了基于DTW的K-Means算法,对每个时间点赋予不同的权重,使类内非相似性尽可能小,提高聚类效果,方便用户准确地分析时变数据的特征模式;(3)在关注可视化整体过程的基础上,设计了一种基于平行坐标系的时变数据可视化方法,综合考虑数据本身属性及其时间维度上的变化,使用以时间戳为坐标轴的平行坐标系,呈现时变数据的变化趋势和数据间的同异性。基于上述研究内容和成果,本文设计并实现了时变数据可视化系统。该系统后台封装相关算法,以解决高维时间展示困难和聚类可视化不够准确的问题,为用户提供了一个完整的时变数据可视化流程,并集成了数种可视化布局组件,易于操作,能够帮助用户准确、高效地探索时变数据中蕴含的规律和价值。
其他文献
<正>据报道,毕业来临之际,南开大学有28名博士生因未达到毕业要求只能拿到结业证书。南开大学校长助理佟家栋教授说,此举是为保证博士质量,这28人将不会是惟一一批被淘汰的南
目的探讨药物联合针灸治疗动眼神经麻痹的临床疗效。方法对我院106例临床动眼神经麻痹病例进行药物联合针灸治疗。结果 24例患者治疗3个疗程后病情基本痊愈;62例患者病情明显
碑刻的完成离不开刻工的功劳,刻工将文本上的字体转移到碑刻上实现了字体文献的转移,并形成了永久保存的碑刻艺术,使中国历史文化广泛传播和长远流传。其贡献之大却少有人知,
<正>弟子门生以"先生"尊称陈光中教授,这个称谓与"王先生"、"李先生"之类泛泛称呼不同,它的含义和古称的"子"略相近似。"子"曾是男子的通称,后来成为对有道德、有学问、有爵
以贵州兴仁县产薏苡的不同部位为研究对象,分析测定其种仁及非种仁部位的营养成分和功能性成分。结果表明:薏苡6个部位的化学成分含量有一定差异,种仁的蛋白质和多糖类物质含
在科技高速发展的今天,人类在享受高科技成果所带来巨大福祉的同时,也应该清醒地认识到所面临的巨大挑战,这就是作为支撑人类社会生活的两股重要力量科学技术与人类伦理道德之间
【目的】研究塔里木河叶尔羌高原鳅盐碱胁迫下机体耐受和行为变化。【方法】以塔里木河叶尔羌高原鳅为研究对象,通过采用生态急性毒理学试验方法,限定低温环境(13±0.5)℃,测定
<正>避雨栽培在多湿的气候条件下是一项积极有效的栽培方式。既可以早春保温,促进甜瓜前期生长,解决早春低温问题;又能在甜瓜成熟期间避免雨水的影响。既减少了病害的发生,又
人类对大自然的掠夺式开发和利用,带来了当前最大的全球性挑战和经济发展瓶颈:严重的资源和环境问题。作为解决经济发展和资源环境约束矛盾的根本出路,循环经济成为最先进的
中国共产党人和中华民族在近百年历史进程中,始终坚定对马克思主义的信仰、对中国特色社会主义的信念、对实现中华民族伟大复兴中国梦的信心。坚定的信仰、信念、信心,既有着