智能数据可视化系统中自动化图表推导技术的设计与实现

被引量 : 0次 | 上传用户:yangying_han
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据应用规模的急剧膨胀,可视化技术也得到了飞速的发展,它不仅能够直观且美观的展现数据之间的关系,更重要的是能够帮助数据分析师和管理者迅速做出重要决策。然而,现有的大数据可视化平台技术对于大数据探索的支撑还相对落后,具体体现为:一次传统的数据探索和分析过程往往需要数据分析师提出需求,数据工程师进行后台大数据计算,再由可视化工程师进行可视化渲染。每次数据探索都涉及到不同的工作角色和开发部门,从而需要消耗极大的时间成本,非常不利于快速多变的商业竞争环境,往往因为数据探索的效率低下导致失去了重要的决策时机。然而,相关技术在国内的研究和发展才刚刚起步。基于上述观察,本文提出并实现了一个能够进行快速探索的智能数据可视化发布系统。对于图表的自动化推导技术进行深入的研究,提出并解决两个最核心的技术难题,1)对于高维多元数据如何自动化的实现可视化展示,2)如何根据用户指定的信息对图表自动化的选择可视化编码方式并展现出来。针对高维多元数据的自动化展现问题,本文改进了表格透镜的方法,结合原始数据透视表的概念,用统一的表代数运算公式对用户输入信息进行可视化降维,这种降维方式对于图表有较强的可读性。图表智能生成并渲染问题,从数据类型推导图表类型,然后根据可表达性判断,有效性判断进行可视化编码方式的选择,最后确定能够表达且最有效表达的图表设计方式。本文提出的技术和子系统已经应用在网易在线教育产品中,为该产品运营过程中的快速决策和研发迭代提供了快速可视化数据探索工具。
其他文献
课堂提问是众多课堂教学技能中被运用得最广泛的技能之一。可见,教师是否将课堂提问使用得当很大程度上影响着一堂课的质量高低,课堂提问被很多研究者比喻为“教学的生命”。
隧道工程具有复杂性、隐蔽性、不确定性等特点,导致施工过程中事故频发。通过综合分析隧道现场各类信息,能够在一定程度上预防事故的发生。但是,目前国内针对隧道施工过程多
文章主要针对当前专业音乐院校中国音乐史共同课教学存在的问题,侧重以教师角度,提出进行改良的教学思考。
经1996~1997年于河南、江苏两地小麦超高产综合试验,初步论述了在合理选用品种基础上的超高产栽培调控技术:(1)明确栽培途径,建立高质量群体起点;(2)以合理叶蘖动态为直观指标,全面构建超高产群体
苏里格气田是低产、低压、低渗、低丰度、非均质性强的复杂气田,随着开发规模的不断深入和扩大,产水气井日益增多,产水量逐渐增大,排水采气工作日益突出。本文对排水采气工艺
IaaS是云计算的主要服务模型之一,IaaS通过在云数据中心部署虚拟机来分配计算资源,并将这些计算资源通过操作系统的实例按需地提供给用户。准确评估IaaS安全水平有利于指导Ia
根据西枝江流域多年水质监测结果,分析西枝江水质现状特点,水质时空变化特点,并进行水质评价与污染原因分析;预测西枝江水源水质发展趋势;提出保护西枝江流域水源水质的措施,即实施
提出了一种基于支持向量机的手写体数字识别系统。支持向量机方法,突破了传统模式识别方法的局限,使得基于支持向量机的分类器具有较好的推广能力。文中重点阐述了支持向量机
首先介绍了PLC(可编程逻辑控制器)的基本结构、应用特点以及工作原理,然后在此基础上介绍了PLC的应用领域,并描述了PLC的发展历史、发展现状以及发展趋势。