图标可视化技术在聚类算法中应用方法研究

来源 :北京交通大学 | 被引量 : 12次 | 上传用户:usernameing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据时代的来临,大数据的分析、挖掘与可视化成为了信息技术发展的研究热点。数据可视化是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来并进行交互处理的理论和方法。基于图标的可视化方法是一种常见的可视化方法,它采用了图标表达多元数据对象,并用不同的视觉元素表示数据对象不同的属性,在某些场合下具有简单高效的特性,因此在数据挖掘领域中得到了广泛的应用。本文首先介绍了数据可视化的基本概念和数据可视化中常见的算法,详细说明了图标可视化技术的优势,为之后的研究工作打下了基础。接下来介绍了数据挖掘中常见的聚类算法,比较分析了这些算法的优缺点。然后着重阐述了K-means算法(K-均值算法)在聚类分析中的应用以及常见的对K-均值算法聚类效果的评价指标。最后提出了一种新的可视化方法,该方法不仅可以对K-均值算法初始参数的设定起到指导作用,而且能对K-均值算法的聚类效果起到评价作用。PCA(主元分析)是数据挖掘领域中一种常用的数据分析方法。当数据的维度非常高时,各类可视化方法都无法清晰地表现数据细节。针对该问题,本文提出了一种基于PCA技术的图标可视化方法。该方法在减少数据集维度的同时,利用不同颜色的图标显示多元数据。实验表明,该方法不仅能在合理的空间布局下有效地展示复杂数据中隐含的关系和信息,而且与其它方法相比能够快速直观的对K-均值算法的初始参数进行指导,并对K-均值算法的聚类结果进行对比评价。
其他文献
自动摘要是利用计算机自动地从原始文献中提取摘要,减少文档的过程。它是计算智能,机器学习和自然语言处理研究方向的一个部分。论文以印度尼西亚文的自动摘要展开研究。该研究
随着现代工业的快速发展,对设备的安全稳定运行要求越来越高,故障诊断技术得到了广泛的应用,而与此同时,传统的诊断技术已经很难适应工业生产的需要。正是在这样的背景下,本文将时
目前,一些企业偷税漏税手段复杂、花样翻新,成为税务稽查的一个难题。传统的稽查选案是以举报信息为主要依据的,这很大程度上依赖于专业的稽查人员根据以往的工作经验和某些直觉
随着社会信息化的不断发展,人们对Web信息管理系统的需求也不断增加。由于这类系统各模块的相似度比较高,因此开发人员在开发这类系统时会出现重复性编码工作。国内外很多研
随着信息技术的发展以及企业服务意识的提升,呼叫中心得到了广泛的应用,例如为用户提供如天气预报、股市行情、产品的最新报价、查询费用等信息。然而当人们希望在比飞机航班或
随着Intenet迅猛发展,各种资源不断增多。为了快速、高效的查找信息,信息处理以成为当前重要的研究领域。针对信息处理涉及的内容,本文对中文信息处理中的若干关键技术进行了
因特网已经应用到社会生活的方方面面,人们对网络安全的要求也逐渐提高。入侵检测作为一种积极主动的安全防护技术,对它的研究倍受重视。本文首先介绍了目前国内外入侵检测技
随着网络信息的急剧增长,在搜索引擎中使用确定的查询词检索时,返回结果一般是一个庞大的相关文档集列表。如何从该列表中快速获得想要的信息就成为一个极具研究价值的问题,解决
没有一套需求理论能放之四海而皆可用,因为不同的需求方法各有其专注的领域;同样,需求验证方法也必须遵循需求模型的特点才能达到更好的验证效果。本文针对主谓宾需求模型提出基
作为计算机学科的一个重要应用方向,生物特征识别技术正在成为一个蓬勃发展的研究领域,笔迹鉴定技术则是其中具有吸引力的一个方向。近年来,一些发达国家已把生物特征识别技术,从