数据挖掘中可视化技术研究与实现

被引量 : 0次 | 上传用户:chf012183
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几十年来,随着计算机硬件和软件的迅速发展,尤其是Internet技术的快速进步,人们收集到的数据以令人吃惊的速度日益增加,形成了一个浩瀚无边的数据海洋。如何从海量数据中寻找到隐藏在数据背后的有用知识成为了一个热门的研究课题。数据挖掘正是解决这样一个问题的新兴领域。在数据挖掘中,可视化技术有着广泛的应用。在数据挖掘中使用可视化技术,让我们可以结合人的视觉优点和主观认知,使数据挖掘过程具有直观性和可交互性,从而挖掘出更有价值并易于理解的信息。本文在一个基于Web的分布式挖掘系统MinerOnWeb的基础上,对数据挖掘中的可视化技术及其实现进行了重点研究。本文阐述了数据挖掘系统MinerOnWeb的详细设计与实现。MinerOnWeb系统是为了给用户提供在线的数据挖掘服务而设计的系统。它的开发遵循J2EE规范,采用了Struts架构。它主要集成了一些成熟的分类、聚类和关联规则挖掘算法,能够处理多种文件格式的数据。基于这个系统,本人重点研究和分析了两种数据挖掘可视化技术,然后将这些技术在MinerOnWeb中加以实现:1) 2维柱状图:与传统的柱状图不同,这种柱状图的横坐标表示一个数据维(属性),纵坐标表示数据记录数。这样我们可以看出数据在这个属性上的分布情况。柱图上的颜色表示第二个数据维(属性),不同的颜色表示不同的属性值。通过这样的图形化方式,我们可以同时观察到两个数据属性的分布情况以及两个数据属性之间的联系。2)基于星型坐标系的散点图:这是一种将多维空间内的数据映射成二维平面上的点的方法。每一个数据维被都被映射成二维平面上的轴线,这些轴线都相交于一个中心点,构成星型坐标系。然后数据在被最大最小规格化之后,通过一种被称为α映射的方法映射到二维平面的星型坐标系中。二维平面上的数据点可以通过用户调节α值来动态地显示,使用户得以从不同角度观察数据。由于这种可视化技术非常适合聚类数据的可视化,本文基于这种可视化技术,讨论和分析了一种基于人工标记的可视化聚类分析方法,归纳了两条用于发现聚类的规则,然后将这种可视化技术与自动聚类算法相结合,研究了一种基于聚类算法的交互式可视化聚类分析方法。
其他文献
利用环境同位素氚和氧-18对实验集水区进行降雨和径流响应的研究表明:(1)地面径流必源于本次降雨的概念不确,其中往往有非本次降雨的水量。经对1986年~1989年各次降雨估算表明
居住建筑是最基本的建筑类型,是人类社会、经济、文化发展重要的载体,住宅的研究对提高人们的生活水平,促进社会发展有着重要的现实意义。随着人们生活水平的提高,人们对居住的需
<正>当前,人才流动特别是高层次人才流动呈现出新的特点。高等学校要为社会人才诚信建设起到引领、表率作用。教育主管部门有责任对人才流动中出现的不合理、非理性现象进行
<正>现代玉米生产方式的方向是全程机械化,机械收获特别是粒收水平低是制约我国玉米全程机械化发展的瓶颈。为推动玉米机械粒收技术的应用,中国农业科学院李少昆研究员带领的
介绍了汽车制动器衬片及其分类以及国际标准化组织、美国、欧洲、日本和中国衬片产品的主要技术标准体系,阐述了衬片产品的主要检测项目及其测试方法,分析了2016年衬片产品质
通过对体育舞蹈发展及现状的阐述,分析了体育舞蹈在高校教育中的作用,指出在高校深入开展体育舞蹈活动是稳定校园秩序、丰富校园文化生活、促进和谐校园构建不容忽视的问题,
社区矫正是相对于监狱矫正而言的一个专门性术语,它是西方国家民主意识、人道观念、教育刑思想以及刑法经济化原则等现代行刑理念下的产物,社区矫正制度自20世纪在西方国家形
教育的民主化与平等是教育走向现代化最为重要的目标。性别平等是教育中的重要议题。然而,在教育过程中,性别平等又是一个常常被忽略的问题。女性主义教育研究者对教育领域中
武侠电影是中国民族电影中颇具影响力的类型片种,在电影史上留下了精彩的艺术轨迹。新世纪以来,随着电影业竞争的加剧和全球化电影生产趋势的出现,电影的商业属性在急切地想要拯
抗战前夕的上海是全国的文化中心,在全国具有无可替代的重要地位。数量众多的各种文化人常年集中在上海,开展多种多样的文化活动,遂使上海文化呈一时之盛。“卢沟桥事变”后,平津