基于数据挖掘系统的可视化技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wuzheyun314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对传统的数据挖掘研究,以可视化的形式对数据挖掘的研究有其独特的优势。利用可视化技术可以使用户更好地了解数据挖掘的全部过程,包括从数据预处理的可视化展示,到数据挖掘过程的可视化显示,再到数据挖掘结果的可视化显示。用户与数据挖掘系统建立非常良好的交互沟通方式,如通过丰富用户的专业知识来规整、约束数据挖掘的过程,然后根据数据挖掘的结果再分析改善其过程,最终得到正确合理的数据挖掘结果,通过这些活动可以使用户对挖掘结果有深刻并且直观的理解,这样做打破了传统的数据挖掘算法的黑盒子模式。实践证明,将可视化技术应用到数据挖掘中有很高的研究价值。   本文的主要工作如下:   第一,对相关技术进行研究。包括可视化数据挖掘技术的研究,即通过观察数据挖掘可视化的结果分析调整其中的预处理技术,数据挖掘算法,使得可视化展现的结果更清晰正确。由于时间的关系本文实现平行坐标系技术,星型坐标系技术,多边形技术,散点图技术的展示。还分析数据挖掘算法中分类算法和聚类算法等等。   第二,对可视化数据挖掘系统进行总体设计。包括设计思路,系统设计原则,预处理模块,数据挖掘模块,可视化技术模块等各个模块的总体设计介绍。   第三,对可视化数据挖掘系统进行深入的分析和设计。包括系统设计的开发环境,接口设计,类图,用例图,各个模块的详细设计。预处理模块的设计包括非空化,去重复值,标准化,维控制;算法选择模块的设计包括数据挖掘算法中分类算法和聚类算法的设计;可视化技术模块的设计包括四个可视化方法的实现。   第四,将分类算法和聚类算法的结果用四种可视化方法进行展示,通过对展示结果的分析,确定了数据挖掘算法和可视化方法的使用特点和应用范围。   最后,对系统和项目进行总结,指出下一步的工作。
其他文献
车牌识别系统是智能交通系统的核心技术,在实际生活中发挥着重大作用。虽然现在的车牌的识别率在90%以上,但是因为车牌识别的实际工作环境复杂譬如当车牌因泥巴或水雾等自然
人脸识别技术是模式识别、图像处理、计算机视觉等领域的一个极富挑战性的课题,但近些年确是一个研究的热点。广义的人脸识别技术包括人脸检测和人脸的身份识别两个方面的内
无线传感器网络是21世纪最重要的技术之一,能够广泛的应用在智能交通、国防军事、环境监测、医疗卫生、空间探索等许多领域。节点自定位技术是无线传感器网络的主要支撑技术
随着信息技术的飞速发展,各种计算机软件的功能越来越强大,加之商业组件(COTS)的大量应用,随之出现的健壮性失效问题也越来越多。在一些关键行业(如民航订票系统、银行结算系
目前对于虚拟社区的研究主要有两个方向:一个是无场景支持的用户交流平台;另外一个是有场景支持的,通常提供用户绚丽的社区场景漫游。这两个方向都有其缺点,首先,无场景支持
随着各领域信息化建设的不断发展,许多政府部门或企业都开发和使用了一些独立的信息系统。在数据量和业务需求不断增加的同时,旧的信息系统会面临升级、替换的问题,而旧系统所积
随着计算机软硬件技术的不断进步,嵌入式系统得到快速发展,并广泛应用于工业控制、信息家电、通信设备、智能仪器仪表等领域。同时,系统的复杂性不断增加,导致嵌入式系统软件的规
系统、软件及程序在运行过程中,都有可能由于缓冲区溢出的问题导致程序行为异常。恶意用户利用服务程序中的缓冲区溢出漏洞,攻击目标信息系统,破坏、修改、窃取信息系统中的敏感
学位
随着Internet的快速发展,网络安全问题日益突出,防火墙技术成为保障网络信息传输安全的有效手段。但传统的防火墙系统难以高效地过滤内容信息,易成为整个网络的性能瓶颈。因
从采用IRC协议的“egg drop bot”到高度模块化的AgoBot,僵尸程序从最初的网络聊天室辅助软件,逐渐成为威胁网络安全的主流恶意软件之一。在僵尸网络的攻防博弈中,IRC协议被H