【摘 要】
:
数据挖掘是指从大量数据中提取隐含、事先未知、并且潜在有用知识的技术,是目前国际上数据库和信息决策领域最前沿的研究方向之一.数据挖掘技术已经被广泛用于各个领域,这些
论文部分内容阅读
数据挖掘是指从大量数据中提取隐含、事先未知、并且潜在有用知识的技术,是目前国际上数据库和信息决策领域最前沿的研究方向之一.数据挖掘技术已经被广泛用于各个领域,这些领域都具有各自的特点.该文研究了食用菌分析应用中的数据挖掘技术,提出数据分析方法必须与领域相结合的观点.文中介绍了食用菌分析中采用的分类、聚类、关联规则等方法,同时也对数据可视化技术进行了阐述.该文的重点是图谱序列的分析与改进方法,并提出了问题的解决方案.其研究成果已经得到了实现,并在实践中加以应用.该文的主要工作如下:(1)阐述了数据挖掘的基本概念、主要内容和发展趋势.提出了用CRISP-DM方法解决实际分析领域的问题,定义了一种基于XML的数据挖掘应用平台建模语言DMAPML(Data Mining ApplicationPlatform Modeling Language),用于描述分析流程的各阶段.(2)确定了食用菌分析应用中的用户需求,使用数据挖掘中关联规则、决策树分类、K-均值聚类和时间序列相似性查找四类算法解决了具体的分析问题,同时利用数据可视化技术描述了相应的实验结果.(3)改进了时间序列数据相似性分析的方法.针对应用特点,采用作为欧氏距离作为相似度度量,提出了新的SWBU算法,能够精确对图谱序列进行分段;利用三角不等性质减少了序列比较时的不必要的计算,提高了算法效率.(4)实现了一个数据分析系统.该系统按照数据分析的一般过程,将数据分析任务划分为数据集成、数据准备、数据探索、挖掘算法和结果展示等模块.该系统的各模块之间用先进的XML技术进行参数传递,具有高度的可扩展性,能实现跨平台、分布式的计算,并能通过网络发布分析结果.
其他文献
人工神经网络从着手研究到现在,已有五十多年的发展史.虽然几经坎坷,但随着众多学者的不懈努力,不但在理论上为神经网络的发展打下了坚实的基础,而且在信号处理、计算机视觉
自从计算机问世以来,让机器具有模式识别能力一直是计算机科学家们的努力方向.研究表明,对视觉和听觉信息的处理过程,不仅仅是一个感知过程,也是一个认知过程.因此,研究模式
随着信息技术的发展,文档图像在办公自动化、数字图书馆、电子商务、电子政务等项目中获得广泛的应用。在这些应用中,纸质文档通常采用扫描方式形成数字化文档图像进行存储、
数据库安全理论和技术不仅是数据库理论研究的重要方向,而且也是信息安全的重要研究方向。本文提出采用主从结构表的方法对BLP模型加以改造,使得改造后的BLP模型具有较高的可用
本论文分析并研究了电信管理网的功能体系结构、物理体系结构和信息体系结构;研究了电信统一网管平台的功能体系结构;完成了统一网管平台之系统管理子系统的需求分析和设计;采用
本课题所开发的用户界面代码自动生成系统(AUI-Automatic UserInterface),是在大量相关研究的基础上加以实现的.大量基于模型用户界面生成工具证明了自动生成用户界面源代码
该论文主要研究C/C++中的类型转换,特别是隐式类型转换的静态安全性检测.通过分析各数据类型的特性,研究它们之间不安全的转换,根据产生机制进行了分类,借鉴文法的表述形式对
本文首先逐步深入地对软件测试、面向对象软件测试、自动化软件测试和面向对象软件单元测试进行了介绍和分析。最后主要集中精力于基于设计模型规格描述的自动化单元测试技术
几何证明系统是一类强大的几何教学辅助系统,在几何教育应用中有着举足轻重的地位。目前成功的几何证明系统有MathXP、Z+Z智能教育平台和Geometry Explorer等,由于它们运行在传
随着网络技术的高速发展,计算机网络获得了广泛的应用,如何解决信息安全问题成为网络应用的关键性技术问题。在电子商务应用中,要求网络通信的双方必须能够了解对方的身份,并确认