离散化算法的研究及应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:limutou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文首先介绍了离散化处理的发展现状,并且详细介绍了整体离散化算法.经过对它的分析,在其基础上提出了基于数据分区的整体离散化算法.基于数据分区的连续属性整体离散化与基本的整体离散化的不同主要体现在:它首先对例子集合在各个连续属性上的取值进行统一数量级别的放大处理,使不同属性轴上的取值在数值空间上可以相互比较和计算;根据经过统一处理后的数据,分析例子集合在各个属性轴上的取值的分布,选出包含最多聚类信息的属性,根据该属性上的数值分布情况,将整个例子集合粗略的划分为多个分区;然后在各个分区中分别进行聚类;将在各个分区中得到的聚类结果进行合并,形成在整个数据集上的聚类;接下来根据整体离散化的一般方法把获得的聚类投影到属性空间的各条属性轴上;最后,将各属性轴上的冗余投影区间去除,确定各属性轴上的离散化划分点.该文最后构建了一个专家系统自动知识获取模型,用土壤分类数据作为算法的实例数据,分析了基于数据分区的整体离散化算法的性能以及它在实际应用中的意义.
其他文献
裂缝参数的提取是FMI成像测井解释的重要环节之一.目前,从成像测井中识别裂缝主要通过人眼完成,裂缝参数的计算也是通过人工给出裂缝关键点通过计算机自动拟合来实现的.实现
随着计算机技术的发展以及用户对于存储需求的日益增长,主动存储系统成为热点研究。如何利用未来存储设备上的计算能力来支持高性能的计算和高效的存储访问成为问题的关键。本
该文试图提出一套完整的基于多Agent协商的机制来解决组合拍卖的问题.该文中详细介绍各种组合拍卖的竞价语言并分析了它们的表达能力.在OR语言的基础上,该文形式化定义了组合
Web服务是电子商务领域具有革命性的技术,它以XML,HTTP等开放的规范为基础,以SOAP,WSDL,UDDI为核心,在现有的各种异构平台的基础上构筑一个通用的平台无关、语言无关的技术层
随着网络技术的不断发展和社交媒体的流行,当前媒体社会进入到“自媒体”时代。在自媒体时代,人人都是信息的传播者以及推动事件发展的主要力量,这就使得网络信息传播速度更快,受
目前网络中急剧增加的服务以及新技术的采用,一方面满足应用的需求,但同时也增加了出现安全漏洞和网络攻击的机会,迫使不断增加和升级安全设备.安全系统遵循所谓的"木桶原理"
随着我国市场经济的发展,企业的生产模式向小批量、多品种发展,多样化和定制式的产品代替了标准产品.企业要满足客户个性化的需求,就需要大大缩短产品开发周期,而用手工方式
通过搜索引擎来查找所需要的信息,是当前人们在网上获取信息的重要手段之一。在信息检索领域,评价一个检索系统性能的优劣,不仅要看检索模型是否有效,更要考察检索系统对于不同的
高能物理离线数据处理作业主要分为CPU密集型和I/O密集型两种。传统计算集群采用计算资源和数据存储相分离的架构,大量的数据传输对网络I/O造成了很大压力;而运行在Hadoop之上
该文以高速入侵检测原型系统的设计和实现为工程背景,以建立实际有效的北大校园网高速网络入侵检测原型系统为目标,根据入侵检测系统的特点和对高速网络检测能力的不足,通过