粗系统的挖掘与度量

来源 :杭州师范大学 | 被引量 : 0次 | 上传用户:lvlianpeng2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自二十世纪七十年代大规模集成电路、超大规模集成电路诞生以来,计算机已经成为现代工业、商业、农业等各个领域必不可少的一个工具,但随之而来的是数据的迅速膨胀,使得人类在一个极短的时间里进入了数据爆炸的时代.这些数据具有巨大性、随机性、不确定性等特征,并且数据的生成过程又往往存在着动态特征.实际上,在这些大型的、复杂的、信息丰富的数据中,只有一小部分是人们真正需要的,如何从其中提取出人们所需要的信息,已经成为目前一个重要的课题.粗集理论是波兰数学家Z.Pawlak在1982年首次提出的,这是一种处理不完整、不精确问题的新型数学工具,它通过等价关系和近似概念对数据进行约简以获取知识.粗集知识系统是一个基于规则的系统,它不需要精确的数学描述,而是对经验的总结,因此非常适合数据处理过程中直观、简单、易于理解、人性化、智能化的要求,为数据挖掘技术提供了理论基础和研究思路.  传统的数据挖掘方法是建立在数据不会发生变化的假设下进行讨论的,可以说是一种静态的数据挖掘方法,实际上数据不可能是一成不变的,当数据发生变化时,静态的数据挖掘方法便失去了效用,因此传统的数据挖掘方法具有局限性.奇异粗集(Singular Rough Sets,简称S-粗集)是Z.Pawlak粗集的一种改进形式.它是山东大学史开泉教授于2002年提出的,是基于元素迁移的概念建立起来的一种动态粗集. S-粗集具有三种形式:单向 S-粗集(One direction S-rough sets),单向 S-粗集对偶(Dual of one direction S-rough sets),双向S-粗集(Two direction S-rough sets). S-粗集的动态特征、遗传特征、粒度特征等特性,S-粗集的提出为我们研究动态数据挖掘开辟了一个全新的方向并提供了必要的理论保证.  本文的主要工作如下:  1.主要介绍了数据挖掘的发展研究现状以及数据挖掘的分类;阐述了粗集理论提出的背景、发展状况、研究的内容和方向;介绍了S-粗集提出的背景及研究现状;并将S-粗集的理论进行了简单的介绍.  2.利用S-粗集的动态特征、遗传特征、粒度特征等特性,给出了单向S-粗集与数据筛选-过滤的研究,本文给出属性内涵,属性效率的概念,提出数据挖掘的属性效率定理;单向S-粗集是动态数据挖掘研究的一个新工具.  3.利用函数单向S-粗集和函数单向S-粗集对偶,给出-f规律知识,-f规律知识,-f规律和-f规律的概念,利用这些概念,给出规律知识生成的规律之间的关系和积分度量,以及规律属性的积分控制定理.
其他文献
开映射定理、闭图像定理和等度连续定理是泛函分析的三大基本原理。人们对三大基本原理的推广和改进已持续了60多年,但大多数文章都是从改进空间的角度出发考虑的。最近有一些
自缩序列是一类重要的伪随机序列,而周期和线性复杂度是序列伪随机性的经典量度.如何构造自缩序列的新模型,使生成序列具有大的周期和高的线性复杂度是一个重要问题.本文构造
所谓排序,就是在一定的约束条件下对工件和机器按时间进行分配和安排次序,使某一个或某一些指标达到最优。在平行分批排序模型中,机器可以同时加工属于同一批的多个工件。每
图谱理论是图论研究的一个重要领域,它在统计力学,通信网络,量子化学等学科均有广泛的应用.基于图谱的图能量在化学中已有六七十年的研究背景,本文对r-正则图,讨论了其xyz-变换图
《国际贸易实务》是一门专业核心课程,学生对这门课程的期望很高,但目前的教学情况难以令人满意。该课程在高职院校的教学中存在着教师讲课过多、国贸理论过多和考核方式单一
本文研究一个刻画癌细胞浸润其周围正常组织的带交叉扩散的偏微分方程模型整体解的存在性.该模型主要是由三个方程组成:第一个方程描述了癌细胞在趋化性机制和趋触性机制作用
学位
Sira-Ramirez和Cruz在2001年基于广义哈密顿系统被动观测器设计方法提出了实现混沌同步的广义哈密顿系统和观测器方法。本文利用该方法研究了几个时滞、无时滞混沌系统的同步
特殊矩阵是指它的元素在数值上或其所具有的性质上有特性的矩阵。从大的方面来说,研究这类问题大体上可以划分成两部分:一部分是通过含有不易直观识别的性质来刻画的,称之为特性
概率极限理论不仅是概率论的主要分支之一,而且也是概率论其它分支以及数理统计的重要理论基础。前苏联著名的概率学家Kolmogorov曾说过:“概率论的价值只有通过极限定理才能被