论文部分内容阅读
1982年波兰数学家Z.Pawlak提出粗糙集,它是具有静态特性的集合X的粗糙集,这一特性限制了Z.Pawlak粗糙集的广泛应用,特别是利用Z.Pawlak粗糙集研究一类动态的系统,动态的数据挖掘,动态的知识发现时遇到了困难.2002年史开泉教授给出动态集合的描述,提出S-粗集,它将粗糙集应用从静态推广到动态,S-粗集为动态数据挖掘-动态知识发现研究提供了理论支持.然而利用Z.Pawlak粗糙集与S-粗集进行规律挖掘-规律发现研究也遇到了困难,因为Z.Pawlak粗糙集与S-粗集不具有规律特征.2005年史开泉教授又改进了Z.Pawlak粗糙集与S-粗集,提出了函数S-粗集,它将粗糙集应用从数据挖掘推广到规律挖掘,函数S-粗集具有动态特性,规律特性与规律隐藏特性,是研究动态系统规律的一个新的数学工具,以Z.Pawlak粗糙集、S-粗集、函数S-粗集为理论基础,本文将Z.Pawlak粗糙集、S-粗集、函数S-粗集理论与综合评价、知识隐藏发现、动态经济系统规律预测、信息安全相嫁接,给出研究与讨论。全文共分六章,主要研究内容和创新成果是:
1.研究内容
1.将模糊C-均值聚类与粗糙集属性重要度有机结合,研究了聚类问题和诸评价因素的合理赋权问题,提出了适用于包含大量不确定信息和不完全信息的经济系统的FCM-WMRS方法(Fuzzy C-Mean Algorithm and Weighting Mining by Rough Sets),这是一种基于原始统计数据,无需人们先验知识的模糊聚类,并在此基础上,仅仅从原始的统计数据中挖掘出各评价因素权重,进而开展综合评判的新方法.根据这一方法,设计开发了区域科技能力评价系统.利用中国科学院可持续发展研究组所提供的2000-2003年度《中国可持续发展战略报告》中的评价指标体系和有关数据,对中国区域科技能力评价问题进行了聚类实证分析,对各评价因素进行了权重挖掘,发现了各评价因素对总体水平评价的不同贡献.
2.S-粗集具有动态特性,遗传特性,记忆特性与隐藏特性.以S-粗集为理论基础,给出S-粗集与隐藏知识发现的讨论。利用单向S-粗集,给出f-隐藏知识,F-隐藏知识,隐藏度,依赖度概念,提出隐藏知识的隐藏定理,隐藏知识的隐藏依赖定理,F-隐藏的知识发现原理,给出F-隐藏知识在系统故障状态发现-识别中的应用,利用双向S-粗集,给出(f,f)-隐藏知识,()-隐藏知识,隐藏度,依赖度概念,提出隐藏知识的隐藏定理,隐藏知识的隐藏依赖定理,()-隐藏的知识发现原理,给出()-隐藏知识在利润波动分析中的应用.隐藏知识与它的隐藏特性的应用,是S-粗集中的一个新的研究方向.
3.函数S-粗集具有动态特性,规律特性与规律隐藏特性,是研究动态系统规律的一个新的数学工具,以函数S-粗集为理论基础,将动态经济系统规律研究与函数S-粗集嫁接,交叉,渗透,给出经济系统规律隐藏与规律预测的讨论,提出了一种新的预测模型-基于函数S-粗集的双规律预测模型,包括上规律预测模型与下规律预测模型;给出了该模型的实现算法,最后通过对海南省区域经济发展的预测证明了该方法的有效性.
4.随着信息网络化的普及,信息数据的安全性日渐引起人们的重视,把信息安全中的椭圆曲线加密理论与S-粗集,函数S-粗集嫁接,交叉与渗透,给出知识、双规律预测的安全隐藏与认证的讨论,这些研究得到了应用.S-粗集,函数S-粗集与信息安全理论融合,共享是信息系统中信息安全应用研究的一个新的方向.
5.对本文的讨论进行总结.
11.本文的创新点
创新点1.提出了一种新的综合评价模型-基于FCM和粗糙集属性重要度的评价模型
研究了评价问题的聚类分析与各因素的合理赋权问题,给出基于原始数据挖掘因素权重,开展综合评判的FCM-WMRS方法.根据这一方法,设计开发了区域科技能力评价系统,利用中国科学院可持续发展研究组所提供的2000-2003年度《中国可持续发展战略报告》中的评价指标体系和有关数据,对中国区域科技能力评价问题进行了实证分析.
创新点1列于第2章中.
创新点2.给出了S-粗集与隐藏知识发现的讨论:
(1)利用单向S-粗集,提出了F-隐藏知识、F-隐藏度、F-依赖度的概念,得到了F-隐藏知识的隐藏定理,F-隐藏知识的隐藏依赖定理,F-隐藏知识的知识发现原理和F-隐藏依赖的知识发现原理;给出了F-隐藏知识的应用.
(2)利用双向S-粗集,提出了()-隐藏知识、()-隐藏度、()-依赖度的概念,得到了()-隐藏知识的隐藏定理,()-隐藏知识的隐藏依赖定理,()-隐藏知识的知识发现原理和()-隐藏依赖的知识发现原理;给出了()-隐藏知识的应用。
创新点2列于第3章中,
创新点3.提出了动态经济系统的规律预测模型-基于函数S-粗集的双规律预测模型
双规律预测模型包括上规律预测模型与下规律预测模型;给出了规律关系贴近度(f-规律关系贴近度和f-规律关系贴近度)的概念,得到了最小成本f-预测规律[u]pf,最大成本f-预测规律[u]qf,最小效益f-预测规律[u]pf,最大效益f-预测规律()(最小成本f-预测规律(),最大效益f-预测规律()构成由函数单向S-粗集和函数单向S-粗集对偶生成的双规律预测,给出了双规律预测模型的实现算法;最后通过对海南省区域经济发展的预测证明了该方法的有效性.
创新点3列于第4章中.
创新点4.提出了知识、预测规律的加密潜藏-解密发现与认证方案
知识[x]f的安全([x]f不被从[x]内获取)依赖于[x]f的属性集αf的安全,或者依赖于αf中的属性值的安全,依赖于αf={α1,α2,…,αλ,α}构成的属性值数据Pf={P1f,P2f,…,Ptf)的安全.而经济预测结论(双规律预测)的安全,依赖于双规律的离散数据点(1,y1),(2,y2),…,(n,yn)的安全.为了防止知识[x]f和经济预测结论在数据传输过程中,被盗取或篡改,把S-粗集,函数S-粗集与椭圆曲线加密理论相交叉,研究了知识[x]f、双规律预测的安全隐藏与认证,讨论了三种数字签名-认证方案,最后给出了知识[x]f加密潜藏-解密发现的应用和上规律预测数字签名-认证的应用.函数S-粗集与信息安全理论融合,共享是信息系统中信息安全应用研究的一个新的方向.
创新点4列于第5章中.