基于分类模型的知识发现机理和方法研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:liganggg1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识发现(KDD,Knowledge Discovery in Databases)是从数据中获取知识的一种智能信息处理技术。本论文在深入分析国内外相关研究成果的基础上,首先利用粒度计算理论,独立于具体算法,展开对基于分类模型的知识发现机理的研究,以探讨信息系统中知识形成的一般性规律和内在机制,并由此分析KDD研究中若干问题及其存在的根源。然后,在充分研究多种面向KDD的计算方法的基础上,提出新的理论和方法,对个性化知识发现、效率和准确率问题以及KDD算法的早熟收敛等问题展开了研究,形成一套有效的解决方法,拓展了传统的知识发现方法。本文的主要工作及创新性成果如下: 提出并构造信息系统的知识粒度空间——超粒度空间(S_GS)和全粒度空间(AllGS),找到了定义于超粒度空间之上的格和布尔代数。利用格的性质,得到了全粒度空间.的结构模型——超树,其节点代表全粒度空间中的粒度。布尔代数、格和超树及其有关性质,进一步丰富和完善了KDD的几何和代数理论体系,初步形成了信息系统知识空间的数学模型和拓扑结构。在现有决策逻辑语言的基础上,定义用于粒度描述的正基语言,提出并研究“全粒度空间+正基语言”的粒度计算模型,找到了正基语言系统、全粒度空间和基本概念空间的关系,证明了这种关系是正基语言系统到全粒度空间的一个满射。进而分析了知识的形成机理和个性化知识发现问题存在的根源,把知识发现归结为,在全粒度空间(或超树)中搜索各目标概念的最佳粒度表示并形成其有效描述的过程。显然,该过程是基于提出的模型,而粒度空间、超树、格和布尔代数等的有关性质由此而得到完美的结合并在搜索过程中发挥重要的启发作用。同时,分析了一些KDD算法存在早熟收敛、局部知识产生的原因等,提出本文解决方法的基本思路。 基于RS理论提出完备的个性化属性约简算法——DA-FPR算法。该算法的特点是,首先构造分辨矩阵的极小全空间以及基于空间的Θ_简化运算和x_子化运算;然后在用户偏好的作用下,通过交替用运这两种运算(交替次数不超过条件属性集的大小),逐步去除用户不感兴趣的条件属性,最终使得极小全空间收敛于单目空间;最后可由单目空间直接得到所需的约简。实验表明,极小全空间的规模与训练集规模几乎无正比关系,算法时间开销主要是用于构建极小全空间;而之后的操作基本上是基于条件属性集合的简单运算,其时间开销与前面相比,是非常小的,所以算法具有较高的效率;并在与已有方法对比的基础上证实了算法的有效性。文中还从理论上证明了DA-FPR算法的有效性、收敛性和完备性。 提出规则约简算法——DA-FPDR算法和决策算法极小化算法——PA-MRS算法。前者对每一条规则去除其中用户不感兴趣的属性-值对,后者则进一步去掉用户不感兴趣的整条规则。这
其他文献
目的探讨急性脑梗死后介入高压氧(HBO)治疗的时间与疗效.方法将186例急性脑梗死患者在临床常规治疗的同时按发病后高压氧治疗介入的时间分早期介入组(病程7d内)、中期介入组(
为了找到既有金融或经济意义,又能够简化Black-Scholes方程的方法或变量代换,本文利用币制替换,引入新的变量,在此新变量下,Black-Scholes方程被极大地简化,相应的边界条件也
2005年12月1日闭幕的中央经济工作会议强调:“扎实推进社会主义新农村建设”,它的实质是将增加农民消费作为调整投资消费关系、扩大消费需求的重点。因此,增加农民消费将成为下
目的分析肝胆外科T管引流并发症的原因,并总结临床护理措施。方法收集肝胆外科T管引流患者648例,分析其并发症情况,并总结其护理措施。结果本组共11例患者出现并发症,发生率为1.7%
上课铃声刚响,我步入了课堂准备上课时,教室里总免不了还有一些嘈杂的声音,为了引起学生的注意力,将他们的注意力迅速集中到课堂上来,我对大家说:“同学们:今天我当你们的学生,你们当
《化工安全工程》是化学工程与工艺专业的基础拓展课程,课程组以课程设置的宗旨为着眼点,根据课程的实际教学改革方案,详细阐述了化工安全工程课程教学讲授的内容和方法,将单一的
《采矿学》是一门较为复杂抽象又具体实在的专业课程,课程内容多又偏重实践,初学者一般难以理解和真正掌握。人的认知具有多维性、相对性、先占性、联想性、发展性以及整合性
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的分析颅脑枪弹伤的特点,探讨影响其转归的因素。方法回顾分析9例2002~2005年间收治的颅脑枪弹伤病人的临床及头颅CT等有关资料,将他们的入院GCS、瞳孔的改变、枪弹及受伤
本文的研究是为了使非线性控制更好地应用于工程实际,其内容主要包括 ·研究了非线性系统的局部镇定问题,重点考虑工程中常用的泰勒展开线性化不能镇定的情形,通过引入中心流