【摘 要】
:
信息时代的来临,带来大量的数据。这些数据中隐藏着许多重要的信息和知识。如何从表面数据中提取到深层次的、表现了事物内在规律的规则来进行预测或指导决策,是迫切需要解决
论文部分内容阅读
信息时代的来临,带来大量的数据。这些数据中隐藏着许多重要的信息和知识。如何从表面数据中提取到深层次的、表现了事物内在规律的规则来进行预测或指导决策,是迫切需要解决的问题。数据挖掘正是在这样的背景下产生的新的研究领域,是统计学、计算机科学、模式识别、人工智能、机器学习、数据库等多领域的交叉学科。规则提取是数据挖掘领域的一个重要课题。本文就数据挖掘中的规则提取问题进行了相关的研究。首先,讨论了连续属性离散化问题。连续属性离散化是否合理决定着表达和提取相关信息的准确性。CHI2系列算法关联着统计学理论方法,有着重要的研究价值。在对CHI2系列算法中统计量x 2应用意义讨论的基础上,提出了一种新的Intelgal-CHI2算法,能够更合理更准确的对连续属性进行离散化。其次,研究以免疫算法为工具对信息系统进行规则提取。在免疫算法中结合了小生境技术的共享机制,利用了共享机制中对资源的共享和竞争原理,体现了规则之间竞争与互补的关系。针对普通可信度度量方法的不足,提出了柔性可信度的概念和度量方法,能够获得更好的规则。最后,本文研究了从神经网络中进行规则提取的问题。神经网络是一种非常好的数据挖掘工具,具有良好的非线性处理能力。但神经网络学习到的信息是蕴涵在大量的连接权中,很难被理解。本文提出了一种基于神经网络的、对信息系统进行规则提取的新方法。该方法是多项式级的,并且可以处理离散型变量。
其他文献
近年来,互联网已经深入到生活的各个方面,对互联网行为的研究成为热点,BGP作为事实上AS(Autonomous System自治系统)之间标准协议应用于互联网,因其重要性,更是得到了广泛的
网络规划设计的关键之一是建立网络的优化模型。对网络进行优化需要对网络性能进行分析,目的是在网络建设开始之前,就可以有效地设计、模拟网络的运行环境,在网络实施之前就能获
程序调试是软件开发过程中的一项非常繁琐的工作,主要包括故障检测、故障定位、故障修复。其中故障定位是调试过程中最为耗时和费力的活动之一,它通过审查源程序语义和结构,
基于构件的软件开发是解决软件危机的有效途径。在基于构件复用的软件开发过程中,构件库管理系统扮演了重要角色。在构件库管理系统中,构件的分类方式及其检索是最基本也是最核
随着多媒体信息技术和互联网的飞速发展,以及消费类电子产品智能化趋势的加强,嵌入式系统得到越来越广泛和深入的应用。在航空航天、工业控制、医疗等重要领域中,嵌入式系统
随着互联网的迅速发展,网络应用程序的开发呈现多层体系结构,数据库系统的性能在整个应用程序的体系结构中体现着尤为重要的作用,与此同时,互联网的用户在迅速增加,数据库负
虚拟装配是虚拟现实领域中一个新的研究方向,是一种集成虚拟现实技术和CAD/CAM技术的交叉学科。运用虚拟装配技术,不但有利于并行工程的开展,而且还可以大大缩短产品开发周期,降
灵活开放标准的使用,使得Web服务成为一种优秀的机制,可以通过Web服务将功能非常方便的向客户端公开,越来越多的公司和组织开始创建和部署Web服务。但Web服务所面临的安全性因素
随着移动通信业的迅速发展,移动运营商之间的竞争越来越激烈,客户资源成为了企业竞争的焦点。当前各运营商都面临严重的客户流失问题。大量而频繁的客户流失给企业造成了巨大
随着信息技术的发展,军事电子信息系统的规模将越来越大,系统构成也将越来越复杂。军事电子信息系统固有的异构性、开放性和复杂性等特点使军事电子信息系统在发展的同时对其监