论文部分内容阅读
随着计算机和通讯技术的迅猛发展,人类活动产生的数据日益增多,成千上万的数据库被用于政府事务、商业管理、工业生产和科学研究及其它领域,人们搜索数据的能力也越来越强。从某种意义上说目前我们不是缺少信息,而是被信息淹没了。如今的数据库系统可以高效地实现数据的录入、修改、统计、查询等功能,但是无法发现数据中存在的关系和规则,无法根据现有的数据准确的预测未来的发展趋势,缺乏挖掘知识的有效手段,导致了“数据爆炸知识匮乏”的现象。人们需要有新的、更有效的手段对各种大量数据进行挖掘以发挥其潜能,将信息变为知识。 数据挖掘技术正是在这样的应用需求环境下产生并迅速发展起来的,它的出现为自动和智能地把海量的数据转化为有用的信息和知识提供了手段。数据挖掘技术是一门交叉性学科,涉及到机器学习、模式识别、归纳推理、统计学、数据库、数据可视化、高性能计算等多个领域,对解决在信息技术发展中存在的拥有大量数据但缺乏有用信息的问题,以及完成从业务数据到决策信息的转换方面具有较强的功效。它不仅被许多研究人员看作是数据库系统和机器学习方面一个重要的研究课题,而且被许多工商界人士看作一个能带来巨大回报的重要领域。从数据库中挖掘出来的知识可以用在信息管理、查询响应、决策支持、过程控制等许多方面。 本文针对现有数据挖掘方法在很多情况下难以推广应用,例如对于有噪声的数据、有冗余的信息、数据不完整、数据稀疏等情况下,这些传统算法的使用效果往往不佳。而模糊神经网络由于其本身良好的鲁棒性、自组织自适应性、并行处理、分布存储、高度容错、易于理解等特性,特别适用于在以上情况下用来挖掘数据库中的知识。由此,本文提出了用模糊神经网络来进行数据库中的规则发现。同时,针对SBP神经网络对于复杂的非线性问题容易陷入局部极值,提出了改进的BP算法(NFCS-CAF)。经过仿真实验证明:本文提出的数据挖掘算法优于传统的挖掘算法,且网络经学习裁剪后更为简洁,能有效的从网络中抽取出规则。这为数据挖掘技术的研究开辟了新途径。