【摘 要】
:
随着现代信息科技的迅猛发展,尤其是因特网上信息资源的高速增长,人们可以在短时间内搜集和积累大量的数据资料,使我们面对着日益严峻的信息挑战。我们不仅应当重视信息的有效性
论文部分内容阅读
随着现代信息科技的迅猛发展,尤其是因特网上信息资源的高速增长,人们可以在短时间内搜集和积累大量的数据资料,使我们面对着日益严峻的信息挑战。我们不仅应当重视信息的有效性,而且更加关注信息获取的经济性。属性约简,就是在保持信息系统的分类能力不变的前提下,删除其中的冗余属性,从而缩减属性的数量,为进一步的知识发现算法提高准确性。
本文首先分析了已有的经典属性约简算法,通过实验分析结果选择基于可辨识矩阵的约简为本文的主要研究方向;其次在基于可辨识矩阵的约简算法进行系统深入的探讨和研究的基础上,提出了对该算法的改进,将属性取值的频率加入可辨识矩阵的构造中,通过给定置信度的方式来选择去除噪声数据的范围。针对动态数据库,提出当加入新的记录时更新已有约简结果的解决方法,对基于信息量、基于可辨识矩阵,以及整数规划算法进行了改进。本文还将属性约简问题理论化到SAT问题(可满足性问题)上,利用SAT问题证明了属性约简有解的充分必要条件。最后将先前的算法应用到民航顾客满意度-地面服务数据集中。
通过实验研究,本文提出的对基于可辨识矩阵约简算法的改进能够更加精确的寻找属性间的准确关系。实验所求解出的属性约简,正是现实中对于民航所提供的各项服务中,顾客最关心的服务项目,因此,通过该实验说明基于可辨识矩阵的约简在删除冗余属性领域中表现出了良好的性能,具有一定的应用前景。并且对动态属性约简的实验发现,动态算法可在保持结果与静态一致的基础上提高效率,节省计算时间。
其他文献
事务作为数据库发展过程中最基本的概念之一,已在各种电子商务平台、企业信息化平台中获得了日益广泛的应用。然而,在全球网络化大潮汹涌澎湃的今天,Internet已经逐渐替代以
本文分析了当前输变电施工进度网络图优化存在的主要问题和当前优化技术的发展趋势和现状。深入研究和分析了粒子群优化算法,根据算法的进化公式,提出了四种优化模型、并分析
本文论述了基于统计的汉语自动分词系统的原理和过程。本文首先回顾了分词的发展历史,总结了分词的目标,分析了分词存在的问题,总结了前人对基于语料库的统计分词理论的研究
随着相关技术的快速发展,视频图像处理技术在智能交通、智能安防等很多行业与领域取得了成功应用。面对当前大型会场越来越普及的现实情况,在线准确把握会场状态,提高服务质
数据挖掘起源于20世纪90年代初期,它是知识发现过程中的一个关键步骤,也是当前知识发现领域中的一个研究热点。关联规则挖掘是数据挖掘中的一项重要任务,用于发现大量数据项
下一代网络的出现是增值业务发展的必然趋势,下一代网络是基于分组交互的网络,它采用了分层的结构体系,分为业务层、控制层、媒体传输层和接入层。在下一代网络体系中,应用服务器
Web服务技术的蓬勃发展,进一步促进了面向服务架构(SOA)的繁荣,越来越多的组织机构已经或正在准备接纳这一新技术来构建基于Web服务的应用。传统的工作流管理系统已经不能满
随着云计算技术的快速发展,部署在云计算平台下的应用程序向着多样化和复杂化的方向发展,对云计算技术的要求也越来越高。云数据库作为云计算平台的后台支撑系统,其性能直接
数字信号处理器(Digital Signal Processor,DSP)具有运算速度快,处理性能强等特点,在电子产品的各个领域都有着广泛的应用。DSP的测试能够为包含其应用的电子系统设计的正确
本文的研究目标是实现一个复杂背景下的运动目标分割和识别系统。运动目标分割方面。本文首先研究和比较了运动目标分割算法,指出在这些算法中,背景差法最适于解决本文中的运动