信息系统中属性约简算法研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:nizhongyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是波兰学者Z.Pawlak于1982年提出的一种数据分析理论。该理论建立在论域中的不可区分关系之上,用上、下近似来描述概念,无需任何先验知识或附加的信息,就能有效地分析和处理不精确、不确定和不完全的数据。经过二十余年的发展,粗糙集理论已经成功地应用于机器学习、决策分析、模式识别、图像处理、专家系统、智能系统等研究领域。知识约简算法的研究一直是粗糙集理论研究中的核心内容之一。寻找最小约简已被证明是NP-hard问题,而目前的知识约简算法在处理大规模数据时,算法的效率和可行性都面临着巨大的挑战,研究高效实用的属性约简算法仍具有重要的价值。本文围绕知识量的性质和应用,就如何实现基于知识量的信息系统和决策表的约简算法进行了较为深入的研究。本文主要的研究成果包括:1.提出了一种新的知识度量方法。从粗糙集理论认为知识是区分事物能力的角度出发,利用不同属性的区分能力大小不同的特点,给出了知识的一种新的度量方法,其增益函数基于直观的知识含量特性,分析了度量的合理性,给出了它的一些性质,并且在知识量的基础上,提出了相对知识量的概念,用来考察属性间知识的变化情况。2.提出了两种在信息系统下基于知识量的属性约简算法。第一种利用知识量重新定义了属性的重要度,将属性重要度作为启发式信息,设计了启发式约简算法:另一种则从属性划分的角度出发,分析了属性间的划分能力可以去除冗余属性的特性,提出了左划分和右划分的概念,在此基础上,设计了基于划分的属性约简算法,最后,通过实验系统研究了这两种算法的执行效率,分析了它们各自的优缺点,证明了算法的可行性和有效性。3.设计了基于知识量的决策表属性约简算法。利用相对知识量定义的属性重要度设计了启发式约简算法,而利用相对划分的概念设计了基于划分的属性约简算法。对于后一种算法,为了使其能够适用于不一致决策表的属性约简,分析了不一致决策表转化为一致决策表而约简集不变的性质,从而保证了算法的适用性和正确性。最后,实验系统对真实数据进行了测试,从执行的结果和效率上分析比较了算法的优势和特点。最后,概括了本文的主要结果,说明本文工作的理论意义和应用价值,指出本文的不足和有待进一步解决的问题。
其他文献
基于位置的服务(Location-Based Service)已经在诸多领域蓬勃展开,其目的在于可使任何人、任何地点、任何设备、任何时间实时获取各种基于位置的属性信息。各种类型的移动智能
图像分割是图像处理的核心问题之一,是计算机视觉的基础步骤,是后续图像分析的基础。 对图像分割算法的研究巳有几十年的历史,借助各种理论至今已提出了上千种各种类型的分割算
随着信息技术的飞速发展,21世纪的计算模式正发生着深刻的变革。从分布式移动计算进入到无所不在的普适计算是计算发展的必然趋势。普适计算指的是一种无所不在的计算。在一个
现实世界中包含大量的模糊因素和模糊信息,因此模糊推理研究在人工智能领域具有重要的价值和意义。模糊推理过程中,选择不同的模糊算子对模糊推理的效果有直接的影响。传统的
机器学习 (知识获取) 的目标是将大量数据中所隐含的知识发现出来,也就是将知识从人们难于理解、操作和使用的数据表达形式转化为便于人们理解、操作和使用的决策规则形式的表
笔式交互是一种“以人为中心”的自然交互方式,其具有便利性、自然性和可控制性的特点。F-Tablet手写板是一种基于力的手写输入设备,计算机把通过其捕获到的书写者书写时的力信
决策树归纳学习算法是目前商业数据挖掘工具中使用最为广泛的算法之一,因其形状像树且应用于决策而得名。它是一种逼近离散值目标函数的归纳推理方法,在这种方法中学习到的函
由波兰学者z.Pawlak于1982年提出的粗糙集理论是一种新的处理不确定性知识的数学工具。经过二十余年的研究与发展,粗糙集理论已经在理论和实际应用中取得了长足的进展。由于该
学位
随着网络的不断发展,网络在人们生活中的地位显得越来越重要,用户对网络的需求不断发生变化,要求传输的信息种类越来越多,要求提供的服务质量也越来越高。计算机网络系统的瘫痪可