基于粗糙集属性约简一些问题的研究

被引量 : 0次 | 上传用户:deng5384588
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集作为一种具有模拟人类认知推理过程中粒化和近似的特点,是处理含有不确定性、不一致性、模糊性等数据的有效数学工具。近年来,基于粗糙集的属性约简成为一个非常热门的研究方向,这是因为属性约简在机器学习、数据挖掘、模式识别等领域得到广泛的应用及学术界不断的关注。然而实际环境中数据信息的不确定性、不一致性、模糊性等因素导致属性约简的难度加大,从而限制粗糙集理论在相关领域的推广和大规模应用。本文在前人研究基础上对粗糙集理论及属性约简算法已有成果进行总结,并对协调信息系统的邻域粗糙集模型的属性约简和不协调信息系统分布约简以及不协调邻域粗糙集的分布属性约简的一些问题做了以下探索研究:首先,设计一种基于邻域粗糙集模型的优化的高效属性约简算法。基于经典粗糙集的属性约简和基于邻域粗糙集模型的属性约简有很大的不同,后者因为增加邻域概念导致许多针对经典粗糙集属性约简的方法不再适用于邻域粗糙集模型属性约简,而且基于邻域粗糙集模型的约简算法在计算样本的邻域时要花费大量的时间计算距离,这样约简效率相对于经典粗糙集属性约简大打折扣。如何在邻域粗糙集模型中通过减少样本比较次数、缩小搜索空间来快速计算样本的邻域成为设计邻域粗糙集模型属性约简算法的瓶颈。为了缩少求邻域时的搜索空间。本文首先对需要约简的数据集进行一次切片,使彼此相邻的对象聚集在一个分片中,通过理论证明我们可知某个分片中对象的邻域只包含自己本身和相邻两个分片中的对象,为此求分片中对象的邻域只需搜索本身所在分片及相邻的两个分片。由于搜索空间限制于三个分片中,故属性约简算法的时间效率有明显的提高。其次,提出一种快速不协调信息系统分布约简算法。相对于使用差别矩阵来进行不协调信息系统分布约简,本文的算法在时间效率上更具有优势。通常Rough集理论是以不可分辨关系为基础,通过引入上近似集和下近似集,在集合运算上定义的,这称为Rough集理论的代数观点。然而有些学者以信息论为基础来研究Rough理论,提出了Rough理论的信息论思想。为此以Rough理论的信息论观点来研究粗糙集的属性约简成为一种选择。本文正是根据代数观点和信息论观点的关系选择条件信息熵为属性选择准则,设计了基于hash分类的启发式后向贪心属性约简算法。最后,针对信息系统的属性约简算法可能同时面临不协调信息系统分布约简算法和邻域粗糙集模型属性约简的问题,如何解决此类问题成为必要。本文就此讨论不协调邻域粗糙集的分布属性约简的差别矩阵和基于条件信息熵的后向贪心约简算法。
其他文献
介绍了以板栗为原料,经过酶解而得到板栗饮料的方法。主要是采用耐高温液化酶和糖化酶来进行转化。同时应用正交实验确定了以液化酶和糖化酶为酶源水解板栗淀粉的最适工艺条
随着经济的发展和科学技术的进步,机械自动化开始广泛应用于各行各业。煤矿行业中的机械设备发挥着积极的作用。在具体的应用的过程中,由于各种原因会使得机电设备发生故障,
医疗行为作为一种正当业务行为,其合法化根据应立足于被允许的危险之法理加以解释;对被允许的危险的判断,应坚持结果无价值的立场,并考虑行为无价值的因素进行综合评价;医疗行为中
论述了工程施工质量控制管理的途径,强调了细节管理对质量控制的重要性,并介绍了细节管控的方法。
文章依据调查数据,分析了影响高校毕业生就业的原因,提出了做好高校毕业生就业指导的对策与建议.在社会方面,要鼓励企业提供更多的就业岗位,为企业吸收更多的人才.在学校方面
新加坡就像一个大溶炉,奉行多元文化的民族政策。在文化和谐背景之下,新加坡公共外交具有包容性和开放性,其最根本的动力是公民社会的发展和国民集体文化素质的提升,这依赖于
近年来,频繁发生的自然灾害在全球范围内带来重大损失,不仅给灾区人民带来巨大伤痛,更重要的是给世界范围的自然灾害救助带来了难题。河北省明确提出在“十二五”期间,既要把
研究背景烟草流行是当前社会面临的重大公共卫生问题,长期烟草使用造成致残和致死高风险,给社会和家庭带来沉重的疾病负担和经济损失。然而,尽管近年来人们对吸烟相关危害的
近年来我国的农业生产积极推广覆膜生产模式,但是在生产过程中出现的问题也越来越多,其中地膜残留污染是现代土壤环境污染的主要原因,很多农民对地膜污染的认识不到位,在生产
汽车产业是国民经济的重要产业支柱,是拉动内需、推动GDP增长的重要产业;如今,随着全球经济的发展和市场竞争激烈的加剧,汽车企业之间的竞争也愈加激烈,更多地则表现为供应链