基于变精度粗糙集的多粒度知识获取算法研究

来源 :太原理工大学 | 被引量 : 1次 | 上传用户:Aiming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机通信技术以及互联网的快速发展,各领域内的信息量随着时间的推移快速增长,人类已经进入大数据时代。尽管人们被海量数据所包围,但却并没有与之相匹配的数据分析处理能力,依然面临着知识匮乏的局面,因此,知识获取近年来已成为研究热点。作为知识获取的一种手段,粗糙集理论处理不确定信息具有得天独厚的优势,但是当数据中出现噪音或信息缺失时,基于精确分类的粗糙集表现效果不佳,而粗糙集的改进模型变精度粗糙集则为此类问题提供了一个较好的解决途径。粒计算作为一种处理大规模、复杂问题的计算模型,通过信息粒子的形式表示或处理信息。其核心思想是将所求解问题转化为多个子问题,在各粒度空间内分别进行求解,最终将多个子问题的解进行合并,共同构成原始问题的解。粒计算从多粒度方向分析求解问题,不仅降低了求解原始问题的难度,而且满足了人类希望从多角度分析问题的要求。部分研究者将粒计算中的多粒度思想与粗糙集理论相结合,提出了多粒度粗糙集,为解决从海量数据中进行知识获取提供了一个有力工具。本文在变精度粗糙集和多粒度粗糙集理论的研究基础上,重点研究了信息系统的属性约简及规则提取,主要从以下几个方面进行研究:1.将粒计算理论中粒化思想运用到条件等价类、决策等价类的粒化过程中;将条件信息粒、决策信息粒用粒矩阵进行表示,并基于变精度粗糙集理论提出一种β粒关系矩阵,该矩阵从本质上反映了条件信息粒及决策信息粒之间的概率包含关系,这种概率包含关系是进行属性约简及规则获取的理论基础。2.在属性约简的研究中,首先提出了基于变精度正域的多粒度属性约简算法,随后分析了该算法的不足,提出了改进的基于变精度下近似的多粒度属性约简算法。3.对于决策信息系统的规则提取,首先利用矩阵运算,在不同粒度空间内进行求解,并通过定义启发式信息,对各粒度空间进行排序,以减少搜索空间。然后,提出了一种基于变精度粗糙集的完备决策表多粒度规则获取算法,该算法适用于一致决策表及不一致决策表,提高了算法的泛化性。最后在此基础上提出了基于变精度粗糙集的不完备决策表多粒度规则获取算法,分别对所提两种算法进行实例分析以及UCI数据集测试,测试结果表明算法的正确性与有效性。4.在本文提出算法的基础上设计了基于变精度粗糙集的多粒度知识获取系统平台,该平台集成了本文所提算法以及一些传统算法,方便用户选择合适的算法进行知识获取。
其他文献
<正>京政办发[2011]65号各区、县人民政府,市政府各委、办、局,各市属机构:市规划委、市残联制定的《北京市"十二五"期间无障碍环境建设指导意见》已经市政府同意,现转发给你
<正>血栓调节蛋白(thrombomodulin,TM)是广泛分布于血管内皮细胞的一种跨膜糖蛋白,它通过抑制细胞增殖、黏附和炎症反应来维持内皮微环境[1],同时它也可激活蛋白C及凝血酶,增
本文通过对备选宏观经济指标进行主要成分分析,挑选出影响失业率的主要宏观指标对其进行单位根检验和协整检验,并用Engle和Granger两步法构建了体现这些指标和失业率之间联系
针对国内直径最大的Φ1800mm螺纹锁紧环式换热器,从资料审查、质保体系运转情况、制造、焊接、组装和水压试验等方面进行严格控制,各项检验项目、检查结果均满足设计要求,为
西方迷宫的起源可以追述到克里特岛上由传说中的戴达琉斯所设计的迷宫。除历史上第一个迷宫外,戴达琉斯还为公主阿尔德尼设计了一个露天舞台。文艺复兴时期的建筑师在为维特
现阶段中国农村社区并没有形成严格意义上的“多中心治理”格局,乡村精英之间的权力博弈、利益争夺与话语权竞争仍然存在,由此产生“团结建设村庄,分裂治理村庄”的悖论。拥
胃癌是我国最常见的恶性肿瘤之一。近些年,关于胃癌致瘤机制的研究有了长足进展,但是其发病率及死亡率仍居高不下,原因是对胃癌的发生及发展仍然存在诸多疑惑,缺乏对胃癌研究
“溪从城里过,人在镜中居。闭户防惊鹭,开窗便钓鱼。”唐宋八大家的苏辙向远在济南的朋友这样介绍湖州的生态。$$这不就是一幅山清水秀、人与自然和谐相处的生态画卷吗?900多
报纸
<正>~~
期刊
研究旨在应用酶解技术将燕窝中不溶性蛋白转换为水溶性多肽,有利于人体消化吸收,以期为燕窝新产品的开发奠定基础。以水解度和肽得率为指标,筛选出碱性蛋白酶对燕窝中不溶性