基于遗传算法和概率粗糙集的属性约简研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:heran3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集作为一种新型的数学工具用来处理一些不确定和不完整信息,利用集合中各属性之间的不可分辨关系,将系统中的信息更加简洁有效地表示出来,目前已经被应用到各个领域。经典粗糙集模型的假设分类必须是确定的,在实际应用中缺乏一定的灵活性,因而存在着很大的局限性,不能很好地处理含有干扰信息的数据。为此,众多学者在传统粗糙集的基础上引入概率阈值提出了概率粗糙集模型。属性约简是粗糙集理论研究中最主要的问题之一,从客观上来讲,冗余信息存在于各类知识决策系统当中,属性约简就是删除其中不相关的属性,对系统中的属性进行简化。所谓最小约简就是更加简明有效的属性决策规则,然而能否求出最小属性约简问题被证明是一个NP问题。要探寻一种合适的属性约简算法在日常生活中就显得尤为重要。本文针对概率粗糙集处理属性约简过程出现的不确定性,与遗传算法结合提高约简效率,对概率粗糙集属性约简进行更深入的研究,提出了两种属性约简算法,取得主要研究成果如下:1.针对基于概率粗糙集的启发式属性约简算法,必须在属性核的基础上计算所有属性添加和删除之后的概率近似精度的更新值,计算量大且所需存储空间多,导致效率低。基于此,提出改进近似精度和概率粗糙集属性的约简算法。该方法开始时计算每个属性的改进近似精度和属性重要度,不需要计算所有属性增删后的近似精度,根据属性重要度的大小顺序以及改进概率近似精度,并按这个顺序去掉属性约简中冗余的属性,从而得到最小属性约简。与原算法相比求解效率和约简准确度有了一定的提高。2.传统遗传算法和粗糙集结合进行的属性约简算法,其适应度函数存在一定的局限性,使得属性约简算法必须检查一个属性集合的所有子集。为了提高属性约简的精度和效率,结合遗传算法,提出了基于遗传算法和概率粗糙集的属性约简算法,初始化种群时用核属性加以限制初始种群个体编码的方式,计算适应度时加入修正算子,并且该方法改进原有的适应度函数,并将条件信息量作为判断依据,随时修正种群的进化方向,确保进化方向和种群的多样性,使得最后保留下来的最优个体即为最小属性约简。
其他文献
目的:研究Nesfatin-1大鼠大脑中动脉缺血再灌注后(Middle cerebral artery occlusion rePerfusion MCAO/R)CAMKⅡ和PSD95蛋白表达的影响,探讨Nesfatin-1对大鼠脑缺血再灌注有
本文以人的本源性、“人本位”、“后人类学”为核心理论,首先析取梳理科幻片中的拯救情节,然后阐释拯救情节中的“多个人”——拯救者与被拯救者关系,最后分析拯救情节中的
股东代表诉讼是当公司怠于追究损害公司利益的对象时,符合条件的股东以自己的名义代表公司提起诉讼的制度。为了平衡公司的法人独立性和赋予股东权利保护公司利益的迫切性,股
随着无线移动通信技术的发展,移动网络用户规模不断扩大。互联网行业的高速发展,也促使部分传统行业与互联网应用相结合,兴起了许多新型的移动互联网服务。在线办公、在线教育、视频直播等依托于多媒体视频传输的应用便是其中的一个典型案例。然而,随着网络服务需求的增加以及入网智能设备的增加,现有频谱资源越发紧缺。然而,现有的授权服务频段的频谱利用率并不高,通过频谱共享可以有效地提升无线通信系统潜在的系统容量。本
随着大数据时代的发展,生活中记录的数据呈现出海量化、多样化和非规则化等特点。其中复杂的非规则的分布式网络结构广泛存在于现实当中,例如,疾病传播网络,社交网络,全球海平面温度网络,传感器温度网络等。对于复杂的非规则的网络数据,传统数字信号处理难以对其分析处理,因此发展出了图信号处理。在传统数字信号处理中,多尺度变换方法可以在不同分辨率水平下揭示关于信号的结构信息。同时,它们能提供一种粗到细分析方法,
邮轮旅客人身损害事故纠纷在审判实务中屡屡发生,由于船票销售模式、旅客人身损害原因的不同,邮轮专门立法的缺失,导致邮轮旅客、邮轮公司与旅行社之间的法律关系复杂。因此,
洛阳与文学的关系已经众多学者进行研究,但关于洛阳意象的研究并不多。洛阳在汉代和唐代的地位不尽相同,汉代对于洛阳又具有特殊意义,频繁出现在汉唐两个朝代文学作品中的洛
本文以罗璟为研究对象,正文共计三章,主要内容包括罗璟的生平、家族成员、著述情况、交游情况及以《罗冰玉先生文集》为中心的罗璟诗文创作研究。附录有罗璟年谱与《罗冰玉先
无线传感器网络(Wireless Sensor Networks,WSNs)是一种由大量传感器节点通过单跳或者多跳的方式进行协同感知而构成的自组织网络,目前已被成功应用于军事、农业、医疗、环境
随着科学的进步和社会的发展,现在统计学的应用显得尤为重要,其中一个非常重要的组成部分就是多元统计.比如说我们在面对基因研究分析中的超高维数据的时候,很多情况下我们都