基于划分差异熵特征选择改进方法的研究

来源 :大连海事大学 | 被引量 : 1次 | 上传用户:ununszeto
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是一种有效的数据降维技术,主要任务是从原始数据集中选出最具代表性的特征子集,这些特征子集可以表达原始数据集的含义,并且可以代替原始数据集对未知数据进行预测。目前的特征选择算法中,粗糙集特征选择模型处理的主要是离散化的数据集,它不能直接处理连续型数据。由于现实生活中绝大部分数据集都是连续型的,因此将模糊集和粗糙集结合构成模糊粗糙集来进行特征选择。常见的模糊粗糙集特征选择算法有基于正域(依赖度)的算法和基于信息熵的算法等,这些算法在处理过程中时间开销较大。在粗糙集特征选择模型中,划分差异熵模型利用“划分”的思想先将原始信息系统划分为多个子信息系统,通过计算子信息系统上的划分差异熵,代替直接在全体条件属性集上计算熵的方法,缩短了时间复杂度,同时达到了与传统信息熵模型相同的分类能力。但是受粗糙集的影响,划分差异熵模型只能处理离散型数据集。本文利用多分类数据集决策类别较多的特点,提出了基于Lambda划分差异熵的特征选择算法(LDE-FRFS)。先将原始决策系统划分成多个子系统,在每个子系统中评价属性局部重要程度,然后利用局部重要程度计算属性全局重要程度,得到约简结果。LDE-FRFS算法与模糊粗糙集中的熵方法相比,在保证了分类准确率的前提下,时间复杂度更低,并且与划分差异熵相比,本算法能够直接处理实值类型数据。同时本文发现LDE-FRFS算法受噪音数据影响较大,因此在算法中加入了一种降低噪音数据影响的算法,即不同类比算法,从而提高了算法准确率。本文用九种基准数据集对两种算法进行特征选择的实验验证,将本文算法分别和其他四种算法(基于Lambda条件熵特征选择算法、基于模糊粗糙快速属性约简算法、基于模糊熵的特征选择算法和主成分分析算法)进行对比实验,实验成果证明本文算法的性能优于其他经典的特征选择算法。
其他文献
随着海洋工程的日渐发展,动力定位系统(Dynamic Positioning System)如今已经成为一些海上作业船舶必不可少的支持系统,应用于船舶的定点作业、海底管道、电缆铺设、海上救助
在固态系统中寻找拓扑非平庸的量子态一直是凝聚态物理中的前沿热门问题。对于电子这样的费米子体系,拓扑非平庸的边缘态已经在理论上广泛研究,并且在实验中也观测到了其存在
SINS/DVL组合导航系统是以捷联惯性导航(SINS)作为主导航系统,多普勒测速系统(DVL)作为辅助测量的导航系统,并通过滤波技术来达到期望的导航精度。课题针对导航系统的输出信
近年,随着无线通信网络技术的进一步发展,车联网成为了其在交通领域的最新应用,在学术界和工业界得到了非常广泛的关注。在车联网中,车辆节点与骨干网的距离相对较远,属于网
目的:系统评价X 线修复交叉互补基因 l(X-ray repair cross complementing group 1,XRCC1)Arg399Gln基因多态性与中国人群消化系统肿瘤的关系,为消化系统肿瘤的防治提供临床
[目的]近年来,随着胃镜检查技术的提高和普及,特别是中年以上有胃癌发病高危因素的慢性萎缩性胃炎、胃溃疡患者,早期诊断和治疗可以预防胃癌的发生,然而肿瘤的快速生长和远处
防碰撞技术在数控加工和测量设备中已经扮演着越来越重要的角色,它是实现智能制造和智能测量的关键。在防碰撞系统中,零件及位姿的识别是通过保证虚拟空间和实空间的一致来实
目的:分析不同时间段复发转移的肝细胞性肝癌(hepatocellular carcinoma,HCC)长链非编码RNA(long non-coding RNA,LncRNA)的表达谱,验证其差异表达,探讨LncRNA与肝癌术后复发
足球机器人系统是一个集环境感知、动态决策、行为控制、行为执行的大系统,是机器人学与人工智能的一个结合点。路径规划及对抗决策是足球机器人决策系统的重要组成部分,路径
近年来,在现代企业管理模式中,采购管理逐渐成为企业核心竞争力的要素之一。为了充分满足生存发展和提高效益的目的,企业越来越重视供应链管理模式下的采购管理。另一方面,随