【摘 要】
:
特征选择一直是模式识别领域的研究热点之一。模式识别是对数据进行分类,分类的过程可以在原始数据空间中完成,也可以对原始数据进行变换,将数据映射到更能反映分类本质的特征空间中进行。在特征空间中得到的分类模型无论是模型的训练时间还是模型的可解释性都优于直接从原始数据得到的分类模型。所以特征选择的研究是模式识别的一项重要任务。论文详细介绍了基于互信息的过滤式特征选择算法的基本概念,在分析了已有的特征选择算
论文部分内容阅读
特征选择一直是模式识别领域的研究热点之一。模式识别是对数据进行分类,分类的过程可以在原始数据空间中完成,也可以对原始数据进行变换,将数据映射到更能反映分类本质的特征空间中进行。在特征空间中得到的分类模型无论是模型的训练时间还是模型的可解释性都优于直接从原始数据得到的分类模型。所以特征选择的研究是模式识别的一项重要任务。论文详细介绍了基于互信息的过滤式特征选择算法的基本概念,在分析了已有的特征选择算法的优缺点之后,提出了两种新的特征选择算法。(1)提出了一种基于最小条件相关和最小条件冗余的特征选择算法-MCRMCR(Minimum Conditional Relevancy and Minimum Conditional Redundancy)算法。通过对RelaxFS(Feature Selection based on Relaxing Max-relevance and Min-redundancy)算法的分析发现,RelaxFS算法在特征选择过程中,使用所有的已选特征对新特征进行评价,这样会在计算特征与类的相关性和特征与已选特征集合的冗余性过程中耗费大量的时间。因此为了更精确地刻画特征之间的相关性和冗余性,减少产生不必要的冗余信息,MCRMCR算法从已选特征集合中仅选择有限个特征对新的特征进行评价。实验表明,MCRMCR算法可以有效地提高分类器的分类准确率。(2)提出了WCFR(Weight Composition of Feature Relevancy)算法。传统的基于互信息的特征选择算法大多是在冗余项引入一个合适的权重,以此调节相关度和冗余度。WCFR算法引入了标准差作为权重,同时作用于相关项和冗余项。其目的是尽可能地使选择的特征与已选特征集合冗余度低些,且在给定已选特征集条件下与类高度相关。使用相关值和冗余值的离散程度分别权衡相关值和冗余值的重要程度。理论和实验证明WCFR算法可以有效地提高分类器的分类准确率。
其他文献
<正> 现在,随着现代化进程的展开和对外开放政策的实行,中国传统文化与西方文化发生着大面积的接触与冲撞,中国文化有着极为深厚的生命力和根基,外来的文化也有其比较先进的
脂肪酸金属皂可有效降低橡胶胶料的粘度,改善加工性能。同时还可以促进填料分散,提高混炼效率,降低能耗。本文主要探讨了绿色环保的加工助剂脂肪酸镁皂和脂肪酸钾皂对炭黑(CB
与常规天然气开采相比,页岩气开采增加了水力压裂过程,开采的能源投入也相应增加。页岩气开发、运输、存储过程中的甲烷泄漏远高于常规天然气,产生的温室效应更大,对气候变化
外籍教练执教中国男篮所体现出的新理念主要有以下几个方面:强调训练态度,提倡求真务实的科学训练 观;重视技、战术训练中的每一个细节,必须在观念、理论、训练实践和作风上
本文对压力型体制产生的原因、特征、弊端进行了粗浅的论述。本文认为当前中国各个阶层必须达成共识,坚持以对社会主义的新认识、新发展的理论,对社会主义的本质更深刻认识的
页岩气开发利用的环境效益产生于页岩气能源对于煤炭能源的替代价值。因此,其环境效益评估体系应包含页岩气与煤炭资源两方面,其环境效益评估的基础是煤炭资源开发利用的环境
综述国内外关于岩体裂隙渗流特性的研究成果,并进行相应的分析和讨论。分析表明:试验研究在岩体裂隙渗流特性方面具有不可替代的作用;许多研究者根据试验结果提出相应的经验公式
情报主导警务(Intellgence-led Policing)是21世纪初在全世界范围内掀起的警务变革,其所体现的警务运行管理和社会治安治理理念和方法也对中国警务运行模式变革不断产生着影响。目前,我国已是新的信息化技术发展的高地,5G网络技术、大数据技术、人工智能等一系列的新的信息化技术的快速发展为情报主导警务在我国本土化实施提供了比较优势的技术环境。情报主导警务先进理念和先进网络数据技术及相关
谐波电流损害电器设备、缩短设备的使用寿命、降低电能使用和传输效率,形成资源浪费和环境污染,存在着巨大的安全隐患。阐述谐波检测和抑制的意义,探讨谐波检测和抑制的方法
胶凝砂砾石(CSG)坝是在碾压混凝土坝和面板堆石坝的基础上发展起来的。文章通过国内外CSG材料筑坝实践和研究现状,归纳分析了CSG坝的特点及大力开展CGS材料、本构模型、工程