基于类别概率的特征选择方法

来源 :广州大学 | 被引量 : 0次 | 上传用户:liongliong504
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,各类数据都在快速增长.然而不是所有的数据都有价值,或者说存在一些垃圾信息,这给数据分析和决策带来一定的困难.因此需要从大量的数据中提取有用的信息,特征选择便成为处理该问题的重要方法,即从原始特征中提取有效特征进而达到降维的效果.除此之外,在含有一个因变量的高维或者大样本的离散型数据中,其解释变量的某些类别可能包含信息较少或者冗余.为了提高数据分析与数据挖掘的效率,我们提出了一个基于类别概率的特征选择方法.它能将各离散特征中包含信息丰富的类别选出来,将包含信息较少或者冗余的类别合并从而得到新的特征,并用可靠性度量指标和关联度对基于该方法和基于原始特征中选择进行对比分析,评价选择后的特征的可靠性和预测能力.最后用两组实际数据进行验证分析,实验结果显示了该方法的有效性.
其他文献
伴随着全球油气勘探目标的转移和石油地质学的发展,以及油气田不断的深入开发,剩余油的开发已成为各大油气田科研的重点区域。为实现有效开采以及达到稳产的效果,通过对目的
涡轮发动机在航空航天、船舶、发电等重工业项目中广泛应用,目前已经成为衡量国家工业水平的重要指标。热端部件是涡轮发动机运行的核心部件,它的运行环境十分严峻。GH536是一种镍基高温合金,常用来制作涡轮发动机的热端部件,但是镍基合金属于难加工金属,这方面限制了GH536的应用,因此研究GH536的铣削力和铣削温度,对实际生产加工具有重要意义。为减少人力物力的浪费,基于切削实验与切削仿真相结合的方式是当
近年来,世界范围蓝藻水华频繁暴发引起广泛关注,而蓝藻水华引发各种衍生物污染,严重时甚至造成重大生态灾害事件,制约了区域经济可持续绿色发展。在蓝藻水华衍生物中,微囊藻
本论文首先采用Hummers法制备了氧化石墨烯(GO),进一步通过溶胶-凝胶技术合成了氧化石墨烯二氧化硅(GO@SiO2)纳米复合材料,并对其进行了一系列的表征。将GO@SiO2复合材料作为吸附
在传统的GPS辅助空中三角测量中,GPS数据的处理通常都采用差分定位模式,这样就需要在无人机飞行作业时必须在测区的合适位置架设地面基准站,当航摄范围较大时架设基准站就成
伴随国内经济水平的提高和人们精神文化需求的不断增长,文化建筑,特别是博物馆建筑的数量、种类、质量都有了飞速发展。博物馆建筑需要适应更加复杂多变的社会、人文、地理环境。成都及周边地区的自然科学类博物馆较少,而成都理工大学积累多年的地学展品和自然科学学科优势又急需一座具有完备功能的博物馆建筑陈列展品。在此背景下对成都自然博物馆展示空间设计进行研究具有较强的现实意义。成都自然博物馆拟陈展品主要以地质类为
衰老是指机体各器官功能普遍的、逐渐的降低过程。它是一种动态的、并持续发展的复杂过程。虽然衰老本身不是一种疾病,但和衰老相关的疾病如:阿尔茨海默病、糖尿病、帕金森氏
拓扑指数主要应用于两个方面:构效关系研究;化学信息管理。其中化学信息管理要求拓扑指数具有高选择性,需要用含有大量化合物的数据集检验其唯一性。基于此前工作(如结构生成
配位化学已作为一门独立的学科,配位聚合物含有各种的金属离子、具有结构多元化、性质特别、不同寻常的光电效应等特点,因此,它们在磁性材料、非线性光学材料、储能材料、超
金属有机框架作为一种新型的多孔基材料,由于其确定的结构以及功能的多样性,在不对称催化、气体储存、光催化分解水方面具有广泛的应用前景。金属有机框架是由具有空轨道的金