数据预处理方法相关论文
现实中许多领域产生的数据通常具有多个类别并且是不平衡的。在多类不平衡分类中,类重叠、噪声和多个少数类等问题降低了分类器的能......
利用傅里叶红外光谱仪扫描从企业收集的86个油茶籽油样品,并用气相色谱测定其脂肪酸组成,红外光谱数据通过Savitzky-Golay(SG)平滑、多......
身份识别是安防系统的一项重要功能。常用的身份识别通过指纹识别、面部特征、虹膜识别等方法实现,但存在设备昂贵、生物特征易被窃......
粗糙集理论是一种不需要先验知识且能有效处理不精确信息的重要工具,属性约简为粗糙集理论的核心应用,属性约简是针对一些高维海量数......
当前,为了节约成本,许多不法用电用户通过各种窃电手段破坏电能表的正常计量来达到少交电费的目的。不少用户采用高新技术手段实施窃......
我国幅员辽阔,地质环境纷繁复杂,交通建设迅速发展在给人们带来便捷,为区域带来发展的同时,也孕育了大量土质边坡,土质边坡稳定性问题愈......
在乏燃料后处理工艺中,亚硝酸钠主要用于料液中Np、Pu的调价控制,因此亚硝酸钠含量的分析十分重要。目前采用的方法是在酸性条件下......
提出一种适用于多类不平衡分布情形下的模糊关联分类方法,该方法以最小化AdaBoost.M1W集成学习迭代过程中训练样本的加权分类错误......
空间数据挖掘是指从空间数据库(空间数据仓库)中提取用户感兴趣的空间的和非空间的模式和规则的过程,空间聚类是空间数据挖掘最基......
城镇地籍数据库建设是第二次全国土地调查工作的核心部分,其数据的质量和完善性等因素直接影响到数据库的运行效率。本文,笔者以汝......
采用多元校正技术-偏最小二乘法结合具有代表性的烟气总粒相物萃取液的傅里叶变换近红外透射光谱220个,分别建立了焦油、烟碱和一......
提出一种基于Rosetta的神经网络数据预处理方法,解决试验过程中因样本参数多而导致故障分类模型收敛速度慢的问题。详细介绍如何利......
为了提高预测模型精度以及降低模型的复杂程度,减小模型的训练时间,文章提出一种基于改进模糊C均值聚类算法的数据预处理方法,以提......
主要介绍了Web用户访问日志数据挖掘数据预处理过程,综述了国际上的研究现状,流行的预处理方法.在对用户访问行为的合理假定基础上......