基于增益得分的噪声发现算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:whpzmfwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实数据集中不可避免地存在噪声,如何检测并去除噪声是数据挖掘中的一项重要研究内容。本文提出了一种基于增益的得分算法来检测噪声。为了检验该算法的有效性,以决策树为工具。在产生决策树之前,先用该算法去除训练集中的噪声,以免噪声导致决策树过大和过度拟合。对12个UCI数据集利用该算法去噪,再用C4.5生成决策树,实验结果表明,与不去噪时生成的决策树相比,改善了分类精度,且树尺寸明显减小。
其他文献
<正>~~
为深人贯彻中央、国务院关于深化“放管服”改革和优化营商环境的部署要求,落实浙江省“最多跑一次”改革决策部署,湖州市南浔区全力推进“竣工测验合一”及“综合测绘”改革
论文提出了基于图像多路正交投影和最小距离分类器的人脸识别方法。该方法与Fisherfaces方法相比,是基于图像矩阵的,故它的突出优点是极大地提高了特征提取的速度;与最近邻分类法相比,论文提出的最小类距离分类法,在识别性能上有明显的改善。最后,在ORL标准人脸库上的实验结果表明,其特征提取的速度是Fisherfaces特征提取速度的14倍;在相同的特征维数下,识别性能与最近邻法相比也得到较大的提高
提出了一种针对不容易描述的不规则特征的提取方法:采用贝叶斯启发式学习方法提取图像的聚类变量和等价变量作为特征;用网格划分技术过滤和释放位于稠密超方格的数据项,从而有效减少内存需求、大幅度降低计算复杂度。将此方法应用于医学图像分类器中的特征提取部分,实验结果表明大大地提高了分类的准确率。
成功绝非轻易,但却有规律可循。任何一个一流企业,除了提供价格合理、品质优秀的产品或服务外,还需要有领导者永不言败的意志和刨业的激情。正是刨业者的激情、恒心和毅力主导着
多年来杰出的专家学者们一直在致力探讨,究竟是什么使一个人在工作中出类拔萃。一种观点认为,优秀的表现在很大程度上是由遗传的智商决定的。因此,在招聘和选拔时,各种各样的智力
<正>移动虚拟运营商利用手中的渠道资源与品牌实力着实风光了一阵,然而现在他们必须在不明朗的形势下蛰伏起来,静静地期待时机的到来。面临危机虽然联通和中青旅在广东市场仍
当前,路桥工程施工数量增长速度越来越快,预应力技术在路桥工程的施工过程中得到了广泛的应用。本文概述了预应力技术的发展和应用,同时提出了路桥工程施工过程中预应力的防
目前已知的一些代理签名方案都是由原始签名者、代理签名者和签名验证者三方共同来完成.存在着原始签名者在线的问题。论文引入可信第三方,即仲裁者这一新的角色,并提出了一种由
摘要:针对制药工程专业的毕业论文环节进行了思考,从指导教师选择、论文选题、过程管理、论文写作、毕业答辩等环节对本校制药工程的毕业论文情况进行了分析,并提出了存在的问题及解决方法,为毕业论文的管理和改革奠定了一定的基础。  关键词:本科;制药工程;毕业论文;选题  中图分类号:G642.477 文献标志码:A 文章编号:1674-9324(2014)37-0136-03  高校本科生毕业论文是一项复