基于ROC的分类算法评价方法

被引量 : 0次 | 上传用户:gbbzwklk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类学习是机器学习的主要分支,分类算法的学习能力通常用正确率来衡量。但是当数据类别分布不平衡或分类错误代价不相等时,正确率并不能保证分类算法总体错误代价最小。ROC(Receiver Operating Characteristic,受试者工作特征)分析技术衡量了数据类别在任何分布或任何错误代价下分类算法的总体性能。由于对类别分布比例和错误代价的不敏感性,使得ROC曲线在类别分布未知的领域和代价敏感学习中变得越来越重要。针对ROC曲线只能适用于二类别数据集的不足,本文较全面的分析和总结了目前多类别ROC分析技术,并在其基础上提出了EMAUC分析方法。这种方法采用纠错输出码将多类别问题转化为二类别问题逐个处理。相对于其它的多类ROC方法,它具有计算复杂度低、可理解性强、与多类别数据分布无关等优点。本文在机器学习平台WEKA和ROCon的基础上实现了EMAUC方法,并在大量数据集上进行了实验,结果表明该分析方法可以有效的评价和比较分类学习算法。
其他文献
发展创汇农业是实现农业可持续发展特别是改变农民增产不增收状况的有效途径。山东省安丘市成功地走出了自己的道路。他们的经验主要是:1.发挥农业资源优势,面向国际市场,大
目前对光子晶体光纤中超短脉冲传输产生超连续谱的研究分析已经成为非线性光纤光学的一个重要分支。随着超连续谱产生理论的不断完善,其应用领域的研究也不断深入。国内外最
本文是从汉语结果补语和韩国语进行对比的角度,对现代汉语结果补语中典型结果补语分析的研究。论文选取结果补语为研究对象。在语料分析的基础上,重点抽取13个典型结果补语进行
集成电路发展至今,滤波器已经成为系统中不可或缺、很常用的一个单元。模拟集成电路中常用的滤波器主要有三种:开关电容(Switched-Capacitor)滤波器,有源RC(Active-RC)滤波器
就目前新兴市场来看,尽管立即引发全球新兴市场的金融危机概率不是太高,但是就目前新兴市场的态势来看,面临风险则是很高,还得保持足够的警惕。
对大、小鹤管密闭定量装车技术进行了比较,介绍了油品装车栈台密闭定量装车系统的组成,从定量控制、防止溢漏、防止可燃气体泄漏等方面详细阐述了油品装车栈台密闭定量装车系
针对当前我国水资源短缺现状,以及城市景观水体富营养化带来的藻类大量繁殖,导致水中溶解氧下降,水体发黑﹑发臭问题,结合富营养化天然景观水和经二级生物处理后回用于景观水的
LED照明作为一种新型节能、环保替代性技术,迅速成为政府、资本和企业界聚光的焦点。由于LED本身相比传统的光源有着发光效率高、节能省电、使用寿命长以及安全可靠等诸多优
创新是产品设计活动的核心,它主要集中在概念设计阶段。在该阶段,作为设计师表达与沟通基本手段的草图设计,是创新探索过程中进行图形思维的重要媒介,是整个设计活动中将构思
扇形磨片是造纸和制纤设备的重要部件,其质量和二维质心的准确测量是优化排序安装的前提,决定着安装后设备的平衡效果。通过对相关质心测量方法的研究,结合扇形磨片的结构特