代价敏感学习和类别不平衡学习研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:dongfa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在真实世界的分类问题中,不同的分类错误往往会带来显著不同的损失,而且不同类别样本的数目往往有显著的差别。传统的机器学习研究假定所有的分类错误会带来相同的损失,而且不同类别的样本数基本相同。因此,为了更好地解决真实世界的问题,代价敏感学习和类别不平衡学习成为目前国际机器学习界的两个研究热点。 本文对代价敏感学习和类别不平衡学习进行了研究,主要取得了以下一些创新成果: 1.提出一种基于κ—近邻的代价敏感学习算法,通过对示例加权的方式使高代价的样本具有较大的权值,从而使得分类器对代价敏感。实验结果表明,该算法可以有效地降低总体代价。 2.提出了两种基于集成的类别不平衡学习算法,通过充分利用训练样本,在保持欠取样方法的高效性的同时,弥补了欠取样方法不能充分利用训练样本的不足。研究表明,这两种算法均可有效提高欠取样方法的性能。 3.通过考察类别不平衡学习算法在解决代价敏感学习问题时的有效性,对代价敏感学习和类别不平衡学习之间的关系进行了深入研究。研究结果表明,代价敏感问题和类别不平衡问题具有不同的性质,或者对解决两类类别不平衡问题有效的算法难以有效解决多类问题。 4.对多类代价敏感学习进行了研究,分析了两类代价敏感学习方法直接扩展到多类问题上失效的原因,并给出了判别条件,在此基础上,提出了一种新的多类代价敏感学习方法。实验结果验证了理论分析,并显示出新方法可以有效地进行多类代价敏感学习。
其他文献
移动智能设备和3G、4G移动网络的普及为人们提供了便捷的网络服务,让人们在生活中能够随时随地的拍摄、上传、浏览视频。就目前全球最大的视频网站YouTube的统计——每分钟上
学位
P2P计算是一项具有广泛发展前景的技术,它带给我们的不仅有机遇,还有挑战。受到P2P本身结构特点的影响,P2P系统易于受到攻击,因而安全问题在P2P研究中占有相当重要的位置。信任管
近年来在人工智能领域,不确定性问题一直成为人们关注和研究的焦点。贝叶斯网是用来表示不确定变量集合联合概率分布的图形模式,它反映了变量间潜在的依赖关系。使用贝叶斯网建
随着互联网的发展和普及,互联网隐私问题已经成为上网用户最关注的问题之一。通常,用户的个人隐私数据被大量地存储在Web站点中,由于互联网上信息获取的方便和快捷,当个人的信息
人类接触的各种信息中,图像信息占据了60%~70%的。图像信息是人类传递视觉信息的主要媒介,图像给人们直观而具体的物体形象,这是声音、语言和文字所不能比拟的,因此数字图像已称为当
遗传算法(Genetic Algorithm——GA),是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型,它是由美国Michigan大学的J.Holland教授于1975年首先提出的。J.Holland教授和
高能粒子直线加速器是采用沿直线轨道分布的高频电磁场加速电子、质子和其它重离子的装置。根据加速粒子的不同分为电子直线加速器、质子加速器、重离子直线加速器等。加速器
三维地质模型可视化交互系统指出了利用计算机和人共同构建三维地学模型系统,强调了人机交互在三维地学模型软件中的重要作用。本文以面向对象的思想和基于组件的理论,完成了
随着生活品质的提高,人们生命财产的安全与保障越来越受到重视。各国政府纷纷建立各种应急的机制和系统,以应对突发的应急事件的威胁和侵袭。目前常见的突发应急事件的处置方式