代价敏感的机器学习算法研究及应用

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:wendell0919
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习在数据时代得到了迅速的发展,而其中的分类问题更是重点研究内容。传统的分类算法通常假设训练样本集中每类样本的数目相等,且各类别的错分代价相同,但实际应用问题大多属于代价敏感问题。在这些问题中,通常少数类样本应该获得更多的关注。换句话说,少数类样本的错分代价远远高于多数类样本的错分的代价。本文针对二分类问题展开研究,采用平衡级联的策略解决数据的不平衡问题,同时将代价敏感学习融入到稀疏表示分类和协同表示分类算法中,提出相应的代价敏感学习算法。  本研究主要内容包括:⑴改进平衡级联的稀疏表示分类算法(BC-SRC)。对于类别不平衡分类问题,采用平衡级联采样策略获得平衡化的训练样本,并利用稀疏表示分类算法进行分类。具体地,对于一组类别不平衡的训练样本,每次选择与少数类样本个数相同的多数类样本一同作为子训练集,不重复的多次选择子训练集使训练集中的多数类样本全部被取出过,并利用稀疏表示分类算法对药品进行预测。最后,根据得到的多组结果采用加权策略得到测试样本的最终类别属性,并在药品的近红外光谱数据上验证了该算法的有效性。⑵改进代价敏感的稀疏表示分类算法(CSSRC)。将代价敏感学习引入到稀疏表示分类算法中,并利用概率估计模型估计样本错分的后验概率作为误分代价。由于稀疏表示系数的大小反映该样本在对未知样本线性表示中所起到的作用,因此本文利用稀疏表示系数估计样本的错分后验概率,有效的解决了稀疏表示分类算法对类别不平衡问题的敏感性,还可以降低算法计算复杂度。⑶改进代价敏感的协同表示分类算法(CSCRC)。对于小样本问题,协同表示分类算法提供了一种有效的解决方案,但同样存在样本代价敏感的问题,因此提出代价敏感协同表示分类算法。通过高斯函数定义协同表示的系数向量的分布,并利用对数算子将系数向量的分布转化为协同表示框架形式,根据协同表示系数向量的分布得到样本被错分的后验概率,最后利用代价敏感学习框架有效地解决此类类别不平衡问题。
其他文献
开关磁阻电机(SRM)为双凸极变磁阻电机,转子极既无绕组亦无永磁体,定子极绕有集中绕组。SRM具有结构简单坚固、易于控制和维护等特点。然而SRM固有的双凸极结构、高度非线性的
演化硬件具有类似生物的适应环境、自组织及自我修复的能力,对提高电子系统的稳定性有着重要的意义。实现数字电路的在线进化是演化硬件的重点研究领域之一,也是对演化硬件系统
亮度是当前照明检测与控制行业当中一个重要的参数指标,实时探测空间亮度在照明控制领域有着重要的应用。现有的测量设备在亮度测量的过程中存在诸多的局限性,从而导致未能得到
石碑是记录历史和传承文化的重要载体,是古人赠与我们的宝贵历史和精神财富。但随时间流逝,石碑会遭受到自然风化腐蚀和人为损伤而缺失,导致一定的保存和传播问题,这对碑文的研
电液位置伺服系统具有输出功率大、润滑性好、响应速度快、调速范围宽、使用寿命长等优点,是其它液压系统的基础。所以,电液位置伺服系统在大功率驱动领域得到广泛的应用。但是
在通信对抗领域,电子支援系统的主要工作内容包括对通信辐射源的电磁信号进行侦察、截获、识别及定位。随着辐射源系统复杂程度的提高,以及新的调制方式的应用,通信辐射源特征识
高光谱遥感技术是二十世纪末人类对地观测技术的重大突破之一,应用领域广泛。针对高光谱遥感图像分类领域,现有机器学习算法能够较好解决遥感图像分类问题。但随着遥感图像的光
随着科学技术的迅猛发展,各个领域的大动态范围微弱信号的检测愈来愈受重视。大动态范围微弱信号主要指三个方面:信号的幅值很小、被强噪声埋没、动态变化范围很大。因此微弱
磁阀式可控电抗器(MVCR)作为一种新型无功补偿装置,对于改善供电质量,提高电网经济效益起着重要的作用。由于自身结构的特点,导致其响应时间相对较长。响应速度太慢会严重影响电抗器的动态性能,使其不能进行及时有效的补偿,甚至导致电力系统供电质量的下降。因此对提高磁控电抗器的响应速度问题的研究是必要的,并且具有重要的研究意义和广泛的应用前景。在对磁控电抗器的结构特点和工作原理了解的基础上,详细分析了其工
随着Android智能移动终端设备硬件性能的提升和数字图像处理技术的发展,将全景图像拼接技术应用于智能移动终端设备,以解决宽视野与高分辨率的矛盾已经成为智能移动终端相机应