不均衡数据分类相关论文
不均衡分类问题在实际生产生活中频繁出现,如生物信息学、电信或金融风险评估和文本分类等。传统分类器由于期望整体精度最大化,常......
不均衡数据的分类问题是数据挖掘领域中一大难题.电信客户流失数据集分布存在高度的不均衡性,导致占少数比例的流失客户较难被识别......
针对不均衡数据分类中正类(少类)分类准确率低的问题,本文提出了一种新的集成采样技术以平衡正负类数据分布,进而提高正类分类准......
由于对组织或个人采取针对性的攻击,僵尸网络对因特网构成越来越严重的威胁.并且不同的加密方法以及隐蔽的通信信道使得p2p僵尸网......
现实世界中广泛存在着类别分布不均衡的数据,而传统分类算法在数据失衡的情况下分类效果很不理想,为此提出一种基于决策准则优化的组......
现实世界中广泛存在着类别分布不均衡的数据,其分类问题已成为数据挖掘领域中的研究热点.提出一种基于高斯混合模型,并结合自适应......
随着信息化建设的深入,网络攻击变得复杂多变,严重威胁着网络安全与信息安全.一个好的入侵检测系统往往要求具有高效性,高速性,智......
支持向量机利用接近边界的少数向量来构造一个最优分类面。然而当两类中的样本数量差别悬殊时,PSVM算法则会过度拟合样本量大的那一......
针对蚁群挖掘算法(ant colony mining algorithm,ACMA)中的规则评价函数和规则修剪方法,提出一种改进的蚁群挖掘算法(improved ant co......
支持向量机是近几年发展起来的机器学习方法,它是利用接近边界的少数向量来构造一个最优分类面。然而当两类中的样本数量差别悬殊......
脉诊是中医四诊之一,是中医诊断疾病常用的方式。脉诊包含丰富的病理信息,且是一种无痛无创的诊断方式。“脉为医之关键,医不察脉,......
为了提高重采样算法在不均衡数据学习的性能,提出一种基于粒子群优化的不均衡数据学习方法。通过粒子群优化,以不均衡数据分类评价准......
随着中医信息化发展,中医诊断的客观化研究日益受到国内外重视。如何充分利用宝贵的中医临床数据资源来为中医学诊疗提供科学决策......
支持向量机是在统计学习理论基础上发展起来的一种十分有效的分类方法。然而当两类样本数量相差悬殊时,会引起支持向量机分类能力......
基于欠采样的不均衡数据分类算法是一种随机数据优化算法,但它不能最好地反映中医临床原始数据的分布并解决数据的特征冗余问题。......
手机玻璃屏(MPSG)作为手机的重要部件之一,其表面缺陷直接影响手机的质量。目前手机玻璃屏表面缺陷视觉检测因受图像采集的振动、......
在实际的电信客户数据集中,流失客户的占比远远低于非流失客户,故将客户流失预测视作不均衡数据的分类问题。传统分类算法以整体预......