【摘 要】
:
非平衡数据集是指数据集中的某类样本数量远大于其他样本的数量。对于此类数据,类分布的不平衡会直接导致很多分类算法的失效。文中基于K—means聚类,Silhouette指标和M.近邻下
论文部分内容阅读
非平衡数据集是指数据集中的某类样本数量远大于其他样本的数量。对于此类数据,类分布的不平衡会直接导致很多分类算法的失效。文中基于K—means聚类,Silhouette指标和M.近邻下采样提出一种新的数据平衡方法(K—S—M)。该方法首先用K—means算法对多数类样本进行多次聚类并选取最优聚类个数,然后采用M-近邻下采样对聚类后的数据进行采样,将采样后的点最终构成平衡数据,并对得到的平衡数据进行癫痫性发作的自动检测。实验结果表明,文中所提方法可以很好地处理非平衡数据,减少数据信息损失,同时可以提高非平衡数
其他文献
目前中国的产能已经在国际市场中占领了第一的地位,其次第二是美国,美国主要有英伟达及奥升德,其中英威达在美国的装置使用的是页岩气,生产成本较低,其次就是欧盟,欧盟市场在
针对X线图像乳腺肿块分割易受边缘及周围腺体组织干扰,分割精度不高的问题,该文提出了一种基于格式塔认知框架的乳腺肿块分割算法。该算法利用格式塔心理学理论,对人类视觉自下而上的感知和自上而下的认知过程建模,并将其在肿块分割问题中实例化表示。首先,抽取视觉块,并将其作为基本认知单元;然后,利用图像局部自相似性及格式塔规则进一步简化图像;最后,从全局特征出发,融入专家诊断知识,通过最优化实现肿块的自动化分
拿一个洋葱横切开后,一个圈一个圈地延伸开来,里是一道有名的开胃小菜。我们会看到它由里及外这就是洋葱圈,在西餐它与安全生产有什么联系呢?6月10日,“三晋安全行”采访团来到了
本文给出一族并行三阶龙格——库塔方法。运用此方法可以在MIMD型机上使用两个处理器做并行计算。这个方法具有绝对稳定区。
本文从软件方法上研究了微机普遍使用的汉字操作系统CCDOS对紫金AT机的可用性问题,即操作系统的向上兼容性问题。笔者通过建立母子系统并存及分辨率模式辨析试验之后,设计了
<正> 薏米为禾本科植物薏苡的种仁。薏米又称薏苡仁、草珠子、薏仁、药玉米等,为一年生或多年生药粮兼用植物。其叶、根均可入药,但以仁临床使用最为广泛,其功效为:健脾、补
大宗商品贸易具有交易量大、资金占用量大、价格波动明显、流通范围广等特点,其融资性衍生趋势,致使大宗商品贸易业务面临更为复杂的风险。本文列举了大宗商品贸易的主要风险
8月25日,藤县安监局组织党员干部召开了下半年党风廉政建设工作分析会议。会议要求,下半年务必做好“三化”,构建生产安全的和谐环境。一是强化廉政教育,全面提高责任意识。下半
1月24日,国家安全监管总局正式公布并施行《煤矿矿长保护矿工生命安全七条规定》,明确煤矿矿长保护矿工生命的责任和措施。
提出了基于椭圆曲线的门限身份认证协议.证书中心采用无可信中心的门限密钥系统,任何t个有效成员组合均能有效地将用户提交的ID号和公钥以证书的形式绑定在一起,但t-1个成员