非平衡数据集的分类

来源 :电力学报 | 被引量 : 0次 | 上传用户:nafei123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非平衡数据集在金融、商业以及学术的研究等诸多的领域有着广泛的应用,主要研究的是对于非平衡数据集的处理和分类问题,首先使用了Smote算法对于非平衡数据集进行平衡化处理,然后采用Weka软件中提供的分类算法建立分类模型,最后与没有进行预处理而建立的分类模型进行分析和比较,验证了Smote算法对于非平衡数据集分类的必要性,同时也指出有待于进一步的改进。
其他文献
在改革高等学校会计核算模式的前提下,本文拟对如何选定高等学校培养成本的核算对象、确定成本核算方法、设计成本核算项目以及特殊项目列支等构建高等学校培养成本核算模式一
采用镜像原理对2相同导体球之间的电容进行了分析,并推出2个不同的计算公式.通过实例,对2种计算方法进行了比较分析.
本文利用临界点定理中的鞍点定理在次凸条件和次二次条件下证明了一类推广的二阶Hamilton系统周期解的存在性、
主要针对国华锦能公司4台600 MW机组高调门LVDT发生的几次故障,进行深入的原因分析,从而根据故障的诱因提出了可行的改进措施,并对改进措施的执行情况和应用前景做了简要说明
在普通的代理签名中,原始待签消息对代理签名者来说是完全可见的,但在现实应用中,原始待签消息可能含有原始签名者或消息接收者的一些机密,这时让代理签名者看到待签消息的明文是
在全球能源价格高企的时代,各国日益认识到新能源汽车的开发和应用是实现经济结构转变、实现绿色环保的关键。相对燃油汽车百年的发展史,新能源汽车还处于起步阶段,各项技术
基于灰色理论建立了1种新的电力负荷预测模型。该模型应用累加(GAO)和累减(IGAO)方法生成了等雏递补模型。由定例计算表明,该模型具有良好的精确性和应用性。
提出了用于中长期负荷预测的多重可拓聚类模型和算法。首先在构建可拓经典域和节域的基础上,结合数据聚类的相关理论,针对待预测样本的数据进行样本类别的划分;然后建立相应的关
2009年,山西省电力公司将围绕国家电网公司“一流四大”科技发展战略,加大科技投入、开展重点攻关,全力服务特高压和公司核心业务,进一步发挥科技推动公司和电网发展方式快速转变
采用模拟进化优化算法--蚁群优化算法来求解机组最优启停问题.引入了状态、决策、路径等概念,把机组最优启停问题设计成蚁群算法模式,通过附加惩罚项来处理各种约束,用tabu表