【摘 要】
:
不平衡数据学习是机器学习中一个研究热点,近年来得到广泛的关注.以SMOTE为代表的过采样方法是不平衡数据学习的主流方法之一,近年来涌现出大量的基于SMOTE的改进过采样方法.但是,当前对过采样的研究中,如何利用样本分布信息,实现高效的过采样,仍然是一个具有挑战的问题.本文提出一种有监督的样本空间分布学习方法,用以学习少数类样本的局部邻域信息,并以局部邻域信息约束过采样过程中样本的合成,以降低线性插值可能带来的噪声以及样本重叠等不利因素,从而提高过采样的效率.在典型不平衡数据集上的实验表明,利用少数类样本邻
【基金项目】
:
国家自然科学基金项目(61806002,61673020,61872002,61876001)资助,安徽大学博士科研启动基金项目(J01003253)资助。
论文部分内容阅读
不平衡数据学习是机器学习中一个研究热点,近年来得到广泛的关注.以SMOTE为代表的过采样方法是不平衡数据学习的主流方法之一,近年来涌现出大量的基于SMOTE的改进过采样方法.但是,当前对过采样的研究中,如何利用样本分布信息,实现高效的过采样,仍然是一个具有挑战的问题.本文提出一种有监督的样本空间分布学习方法,用以学习少数类样本的局部邻域信息,并以局部邻域信息约束过采样过程中样本的合成,以降低线性插值可能带来的噪声以及样本重叠等不利因素,从而提高过采样的效率.在典型不平衡数据集上的实验表明,利用少数类样本邻
其他文献
针对传统电力消防安全培训的纯理论、无体感、抽象晦涩等问题,该研究结合虚拟现实技术设计出一套新型的电力消防安全培训系统,采用3ds max软件、Unity 3D开发引擎对火灾场景进行建模和系统功能开发,对会议室和灭火器的场景建模过程与方法进行描述,同时采用高斯分布原理对火灾发生时任意位置的烟雾浓度进行确定,对高度还原现实生活中的火灾发生提供了支持。试验证明,在面对面积大小为100mm2的突发电力火灾时,该研究系统的处置结果能够减少财产损失130万元。
党的十八大以来,党中央和国务院高度重视网络安全工作.2019年9月15日,习近平总书记对网络安全工作做出了“四个坚持”的重要指示,为做好网络安全工作特别是网络安全标准化工
为了提高智能变电站运维效果,提出基于Solidworks的智能变电站运检一体化管控方法。利用Solidworks根据采集到的智能变电站信息仿真建模,并将运行状态信息传递至数据中心;建立智能变电站数据库,分类处理采集到的数据信息;分析智能变电站设备运行状态指标,判断智能变电站设备可能存在的故障,运检一体化管控巡视智能变电站,确定智能变电站设备存在的问题,进行解决并记录。实验结果表明,所提方法的智能变电站设备运行状态信息采集准确率较高,提升了智能变电站设备运行状态运检管控效率,避免了漏检现象发生。
随着云计算、大数据、人工智能、物联网的逐渐成熟,科技进步和创新应用不断提速,尤其各个行业中,传感器、智能设备和移动用户数量激增,需要及时应对越来越多的需要就地处理的
介绍了智能灌溉系统与WaterSense?测试规范,重点阐述了基于云服务的智能灌溉系统通过WaterSense?测试规范的过程,通过分析测试结果得出可达到与传统灌溉控制器系统相同甚至更
多自主水下机器人系统(MAUV)越来越多地被应用于海洋勘探与资源开发,受到研究者们的普遍关注.本文探讨了常见的多自主水下机器人系统所执行的任务及所用方法,并从新功能涌现
关于股票价格走势的预测,传统的操作方法多是通过统计分析工具或者是单一的机器学习算法进行预测,很难准确把握股价这种时间序列数据的非线性和非平稳性等特征,从而使预测精度受限.融合SDE算法与加权BiGRU网络的优化预测模型,先使用SDE全局寻优网络的结构参数,求得最优初始权值、阈值以及权重系数,再将优化的参数应用到改良的加权BiGRU网络模型中进行预测.优化的预测模型能够有选择的考虑过去和未来时间点对当前时刻数据的影响,而且能有效避免局部最优值以及网络的长程依赖问题.实验结果表明,优化的预测模型与其他传统神经
中文文本情感分类的一个难点是未利用句法信息来做分类决策从而需要大量训练数据.针对现有深度学习方法在语义分析中效果显著但尚未充分利用句法信息的现状,本文提出一种基于句法依存融合ONLSTM-GCN-Attention(OG-ATT)的中文评论文本分类的机器学习模型.该模型可在得到语义分析的基础上进一步捕获文本的句法信息并引入注意力机制使得文本中重要信息获得更高的决策权重,从而模型对评论文本类别做出准确的判断.本文在两个数据集(携程酒店评论数据集,新浪微博评论数据集)上进行实验根据准确率,召回率,精确率,F1
文本情感分析是自然语言处理的重要部分,但现有的文本情感分析方法均有其不足.为了使各个方法进行互补,提出了一种融合改进Stacking与规则的文本情感分析方法 Stacking-I.该方法在Stacking集成算法的基础上进行改进,融合了两种主流的情感分析方法:文本规则方法和机器学习方法.在不同的3组网络评论文本上进行实验,证明该方法在网络评论文本情感分析实验中表现良好且有较高的准确率,其准确率高于传统机器学习方法、其它集成算法以及深度学习方法,最高可达91.700%,并且在不同数据量的基础上,通过大量实验
寻找近邻用户或近邻项目是传统协同过滤推荐算法的关键内容.通常,数据稀疏性会导致推荐精度降低.基于项目类别偏好的混合协同过滤算法利用项目特征的低维性与二值性进行聚类,通过用户的类别偏好信息寻找近邻用户,此类方法可以在一定程度上缓解数据稀疏性问题.为了进一步提高近邻用户间的相似性,本文在项目类别偏好的混合协同过滤的算法基础上利用半监督AP聚类算法代替传统的聚类算法,并对相似性度量方式进行改进,提出了一种基于半监督AP聚类和改进用户相似度的协同过滤算法.该算法有两个方面改进:一方面,提出了一种新的半监督AP聚类