一种利用SPXY采样的标签噪声主动清洗方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:Eryuelan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于主动学习的标签噪声清洗方法(Active label noise cleaning,ALNC)是一种通过主动学习筛选疑似噪声样本,进而交给人工专家进行再标记的标签噪声清洗方法.虽然该方法既有很好的噪声识别效果又能保持原有数据的完整性,但仍存在人工额外标记代价较高的问题,即筛选出的疑似噪声样本中存在一定比例的正常样本.为了解决这一问题,降低标签噪声清洗过程中的人工额外检验代价,本文提出了一种基于SPXY(Sample Set Partitioning based on Joint X-Y Distance Sampling)采样的标签噪声主动清洗方法(Active label noise cleaning based on SPXY,SPXY_ALNC),该方法在主动学习筛选疑似噪声样本的过程中结合了SPXY采样方法,这样既考虑了样本的不确定性,又考虑了样本的代表性,并且在原有标准数据集上针对分类问题进行了实验,实验结果表明该方法在保持原有噪声识别效果的同时可以明显降低人工额外检验代价.
其他文献
KNN算法以其稳定性好、准确率高等特点受到了广泛的应用.但其分类效率与训练样本的规模呈正比,在面对大规模、高维度的数据时分类效率较低.一些改进的KNN算法通过聚类对训练
短时交通流预测在现代城市交通中有着重要的作用,可以帮助智能交通系统提供决策,提升人们的出行效率,这就使得提高短时交通流预测的精度成了当前研究的热点问题,本文通过引入自适应权重策略和天牛须搜索策略对鲸鱼优化算法做出改进,使用函数仿真实验证明了改进策略的有效性,然后将改进后的算法来优化最小二乘支持向量机(LSSVM)的惩罚因子和核函数参数并构建短时交通流量预测模型进行预测.通过仿真结果可以看出,对比其他模型,本文构建的ABOA-LSSVM模型在短时交通流预测方面具有优势,非常适合于交通流量预测.
在陕北米脂试验站设置了野外10 m地下大型土柱,分别利用BLJW-4小型综合气象观测站、CS650-CR1000自动监测系统对降雨状况和土壤水分状况进行长期连续定位观测,分析黄土丘陵区深层干化土壤对降雨入渗的响应。结果表明:(1)黄土丘陵区降雨可以划分为3种类型:快速蒸发型降雨(P≤13 mm)、缓慢蒸发型降雨(13 mm
针对目前中文评价情感分析对深层情感语义信息关注较少的问题,提出一种多重注意力的特征融合神经网络模型简称MTA-CBG(Multi-Attention Convolution-BiGRU).传统词向量不能有
为庆祝中国共产党成立100周年,铭记党的光辉历程,深化党史学习教育,激发党员干部职工爱党爱国热情,中国水利工程协会党支部于2021年6月28日组织开展了“歌唱祖国歌唱党”党史
期刊
为揭示长期咸水滴灌对灰漠土物理化学特性及棉花生长的影响,研究了咸水灌溉11 a后土壤盐分、容重、水力特性、棉花耐盐生理特征及产量。试验设置3个灌溉水盐度水平:0.35 dS·m~(-1)(淡水)、4.61 dS·m~(-1)(微咸水)和8.04 dS·m~(-1)(咸水)。研究表明:与淡水灌溉相比,微咸水和咸水灌溉显著增加土壤容重、盐分、pH值和土壤含水量,显著降低土壤孔隙度、全氮和有机质含量;土
互补替代推荐在现代推荐系统中起着十分重要的作用,如何对现有推荐系统进行升级并给出更细粒度的推荐成了学术界研究的热点.为了解决互补替代推荐系统的精度不高以及缺乏多样
与协同过滤相比,序列推荐能很好的捕捉用户兴趣偏移.在序列推荐中自注意力机制可以捕获长时间依赖关系,所以有很大优势,但是面对数据稀疏性问题,仍然难以获得较好结果.针对推
为解决传统推荐系统中的数据稀疏、关联性差、冷启动等方面的问题,有学者提出将社交中的信任关系引入推荐系统形成社会化推荐机制.这在一定程度上提高了推荐精度,但是显式信任信息很难获取并且现有的信任信息非常稀疏.针对加入用户信任信息算法的不足之处,提出了融入用户隐式信任的协同过滤推荐算法模型FITrustSVD,该模型是在TrustSVD算法的基础上融入了用户的隐式信任,定义了隐式信任用以矫正用户间的信任信息,对用户的信任范围做了约束,改进相似度算法的计算公式,并在信任预测公式中加入了用户的信任偏置.实验表明改进
构造一个满足完整性、一致性且组织良好的需求制品是提高安全关键软件质量的重要方法.本文工作面向机载软件领域,设计一种从自然语言描述的条目化需求到形式化需求模型生成的方法;工作包括:分析航电领域的需求描述特征,从该领域的自然语言描述的条目化需求入手,定义一套面向领域的自然语言需求模板,综合考虑所采用的形式化需求模型(VRM:Variable Relation Model)元素的语义,形成基于此模板的需求规范方法;然后给出从规范化后的需求条目集到VRM形式化模型的自动构造方法.最后选取了发动机指示和机组警告系统