【摘 要】
:
处理类不平衡数据时,少数类的边界实例非常容易被错分。为了降低类不平衡对分类器性能的影响,提出了自适应边界采样算法(AB-SMOTE)。AB-SMOTE算法对少数类的边界样本进行自适应采样,提高了数据集的平衡度和有效性;同时将AB-SMOTE算法与数据清理技术融合,形成基于Ada Boost的集成算法ABTAdaBoost。ABTAda Boost算法主要包括三个阶段:对训练数据集采用AB-SMOT
【机 构】
:
南通大学电子信息学院,南通大学计算机科学与技术学院,南通理工学院计算机与信息工程学院
论文部分内容阅读
处理类不平衡数据时,少数类的边界实例非常容易被错分。为了降低类不平衡对分类器性能的影响,提出了自适应边界采样算法(AB-SMOTE)。AB-SMOTE算法对少数类的边界样本进行自适应采样,提高了数据集的平衡度和有效性;同时将AB-SMOTE算法与数据清理技术融合,形成基于Ada Boost的集成算法ABTAdaBoost。ABTAda Boost算法主要包括三个阶段:对训练数据集采用AB-SMOTE算法,降低数据集的类不平衡度;使用Tomek links数据清理技术清除数据集中的噪声和抽样方法产生的
其他文献
由于采用矩阵的表示形式会破坏视频数据的原始空间结构,针对这一问题,提出了一种基于块和低秩张量恢复的视频去噪方法。首先运用自适应中值滤波器对含噪视频进行预处理,通过相似块匹配构造一个三阶张量,根据视频张量的低秩性和噪声像素的稀疏性,利用基于张量的增广拉格朗日乘子法(ALM)重建出三阶视频张量的低秩部分和稀疏部分,实现噪声的分离。该方法采用张量模型来处理视频去噪的问题,更好地保护了视频序列的高维结构特
针对三维空间中移动自组网的地理多播问题进行了研究,为降低传输开销并提高多播成功率,提出了一种新的基于象限转发概率的地理多播协议。该协议以发送节点为原点建立笛卡尔坐标系簇,根据转发节点与目标区域的相对位置将三维空间划分为四类转发区域,并为不同区域中的转发节点指派合理的转发概率。该协议实现了方向性转发和概率转发的综合运用,既考虑了目标位置的方向性以节省传输开销,又加入了概率广播以提高成功率。通过仿真实
为了解决云联盟中云资源提供者间的信任问题,提出一种基于信任机制的云联盟算法。算法将多个云资源提供者以合作形式完成用户任务的问题形式化为联盟博弈模型,在建立联盟时兼顾考虑成员间的信任关系及成员收益,使得具有更高信任度的资源提供者能够建立联盟以降低任务执行代价,并确保参与联盟的个体成员收益最大化;同时,证明了该算法求解的联盟结构是稳定的,并且满足Pareto最优性质。实验结果验证了算法的有效性和可行性
LDA没有考虑到数据输入,在原始输入空间上对所有词进行主题标签,因对非作用词同样分配主题,致使主题分布不精确。针对其不足,提出了一种结合LSI和LDA的特征降维方法,预先采用LSI将原始词空间映射到语义空间,再根据语义关系筛选出原始特征集中关键的特征,最后通过LDA模型在更小、更切题的文档子集上采样建模。对复旦大学中文语料进行文本分类,新方法的分类精度较单独使用LDA模型的效果提高了1.50%。实
ViBe算法是一种快速高效的背景建模算法,但该算法在运动目标检测过程中会产生鬼影。针对ViBe算法中鬼影消除缓慢的问题,结合多个场景的交通视频提出一种通过连续两帧前景背景像素时域变化来判断鬼影像素点并消除的方法,该方法加快了鬼影的消除速度。同时,对于视频拍摄场景中的背景噪声,采用了对前景图进行开闭操作去除小像素点以及对目标区域的空洞进行填充处理。实验表明,改进的ViBe算法能够加快鬼影的消除,并且
为了解决作战过程中指挥控制结构设计的问题,首先定义了指挥控制结构中的各个要素,然后对问题进行了数学描述,通过定义决策实体的工作负载,以最小化工作负载的均方根为优化目标建立数学模型。在模型的求解过程中,将量子遗传算法与自适应策略相结合,形成了自适应量子遗传算法。该自适应策略包括自适应调整量子旋转门、自适应生成交叉概率、自适应生成变异概率。实验结果表明,自适应量子遗传算法具有进化速度快、搜索结果好等优
在基于构件的系统设计中,需要对构件的一致性进行验证。构件的一致性包括语义一致性和协议一致性,已有的一致性验证方法仅支持构件的协议一致性验证。而在实际应用中除了要进行构件的协议一致性验证外,还需要进行其语义一致性验证。为此提出了一种包含协议和语义的构件一致性验证方法。将方法语义与基于场景的需求规约相结合,使用语义扩展接口自动机模型(SIA)来建模构件的语义和协议信息,使用带有语义约束的UML交互概观
针对中文专利侵权检测中关键词特征表达能力弱以及句子结构特征容易引起噪声干扰的问题,提出了一种通过抽取三元组特征来改进中文专利侵权检测的方法。该方法将专利权利要求书
针对宽场荧光显微图像盲复原中的不适定性和细节模糊问题,提出了基于双层反卷积的宽场荧光显微图像盲复原算法,该算法通过双层反卷积,结合图像金字塔,实现了由粗略到细致的图像复原。为抑制不适定性,外层反卷积采用全变分模型,对复原图像和光学传递函数进行正则化约束。在内层反卷积中,通过残差图像进一步复原出图像细节。实验结果表明,该算法能在有效抑制伪影和噪声的同时,复原出宽场荧光显微图像的细节。与近几年图像盲复
针对雾霾天气条件下,大气粒子的散射作用导致的图像质量下降问题,提出一种基于暗通道先验知识与局部多项式核回归算法相结合的去雾方法。根据暗通道先验原理估计出大气光强度和初始透射率,采用局部多项式核回归对透射率进行精细化处理,利用细化后的透射率和估计出的大气光强度恢复雾霾图像。通过大量的实验数据表明,该方法可以有效地对雾霾图像实现去雾处理。与最新的几种去雾算法相比较,该方法处理后的图像保留了更多的细节信