基于非均衡数据集的新型混合重取样算法

来源 :2010年全国理论计算机科学学术年会 | 被引量 : 0次 | 上传用户:cashwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文在分析重取样技术的基础上,设计并实现了自适应选择近邻的混合重取样算法。该方法结合过取样和欠取样方法的优势,改进了SMOTE过取样算法在产生合成样本过程中存在的盲目性及只能复制生成数值属性的问题,新算法能根据实例样本集内部分布的真实特性,自适应调整近邻选择策略,对不同属性的数据采取不同的复制方法生成新的少数类实例,控制和提高合成样本的质量;并通过对合成之后的数据集用改进的邻域清理方法进行适当程度欠取样,去掉多数类中的冗余实例和边界上的噪音数据,减少其规模,在一定程度上达到相对均衡,从而可有效地处理非均衡数据分类问题,提高分类器的性能。
其他文献
本文研究了CFRP全包裹方式加固素混凝土圆柱的耐久性,环境因素考虑了人工模拟盐雾干湿腐蚀环境、盐雾干湿腐蚀和应力腐蚀共同作用的环境以及紫外线照射下的干湿环境,通过对比自然环境和三种模拟恶劣环境下试件的受力性能,并分析其劣化机理,为实际工程中耐久性设计提供有意义的试验数据。
本文采用基于实体有限元的分析方法,对某公路匝道曲线箱梁桥进行了抗倾覆分析,并提出了加固方案。结果表明,实体有限元模型合理反映了曲线梁桥的受力特性,是一种高精度的抗侧倾分析方法。以双支座代替单支座,或者拉大支座横向间距都可以避免曲线梁桥的侧倾,可以通过数值仿真与比选寻求经济有效的加固方法。
纤维织物混凝土具有较好的动力耗散作用,特别是纤维组合配置的结构具有阻尼耗能的潜在功能。纤维组合结构是纺织纤维材料的基础,可以构成耗能元件,同时纺织纤维复合材料具有良好的能量吸收能力。因此,采用纺织纤维组成能量耗散结构增强混凝土,利用纤维结构的组合效应,实现弹性波的强力衰减,达到材料的耗能要求。
在表面嵌固法中,嵌固板条能否发挥其抗拉能力的关键,在于嵌固板条与混凝土表层是否具有足够的黏结强度。本文采用试验的方法,研究了嵌固板条与混凝土基体的黏结强度和破坏情况,可以为采用表面嵌固法时嵌固板条的锚固长度设计提供一定的参考;本次试验的破坏形态均为嵌固材料从结构胶层拔脱,发生滑移破坏,造成黏结失效。黏结强度主要与结构胶自身的黏结强度和嵌固材料表面的粗糙程度有关,基材混凝土的强度对黏结强度的影响不大
建筑结构的耐久性能关系到工程的长期使用效益和工程寿命,受重视程度越来越高。提高既有构件耐久性能是继提高既有结构承载能力后的又一个重要课题。本次试验通过对比粘贴FRP的试件与未加固试件抗渗水能力的变化情况,并结合相关理论分析,证明了表面粘贴FRP后可以大大减小试件表层的渗透系数,有效降低环境水对试件的渗透作用,使试件内部不易遭受水的侵蚀,从而达到了提高构件耐久性的目的。表面粘贴FRP不仅可以提高混凝
本文建立了U型粘贴FRP抗剪加固钢筋混凝土梁的力学模型,给出了能够预测FRP抗剪剥离破坏全过程的理论解,得到了不同破坏阶段FRP正应力、界面剪应力以及裂缝端荷载与滑移的表达式。其中,FRP-混凝土界面本构模型采用双线性本构模型,并且在界面本构模型中考虑了卸载过程。通过考虑不同的简化主斜裂缝模型及其滑移场,得到了U型FRP抗剪贡献与平均裂缝宽度的关系曲线图,以及沿主斜裂缝FRP的正应力分布图。
本文结合加固工程实例论述碳纤维复合材料加固技术应用于场地较小、环境复杂条件下的加固方案、设计原理及施工过程,通过工程实例阐明碳纤维材料是一种适用面很广的加固修复材料,而且有良好的耐久性和耐腐蚀性,可在类似工程中借鉴。
本文设计了5根预应力碳纤维板加固的钢筋混凝土足尺梁试验方案,通过调整碳纤维板加固量及加固方式来验证其在加固过程中所起的作用。建立有限元分析模型对设计的试验梁进行有限元分析,得到关于梁的抗弯性能的计算分析结果,为今后应用提供有价值的参考。
PWM变频技术是目前国际上中小功率交流电动机调速的主要发展方向。该设计选用Inte18098单片机,将整个系统设计为转速单闭环控制系统,采用转差频率调节方式,对转速进行动态调节。系统总体结构主要由变频器主回路、驱动电路、光电隔离电路、HEF4752V大规模集成电路、保护电路、Inte18098单片机、L/0接口芯片、CD4527比例分频器和测速发电机等组成。主要是硬件部分的设计。
XML已经成为Intemet上数据表示和交换的标准,因此,在XML查询处理过程中如何有效地找出满足条件的查询路径表达式是非常关键的。目前,在区间编码的基础上已经提出了许多小枝模式匹配算法来实现XML路径表达式的查询。在PSB编码的基础上提出了一种新的小枝模式匹配算法PSBDirect。与现有的算法相比,该算法可以直接跳过一些不需要参与连接的结点,在一定程度上提高了查询处理效率。