边界与密度适应的SMOTE算法研究

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:marker1900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对合成少数类过采样技术等基于近邻值的过采样算法在处理数据类不平衡时,不能根据少数类样本分布情况及时调整模型参数,导致过采样后的数据集引入噪声,并且在原始分布区域上无差别地合成少数类实例造成过拟合等问题,提出了一种特征边界和密度适应的SMOTE算法(SMOTE algorithm for feature boundary and density adaptation)BDA-SMOTE。该算法为每一个少数类样本规划安全区域,增加少数类的分布,同时基于数据的分布密度动态地调整模型参数,确保生成的数据具
其他文献
密码S盒即黑盒,作为对称密码算法中的非线性部件,其代数性质往往决定着密码算法的安全性能。差分均匀度、非线性度及透明阶作为衡量密码S盒安全性质的三个基本指标,分别刻画了其抵御差分密码分析、线性密码分析及差分功耗分析的能力。当密码S盒输入尺寸较大(如S盒输入长度大于15比特)时在中央处理器(CPU)求解所需时间仍过长,甚至不可行。如何针对大尺寸输入密码S盒的代数性质进行快速评估是目前业界的研究热点。基
期刊
在本研究中,我们设计合成了两种卟啉修饰的新型石墨炔衍生物GDYO–TPP和GDY–TPP,它们在有机溶剂和水中具有良好的分散性及优异的生物相容性.研究发现GDYO–TPP和GDY–TPP不仅具有优异的光热转换性能,还具有优异的产生单线态氧能力,并可用于肿瘤的光热/光动力联合治疗,在动物体内表现出优异的肿瘤细胞生长抑制作用,且无毒副作用.进一步研究表明卟啉与石墨炔之间的高效电子转移使得共轭连接的GD
期刊
建筑物的通行能力研究近年来受到广泛关注,安全高效地流通人群是专家学者研究的重点。首先,通过一组节点和边的定义将建筑物表示为网络,进而利用Dijkstra最短路算法生成最短路径集合,最后在该集合的基础上提出平移矩阵算法,利用0-1矩阵的更新模拟人群在建筑路径上的流动过程。通过设置多组教学楼疏散场景并与Pathfinder软件的对比验证平移矩阵算法的有效性。对比结果显示不同密度下两种方法的总疏散时间差
期刊
2019新型冠状病毒肺炎已经成为一场“大流行病”,这一致命的疾病对人体多器官造成了损伤,包括呼吸系统、胃肠道系统和神经系统等.类器官作为一种具有自我更新、自我组织能力和再现来源组织生物学结构和功能的新型研究模型,已广泛应用于新冠病毒研究.它不仅能模拟新冠肺炎的感染机制、临床特征,还能为抗病毒药物筛选带来新的希望.
期刊
针对大数据环境下并行SVM (Support Vector Machine)算法存在冗余数据敏感,参数选取困难,并行化效率低等问题,提出了一种基于Relief和BFO算法的并行SVM算法RBFO-PSVM(Parallel SVM algorithm using Relief and Bacterial Foraging Optimization algorithm based on MapRed
期刊
目前,众多关于入侵检测系统(IDS)的研究都集中在网络流量识别和日志分析上,但是还存在另一种能够了解入侵检测问题的方法,即分析位于IDS核心的规则。基于签名的IDS会把其遭受攻击的特征封装到其本身的规则中,因此对规则的分析可以揭示恶意流量中的各种有用信息。文中对目前流行的开源入侵检测系统Snort的规则进行了统计和聚类分析,重点关注了规则使用的网络协议,揭示了Snort系统重点针对的恶意流量的类型
期刊
针对现有区块链系统可追溯性与隐私保护难以兼顾的问题,设计了一种可监管的区块链匿名交易系统模型。首先结合标识密码(IBC)和无证书公钥密码体制(CL-PKC)的优点,解决了单一标识密码托管密钥带来的隐患,在可保证安全条件下将用户交易标识与用户身份关联,保证了模型中的可监管性;其次,通过从网络层和应用层双层签名认证实现了隐私安全,既保证了用户交易内容和身份隐私的安全性,又确保权威机构能够根据异常交易进
期刊
通过建立一种基于人际关系的传染病传播仿真模型,对传染病传播过程以及预测在相关防控措施下疫情发展的趋势进行研究。基于人际关系描述个体间的接触与交互,以个体为单位建立仿真模型,根据中国卫健委平台收集武汉地区COVID-19疫情的初期数据调整模型参数,估算基本再生数(R0)验证模型,并模拟不同疫情防控手段的场景,探讨不同干预措施下疫情传播的趋势。建立的基于人际关系的传染病传播模型首先模拟了武汉疫情初期的
期刊
构建用户-项目交互网络并学习其表征是一种有效的推荐方法。已有的方法大多将交互网络视为静态同质网络,忽略了交互时序性和节点异质性的影响。针对这一问题,提出一种基于动态二分网络表示学习的推荐方法,首先构建时序加权二分网络,然后将用户节点和项目节点分别映射到不同的向量空间以保留网络的异质性,选择图卷积网络来聚合节点的一阶和高阶邻居信息,最后使用多层感知机学习两类节点嵌入的非线性关系并进行Top-N推荐。
期刊
针对传统谷物粉种类检测速度较慢的问题,本研究基于Zynq平台实现随机森林算法辅助微波无损检测技术对谷物粉种类进行高效准确识别。通过对随机森林模型硬件实现的分析研究,提出了一种改进模型参数结构,有效节省了硬件存储资源的消耗。为了缩短算法预测时间并降低系统功耗,在硬件实现时引入提前终止识别机制,在保证准确率不变的前提下避免不必要的决策树预测过程。针对Zedboard开发板,设计一种模型参数存储方案,充
期刊