基于改进LightGBM的分类预测算法研究与应用

来源 :北京石油化工学院 | 被引量 : 0次 | 上传用户:wik2pwerq32
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
化合物在日常生活被广泛使用,不可避免地产生有机污染物,而有机污染物会对生态环境平衡以及人类自身健康带来威胁,因此,生物降解性预测是当下研究热点。现有分类预测方法虽包含特征选择,但并没有考虑其动态变化过程,且对无关和冗余特征去除不准确,同时集成算法存在超参数选择耗时低效的问题,所以研究基于特征选择和超参数优化的分类预测算法具有一定的现实研究意义和应用价值。本文提出基于MD-Medoids特征选择和麻雀搜索算法(Sparrow Search Algorithm,SSA)参数优化的改进LightGBM算法,并在生物降解性预测的研究中进行应用,主要的工作内容如下:第一,针对特征选择动态变化的过程,本文提出MD-Medoids特征选择算法,该算法首先将数据集的特征划分为已选特征、候选特征两部分,并通过互信息来计算已选特征、候选特征这两者之间的关联信息量,使用动态相关性来计算已选特征与类别标签,两者之间的相关信息量,然后将关联信息量和相关信息量作为聚类算法K-Medoids的输入,对所有特征进行聚类分析,以此方法来达到对冗余特征和无关特征准确去除的目的,最后将该方法在5组数据集上进行验证,结果表明MD-Medoids特征选择算法在Accuracy、Precision、F1和AUC上均有很好的表现。第二,针对LightGBM存在超参数寻优的问题,本文提出SSALightGBM分类预测算法。该算法主要使用SSA来对LightGBM算法进行改进,针对LightGBM,筛选了8个对训练结果影响较大的参数,通过SSA对这些参数进行寻优,确定其最优的参数组合,最后在5组数据集上进行实验验证,并与SVM、XGBoost、RF、LightGBM这几个分类器进行性能对比,本文所提的SSA-LightGBM分类预测算法取得的Accuracy、F1和AUC值最佳。第三,本文将前面所提出的MD-Medoids特征选择算法和SSALightGBM分类预测算法进行结合,提出了基于MD-Medoids特征选择和SSA参数优化的改进LightGBM算法,并将该算法在定量构效关系模型(QSAR)的Biodegradation生物降解数据集上进行了应用,对可降解和不可降解的生物分子进行分类预测,最后将该算法的实验结果与SVM、RF、XGBoost、LightGBM、SSA-LightGBM进行了对比,结果表明本文所提的算法在Accuracy、Precision、F1和AUC上均取得了最佳的结果。
其他文献
随着我国制造业的发展深入,焊接技术成为大国制造的重要一个环节。在机器人焊接时,需要定位焊接试件位置,人工示教定位存在低效率、重复性劳动过多的缺点。光电传感测量技术的不断更新、加上机器视觉传感的算法不断推出,让机械设备在作业过程中减少对人工示教的依赖性,自动化识别焊接试件位置,明显提高焊接机器人的作业效率。但是焊接机器人在作业过程中尚不能完成CAD图纸到工件之间的有效匹配,还需要人工干预,智能自动化
学位
学位
在信息化视域下,高中语文教师在教学创新活动中需要找准重心和方向,同时结合数字化媒体技术、信息化工具,革新现有的语文课堂教学机制,打造全新的信息化教学生态链,帮助学生实现全时段、全方位的课程学习。本文主要对信息化视域下高中语文教学创新的路径进行分析,以期为广大高中语文教育工作者提供一些思考和建议。
期刊
等离子体技术制氢具有产率高、成本低、能耗少、设备简单的特点,是最具发展前景的一种方法,由于制氢时使用的主要原料为液体,因此液体中放电生成等离子体的研究具有非常重要的意义。本课题主要围绕液体中阴极放电影响因素进行研究,主要研究工作如下:(1)建立了直流激励下液体中阴极局部区域放电的等效物理模型,并由该模型推导出液体放电时阴极周围气腔电阻公式,同时根据气泡膨胀半径与焦耳热间关系得到气泡半径热力学模型。
学位
中厚板焊接工件通常选用多层多道的焊接方式进行填充。在焊接前一般通过人工示教的方式进行焊缝初始点定位,然后通过人工布道的方式进行多层多道焊接填充。为进一步降低机器人在工作过程中人为干预的工作量,提升焊接机器人的焊接质量,本文基于机器视觉方法,针对中厚板焊接的焊缝初始定位及多层多道焊动态排道规划两个方面展开研究工作。全文主要成果如下:(1)搭建了一套机器人焊缝初始点定位及多层多道动态排道焊接实验系统。
学位
对储油控制系统的运行数据进行异常检测是保证系统安全生产的重要手段之一。然而当前研究面临很多问题:(1)边云协同架构在现代的工控系统中应用越来越普遍,但是受限于边缘侧一般为算力较弱的工控机,基于深度学习的异常检测算法需要大量的计算资源,难以直接用于边缘侧;(2)传统的异常检测算法只给出了是否发生异常的分类结果,但是很难定位哪些点位受到攻击,现场排错困难;(3)同业务不同现场的工控系统中,存在点位个数
学位
目的:探讨四手操作联合循证理论下精细化护理在牙髓炎根管治疗患者中的应用效果。方法:将200例牙髓炎行根管治疗患者按随机数字表法分为对照组和实验组各100例,对照组实施常规护理干预,实验组实施四手操作联合循证理论下精细化护理干预。比较两组干预前、干预后1 d舒适度[采用舒适状况量表(GCQ)]、疼痛情况[采用疼痛数字评分法(NRS)]及并发症发生率。结果:干预后1 d,两组GCQ评分高于干预前(P<
期刊
“互联网+”是信息化时代的技术革新产物,主要借助计算机技术、网络技术、通信技术与传统企业实现深度融合,讲究的是合作分享、互联互通和信息共享。从高中语文课堂教学角度来说,伴随着新高中教学改革的进一步发展,我们迎来了高中语文课堂教学转型的新挑战,倡导借助“互联网+”技术来打造现代信息化教学模式,实现互联网技术与教育行业的互补结合,从而能够提升高中语文教学质量。
期刊
有关调查表明,中国的老龄化速率正在提高,伴随着老年人数的增长,脑卒中偏瘫患者也在不断的增多。研究显示,功能性电刺激在治疗脑卒中偏瘫患者中取的了有益的效果。同样有相关研究表明早期的脑卒中偏瘫患者,经过及时的康复运动训练,有助于恢复损伤机体的功能性活动,防止肌肉萎缩,并且通过康复训练动作,刺激运动神经系统的重建,最后恢复患者的运动能力。传统的康复训练方式是康复医师手把手的对患者肢体进行康复运动训练,这
学位
装甲车辆作为陆战部队最为重要的武器装备之一,其全部动力输出依靠的是底盘发动机,属于核心部件。对装甲车辆底盘发动机的运行状况进行故障预测,提前了解发动机的健康状况,可以有效保障装甲车辆的作战能力,还能延长使用寿命。因此,本文基于油液在线监测技术,为实现装甲车辆底盘发动机状况的故障预测提供一种智能化的预测方法。首先,本课题开发了一种六合一集成油液传感器,提高了仪器的集成水平,简化了结构设计;改进了对油
学位