【摘 要】
:
为满足日益严格的环保要求,清洁汽油的生产显得格外重要,其中降低辛烷值的损失是目前汽油工业生产亟待解决的问题.本文通过数据挖掘技术对数据进行筛选,建立了基于XGBoost-MLP的辛烷值损失预测模型.首先,在原始数据中根据帕累托法则删除其中缺失严重的特征,又利用K最近邻法对少量缺失的数据进行填充.并使用低方差滤波和Pearson相关系数法筛选出17个具有代表性、独立性的特征变量.其次,建立XGBoost-MLP模型,利用z-score方法对筛选出的特征做归一化处理,训练XGBoost-MLP模型,绘制预测值
【机 构】
:
杭州电子科技大学自动化学院,浙江杭州310018;杭州电子科技大学理学院,浙江杭州310018
论文部分内容阅读
为满足日益严格的环保要求,清洁汽油的生产显得格外重要,其中降低辛烷值的损失是目前汽油工业生产亟待解决的问题.本文通过数据挖掘技术对数据进行筛选,建立了基于XGBoost-MLP的辛烷值损失预测模型.首先,在原始数据中根据帕累托法则删除其中缺失严重的特征,又利用K最近邻法对少量缺失的数据进行填充.并使用低方差滤波和Pearson相关系数法筛选出17个具有代表性、独立性的特征变量.其次,建立XGBoost-MLP模型,利用z-score方法对筛选出的特征做归一化处理,训练XGBoost-MLP模型,绘制预测值和真实值的点线图以及QQ图,并对模型预测结果进行分析评估.最后,以辛烷值损失模型为目标函数,操作变量的取值范围和硫含量不大于5μg/g作为约束条件,建立优化模型.通过差分进化算法寻找目标函数的最小值,同时获得此时的操作变量取值.
其他文献
在“尿的形成和排出”一节教学中,通过创设不同情境,引导学生主动探索,掌握知识背后的逻辑及意义,并实现迁移应用,帮助学生初步树立生命观念、培养科学思维和社会责任,最终发展核心素养.
近年来,随着高通量染色体构象捕获(Hi-C)等技术的发展和高通量测序成本的降低,全基因组交互作用的数据量快速增长,交互作用图谱分辨率不断提高,促使染色体和基因组三维结构建模的研究取得了很大进展,已经提出了几种从染色体构象捕捉数据中构建单个染色体或整个基因组结构的方法.文中通过对在Hi-C数据基础上对染色体三维结构重建的相关文献进行分析,总结了重建染色体三维空间结构的经典算法3DMax的原理,并且提出了一种新的随机梯度上升算法:XNad-am,是Nadam优化方法的一个变体,将其应用于3DMax算法中,以便
结构变异作为人类基因组上的一种大规模的变异类型,对分子与细胞进程、调节功能、基因表达调控、个体表型具有重要的影响,检测群体中基因组结构变异有助于绘制群体基因组变异图谱,刻画群体遗传进化特征,为疾病诊治、精准医疗的发展提供支撑.本研究提出一种面向高通量测序的群体基因组结构变异检测工作流,该工作流通过使用多种高性能基因组结构变异检测算法实现全面、精准的结构变异挖掘,使用多层融合与过滤获得高精度群体结构变异候选集合,利用基因型重新校正、变异修剪、类型校对,最终完整绘制群体基因组结构变异图谱.基于该工作流对由26
探索了多种植物在初中光合作用系列实验中的应用,通过改进实验方法、创新实验装置,优化了实验效果.实验过程操作简单、实验现象直观明显,让学生能真正参与到实验探究活动中,促进了生物学学科核心素养的发展.
脑胶质瘤(Glioma)是最常见的中枢系统恶性肿瘤,MAML2是NOTCH信号通路的共激活因子,通过癌基因组数据库(TCGA)分析验证MAML2基因表达及相关临床参数与低级别胶质瘤(LGG)的诊断及预后价值.从癌基因数据库LGG数据库中下载患者基因表达量数据及患者临床数据,采用统计学方法验证MAML2基因表达差异及临床参数与胶质瘤的诊断与预后关系.在TCGA LGG队列中,发现LGG组织中的MAML2基因较正常组织明显上调(P<0.001),其差异表达可作为低级别胶质瘤的潜在诊断标志物.同时,MAML2低
基于专用集成电路(ASIC)的光数字信号处理(ODSP)设计可以有效提高光传输芯片的传输容量.本文主要解决的问题对ASIC性能和资源进行权衡,实现具体场景下的DSP芯片的算法最优设计.首先我们对整个通信系统进行搭建,进一步讨论不同导频插入、不同插值算法、不同导频调制值以及导频样式对系统性能以及导频开销的影响,以RSNR代价<0.3dB为目标,设计了一套载波恢复算法,使得导频开销最小.此外,我们对系统性能和资源进行分析,利用Q学习算法构造性能和资源的综合代价函数,给出了一套自动优化位宽和实现性设计的方案,仿
前期研究在植物根际促生菌土地类芽胞杆菌(Paenibacillus terrae)NK3-4中发现一个EsxA编码基因,为明确该基因编码的蛋白的性质、结构及系统发生关系,对该基因进行了生物信息学分析.分析表明,该EsxA含有91个氨基酸,分子质量10276.53 Da,理论pI 5.29,分子式为C445H711N125O146S4,弱酸性,亲水,具有WEG保守基序,属于WXG超级家族成员;建模预测表明,自然状态下EsxA形成不对称的同源二聚体,其中每个亚基都由一个β折叠连接两个α螺旋组成,两个α螺旋反向
分析黑龙江省气象因素与猩红热发病的关系,建立时间序列模型,为今后制定更科学有效的猩红热防控策略提供参考依据.收集黑龙江省2010~2020年猩红热月发病数据以及同期气温、气压等气象资料,应用广义相加模型分析气象因素与猩红热发病之间的关联程度和形式.结果发现:猩红热全年均有发病而且呈现出较为典型的双峰型特征,在春季的4~5月份和冬季的11~12月份发病数达到高峰;月平均气压、月平均相对湿度、月日照时数和月平均风速的P值均小于0.05,表明具有统计学意义.同时,RR(相对危险度Risk Ratio)值均小于1
借助科技论文命制生物学试题,既能保证问题情境的真实性和科学性,又能体现学科的应用价值.明确了借助科技论文命制试题的基本步骤;明确考查的素养指标;构建双向细目表;挖掘科技论文中的命题素材;剔除冗余信息、精简表述词语;设计层次性的问题;明确“双位编码”的评分标准,并对初中生物学原创试题的命制进行了尝试和探索.
利用TCGA数据库中肾透明细胞癌的miRNA与mRNA数据及临床信息,构建由miRNA组成的预后风险评分模型,并筛选与生存预后相关的miRNA-mRNA调控关系对,为研究提供理论依据.下载并整理TCGA数据库中肾透明细胞癌的miRNA与mRNA数据;对数据进行差异分析,将差异表达的miRNA与临床信息进行合并,利用单因素与多因素Cox回归分析,构建预后模型并进行模型评价;对模型中的miRNA进行靶基因预测,结果与差异表达的mRNA进行取交集,构建miRNA-mRNA调控网络;对网络中的mRNA进行生存分析