面向桑黄发酵实验不平衡数据的处理方法及其研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:jimiwison
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息产业高速发展的今天,数据已经成为各行各业的生产要素,海量数据的伴随着企业的生产和运营产生,总量增长迅猛。在生物实验中也出现了大量的新增实验数据,这些数据具有纬度高,相似性高,数据不平衡性等特点,传统方法难以应对。本文以桑黄数据为基础,在此基础上采用不平衡数据方法和数据挖掘方法对数据进行了分类处理和预测建模。通过对大量生物实验产生的数据进行分析,生物实验数据具有一定的不平衡性。本文采用KK-SMOTE(k-means and k-neighbors on SMOTE)的不均衡数据过采样方法对桑黄发酵数据进行了预处理。为桑黄发酵条件特征属性进行准确的数据挖掘提供了前提条件,并建立了基于逻辑回归和BP神经网络的桑黄产量分类模型,通过不同的实验条件参数来分析并预测该组实验条件是否为高产实验条件,为产量预测分析做准备。BP(Backpropagation Neural Network)神经网络是高效且简单的预测模型。本文根据桑黄发酵实验数据实验梯度小特性建立了LM算法的BP神经网络产量预测模型,并和传统的回归模型进行了对比。遗传算法(Genetic Algorithm)的模型机理是通过计算机来模拟自然界的自然选择过程和基因遗传学思想来进行计算。本文最后采用遗传算法进行桑黄产量模型的产量寻优,提出了与BP神经网络建模相结合的GA黄酮测方法。通过实验分析表明本文提出的面向桑黄发酵实验不平衡数据的处理方法可以有效地应用于桑黄发酵数据处理与分析。另外基于BP神经网络和遗传算法的产量预测算法可较好的模拟该条件下桑黄产黄酮产量,误差控制在80%以内。为生物实验设计和产量预测决策依据。此外本文提出的模型可以进行一定程度上的产量寻优,寻优产量较真实数据有所提升。
其他文献
量子点是实现高饱和颜色以及广色域的显示器和电视的理想选择,具有极好的应用前景。目前,制约量子点显示技术商业化的主要因素是器件的稳定性,因此本文将从引起量子点器件老化的原因入手,对其寿命进行研究,进而提升器件的稳定性,文章内容如下:(1)影响量子点光致发光器件寿命的主要因素是氧气和温度,本文使用双层玻璃预封装量子点材料,研究CSP和SMD两种封装方式对器件的影响。通过预封装以及多层隔绝水氧的设计,减
钢带式轮胎试验台是一种新型的汽车道路模拟试验设备,采用双滚筒张紧钢带的传动结构,通过钢带模拟路面进行汽车的道路模拟试验,为了提高钢带承载能力,减少钢带磨损以及降低能
巴贝虫(Babesia)是一类经蜱虫传播的血液寄生型原虫,至今共发现100余种,其中多种可引起人兽共患的巴贝虫病,本研究涉及到的田鼠巴贝虫(Babesia microti)就是人巴贝虫病的病原
地铁作为一种广泛应用于解决城市拥堵问题的交通系统,在目前城市发展中占据重要地位。安全和舒适是对地铁系统运营的基本要求。本着以人为本、高效节能和精细化管理的理念,必须解决地铁内部日益突出的热环境问题。而解决这一问题的有效途径是科学地调控地铁内部热环境状态。因此,需对地铁热环境状态进行连续监测分析,并结合地铁车站的全场热环境模拟来预测和掌握热环境状态的变化规律,以便为地铁内部环境调控及系统运行优化提供
从新中国成立至1965年,甘肃民族贸易经历了起步、发展调整、再发展的过程。即1949-1952年的积极开创时期、1953-1957年的蓬勃发展时期、1958-1961年的挫折困顿时期、1962-1965年的稳步发展四个阶段。在这四个阶段中,甘肃省在党中央的领导下,根据国家的民族贸易方针政策,结合甘肃省的地域特点和民族特点开展民族贸易工作,成立国营民族贸易机构,成立民族贸易公司,普遍建立民族贸易的商
烷基叠氮化合物是一类非常重要的有机合成中间体,在材料化学、医学及化学生物学等领域均有极大地应用。其中叠氮基团可以进一步发生反应,得到胺类、三氮唑类等化合物。基于烷
细胞增殖的过程是高度严谨和复杂的,受到细胞内外多种因素的调控。CCAR1(Cell-Cycle and Apoptosis Regulator 1)基因是新发现的一类转录调控因子,属于细胞核周磷酸蛋白,该基
我国白钨矿资源储量丰富,但普遍品位低、共伴生矿物组成复杂。尤其白钨矿与含钙脉石矿物如方解石、萤石因具有相似的表面物理化学性质和复杂的溶液化学行为导致其分选更为困
冷却塔是火电厂以及核电站的重要组成部分。装机容量的不断增大使得混凝土双曲冷却塔趋于超大型化,进而导致冷却塔结构的抗震性能开始被重视起来。另一方面,由于冷却塔特殊的
中国作为世界第一的发展中国家,并且是传统的农业大国,在多数领域都有了长足的发展。随着信息化时代的来临,传统农业已经不能满足现代化农业技术的需求,高昂的人力物力都是对于农耕行业的挑战。因此,提高当前情况下的农作物科学种植技术并准确的获取农作物生长信息,从农作物生长过程中产生的海量数据挖掘出科学的种植建议也成为了当前的热门话题。针对上述问题,可以将传统种植业与当前的信息技术相结合,形成一种智能、科学的