【摘 要】
:
病虫害危害植物生长是现代经济作物生产、植物栽培面临的重要不利因素。具有抗逆基因的植物对于恶劣环境有着良好的适应性,因此对于植物抗逆基因的研究有着很重要的意义。迄
论文部分内容阅读
病虫害危害植物生长是现代经济作物生产、植物栽培面临的重要不利因素。具有抗逆基因的植物对于恶劣环境有着良好的适应性,因此对于植物抗逆基因的研究有着很重要的意义。迄今为止,已有153条经过生物实验验证的植物抗逆基因应用于转基因、分子育种等方面的研究。由于植物抗逆基因相关的生物实验验证需要花费大量的时间物力乃至人力,因此基于机器学习的植物抗逆基因识别有着重要的意义。本文以植物抗逆基因表达对应的蛋白质序列为正例数据来源,根据其对应的蛋白质家族ID从pfam数据库获取负例样本。经过初步的数据清洗获得不平衡的正负例样本。通过分层抽样的方法来解决正负例样本严重不平衡的问题。提取了氨基酸组成、分布、转化的统计量(188D),Kmer,auto-cross covariance,parallel correlation pseudo amino acid composition(Pse-AAC)等一系列特征。对特征进行组合,使用Max-Relevant-Max-Distance(MRMD)方法对特征进行降维。对提取降维后的特征使用朴素贝叶斯,随机森林、支持向量机分类器对数据集进行训练,使用十折交叉验证获取分类结果的准确率、F1-score、AUC等指标,对分类结果进行结果评估。实验结果表明,使用支持向量机(SVM)算法处理经过组合降维后的特征,能够获得最佳的实验结果;在对于ACC+Kmer+MRMD的组合中取得最高的F1值(0.964),在Kmer+pse-AAC+MRMD的组合中取得最高的AUC值(0.985);其模型对于新数据也有很好的泛化性。最后,本文搭建了植物抗逆基因识别的web公共服务平台,用于促进植物抗逆基因识别的研究。
其他文献
青光眼是由多种因素引起的以进行性视功能损害为主要特征的眼部疾病,目前临床上主要采取局部滴眼液治疗青光眼,患者对这种给药方式接受度高。但是滴眼液每天使用的次数较多,
近年来,随着技术的飞速发展,出现了许多新技术和新方法,血氧水平依赖功能磁共振成像(blood oxygen level dependent-functional magnetic resonance imaging,BOLD-fMRI)是一
随着移动通信和宽带无线接入技术的快速发展以及用户本身日益增长的业务需求,未来通信网络异构融合已成为必然的发展趋势。网络选择作为异构无线网络资源管理的重要方面,旨在
啤酒泡沫蛋白主要来自于麦芽,其数量与各分子量区间蛋白组分的比例影响啤酒泡沫的质量。本论文研究了麦芽库值、蛋白质含量、蛋白酶等与麦汁高分子蛋白质含量的关系,建立了麦
随着全球制造业的快速发展,各行各业对产品的多样化、个性化的要求越来越高,柔性化生产模式在制造领域被广泛采用,并逐渐成为未来的发展趋势。自动导引运输车(automated guid
以往的情感分类大多是基于粗粒度进行的,针对五分类进行的研究不多,且最终的情感分类结果只包含一种情感,很少对多情感共存现象进行研究,因此不能完全体现用户情感的丰富性。
基于跨视角匹配的图像地理位置定位任务是将待查询的地面视角图像与参考数据集里带有GPS标记的航拍(卫星)图像进行比对,从而确定待查询的地面视角图像的地理位置(GPS坐标)。
近几年来,在机器人技术中融入机器视觉,并将其在生产中应用,已经变成一种趋势。目前,该项技术已经在工件的装配、分拣、包装以及缺陷检测中有着广泛的应用。然而,在这些领域
在生产制造中使用铝及铝合金替代铜具有更好的经济性。但是铝及铝合金采用软钎料钎焊连接时,会出现母材溶解、润湿性差以及钎焊接头耐腐蚀性较低等问题。通常SnAg和Sn-Ag-Cu
随着现代化农业的发展,由于农业机械的自动导航控制可以有效提升工作效率,提高作业精度,因此智能农业机械被广泛应用于设施农业。而对于自动导航,位置测量和导航路径跟踪控制