基于惩罚逻辑回归的油菜胁迫响应关键基因识别

来源 :河南大学 | 被引量 : 0次 | 上传用户:zhanggang406
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
油菜含油量可达35%-50%,是一种重要的油料经济作物.油菜产量会受到各种非生物胁迫的影响.因此,找出与胁迫响应相关的基因,选育出能够更好地适应外界环境的油菜新品种,提高油菜产量是一个重要的科学问题.本文将根据油菜非生物胁迫条件下转录组数据识别与胁迫响应相关的关键基因.本文采用惩罚逻辑回归模型对油菜胁迫响应关键基因进行识别.已有的结构惩罚逻辑回归(SPR)模型根据皮尔逊相关系数计算特征与特征、特征与响应变量间的关联关系,然而,皮尔逊相关系数并不适用小样本数据,且皮尔逊相关系数不能计算定性变量与定量变量间的相关关系,因此本文对SPR模型进行了两点改进:(1)基于调和曲线函数将特征表达量对应为调和曲线,根据调和曲线间的距离衡量特征与特征间相关关系;(2)基于信噪比函数刻画特征与响应变量间的权重.这两点改进既消除了SPR模型不适合小样本的问题,又能避免用皮尔逊相关系数计算定性变量与定量变量间的相关性.本文称改进后的模型为基于调和曲线与信噪比函数的结构惩罚逻辑回归模型(H-SPR).通过仿真数据集与两个癌症数据集对H-SPR模型进行验证,结果表明:H-SPR模型适用于小样本数据,在数据中分类效果较好,预测精度较高,特征选择性能较优.将H-SPR模型应用于油菜五种胁迫条件下转录组数据中,结果表明:(1)H-SPR模型选择特征时不受特征间相关性的影响,特征选择具有稳定性;(2)H-SPR模型不仅能够识别出其他模型都能识别的关键基因,而且能够识别出其他模型不能识别出的关键基因,这些基因对应拟南芥同源基因部分已被证实对胁迫条件有响应.进而可以做出推断,例如:通过富集分析和文献比对分析等发现,H-SPR模型识别的Bna A06g37950D、Bna C03g14320D、Bna A01g16970D等基因可能在油菜胁迫响应中起关键作用,可以作为分子育种或转基因研究的靶标基因.油菜胁迫响应关键基因的识别可以为分子育种提供目标基因,进而培育出具有抗逆性的品种,提高产量.H-SPR模型可以广泛用于各类高维数据,特别是生物医学组学数据,可以有效实现对高维数据的分类、预测和变量选择等.本文的研究对于生物医学研究具有重要意义.
其他文献
本文主要研究来自于弱电统一理论中一个新的Weinberg-Salam模型双荷子解的存在性.首先对该模型作适当的Ansatz,将其化为由六个方程构成的非线性常微分方程组两点边值问题.然后利用射击法和Sturm比较定理对方程组中的每一个单个方程研究其解的存在唯一性.最后运用Schauder不动点定理证明该模型径向对称解的存在性,并给出解的相关性质.
学位
HIV,又名获得性免疫缺陷症,长期以来一直深受社会各界的广泛关注.而如何通过数学建模的方法,建立与HIV在人体内发病机制更加契合的数学模型,探究HIV到底是如何在患者体内进行无限制传播这一重要谜团,从而进一步为今后HIV的预防控制提供理论参考依据,为政府制定控制舆论发展与走向的公关策略提供理论支撑,仍是众多学者所关注的热点.本文则尝试从两个不同的角度出发,构造并分析两类与HIV动力学行为相关的数学
学位
图的染色问题来源于著名的四色猜想,即只需要四种颜色便可对地图上拥有共同边界的国家染上不一样的颜色.图的正常点染色是指图G中任意一条边的两端点染不同的颜色.随着染色问题的不断深入研究,Vizing[19]和Erd(?)s等人[9]分别独立地提出列表染色的概念,列表染色可以看作是正常点染色的推广.1986年,Cowen等人[5]首次提出缺陷染色的概念,缺陷染色允许图G中某条边的两端点染相同的颜色.在这
学位
信息传播和疾病传播在社会网络中是一种很常见的现象,社会网络中有影响力的传播者的识别一直是研究者关注的热点.为寻找社会网络中有影响力的传播者,研究者们提出了许多方法,然而,不同方法适用范围不同,预测精度各异.新的高效识别社会网络中的有影响力的传播者的算法依然是一个重要且具有实际意义的研究问题.本文对SpectralRank算法进行了改进,构建了两种算法:(1)OWSR算法.由于节点的出度对网络传播过
学位
近年来,越来越多的信息识别与检测技术应用于日常生活中,人脸识别就是其中最常用的方法之一.随着人工智能技术的发展,基于深度学习的人脸识别模型成了当前人脸识别研究的一个焦点.在基于深度学习的人脸识别方法中,影响模型准确性的因素主要有三个:人脸数据的标准训练集,模型选取的网络结构,以及把控网络训练方向的损失函数.其中,损失函数的选取对模型最终分类精度有着重要影响,然而现有的损失函数难以有效地识别异常值人
学位
涡旋为2维的拓扑孤立子,在粒子物理,凝聚态物理,宇宙学,超流,超导和光学等现代物理的众多领域中都有着广泛的应用.在本文主要研究两类涡旋问题,一类是U(1)规范复标量场中的Abelian-Higgs Chern-Simons涡旋,另一类是规范Abelian Skyrme带电涡旋.由于电和MinkowskiR2,1时空特征的存在,研究上述两类涡旋的存在性时需要研究某些具有不定作用泛函的变分问题.本文将
学位
远程制备是一种重要的量子通信方式,它是基于量子纠缠特性来实现量子态的安全传输.本文,我们系统地对赤道态的远程制备进行了研究.赤道态作为一种特殊的量子态,虽然所包含的信息比一般量子态少,但赤道态具有更高的克隆保真度,并且远程制备赤道态能够节约经典通信资源.因此,研究赤道态的远程制备具有重要意义.目前,远程制备主要集中于二维量子系统的研究,对于高维量子系统的研究还比较少,而高维量子系统,能够有效地提高
学位
随着高维数据收集技术的快速发展,其数据集容量也随之增大,使得在处理数据以及解决相关数据问题时需要花费大量时间,从而导致工作效率大幅度降低.因此,寻求能够有效减少处理时间、提升效率的方法,是一项非常具有现实意义的工作.本文主要研究了独立性检验问题中统计量的渐近性质以及计算复杂度问题.首先,在多元数据情况下,考虑其检验统计量的渐近性质以及计算复杂度问题.当原假设成立时,借助于Jin et al.[23
学位
迈上全面建设社会主义现代化的新征程,职业教育肩负着培养时代新人的重任。“德技并修、工学结合”是新时代职业教育落实“立德树人”根本任务的重要途径。在职业教育中全面推进“德技并修、工学结合”的育人机制,对培育时代新人、助力产业升级、推动职业院校高质量发展、提升职业教育整体发展水平、帮助学生实现职业社会化具有重要的价值。
期刊
黄河是我国第二大河,水资源量占全国的2%,承担着全国约15%的耕地、近1/4的煤炭资源和12%的人口供水重任,为我国黄河流域沿岸人民带来巨大便利.近些年,伴随气候变化和人类活动的干扰,黄河流域水资源供应与需求之间的矛盾不断加大.因此研究黄河流域水资源长时序时空变化规律至关重要.GRACE及GRACE Follow-On重力卫星的发射开启了陆地水储量变化定量监测的新纪元,然而该数据源时间跨度短,不能
学位