人管家基因以及不同组织基因中转录调控模体使用的差异性分析

来源 :云南大学 | 被引量 : 0次 | 上传用户:catbull
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因的转录调控是基因调控机制中最重要的组成部分。真核生物基因组规模远远大于原核生物基因组,并具有复杂的结构和调控机制,控制着基因的表达过程。所以对于一个基因组来说,我们不仅要知道其中的每一个基因,还希望知道这些基因是怎样被调控的,在什么情况下表达,如何表达,什么时候表达以及基因间的关系等。本文主要工作是提取基因的转录调控模体,并根据这些调控模体分析它们的表达规律。  本文的样本序列是人管家基因和30个组织特异性基因序列,采取基因上游1000bp区域作为启动子序列。由于Van Helden认为模体在某条基因序列上出现服从泊松分布,所以本文通过泊松分布来度量每个模体出现的概率,再应用主成分分析提取出现概率大于95%的一些“主要模体”作为过表达模体。泊松分布和主成分分析两种方法的综合使用,提取出的过表达模体与TRANSFAC数据库的匹配率在87.50%~95.98%之内,把这些过表达模体作为潜在的转录因子结合位点。并对这些调控元件的特征(AT_rich模体、CG_rich模体和AT/CG_lack模体)进行分析,为下一步各个组织的模体使用的差异性分析打下基础。  其次,通过数据预处理消除过表达模体出现的概率值比较小的影响,通过Wilcoxon秩和检验得出各个组织之间是否具有显著性差异,再用与之有显著性差异的组织的过表达模体进行分析。用超几何分布确定出现次数比较多的模体作为这个组织的特有模体。并分析特有模体的特征是偏向于AT_rich模体或CG_rich模体,以及特有模体在启动子序列中的位置特征。把特有模体与TRANSFAC数据库匹配,得到控制组织特异性基因的特异性表达的转录因子。
其他文献
谷歌一年一度的开发者大会I/O又来了。在这次以人工智能为主要议题的大会上,谷歌首席执行官皮查伊也在演讲当中直截了当地指出,机器学习和人工智能是谷歌未来10年的重点。我
2006年全国纸张订货交易会于2005年11月3日—5日在厦门国际会展中心举行,这是一年一度纸业界知名的品牌交易会,吸引了众多造纸企业、纸张经销商、用户,以及为造纸业直接配套
美国邦纳无线振动温度传感器是获得2015年度工控奥斯卡创新奖(gongkong网)的创新产品,近日邦纳对原有型号QM42VT1进行了功能升级,同时发布了新型号QM42VT2,体现了邦纳传感器
Chaplygin型气体方程组是一类简单而又重要的非完整系统的运动方程组,在研究非完整力学中具有重要的作用.本文针对一类Chaplygin型双曲守恒律系统的狄拉克激波的相关问题进行
矩阵的Schur补在数值分析和线性系统等方面有着广泛应用,已有很多学者对其进行了研究并且得到了一些有重要结果。例如,对角占优矩阵的Schur补是对角占优矩阵,γ-块对角占优矩阵
学位
物价稳定是一个重要的综合性的宏观经济指标,物价波动作为一种复杂的宏观经济现象,直接影响着宏观经济的发展质量。本文通过选取我国2003年1月至2010年3月物价指数,试图从货币数
微分方程是非线性泛函分析的一个重要部分,其中,分数阶微分方程解的存在性问题是非线性泛函分析中研究最活跃的领域之一.本文中主要利用Banach压缩映射原理,Lipschitz条件,Krasno
瓶颈最短路问题(BSP)是一系列网络优化问题的核心,旨在寻找网络中两点之间容量最大的一条路。以这个问题为基础,研究三个新的最优化问题:给定一个赋权连通无向图G=(V E;w;s,t),其中
本文全面系统的介绍了金融时间序列中的维纳过程、单位根过程、协整过程、误差修正模型、向量自回归模型、向量误差修正模型等协整相关理论体系,重点探讨协整理论在经济学实证