全基因组水平上蛋白质相互作用位点对和蛋白质编码基因的预测

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:gny637259
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新一代测序技术的发展,DNA测序的时间可以减少两个数量级,而且成本大为减少,这意味着将有越来越多的基因组被测序,因而必将对基因组研究产生巨大的影响。随着已测序的真核生物和原核生物基因组数目的不断增加,推断基因组功能的能力日益重要。本论文分别研究了功能基因组学领域的两个重要问题:蛋白质相互作用位点对的预测和蛋白质编码基因的预测。   目前,通过实验和计算方法,高通量蛋白质相互作用研究能够在完全测序的基因组中产生全面的蛋白质相互作用数据,这为我们提供了在全蛋白质组水平上更深入的发现潜在的蛋白质相互作用模式的机会。相互作用位点的研究对人们理解蛋白质相互作用的识别机制和蛋白质功能,以及针对蛋白互作的药物设计(涉及到疾病通路的蛋白)很有帮助。这里,我们设计了一个通过挖掘高质量的蛋白质相互作用正数据集(GSPs)和同等重要的不发生相互作用的负数据集(GSNs)的新方法,来识别相对于GSNs在GSPs中出现频率(或比例)显著高的潜在的相互作用位点对。为了评估该方法的预测效果.我们用已知的高质量的相互作用位点数据库对预测出的互作位点对进行验证,发现预测结果显著富含于验证数据集中。同时,我们将此方法与已知的互作位点对预测方法进行了比较,发现此方法取得了最高的预测精确度和敏感度。   当前,复杂基因组的测序已经成为常规,然而目前已测序物种还多集中于哺乳动物,植物中已全测序的基因组还比较少。黄瓜是我国重要的蔬菜农作物,能够为人类提供重要的营养成分。中国农业科学院蔬菜花卉研究所发起了黄瓜基因组测序计划,综合使用传统的Sanger测序技术和新一代Illumina GA测序技术,拼接得到了黄瓜的全基因组序列。根据黄瓜基因组序列,我们构建了一个黄瓜基因预测平台,该平台整合了目前常用的基因预测方法,包括cDNA/EST同源比对、蛋白质同源比对和单基因组ab inito基因预测方法。我们一共预测出25268个蛋白编码基因,平均基因长度为2729bp。此外我们还对这些蛋白编码基因进行基本的功能注释,包括寻找其同源蛋白和结构域注释。这为在黄瓜基因组中进一步开展功能注释以及基因家族进化研究奠定了基础。
其他文献
射频识别RFID( Radio Frequency Identification)技术是当前应用最为广泛的自动识别技术之一。与其它传统的识别技术相比,具有非接触、读写性好、速度快、数据量大、安全性好
永磁无刷直流电机对电动车的动力性、经济性、安全性和舒适性影响巨大,而其所使用的霍尔传感器芯片又直接关系到电机的稳定性和高效运转。永磁无刷直流电机要求霍尔传感器芯片
近年来,随着技术的发展,SOC概念的逐渐实施导致集成度的提高,越来越多的功能需要被集成到MCU中了,例如要MCU中产生一个高频本振信号,需要在其内部集成一个高频的频率综合器。实际
本论文以提高GaN基激光器的可靠性为主要目的,初步建立了激光器可靠性分析方法,研究了激光器快速和缓慢退化机制,取得了以下研究成果:  1.研究了激光器封装热沉尺寸和芯片结构
二氧化硅是集成电路特别是MOS集成电路中广泛应用的关键介质,用于MOS器件的栅介质和器件之间的隔离。地球周围空间、核爆炸环境、加速器和核能装置中存在的大量高能粒子和射线
学位
沃尔巴克氏体(Wolbachia)是一种专性细胞内生细菌,能够通过宿主卵细胞质母源遗传给子代,仅以无脊椎动物为宿主,广泛分布于陆生节肢动物和丝状线虫中,能以多种方式参与调控节肢动物
该瓜早熟性强,从雌花开放到成熟26~28天,花皮圆瓜,果形圆正,无畸形瓜,无次品瓜,是一极少见高档品种。该瓜有三大特点:一、品质高档,含水丰富,中心含糖13.5%,有入口即化之感,
人免疫缺陷病毒(HIV)蛋白酶抑制剂(HIV PIs)通过抑制了HIV蛋白酶的活性,以防止感染性的病毒颗粒的产生从而抑制HIV。其与逆转录酶组成的高效抗逆转录病毒疗法应用于临床以来,HI
学位
第三代化合物半导体材料GaN因为其优异的特性,得到了越来越多的关注和应用。但由于缺乏合适的衬底材料,通过异质外延制备的GaN膜中普遍存在大量位错密度和残余应力,不利于GaN基
学位
东北亚草地作为重要的草地生态系统连续体,是世界上重要的草地区,地处中高纬度,受气候变化影响大,其植被状况直接影响我国北方甚至全国的生态环境,加强对东北亚草地的监测意义重大