基于序列物理化学特征的启动子预测研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:lialianing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基因表达的过程中,启动子是其必不可少的调控元件,它决定了基因表达的开始时机和表达强度。启动子在改变基因表达、研究代谢调控、构建表达系统等方面都有着举足轻重的作用。随着后基因组时代的到来,大量的基因组测序数据的产生,如何研发出能够快速、有效地辨别启动子位置的方法,是目前表观遗传学的重点研究内容。目前存在的一些计算方法中通常存在一定的局限性,比如没有考虑DNA物理结构特征、没有考虑全局关联关系、没有进行特征筛选分析等,因此本文开发一种新的预测方法来进行启动子的识别。本文针对原核生物σ54启动子识别进行了生物信息学的研究,在引入新的特征提取方法的基础上,分类预测精度得到了较大的提高,而且根据本文使用的方法,开发了在线服务软件i Pro54-Pse KNC,以供相关的研究人员使用。首先,我们使用了一种新的特征提取方法——伪k联体核苷酸组分,即把碱基对的六种物理空间结构参数引入进来,而不是仅仅提取DNA序列的k联体频率数据。然后,我们采用支持向量机的分类算法对启动子识别进行预测,jackknife交叉验证的结果显示i Pro54-Pse KNC在σ54启动子的预测上取得了较高的精度。为了验证本文所开发软件的性能优越性,我们做了一些对比试验,选取了实验已经证实的启动子序列,将其进行了全面的对比后发现,本文研究的方法在各项衡量指标上均取得了较高的精度,从而证明本文所研究的方法具有良好的性能。为了在σ54启动子预测相关领域的研究人员方便地使用本文所开发的软件,我们把i Pro54-Pse KNC软件做成一个在线服务软件,用户可以通过访问http://lin.uestc.edu.cn/server/i Pro54-Pse KNC来免费使用该软件。为了更好地了解m RNA上非翻译区的信息学意义,我们对转录起始位点与翻译起始位点之间的距离分布进行了研究。通过统计和数学证明,我们发现该距离分布符合伽玛分布,这与生命科学中其他的一些分布有着同样的性质,揭示了距离分布的神奇面纱。最后,为了方便其他研究人员对于σ54启动子的研究,我们构建了一个关于σ54启动子的数据库Pro54DB。Pro54DB收集了目前实验上已经证实的σ54启动子序列,并且补充了如调控基因、产物及功能、物种等与其相关的信息。此外我们还提供了关键词搜索、BLAST序列比对、预测、统计等相关功能,完成了数据库的基本需求。
其他文献
【正】芗剧的一代宗师邵江海离开我们已经34年了,当年和他一起为"歌仔戏"(台湾称芗剧为"歌仔戏")在大陆生存和发展而共同奋斗的芗剧老艺人也大都仙逝。半个多世纪过去,大多数
通过重庆市2015年的投入产出延长表,可以分析出重庆市房地产业的地位和特点。本文在假定其他产业部门市场价格不变的情况下,从局部和全局模拟重庆市房地产市场价格提高不同程
北京师范大学地理学与遥感科学学院王民教授回答:价值是个人或团体所特有的,是对欲求事物明确的或隐含的概念,它对现有方式、手段和行动目标的选择具有影响.价值是由相关的态
记忆性强是历史学科的重要特点.要使学生学好历史,可以采用精加工教学策略、再组织教学策略、数码、关键词与复述结合策略等去培养学生的历史记忆力.
介绍了单螺杆压缩机技术在主机与控制系统方面的新成就及单螺杆压缩机的缺点。 The new achievements of single screw compressor technology in host and control system
<正> 潍坊棉纺织厂为了提高并条条干均匀度,应用“正交试验设计”的方法进行试验,找出最好的工艺条件,提高了棉条质量。他们对21支并条罗拉加压重量、后区牵伸倍数和后区隔距
<正>通过二维轴对称模型数值研究液桥耦合热-溶质毛细对流流动特性,采用Level set方法捕获液桥自由表面存在的动态变形效应,分析热Marangoni数与溶质Marangoni数的比值对液桥
会议
党的十九大报告提出的乡村振兴战略,包含着众多新概念、新表述和新要求,彰显了以习近平同志为核心的党中央始终坚持以人民为中心的价值追求,是中国特色社会主义进入新时代,党
Cd2 + 胁迫下绿豆幼苗的生长受到明显地抑制 .根、叶组织的电解质泄漏率随镉 (CdCl2 )浓度的增大而增大 ,丙二醛 (MDA)的含量、脯氨酸 (Pro)的积累也随之而增加 .
近年来,随着电子通讯、光伏、新能源、航天技术的发展,稀散金属锗、镓和铟在这些领域起到的作用越来越突出,且它们的使用量逐年增加。然而,在全球范围内,锗、镓和铟资源十分