基于进化神经网络的真核生物基因启动子位点确定模型的建立

来源 :重庆大学 | 被引量 : 0次 | 上传用户:cynthia0737
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因组计划的开展,产生了巨量的基因组信息。分析这些信息是人类基因组研究必不可少的重要工作。作为其中的一个工作,真核生物基因启动子区域的识别是一个难点。为了从基因中分割外显子序列,启动子这一提供生物学功能的富含信息的信号序列是必不可少的。本文在分析了真核生物基因启动子的相对保守序列的基础上,利用真核生物基因启动子的TATA盒、CAAT盒和GC盒的相对保守性和其统计学事实,结合进化神经网络建立了真核生物基因启动子的识别模型,并且设计了计算机仿真程序。主要的工作和结论如下:(1) 由于真核生物基因启动子区域的保守序列具有一定的假阳性,利用传统的基于物理化学原理的方法无法把序列间的关系和相关特征表现出来,神经网络这一具有自学习、自适应能力的系统可以很好的解决此弊病。但是神经网络存在训练速度慢,易陷入局域极小值和全局搜索能力弱等缺点。在研究了遗传算法后,发现它可以较好地改进以上的缺点。所以在此基础上,利用进化神经网络,采取BP算法和遗传算法建立了真核生物基因启动子识别模型。(2) 对设计好的识别模型进行了计算机仿真程序设计,利用从EPD(真核生物启动子数据库)下载的数据对建立好的识别模型进行了训练,然后用对于模型未知的数据对模型进行了预测,结果表明识别模型的建立是比较成功的。(3) 为非编码区其它组分的智能确定模型的建立提供了一个通用的模版。
其他文献
期刊
为改善胶原的机械性能、增强胶原的生物稳定性,本实验对胶原分别采用了热交联法(DHT),1-乙基-3-(3-二甲基氨丙基)-碳化二亚胺交联法(EDC)以及热交联/1-乙基-3-(3-二甲基氨丙基)-
期刊
图像增强能够改善图像质量,这就要求其能够按照特定的要求对需要的图像信息进行突出,同时,削弱或去除不关注的图像信息。人类的视觉信息处理机制可以有效的对图像进行增强。早期
期刊
根据萎缩肌肉肌纤维横截面积减小以及肌肉由于卸载而出现收缩等性质,通过中心导体模型和电缆方程揭示肌肉萎缩和生理肌电参数之间的相关联系.奠定了肌肉萎缩引起肌电幅度增加
该文结合宝钢一钢不锈钢生产的流程,通过对AOD-VOD不锈钢冶炼过程的数学模拟,探明了脱碳反应行为、钢液中铬氧化行为及炉气行为,并且通过调整模型参数来模拟不同冶炼条件下的
学位
目前,中国基质栽培网纹甜瓜的面积逐渐扩大,但其标准化的肥料供给技术体系尚未建立.由于钾素施用量对基质栽培网纹甜瓜的营养生理作用研究不甚系统,使得钾肥的量化施用难以实
超声图象(Ultrasonic Image)的质量(就分辨力等而言)仍远远不如其他影象技术。要实现医学超声成象技术的突破,需要在成象机理上下功夫。 有诗云:“问渠哪得清如许,唯有源头活