基于序列信息的转录因子结合位点和启动子理论预测

来源 :内蒙古大学 | 被引量 : 6次 | 上传用户:dxw2814
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因转录调控一直是生物信息学研究的一个重要内容,转录因子结合位点和启动子的识别是研究基因转录调控的重要环节,是构建基因调控网络的一个核心问题。本文基于已知的转录因子结合位点和启动子序列数据,从序列信息出发,提出了整合位点保守型参量和位置权重矩阵预测转录因子结合位点的位置权重矩阵打分函数方法以及联合位置权重矩阵和离散增量预测启动子的支持向量机方法。 基于转录因子结合位点序列通常比较短且保守,引入矩阵模型描述转录因子结合位点的特性,同时依据转录因子结合位点的位点保守性各不相同,将碱基保守性参数引入矩阵模型,从而提出预测转录因子结合位点的位置权重打分函数算法(PWMSA)。 首先将四种碱基随机出现的频率作为背景频率,以单碱基位点保守性参量结合单碱基位置权重矩阵的PWMSA算法对22种转录因子结合位点进行预测,总体Self-consistency检验为 87.59%,10-foldcross-validation检验为85.48%。 然后考虑到基因序列中的四种碱基并非随机出现,以四种碱基实际出现的频率作为背景频率,用PWMSA算法对酵母九种转录因子结合位点进行预测,Self-consistency检验预测成功率达83.14%,10-foldcross-validation检验预测成功率为77.51%。同时,引进两种最新的评价指标,将PWMSA算法与现有的10种预测转录因子结合位点的软件进行比较,结果表明PWMSA算法的评价指标均高于现有的算法,在核苷酸和结合位点片段两种评价水平上,预测成功率分别高出其他算法4%,7%个百分点。 考虑到转录因子结合位点之间存在碱基相互作用共同贡献与蛋白的亲和力,利用已知的9种酵母转录因子结合位点序列构建近邻核苷酸二联体位置权重矩阵,计算位点近邻二联体核苷酸保守性参量,使用PWMSA算法对9种酵母转录因子结合位点进行预测,Self-consistency检验和10-fold cross-validation检验预测成功率分别达到88.04%,81.10%,明显高于单碱基位置权重矩阵的结果。 基于启动子序列的内容特征和信号特征与非启动子序列的区别,利用离散量方法提取启动子序列的内容特征;构建核心启动子元件的位置权重矩阵,使用位置权重矩阵提取启动子序列的信号特征,最后提取启动子和非启动子序列碱基组份特征。构建了基于综合启动子序列的内容特征和信号特征预测启动子序列的支持向量机分类器,并对人类Pol Ⅱ启动子进行预测,10-fold cross-validation检验为95.70%,对另外选取的独立测试集预测成功率为98.30%,同时与现有的7种预测启动子的软件和算法进行比较,我们的算法预测成功率敏感性为97.00%,特异性为97.98%,结果明显优于现有的预测算法和软件。
其他文献
在冬季,许多动物会采用冬眠的策略应对冷环境和食物来源不足,通过这种方式可以节省90%的能量。动物冬眠时通常会伴随代谢速率下降、体温降低、心跳速率减慢及呼吸频率下降等生理
安祖花终年开花,且花枝独特,是极具价值的观花观叶植物。但在栽培过程中,常常受到病虫的危害,严重影响其产量和质量。利用农杆菌把植物系统获得性抗性的关键调节基因NPR1 转
你“哈韩”吗?在“韩流”劲刮的今天,从《天桥风云》到《冬日恋歌》,韩国影视明星越来越为观众所熟悉。如果你想顺应潮流,做一个或半个“哈韩”族,不能不知道宋慧乔和全智贤
期刊
学位
摘要:高中英语学习的目的不仅是知识的积累,同时也是英语应用能力的培养,听、说、读、写都同样重要。但是由于高中应试考察内容往往不包括口语,使我们将学习的重点放在了听力、阅读、书写方面,口语成为英语运用的薄弱环节。本文结合我们在日常英语口语学习中的经验,分析学习方式、方法中存在的不足,探讨提高英语口语学习成效的策略。  关键词:高中英语;口语;学习成效  在英语学习的过程中,虽然在阅读、书写方面有着明
网易是中国最早的互联网公司之一,但在电商行业却是晚来者。在竞争对手和消费者面前,网易在电商领域正在上演一出属于自己的“老人新戏”。  作为网易邮箱15年的资深用户,最近每次打开邮箱都能看到“考拉海购”和“网易严选”两个选项。好奇下,也多次浏览了网页,并在考拉第一次下单,主要目的是体验一下网易电商的产品与服务,按汽车媒体和3C媒体流行的说法,这叫“亲测”。整体感觉是很不错的,于是说了几句好话附带一张
期刊
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
土壤盐渍化是影响农业生产和生态环境的主要非生物逆境之一。随着人口的增加和耕地的减少,如何开发利用盐渍化土壤已成为农业生产和环境生态亟待解决的问题。利用生物技术深入开展种质资源的耐盐性研究,挖掘其中优异耐盐相关基因,培育耐盐作物新品种,是改良和利用盐渍化土地,增加粮食产量和维持农业可持续发展最为经济有效的策略之一。本实验以102份小麦地方品种群体为研究材料进行耐盐性鉴定,选出鉴定结果呈中间型的群体进
本实验菌种采自胜利油田,在15℃下添加油泥沙为碳源富集培养和在35℃下添加正十六烷烃富集培养,经多次传代后获得了稳定菌群D15和Z35。D15菌群和大庆原油[60:1(ml/g)]在15℃产