基于互信息的基因调控网络构建方法研究

来源 :上海大学 | 被引量 : 18次 | 上传用户:wdelaopologo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
系统生物学是一个新兴交叉学科,是从系统的角度研究生物系统中所有组成成分(基因、mRNA、蛋白质、生物小分子等)之间的相互关系和作用机制。基因调控代表生物体遗传、发育、进化、疾病等过程中的基因-基因相互作用或因果关系,是分子生物学和系统生物学研究的重要间题之一。基因调控网络构建(或逆向工程)的目的正是从基因表达数据中挖掘基因与基因相互作用网络,也是通过高通量数据研究生物机理的重要瓶颈。本文基于互信息理论,针对当前基因调控网络构建方法中存在的各种缺点,提出了几种基因调控网络构建模型和算法,提高了基因调控网络预测的准确度。本文的工作主要集中在以下三个部分:(1)提出了一种结合条件互信息和路径一致算法的基因调控网络构建方法。该方法首先利用能够定量非线性相关性的条件互信息来估计基因对之间的调控强度,然后利用路径一致算法去除间接调控关系,最后得到具有稀疏性拓扑结构的基因调控网络。在基因表达数据的高斯分布假设条件下,条件互信息可以通过一个包含基因表达值协方差矩阵的简单模型来计算。模拟数据和大肠杆菌(E.coli)数据上的结果均表明该算法具有较高的性能。该方法可以通过路径一致算法逐步提高基因调控网络构建的准确率,并且能够将基因调控网络中的间接调控关系尽可能多地删除。(2)提出了一种基于逐步优化模型和互信息的基因调控网络预测高性能算法。该方法首先利用互信息值从候选调控因子中滤除噪声调控子,然后利用逐步优化模型逐步去除冗余调控因子并重新估计调控系数,最后整合得到的线性和非线性调控系数来挖掘可靠的调控关系。模拟数据(包括线性和非线性数据)和大肠杆菌(E.coli)基因表达数据的分析均表明了该算法预测基因调控网络的高准确度。该方法克服了一般互信息类方法无法识别调控方向的缺点,而且拟补了线性回归类方法的非线性损失。(3)提出了一种准确定量调控关系和强度的基因调控网络构建新方法。该方法通过微调条件互信息来准确定量变量之间的因果强度或相关性强度,对于调控关系给出了一个简洁的计算模型。提出的网络构建方法不但能够准确定量因果强度,而且能够保持基因调控网络的稀疏性结构。模拟数据和大肠杆菌(E.coli) SOS数据分析均表明该算法提高了预测的准确度。该方法的主要贡献在于通过准确定量随机变量之间的因果强度大大提高了基因调控网络构建的准确度。
其他文献
以头发梳理功测定和红斑消退试验检测从天然植物中提取的防晒成分CRCSL对头发防止紫外线损伤的保护作用。结果表明,CRCSL能有效地保护头发免受紫外线的损伤,并能够促进皮肤红斑
住房城乡建设部“装配式建筑技能人才需求项目(课题)”日前开题。该课题由中国建设教育协会承担,多位长年从事装配式建筑研究与开发的高等院校教授和企业负责人组成课题组,从新形
葡萄糖转运蛋白(GLUT)是介导细胞进行葡萄糖摄取的主要载体,在人体各组织、细胞中广泛存在。目前研究发现GLUT家族的成员有十四种,其中葡萄糖转运蛋白-1(GLUT-1)是已知体内分
目的分析非酒精性脂肪肝(NAFLD)患者和健康对照组的一般特征和临床指标,探讨其相关危险因素,为防治提供依据。方法根据B超检查诊断,体检患者分为正常对照组(4 086例)和NAFLD
《普通高中语文新课程标准》出:"语文具有重要的审美教育功能高中语文课程应关注学生情感的展,让学生受到美的熏陶,培养自觉审美意识和高尚的审美情趣,培养美感知和审美创造的
鉴于建筑CAD课程在应用型本科院校建筑工程类专业中的重要性,分析当前教学中存在的不足与主要问题,对该课程模块化教学实践,从教学内容的改革措施、项目模块的划分、实训教学
寒山诗及其译本对国内外读者的影响之巨大已经引起了学界对其人、其作品产生了极大的兴趣,而比尔·波特的英译本更是以其独特的视角在国外受众中引起了巨大反响。在其英译本
<正>国家安监总局局长杨焕宁在今年全国安全生产工作会上特别指出,加强安全生产宣传教育,是提高全社会安全文明素质、培养安全行为自觉的必然要求,也可以说是基础中的基础。
高职院校中跨栏教学一直是一个难点,尤其是起跑后跨第一栏对整个过程的影响较大。本文着重分析了这个环节的重点和难点及一些教学方法。
期刊
目前,全球制造业竞争格局正面临重构,为了提升我国制造业国际竞争力,需要进一步提高制造业能源生态效率。本文考虑生产过程中的非期望产出,将制造业废气、废水、固体废物排放