基于信息论的基因调控网络构建算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:s5df45sd6546f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物测序技术的不断进步,基因表达数据呈爆炸式增长,海量数据的出现为基因调控网络的构建提供了可能。详细深入地研究基因调控网络不仅能够帮助人类揭示各种疾病的发病机理,而且有助于人类探索生命的内部本质。因此,从数据中挖掘出基因调控网络信息已经成为生物信息学研究的热点和重点。当前存在多种模型对基因调控网络进行构建,其中基于信息论的方法能有效衡量基因间的非线性关系并具有计算简单等特性,已成为构建基因网络强有力的方法。本文以时序基因表达数据和静态基因表达数据为研究对象,对基于信息论的基因调控网络进行建模,以提高预测准确度为最终目标,设计有效而合理的推断算法,具体工作包括以下几个方面:针对基因间的协同调控作用,使用时序基因表达数据,提出了一种基于信息论准则的协同调控动态性的研究算法。该算法分为三步:首先,确定基因间的调控时延,计算出互信息矩阵。其次,使用每个互信息值作为阈值,建立模型,并使用MDL打分函数对所有模型打分,选出分值最低的模型。再次,精简模型步骤;与传统的信息论方法不同的是,该算法融合了数据处理不平衡及条件互信息,以处理迁移效应和分散效应的影响;同时,通过存储条件互信息值有效地克服了因条件互信息值偏低所导致协同调控作用被误删的缺陷。该算法在IRMA数据集和酵母细胞数据集上的实验表明,它能够有效推断出基因间的协同调控现象,更符合生物意义。针对静态基因表达数据集不能确定方向性的缺陷,提出了一种信息熵与微分方程模型相结合的通路一致性构建方法。该算法融合了微分方程模型和信息论思想的优势,主要分为因果模型选择和优化过程两个阶段。因果模型阶段使用改进的通路一致算法,利用通路一致算法在计算上具有高效性的优势,克服了它在计算高阶条件互信息时出现的误差值以及输入次序不同而引起的推断结果差异性缺陷。在优化阶段,为了克服信息熵方法不能确定方向的缺陷,采用微分方程模型构建最终拓扑图。采用这种策略,既降低了微分方程模型的搜索空间,又确定了基因间的调控方向。使用DREAM数据集对该算法进行实验,实验表明该方法有很好的预测效果。
其他文献
随着中国特色社会主义进入新时代,高校生态文明教育显得尤为重要。中国传统文化中的生态文明观、马克思主义的生态文明观、中国共产党的生态文明观是高校生态文明教育的理论
近年来,随着我国市场经济迅速发展,假冒伪劣产品已经严重干扰了市场经济秩序。防伪技术应用而生,通过防伪技术的应用,可以保护企业品牌和消费者合法权益。光学字符识别技术已
<正>2019年10月12日,由中国高校影视学会、内蒙古广播电视台主办,中国高校影视学会广播专业委员会、暨南大学新闻与传播学院、中国传媒大学文化产业管理学院承办的中国高校影
本文从产教融合的阶段、模式、方法、策略等层面探究“政校企”合作情况和实际做法,重点关注利益机制、激励机制、约束机制、情感机制、运行机制、综合评价机制等校企融合长
工笔花鸟画是我国传统绘画的重要体系之一,其运用线条进行勾描与渲染,完成花鸟结构与色彩的塑造,在用笔和绘制技法方面有着工整与纤细的特征。该文主要探讨中国工笔花鸟画中
为了推动企业的深化改革,提高对民品投资的经济效益,航天总公司审计局于1997年开展了民品投资效益审计调查。在此基础上,为了进一步剖析民品企业的管理状况,我们对北京天云汽车改装厂
付某,女,2008年10月9日初诊。间断性四肢酸痛麻木3年,加重3天。患者3年前因受寒出现四肢酸痛麻木,伴头项、肩背、肢体僵硬不舒,腰膝酸冷,下肢无力,遇寒加重,舌淡暗,苔薄白,脉沉细涩。颈
报纸
<正>1水处理系统为什么要消毒近些年来,关于透析用水和透析液的质量问题被透析专家所重视,认识到使用污染的透析用水和透析液可以引发一系列急性和慢性并发症。而透析机和水
在经济高速发展的今天,钢铁材料是各类工业领域必不可少的金属材料之一。其中,Q235钢是一种重要的结构工程钢,被广泛应用于制造钢筋、建造厂房房架和高压输电铁塔,并且,其在桥梁、车辆和船舶等领域也被大量使用。但是,由于其常在潮湿和海水等侵蚀性环境中服役,其腐蚀失效行为备受关注。导电高分子聚合物聚吡咯(PPy)因其具有无毒、稳定性强以及良好的氧化还原能力等优点渐渐被应用到金属腐蚀防护领域。本文主要研究内
随着中资商业银行实力的不断提升,中资商业银行的国际化发展已是必然趋势。本文通过对当今中资商业银行国际竞争力现状进行调研,结合银行国际化发展阶段理论对中资商业银行发