论文部分内容阅读
基因调控网络可以从基因互作用的角度来剖析生物生命现象及其特定的生理活动,是功能基因组学和生物信息学等领域的重要研究内容。基因调控网络重构和解析有助于揭示基因功能、解析基因间作用,为疾病发病机理和相关药物设计提供支持和帮助。论文利用复杂网络、数理统计和模式识别等理论方法,从基因表达谱数据出发,对基因调控网络构建方法进行了深入研究,主要贡献如下:1、针对目前基于贝叶斯网络模型构建基因调控网络,时间复杂度较大、假阳性边较多问题,提出一种基于kNN局部贝叶斯网络模型的基因调控网络重构算法(LBN)。LBN算法首先采用互信息预测初始基因相关网络,根据kNN分解网络为一系列子网络;然后在子网络上利用贝叶斯网络模型构建局部基因调控子网络,整合这些子调控网络形成初始基因调控网络;利用条件互信息去除网络中的冗余假阳性边,迭代局部基因调控子网络及条件互信息过程,整合生成较优结构的基因调控网络。模拟数据与真实生物分子数据上,仿真实验结果表明:相对于目前性能较优的ARACNE、GENIE3和NARROMI等算法,LBN算法可以高精度、快速预测中小规模基因调控网络。2、针对基于信息论的基因调控网络构建方法,假阳性边较多、不能推测基因调控方向、限制网络搜索空间问题,提出一种基于有序条件互信息和基因有限父节点的快速基因调控网络推测算法(OCMIPN)。OCMIPN算法首先采用有序条件互信息推测初始基因调控相关网络;然后,根据基因调控网络拓扑结构先验知识,限制每个基因节点的父节点调控数量;最后,采用贝叶斯模型结构推断基因调控网络拓扑结构。模拟数据与真实生物分子网络数据上,仿真实验结果表明:OCMIPN算法不仅能高精度构建基因调控网络,而且时间复杂度较低,其性能优于LASSO、ARACNE、ScanBMA和LBN等现有流行的基因调控网络构建算法。3、针对互信息过高估计基因节点间的相关性、条件互信息过低估计基因节点间的相关性,导致重构出的基因相关网络包含较高的假阳性率和假阴性率问题,提出一种基于部分互信息和贝叶斯打分函数的基因调控网络构建算法(PMIBSF)。PMIBSF算法首先根据基因总个数生成初始基因完全网络图;然后,采用部分互信息删除初始基因相关网络中的冗余关联边;最后,采用贝叶斯网络互信息测试打分函数学习贝叶斯网络拓扑结构,快速预测基因调控网络。在计算机模拟数据集与真实生物分子数据集上,仿真实验结果表明:PMIBSF算法性能优于目前较流行的LP、PC-alg、NARROMI和ARACNE等算法,而且预测出的基因调控网络精度较高。4、针对基因节点规模很大的基因调控网络(包含几百个,甚至几千个基因节点)重构算法时间复杂度过大问题,提出一种利用共有基因模块构建大规模基因调控网络算法(CGMN)。CGMN算法从基因表达数据出发,应用六种常用聚类算法把基因表达模式相似的基因聚类成功能模块,找出六种聚类方法的共有模块,并将每个共有模块作为一个功能模块基因节点,采用LBN算法构建功能模块基因-基因调控网络。大规模细胞周期基因表达数据集上,仿真实验结果表明:搜索共有模块压缩基因节点数目策略,能够有效降低大规模基因调控网络重构时间复杂度,CGMN算法可有效构建大规模基因调控网络。