基于KEGG的代谢通路最短路径问题的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:windlian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成,人们逐渐从对结构功能组学过渡到功能基因组学的研究。科研人员也在长期的研究中积累了大量的生物学知识,建立了许多比较完善的数据库。适当的利用这些数据库,就可以快速的寻找到研究上所需要的数据资源。生物信息学发展迅速,特别是近几年围绕微阵列芯片展开的广泛而深入的研究,展现了计算机和数学工具在解决生物问题时的强大威力。许多基因表达谱数据可以公开获得,这样也为基因研究增加了便利。由于人类对健康要求的提高和医学研究的深入,复杂疾病的致病机理的挖掘很有必要。本文研究的是基于KEGG的代谢通路最短路径相关的问题,重点是挖掘在代谢通路具有最短路径性质的基因簇在功能上是否具有某种相关性。本文从mRNA和蛋白质两个层面上对复杂疾病致病基因进行挖掘,寻找对复杂疾病差异表达水平显著同时又在代谢通路上满足最短路径性质的基因簇。首先,基于动态规划算法设计一个代谢通路近似匹配算法,在KEGG的代谢网络中寻找距离最近的最佳匹配。然后,对基于基因表达谱的差异表达基因挖掘原理和方法做了研究。最终,将研究核心集中在挖掘和KEGG的代谢通路最短路径问题有关的差异表达基因簇。用统计学方法得到差异表达基因集,特征基因集在KEGG代谢通路上符合最短路径条件的基因簇和随机基因簇用机器学习的方法评价他们的分类效能,比较他们之间分类效能的差异,最终选取分类效能比较好的若干基因簇作为挖掘结果。
其他文献
随着Internet在人们生活中各个领域内的应用,网络安全也越来越引起世界各国的关注。计算机病毒在不断的产生和传播,计算机网络被黑客非法侵入,重要信息资料的泄密,甚至造成网
智能交通系统(ITS)是交通运输领域研究的前沿课题。为实现ITS对车辆的实时、动态管理,国际上专门开发了适用于ITS领域的短距离无线通信协议,即专用短程通信(DedicatedShort-Ran
嵌入式系统的高可信性是指系统具有高安全性、高可用性、高可靠性、高可维修性和高健壮性等特征。随着嵌入式技术的飞速发展,嵌入式计算机渐渐渗透到人们生活的方方面面。但
网络教学是利用计算机手段和网络技术,协助时空分离的教师和学生共同完成教学活动的一种新型教育形式,是e-Learning发展的趋势。基于Web的在线课件系统是未来多媒体课件的主要
学位
随着Internet网信息的急速膨胀,各项和Web有关的服务也都逐渐增多,Web信息在很多方面得到了广泛的应用。在本文中,我们探索了网络文本之间的相关度计算方法。重点讨论了以下
煤炭生产在我国工业经济活动中起着重要的作用,社会各界和政府对煤矿安全生产的重视使得实际生产中对于矿井下人员精确定位系统的需求越来越高,精确定位成为矿井下人员定位系
搜索引擎给互联网带来了巨大的变化,使得人们能够在浩如烟海的知识世界中,获得自己想要的信息。搜索引擎技术也已经成为信息检索的热门技术。RSS信息聚合技术在新闻和博客领域
学位
二十一世纪世界经济发展的一个重要特征是竞争。在竞争日趋激烈的环境中,供应链中的分销企业如何获取有效的市场信息,如何准确预测分销需求和制定行之有效的分销计划,如何合理规划分销体系的业务,是制造企业和分销集团面临急需解决的重要问题。伴随互联网络的出现和飞速发展,世界经济进入到一个崭新的以信息化为主要特征的电子商务时代。新的形势在加剧企业竞争程度的同时,也给企业所面临的问题提供了新的解决思路。本文首先探