基因组信息的计算机可视化若干关键技术研究

来源 :东北大学 | 被引量 : 1次 | 上传用户:jupming_snoopy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着生物测序技术的快速发展,基因组序列数据呈现爆炸式增长,迫切需要运用最新的计算机技术为分析和处理海量基因组数据提供有效的手段,以便从中获取有价值的信息。计算机可视化方法以其直观、快速的特点,为基因组序列的研究提供了一种新的研究手段,受到了越来越多的研究者的重视。采用基因组序列的可视化方法,能够将难以分析理解的基因组数据转变成直观的计算机图形图像,从而可以帮助研究人员快速发现隐藏在基因组序列中的特征信息。本文围绕基因组序列数据的计算机可视化方法,展开了一系列的研究。主要完成了以下几个方面的工作。(1)提出了一种基因组序列GC含量的可视化表示方法,GC含量双三角形(GCDT)方法。该方法借助计算机可视化技术,将基因组序列中GC含量的分布和变化信息转换成图像表示。图像中不同位置的像素点颜色代表基因组中不同片断的GC含量值,从而使得一幅图像能够同时表示数量众多的GC含量信息。对于给定的基因组序列,GCDT方法将不同尺度窗口下统计得到的一系列GC含量值序列,依据一定的规则用一幅由彩色的下三角形和上三角形组成的矩形图像中的所有像素点表示。在生成的图像中,能够非常清晰地观察到GC含量沿基因组序列的分布和变化情况,从而为直观、快速地观察和分析基因组序列的GC含量带来了极大的方便。这一方法为基因组GC含量的研究提供了一种很好的工具。(2)提出了基于GCDT方法的GC等容线(isochore)边界识别算法。GC等容线结构是一些物种基因组序列的重要特征,识别相邻GC等容线之间的边界是GC等容线研究的基础。依据GCDT方法提出的GC等容线的边界识别算法,综合考虑了多个尺度窗口下GC含量的统计信息,使得所选择的边界更为合理,对于GC等容线研究有着重要的意义。(3)应用基于GCDT的GC等容线边界识别算法,得到了人类全基因组的GC等容线结构图谱。在人类基因组的GCDT图像中,可以非常清晰地观察到马赛克结构的存在,相邻GC等容线之间的分界线也清晰可见。这表明人类基因组中确实存在GC等容线结构。运用GCDT边界识别算法,对人类基因组的GC等容线结构进行了系统的识别,找出了每条人类染色体中的GC等容线结构的边界。GC等容线与许多基因组的功能相关,因而GC等容线结构的图谱对于人类基因组序列的研究很有意义。(4)提出了适用于一般基因组特征量的GIDT可视化方法。以GCDT方法为基础进行了扩展,提出了一种适用范围更广的可视化方法,可以应用于基因组的GC含量、各种碱基及其组合含量、碱基倾斜方向和程度、SNP等基因组特征量的可视化表示。GIDT方法可以将基因组的特征信息以非常直观的方式在计算机屏幕上的二维图像中显示出来,为一般基因组特征量研究提供了一种有力的工具。(5) DHPC可视化方法的研究与实现。DHPC方法利用Hilbert-Peano曲线能够填满整个正方形区域的特性,将一维的基因组序列映射成为二维的平面图像,为展示大尺度基因组序列的全面信息提供了一种很好的方法。在所生成的DHPC图像中,可将基因组序列的构成信息一次性展现出来。基因组序列的全局和局部特征信息都可以在图像中展现出来。对DHPC算法的重点和难点进行了分析,讨论了其中一些关键因素,并介绍了DHPC软件系统的实现。(6)设计并开发了本文所介绍的基因组可视化方法的软件系统。本文中所介绍的几种可视化方法,都进行了实际的软件系统的设计与实现。文中分别介绍了这几个软件系统的基本构成、模块功能、工作流程以及运行环境,并对软件设计与实现中一些重点和难点进行了分析。在本文的研究工作中,对基因组的可视化方法的若干关键问题进行了有益的探索,并在基因组的特征量的可视化表示和全基因组的可视化表示方面做了较为深入的研究。提出了几种实用的可视化方法,为基因组的研究提供了新的工具和手段。将这些研究方法应用到实际当中,取得了相当好的效果。这表明基因组的可视化方法和技术有着非常突出的优点,在基因组研究领域有着广泛的应用前景。本文在基因组的可视化研究方面进行了有益的尝试,今后将会进一步对这些方法进行完善,并在更多的应用领域进行努力和尝试。
其他文献
随着我国经济的快速发展,经管类相关课程已经成为大多数高等院校普遍关注的重要教学内容。然而,由于管理学科的独特性质和教学过程中的现实因素,部分高校管理学课程教学效果不佳
2014年8月10日,国务院印发了《关于加快发展现代保险服务业的若干意见》,对保险业的发展提出了新的要求,标志着保险行业进入了转型阶段。在新形势下,保险公司亟需提升核心竞
QT80A塔式起重机回转驱动齿轮轴断裂失效及改进建议辽宁省本溪市本钢三建周德祥1我单位于1988年购入塔机一台,1989年9月安装使用,1991年1月9日回转驱动齿轮轴断裂失效。使用时间14个月。断裂时环境温度
经皮穿刺射频消融术及臭氧髓核溶解术,因其具有操作简单、并发症少、创伤小等特点得以临床广泛应用。我院自2007年3月-2009年12月应用射频椎间盘内消融联合臭氧髓核溶解术治疗
随着我国经济的不断发展以及人们生活水平的不断提高,很好地促进了桥梁工程的发展。在桥梁工程发展的同时,其结构设计方面是桥梁工程的重要内容。在对其结构进行设计的过程中,必
在对大规模流体数据进行可视化时,特征检测能够加速数据分析速度,并且能够对大量杂乱数据进行有效可视化。在数据集中确定特征的方法有两种:局部特征法和全局特征法。局部特征
以栽培的 2年生细叶百合 (Lilium pumilumDC .)鳞茎为扦插材料 ,将鳞茎分内、中、外三层剥取其鳞片 ,观察鳞片在不同温度、光照强度、基质中的扦插生小鳞茎的效果。扦插 40d
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正> 在考虑选用何种施工机械进行施工,以确定施组方案时,需要对各种施工机械进行比较分析。如果只单纯对机械的技术规格、使用性能作比较,或者凭借经验和习惯,往往不能得出