多重序列比对和基因芯片数据分析

来源 :南开大学 | 被引量 : 0次 | 上传用户:Y13622229444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组(测序)计划(Humangenomeproject)的实现以及分子生物学相关学科的迅猛发展,越来越多的动植物、微生物基因组序列得以测定,基因序列数据正在以前所未有的速度迅速增长.与此同时综合了分子生物学,半导体微电子,激光,化学染料等领域的最新科学技术的基因芯片,也在以其无可比拟的信息量、高通量、快速、准确地分析基因的能力,也在基因功能研究、临床诊断及新药开发等方面显示了巨大的潜能.而生物信息学分析是大规模基因信息(序列信息,表达信息)分析的主要方法.本文主要结果由两部分组成: 第一部分是针对基因序列的快速多重比对算法及应用. 论文的第一和第二章针对基因序列的多重序列的比对问题,根据序列突变与比对的”模代数”结构理论[1],并在序列两两比对的基础上,应用系统聚类等方法,给出了同源多重序列的超级快速比对算法(简称SMA).该算法可适用于大规模(如m>500,n>10Kbp)的同源多重序列的比对计算,SMA的程序和测试数据我们已在网上公布,并提供比对计算服务.我们分别对83×30Kbp的SARS序列与706×10Kbp的HIV-1序列进行比对,主频3.0GPC机上完成多重比对的计算时间分别为21分钟与34小时,SMA算法在速度上对HMMER有明显优势,而且根据相似比等各项优化指标测试,结果不差于HMMER. 多重序列在完成比对后,对序列的结构分析是多重序列比对后的主要与关键问题.论文的第三章给出了利用突变网络理论来研究多重比对后基因的突变分析.利用该理论和正交化方法来研究基因突变,我们可以得到基因组多重序列比对的突变过程更清楚的描述.我们以SARS病毒基因组为例,说明它们的突变网络系统模型与正交化运算,绘制了SARS基因突变图,并由此得到SARS病毒从早期传播到爆发的基因突变过程. 第二部分是针对基因芯片表达数据的聚类算法和网络调控分析. 第四章针对乳腺癌在转移过程中的基因表达特征的聚类分析法分析,我们改进了k-means聚类算法,给出了kr-means算法,使之具有自动搜索聚类数的功能,并且有助于改善k-means算法的聚类结果陷入最小值的状况.通过对平均聚类误差指标的比较,kr-means要明显优于k-means算法.本文所得到的结果可供乳腺癌诊断与病变分析参考,同时可以应用于小型基因检测芯片的制备,也可以用于构建基因网络调控图. 第五章针对表达数据提取基因调控矩阵从而构建基因网络的问题,我们通过线性微分方程模型可以初步构建基因网络,了解网络结构,提取最显著的信息.然而由于分子生物学的条件限制或者数据来源的限制,导致实验数据不充分,使方程组无解.我们使用三次样条方法,对26例临床、病理资料完备的具有淋巴结转移的乳腺癌基因表达数据进行插值处理,使表达数据满秩,从而使用最小二乘法解出加权矩阵,构建初步的表达基因调控网络.通过对构建的基因网络的初步生物学和医学分析表明:乳腺癌转移的形成是由多基因异常引起多条传导通路异常,致使细胞恶性转化的结果,这与生物学上公认的看法是相一致的.利用此线性模型方法对基因表达谱进行分析具有一定可行性,在认识乳腺癌转移机制,乳腺癌诊断和治疗方面具有一定的理论和应用价值.
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
瓦斯水合物在生成过程中会受到很多种因素的影响,其中最主要的三个因素是瓦斯组分、温度和压力。由于其生成过程具有随机性、弱相依性和突变性等特点,运用以往的热力学相平衡
到东莞市中堂镇潢涌村采访广东省十届人大代表、村党支部书记黎树根,在村办公室,笔者一眼望见中共东莞市委、市人民政府授子的三块闪着金光的奖牌:2002年度村级两委工作实绩
本文以经济增长理论、投资经济学、税收筹划和财务管理等相关理论为依托,从微观分析入手,运用数学建模的方法,在企业存量资本模型的基础上,引入税收变量,建立征税状态下的企业资本
BIM技术就是建筑信息模型技术,将该技术应用在建筑工程中,不仅能够对工程的施工情况有一个直观的模拟,还能够对建筑工程的施工流程以及管理措施进行一个仿真,这样就能够将整
对策论中,随机合作对策逐渐成为研究的热点,并受到了广泛的关注,在随机合作对策中得到了广泛研究的就是在不确定支付条件下,局中人如何分配大联盟的赢得。对于这个问题,人们提出了
股票市场中庄家散户的博弈对股票市场的总体发展态势有重要影响.本文运用动态博弈理论对庄家与散户之间的博弈行为进行了研究.首先介绍了离散动态博弈、确定性微分博弈、随机
虽然近年来我国港口得到了迅猛发展,但是科技和创新方面落后于世界著名港口,国际物流专业人才缺乏,从业人员素质不高,创新能力不强。文章基于我国高职高专国际物流专业的特点,借鉴
解读党的十六届四中全会《决定》,有一个首要的也是最基本的问题:党的执政能力究竟是什么?其实,对这个问题并不需要绕很大的弯子来讲,更不需要离题太远,去搞得很玄乎。开宗
在建筑工程施工中,升降机的主要作用是运载施工人员以及施工材料设备,其安全性能与常规载人电梯相比有一定的差距,因此如果安全管理工作不到位,就会发生严重的安全事故。对此