基于UniGene的整合系统

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:john0620
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因组时代所关注的主要问题之一是基因功能的研究.然而,高质量的cDNA序列是进行基因功能研究的基础.近年来,大量实验室获得了较多的cDNA序列和EST序列.但是,由于这些EST序列的质量通常较低,例如含有载体序列、含有非标准碱基,甚至由于实验原因导致不同基因片段形成嵌合体等,导致基于EST序列的cDNA序列拼接存在较多的问题.甚至已有数据库中的cDNA序列也存在质量较差的情况,尤其是开放阅读框架错位等.因此急需一套优化的方案解决该问题,针对此问题,我们提出一套利用测序质量较高的基因组序列进行参考分析的解决方案,并通过对UniGene数据库中的部分数据进行测试,确认了该方案的有效性,为构建高质量全长cDNA序列数据库以及进一步研究真核基因的可变剪接形式奠定了重要基础.具体而言,基于Linux操作系统,采用改进Blast算法将EST序列和基因组DNA序列进行比对,用基因组DNA序列修饰EST序列,随后利用Phrap软件实现EST序列的装配,形成高质量cDNA数据库.由此可为后序可变剪接的研究提供高质量的数据源.
其他文献
摘要Schwarzanberger[Sw61]证明了代数曲面X上每一个满足c1(E)∈NS(X)的向量丛E上都存在一个全纯结构.对于非代数曲面来说,正如Elencwajg-Forster[EF82]和Banica-Le Potier[B
节能降耗是当前经济模式下企业提高竞争力的有效手段。简单介绍了南芬选矿厂皮带输送系统的变频调速技术改造,对比原设备运行状况,进行变频技术改造之后,取得了一定的经济效
《元史·许衡传》载:元世祖忽必烈年间,曾任集贤大学士兼国子监祭酒的许衡,在盛夏的一天偕友赶路,烈日当头,口渴难熬。路旁有梨树,众人皆摘而啖之。唯许衡端坐树下,不为所动
如何确定K群中的有限阶元是代数K理论的一个重要课题.J.Tate证明了若整体域F包含n次单位根ζ,则KF中任意n阶元都可写成{a,ζ},其中a∈F.Suslin将这一结论推广到任意包含ζ的
该文所涉及到的图均是有限的,无向的,简单图.该文主要以下几部分组成:1.直径为2的无爪图的导出匹配可扩性;2.结合图的导出匹配可扩性;3.2n个点3n-1条边的导出匹配可扩性的刻
近年来,眉山市在注重抓好大案要案的同时,重心下移,狠抓基层党风廉政建设工作,切实加大乡镇层级的党风廉政建设力度,收到明显成效。群众利益无小事2001年开始,眉山市改革信访
排队论是运筹学最重要的分支之一,在各个领域都有着广泛的应用.近些年来,随着科学技术以及数学学科的不断发展与创新,涌现出大量的复杂系统的设计与控制问题.这同时也使得排
2003年7月23日,哈尔滨铁路局牡丹江铁路分局迎来了第16任分局长———于孔峰。在上任后的第一次全分局可视电话会议上,这位面容清癯的新局长向全分局干部职工郑重立下承诺:“
假设v和λ是给定的正整数,K和M是给定的正整数集合,三元组(V,g,B)是一个成对不平衡可分组设计,其中V是一个v元集,g构成了V的一个划分,定义区组是留中的元素,定义组是g中的元素,并且需要
余代数的概念来源于对代数的进一步拓展.1976年,J.A.Green将于代数的概念引进并初步研究了其结构.1977年,M.Takeuchi又给出了与余张量积和Cohom函子的概念和相应的性质,完善