单核苷酸多态性识别软件设计与实现

被引量 : 1次 | 上传用户:fiona_01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,新一代基因测序技术快速发展加快了生物科学家对基因的研究。随着千人基因组计划的完成也标志着人类进入了后基因组时代,在后基因组时代中科学家们主要研究影响个体特征的基因组序列。单核苷酸多态性(SNP,Single Nucleotide Polymorphism)作为重要的遗传标记之一,从基因组序列中识别与分析SNP研究更是受到了广泛关注。越来越多的方法被应用到SNP位点的识别,然而,大多SNP的检测方法,价格昂贵,速度较慢并且在海量的SNP刷选中很难对SNP位点进行准确定位。因此,本文对如何在基因组序列中更加快速、准确的识别SNP位点信息开展了研究:本文基于二代测序技术,针对在基因组序列中识别SNP位点存在的问题,本课题组重新设计并优化识别SNP的软件,以实现准确定位和快速查找SNP位点。该软件设计主要是基于逻辑回归模型与贝叶斯框架,主要分为数据预处理、基因定位、SNP识别这三个模块,数据预处理模块主要完成数据获取与数据转化;基因定位主要把NGS数据映射到参考序列上,得到有碱基替换的SNP信息;SNP识别主要完成真正SNP的检测获取。本文最后使用Torque-PBS集群管理系统,分别对优化后的软件与原软件进行基因组序列SNP位点识别检测,获取检测SNP所用的时间并进行比对。实验表明重新优化设计的SNP检测方法不仅在检测时间上有了明显的缩短(其检测时间只是之前方法的1/3—1/2),而且充分利用了计算资源。
其他文献
<正>党的基层组织和国家基层政权组织是共和国大厦的基石。毫无疑问,人民政协基层组织是坚持中国共产党领导的多党合作政治协商这一共和国基本政治制度的基础,是建设和发展社
在新世纪到来之际,继一些发达国家之后,我国也已开始步入老年型国家的行列,老龄化将给未来经济的可持续发展带来沉重的负担和压力。更严峻的是,"白发浪潮"对我国社会的冲击远
随着我国社会经济的快速发展,作为经济基础的制造业领域内部发生了极大的变化,现代化的高精度加工机床已经成为制造业生产任务,以及生产效率提升的核心因素,因此国内对大型高
在大气中1400℃下对添加标题提及的B4C耐火材料的氧化特性进行了动力学研究。氧化率可以通过测量随氧化时间而变化的脱碳面积的比例来确定,也可以用一个圆柱体试样的局部化学
大学生职业核心能力的培养既是社会经济发展和科学技术水平提高对人才的要求,也是大学生个人实现自我价值和可持续发展的要求。本文通过分析大学生职业核心能力要素,探索了大
压疮是临床疾病中的一个重要的并发症。多年来,国内外护理学者对此进行了研究和探索。本文阐述了压疮新的分类方法以及中国和美国对压疮护理的新规程,并提出了有效的压疮疗治
1971年的印巴冲突是国际关系史上一次影响深远的事件。印度武装干涉巴基斯坦内政并导致"东巴"独立为"孟加拉国"激化了印巴矛盾,引发了美苏两个大国的集团对抗,让美国在冷战中
原小檗碱类化合物是一类异喹啉生物碱,广泛存在于多个种属的植物中,在化学结构上具有相似的骨架结构,根据骨架结构和取代基团的不同,可分为原小檗碱型、双苄基异喹啉型和阿扑
<正>羊肚菌属珍稀名贵食用菌,有野生和人工栽培之分。野生的一般生长在森林中,全国每年仅产10多吨;人工栽培的,全国每年产量仅300吨左右。但是,全球羊肚菌总需求量预计超过了
洋蓟系药食兼用的功能性植物,其花蕾和茎叶富含酚类化合物、黄酮、花青苷、菊粉和酶类等化学成分,具有利胆、解痉、降血脂、性腺保护和抗氧化等生物活性。介绍近年对洋蓟化学