新一代半导体测序仪测序数据分析方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:shimin_job
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在近几年的发展里,第二代测序技术的测序通量越来越大,测序速度越来越快,出现了各种各样的测序平台。作为新一代测序技术,半导体测序仪采用了半导体芯片进行测序,摆脱了传统测序技术采用光学成像装置进行信息检测的限制,极大地提高了测序速度,缩减了测序成本,并使得测序技术走进临床应用成为可能。第二代测序仪中的离子半导体测序仪,目前包括IonPGMTM测序仪和Ion ProtonTM测序仪,其中Ion PGMTM测序仪是针对较小规模的基因组测序设计的,Ion ProtonTM测序仪是针对较大规模的基因组测序而设计的,这两款测序仪的测序原理基本相同,在测序速度上都有了极大的提高,但其测序准确率却不是很高,准确率约为98%左右。半导体测序仪在测序的过程中,首先利用半导体装置测得一系列的电压信号,然后根据测得的电压信号的大小推测出电压信号代表的碱基长度,这个过程是存在误差的,也是导致半导体测序仪测序准确率偏低的主要原因。针对半导体测序仪基于测得电压值解读碱基长度时存在检测误差的问题,本文进行了相应研究。首先,从半导体测序仪原始测序数据出发,实现了测得的电压信号的有效提取,并根据测序仪的测序误差特点对电压信号进行了合理分组。然后,通过统计分析各组电压信号的信号值分布规律,实现了基于贝叶斯的对测得电压值进行碱基长度判别的方法。依据同一物种的个体碱基差异仅占基因组约1%的特点,进一步提出了一种新的结合贝叶斯和参考基因组信息的对半导体测序仪碱基长度判别的方法。随后进行的实验测试表明,本文所设计方法对测得电压值碱基长度的判别错误率不到0.85%,比半导体测序仪现用算法的判别错误率下降了 80%。实验结果表明本文所提出的判别方法的可行性。
其他文献
2019年对兵团第一师五团连队部分果园苹果锈病发生情况进行实地调查,结果表明苹果锈病发生较重,已成为苹果生产中不可轻视的病害。对调查结果进行分析得出:果农对苹果锈病普
<正>现代信息技术是科技发展、教育信息化时代的&#39;宠儿&#39;,是优化教学结构,激发学习兴趣,提高教学效益的重要手段,是新一轮课程改革的重要内容。众所周知,数学是一门极
期刊
茶树(Camellia sinensis)是我国重要的木本经济作物,害虫常年发生严重,严重影响我国茶叶的产量和品质。因此,深入挖掘茶树中的重要抗虫基因,分析其在茶树防御中的作用及机理,
脑多头蚴病(Cerebral coenurosis)俗称脑包虫病,是由多头带绦虫(Taenia multiceps)的幼虫脑多头蚴(Coenurus cerebralis)寄生在绵羊、山羊、牦牛等反刍动物脑部、脊髓中引起
数据发布中的隐私保护问题是信息安全领域的一个重要研究方向,如何防止敏感信息泄露已经成为现在研究的热点。高维数据由于其数据量庞大、关联度高的问题,导致经过差分隐私保护的数据效用性较差。出现这种问题的其中一个原因,是因为大多数差分隐私保护算法使用的都是全局敏感度,并没有注意到实际数据集中不同数据添加的噪声应该是不同的。不仅如此,对高维数据进行差分隐私保护,一般需要耗费很多时间。因此,如何在保护数据隐私
十九大的召开,明确提出我国已经进入了新时代的历史征程。随着社会科技的不断发展以及国家落实“立德树人”根本任务的要求,教育改革也已经进入了新时代。教师,作为教育中的
应重庆大学副校长黄宗明教授的邀请,教育部社会科学司袁振国副司长于2006年12月19—20日,前来重庆大学调研考察,并为学校哲学社会科学的科研骨干做了题为“关于提高高校哲学社会