基于群体基因组信息的个体基因变异检测算法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bashi0000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究证实,关于人类进化、疾病以及遗传的信息都蕴含在人类基因组数据中。从出现人类现代生命科学以来,对于基因组数据和基因变异的研究一直是学界的热点问题。基因测序技术对人类设计基因变异检测算法有着至关重要的影响,由于高通量测序技术的蓬勃发展,因此研究出了大量基于高通量测序数据的基因变异检测算法。尽管如此,基因变异检测技术仍面临严峻的挑战,这是由于高通量测序技术本身的局限以及高重复的基因组数据决定的。在解决人类疾病的方面,基因组测序和基因组变异检测扮演者重要的角色,因而,在生物信息学研究中,检测基因组的变异信息成为热点研究方向。通过研究基因组变异检测技术的现状、基因组拼接算法的基本思想和有关基因组测序技术的发展。为了检测个体基因组出现的变异信息,本文提出了基于群体基因组信息的个体基因变异检测算法。本文的主要研究工作如下:(1)识别基因组数据中未知变异的变异区域。在基因组数据中通过滑动窗口机制识别变异区域,从而在变异区域之中判断基因变异类型。基因组数据划分成多个连续的滑动窗口,并且保证滑动窗口中reads的覆盖度,通过统计各个滑动窗口中变异位置占比得到滑动窗口变异占比曲线,进而获得变异区域,利用已知变异信息获得未知变异的变异区域。(2)针对未知变异的变异区域设计基因组局部拼接算法。通过对基因组拼接问题的分析与建模,将基因组问题转化为特定字符串序列问题。并且提出基于unikmer的基因组拼接算法,其中利用unikmer在基因组中出现的唯一性和位置的确定性,将其与reads进行完全比对,因此可以知道reads相对参考基因组上的位置,可以容易的判断相互之间的位置关系。(3)基因变异信息检测。在进行基因变异检测时通过判断变异区域和实现变异区域中基因组数据拼接从而得到contigs集合,借助参考基因组可以检测出基因组中数据的变异信息。本文提出了基于群体基因组信息的个体基因变异检测算法,该算法通过滑动窗口机制检测未知变异的变异区域以及利用unikmer进行基因组局部拼接,不但提高了基因变异检测算法的效率也降低算法执行过程中内存空间的使用,而且对得到基因组数据的变异检测分析具有重要的指导作用。
其他文献
近年来,快速拓展的移动互联网市场对通信的速率和带宽提出了更高的要求。随着无线数据流量不断地飞速增长,第三代合作伙伴在增强型长期演进(LTE-A)中引入了异构网络以应对用户对于超高速率、超低时延、高速移动等各方面的移动网络需求。然而,由于各类基站节点之间存在发射功率与性能的差异,密集地同频部署会导致网络负载失衡和更加复杂的干扰。本文重点对LTE-A异构网络中的下行链路干扰协调策略进行研究。论文的主要
目的:通过对比脊柱内镜经椎板间单侧入路双侧减压术及腰椎后路双侧椎板开窗减压术治疗腰椎管狭窄症的临床疗效,并分析脊柱内镜技术的操作要点、适应症及优点,为今后腰椎管狭
目的:筛选不同敏化状态下膝骨性关节炎(Knee Osteoarthritis,KOA)模型大鼠敏化穴位组织中差异表达的miRNA,并进行生物信息学分析,从基因调控的角度研究穴位敏化现象发生及不
压缩感知理论是一种新的信号处理理论,该理论利用信号的稀疏性,将图像信号的采样和压缩合二为一,通过选择合适的重构算法高精度地恢复出原始信号。与传统奈奎斯特采样定理相比,该理论降低了对信号采样速率的要求,减少了采样资源的浪费。在图像压缩感知过程中,测量矩阵在图像信号的采样、压缩、恢复环节扮演着非常重要的角色。设计性能优异的测量矩阵对图像信号的重构和压缩感知理论的发展具有非常重要的意义。本论文在对测量矩
近年来,科技的迅速发展使得对控制系统性能的要求更加严苛。在实际工业过程中,因受到随机参数变化等的影响,系统的结构和参数会发生改变。马尔科夫跳变系统由于其自身系统特性对这类复杂系统具有强大的建模能力,因而受到控制界和工程界学者的广泛关注,并且其研究成果越来越多地被应用到实际系统中。然而,因其转移概率矩阵是时不变的,许多实际系统常常无法满足这一要求而限制了其相关理论的应用。半马尔科夫跳变系统由于放松了
软件测试是软件质量保证工作中的一个重要环节,是对软件质量的度量与评估[1]。软件开发企业非常重视软件的质量,希望为用户提供安全可靠的软件产品。现在很多的软件项目都开
无线传感器网络发展至今,已应用于很多领域,其安全性也随着无线传感器网络的广泛应用而越来越受到重视,只有保证了网络的安全性,才能保证信息的正确、不被窃取。无线传感器网
细分方法由于格式简单,且只涉及局部计算,因此被广泛应用于具有良好流线型性质的曲线曲面设计、游戏、视频中的场景快速重建等几何造型领域。本文则重点研究其中曲面细分格式
目的:调查老年T2DM患者抑郁水平的现状,分析老年T2DM患者自我感受负担、家庭支持和抑郁水平之间的关系。并据此探讨更有效的有针对性的干预措施用于改善老年T2DM患者心理健康
目的:探究紫草对兔心脏术后心包粘连的预防作用及其可能的作用机制。材料与方法:选择雄性日本大耳白兔32只,以每组8只按随机数字表法分为空白对照组、模型对照组、赛必妥组和