基于动态短序列比对算法的高血压多态性位点挖掘检测

来源 :青海师范大学 | 被引量 : 0次 | 上传用户:xiaorixue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国高血压疾病发病率逐年增高,发病群体越来越低龄化,严重威胁居民身体健康。由于该疾病病因复杂,大多是遗传因素、环境因素、生活方式等综合作用的结果,因此在预防和治疗研究方面困难重重。单核苷酸多态性作为第三代分子标记在探索表达基因与疾病关联关系中发挥着巨大作用。通过对高血压患者基因组序列中SNPs位点识别检测,进而确定高血压疾病易感基因,在基因水平上探究高血压形成的分子机制,对高血压的预防和治疗具有重要意义和价值。随着生物信息学与生物信息技术的快速发展,高通量测序成本降低,使得生物数据呈现爆炸式增长,这给SNPs挖掘研究带来机遇的同时也带来了巨大的挑战。目前,该领域存在的主要问题是现有SNPs识别算法不能很好满足当前大数据分析需求。如何快速准确地从海量临床医学组学数据中挖掘出高血压疾病相关SNPs位点,将复杂冗长的碱基序列转化为高效可读的信息是当前研究的重点和难点。本文通过对现阶段主流SNPs识别检测算法深入研究,提出一种基于动态短序列比对算法的SNPs识别检测模型,来准确定位和快速查找SNP s位点。本文实现以下几个方面的创新:(1)提出一种基于FM_index索引和哈希索引相结合的混合索引算法,实现测序结果的reads序列在参考序列快速定位,可以很好的解决生物大数据时代由于测序数据序列短,数量大导致SNPs识别检测慢的问题;(2)构建一个本地SNPs数据库,并在此基础上设计了一个基于动态规划策略的快速SNPs识别检测模型,在序列精确定位基础上,提升高血压多态性位点识别检测效率。本文主要从短序列定位、SNPs数据库构建、SNPs识别、可视化等方面对高血压SNPs位点识别检测模型进行研究;利用NCBI公共数据库中SRA二代测序数据库的数据进行验证,通过原始二代测序数据验证该模型准确性与有效性,利用R语言及其可视化软件包将检测结果以图形图像形式直观形象呈现出来。
其他文献
第一部分医院血培养病原菌分布及耐药性分析目的:分析某院血培养主要病原菌的分布及耐药情况,为血流感染(bloodstream infection,BSI)的经验性用药提供参考。方法:回顾性分析
小麦是世界上重要的粮食作物之一,开花是其从营养生长向生殖生长的转变的重要时期,小麦开花发育调控直接影响着其产量,而小麦产量一直是小麦科研关注的重点。因此,开展小麦开
目的:系统总结荣震主任医师临床治疗乳腺癌的病例处方,从而实现对荣震主任医师治疗乳腺癌的临床经验及学术思想的总结及传承,同时基于《中华医典》分析古代医家治疗乳腺癌相
随着化石能源的不断消耗和全球环境的不断恶化,如何利用可再生能源或清洁能源的问题受到广泛关注。微电网是一种分布式能源供应的管理技术,通过并网运行与孤岛运行模式灵活的转换,实现对分布式电源的最大化利用。微电网转换电能质量好坏将直接影响分布式能源的利用,直流电压变换器是微电网能量转换装置不可缺少的一环。本文主要研究一种级联直流电压降压变换器。以两个级联直流电压降压变换器为研究对象,相应的方法可推广到多个
目的:人体肌肉含量与骨密度变化的相关性研究是骨质疏松领域内一个热点,肌肉含量对骨量影响也有许多新观点。本研究主要分析“不同年龄腰部肌肉含量与腰椎骨密度”、“不同年
藏医学作为一个传统及独立的医疗体系,对人体的认识、疾病的探究与治疗具有良好的效果,尤其对某些特殊疾病的认识具有独到的见解。以藏医典籍《四部一典》为依据较深入的研究
目的:评价柴陷汤治疗痰热互结型非酒精性脂肪性肝炎的临床疗效。方法:采取随机数字表法将纳入符合诊断标准的62例患者分为对照组与治疗组各31例,最终对照组和治疗组各纳入患
目的:探索MRI测量新生儿松果体体积的可行性,探讨新生儿松果体(pineal gland,PG)体积与受孕后胎龄(postmenstrual age,PMA)增长的相关性,探究影响新生儿松果体体积发育的相关
植物细胞膜脂的不饱和度主要由脂肪酸去饱和酶(Fatty acid desaturases,FADs)决定,它们与植物抵抗低温和高盐等逆境胁迫密切相关。沙冬青(Ammopiptanthus mongolicus)是中亚
[目的]探讨肠道菌群在糖尿病小鼠合并认知功能障碍中的作用。[方法]40只8周龄C57BL/6J雄性小鼠随机分成对照组(Control,CONT组,n=8)和糖尿病模型组(Streptozotocin,STZ组,n=3