多参考基因短序列比对工具MUGI的优化与移植

来源 :深圳大学 | 被引量 : 0次 | 上传用户:zikao0606
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物的进化方向由遗传信息所决定,而DNA是承载遗传信息的唯一物质。新一代的测序工具的飞速发展正使得获取基因数据变得日渐廉价。这意味着,我们正进入到基因大数据的时代。近期,一个新的课题正在兴起,其名为多参考基因的短序列比对。到目前为止,已出现的优秀比对软件已经昭示着这个课题正日趋成熟。一款优秀的多参考基因比对软件的关键在于简洁优秀的索引设计和与索引相匹配的比对算法设计。基于上述两点,我们选取了一款在当前十分优秀的比对软件MUGI进行研究。本文是从软件优化的方向来研究多参考基因的短序列比对技术。我们首先介绍了生物比对工具的研究背景和现状,分析了MUGI优化与移植的必要性。再对MUGI目前尚存在的优化空间进行分析,并提出相应的解决方案。下面介绍本文的主要研究成果和工作。一、对于MUGI软件中索引所匹配的比对算法比对速度较慢,算法设计不够具有针对性的问题,我们分别设计了新的比MUGI原算法更加具有针对性的精确比对和非精确比对算法。新的精确比对算法在增加少量的索引大小的前提下大幅提升了比对速度,而新的非精确比对算法优化了原MUGI非精确比对算法的流程,在不改变索引的情况下,提升了比对速度。二、针对MUGI比对算法是单线程所导致无法发挥多核结构服务器性能的实际问题,我们对MUGI比对算法设计了线程池,以充分利用服务器的多核结构。针对MUGI不能直接在龙芯平台运行的问题,本文首次对MUGI进行全面的移植。同时,结合龙芯的结构特征,利用龙芯的向量部件与多媒体扩展指令进行优化。做到移植优化两不误,既扩展了龙芯的运用,同时还优化了程序的性能。三、构建修改参考框架,框架中可以任意搭配修改算法。同时,本文根据变异点密度与索引大小的关系,设计了一种修改算法,最终达到了减小索引大小的效果。
其他文献
基于多区域重复采样,研究了藏北高原不同状态(正常、轻度和严重退化)高寒草原表层(0~10cm)、亚表层(10~20cm)土壤有机碳(Soilorganiccarbon,SOC)、腐殖质碳(Humuscarbon,HC)、胡敏酸碳(Hum
调度函数是制定水库中长期运行调度的常用方法,然而现行的通过回归分析法提取出的调度函数拟合精度不佳。针对这一问题,文中建立了以调度期内水库发电量最大为目标函数的优化
在现如今的信息化时代中,人们对于生活品质有着更高的要求,越来越多的人开始追求音乐方面的享受,无论是学习还是生活都有了进一步的进展。在我国高校的教学中钢琴课程的发展非常
文章详细分析了江苏省交通事故数和伤亡人数的时间(月、周、24h)和空间(区域各等级公路)分布特性,提出加强事故高发时间段的交通安全管理工作、改善事故高发区域的交通环境的具体
导游陪同口译是一项具体的翻译实践活动,随着全球一体化和旅游业的繁荣,越来越多的人跨国界旅游。在这一跨文化活动中,导游陪同口译员的工作非常重要,作为文化使者应具备跨文
后发国家的产业演化实际上就是以技术追赶为主导的产业升级过程,技术追赶在促进产业的发展、经济繁荣的方面起到了至关重要的作用。由于特殊的历史环境与产业背景,我国诸多产
基因表达作为一种中间表型,能够将基因组中的性状控制变异和作物的重要农艺性状关联起来,为阐明遗传机理并应用到作物改良当中提供了新的契机。然而,由于目前基因表达谱检测
元明清时期,西南少数民族地区的纠纷解决后同时存在中央王朝和少数民族固有机制两种执行程序。呈现出多元化的特点。国家执行程序具有统一性和普适性要求,而中央王朝在西南地区
发动机缸体属于壁薄多孔的箱体类零件,该零件的加工对各道工序的要求较高,其加工质量对发动机性能的发挥具有直接影响。本文主要对缸体加工变形因素进行分析,并提出了提高缸
<正>2016年9月,世界上最重要的20个国家的领导人、国际组织负责人莅临杭州,共同商讨国际大事。与会者的"豪华阵容"令峰会"星光熠熠",也让全球反恐形势下的峰会安保工作格外引