三倍体个体单体型组装问题的研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:n62315942
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SNP的研究对探索三倍体物种的遗传特性和表型差异等方面发挥着重要的作用,而单体型数据比单个SNP位点携带更多的遗传信息,其在生物个体的表型差异、基因表达和疾病预测等方面发挥的作用更大。由于目前的实验技术水平有限,直接通过生物学手段来测定一个个体的单体型的时间和金钱成本过高,因此通过计算方法来获取个体单体型成为生物学关注的热点问题。本文主要研究三倍体个体单体型组装问题,具体工作如下:针对带基因型信息的最少错误更正模型对组装问题进行研究,提出一种基于支持度的重建算法 HTMS(Haplotyping a Triploid individual with Most Support)。HTMS 算法依次重建三条单体型上的每一个SNP位点取值,对于给定位点,首先根据其基因型取值枚举该位点的三种单体型取值情况,然后选择获片段支持度最高的取值作为该位点的重建值。实验测试数据由CELSIM和MetaSim两种测序片段模拟生成器生成,在片段覆盖率、错误率、单片段长度、单体型长度和单体型海明距离等参数的不同设置下,比较分析算法HTMS、T-HC、GTIHR、W-GA和Q-PSO的重建率和运行时间。实验结果显示,算法HTMS在不同的参数设置下,都能用最快的运行速度获得最高的重建率。针对带基因型信息的最少错误更正模型,提出一种基于差异度的重建算法HTLD(Haplotyping a Triploid individual with Least Difference)。HTLD 算法采取一种新的计算方法度量片段和单体型间的距离。当由基因型枚举出待重建位点的三种取值时,分别计算三种取值下,单体型与覆盖该位点的片段之间的距离和,选择对应最小片段差异度的取值,即对应距离和最小的取值。实验结果表明,在不同的参数取值下,算法HTLD和HTMS具有相近的问题求解性能,且都比算法T-HC、GTIHR、W-GA和Q-PSO的重建精度更高,运行时间更短。综上所述,本文基于带基因型信息的最少错误更正模型,提出两种重建算法HTMS和HTLD。大量的实验结果显示,HTMS和HTLD算法都能以更快的求解速度获得精度更高的单体型,是解决三倍体个体单体型组装问题的实用方法,具有很强的应用价值。
其他文献
天光作为一种主要的噪声,叠加在目标天体光谱之中,降低了光谱的信噪比。LAMOST作为我国最大的光纤光谱望远镜,其拥有一套完整的观测运行系统以及数据处理的流程,其中减天光作
【目的】脊髓损伤(Spinal Cord Injury,SCI)常导致损伤节段以下肢体感觉运动功能丧失,严重影响患者的生活质量。以炎症反应为主的继发性损伤是SCI后神经退变的主要原因,且调节损伤局部炎症反应,减少其有害效应,可促进脊髓损伤修复。非甾体抗炎药(Non-Steroidal Anti-Inflammatory Drugs,NSAIDs)通过抑制环氧化酶而减少其下游炎症因子产生,被广泛用于
磁性斯格明子是一种具有拓扑保护的磁畴结构,因其小尺寸、易被电流驱动、低能耗等优点成为磁信息存储和自旋电子学器件的理想材料,近年来备受人们关注。目前国际上已经在少数
在光波场中奇点光学已经发展成为现代光学领域一个非常重要的光学分支,并在光通信、光电子学、遥感和原子俘获以及量子信息处理等多方面显示出非常诱人的应用前景。本文分别
随着智能电网的大力发展和新能源的并网发电,电力系统中源、网、荷各个环节均对电能质量的高可靠性、高可控性、高暂态恒定性产生影响,从而对电网运行的可靠、稳定和使用安全性提出挑战。电压暂降是电力系统中难以避免且最容易引起敏感工业用户经济损失的电能质量扰动事件之一。实现电压暂降扰动原因的准确识别有助于干扰治理方案的及时制定和事故双方责任的明确界定,能够有效降低经济损失并解决相关纠纷,对实际生活生产具有重要
目的及意义:犬猫尿石症是目前临床上最常见疾病之一。尿结石是由于尿路感染或代谢异常等引起尿液中的盐类结晶析出,并逐渐增大成为颗粒状物。根据结石部位可分为肾结石、输尿管结石、膀胱结石和尿道结石。本次流行病学调查目的主要是为了研究尿石症在犬猫上的发病规律和特性,包括结石症的不同发病部位以及不同年龄、品种、地区、环境、性别等与犬猫尿石症发病的关系;处方粮研究的目的是为了研究卡里布拉泌尿道处方粮在辅助治疗犬
本文主要研究具非线性对数源项和p-Laplace算子的抛物问题解的整体存在性与爆破性,即考虑如下问题首先给出预备知识和主要结果,其次利用位势井方法以及能量估计,Sobolev嵌入
本文主要介绍了由分数布朗运动驱动的随机比例微分方程及其最大值原理.随机过程可以用来描述很多现实生活中的问题.同时,人们又在追求问题的最优解决方案.这使得最优问题成为
广西三匹虎自然保护区位于广西南丹、天峨两县,总面积3081.9hm2。本文采用资料收集与实地调查相结合的方法,通过对广西三匹虎自然保护区内的植物鉴定和数据统计,研究了保护区
环形RNA(circRNA)是一种结构与常见线性RNA不同的环状的非编码RNA转录物。在生命的各个领域环形RNAs广泛存在,包括真核生物、细菌、古生菌和病毒。最近的研究表明环形RNAs的