【摘 要】
:
随着测序技术的发展,人类获得基因组数据的成本正变得越来越低,速度也在不断加快,个人基因组时代已经到来。基因组数据的获取和存储已经不是问题,亟待解决的问题是如何从大量
论文部分内容阅读
随着测序技术的发展,人类获得基因组数据的成本正变得越来越低,速度也在不断加快,个人基因组时代已经到来。基因组数据的获取和存储已经不是问题,亟待解决的问题是如何从大量的数据中挖掘出具有价值的信息,尤其是与人类健康息息相关的变异信息。新突变是变异的一个重要的组成部分,是导致多种遗传疾病和精神类疾病的重要因素,但新突变的数量极少,对新突变的检测和筛选存在着巨大的困难。目前已经有多种方法被提出来对新突变进行检测,尽管取得一定的成果,但是这些方法中也存在大量的不足。本文基于高通量测序数据主要针对插入/删除新突变的检测和筛选进行研究,本文的主要研究内容如下:(1)本文将Adaboost方法应用在插入/删除新突变检测中,提取了55个与插入/删除新突变相关的特征用于提取特征集,并且将局部比对算法应用到模型中,实现了DNINDELFilter。本文使用经过生物实验验证的真实的插入/删除新突变数据集以及家系数据构建训练集对模型进行训练和调整,使得模型具有较高的分类的可信度,克服了已有方法中的假阳性率较高的缺点,并且可以保持较高的真阳性率。(2)开发了轻量级的可视化工具将可视化方法应用到了插入/删除新突变检测中,该工具大幅简化了操作,提取插入/删除新突变相关的序列特征,重点对覆盖候选突变位点的区域进行可视化。该工具辅助筛选插入/删除新突变,并帮助发现新的可以用来筛选的特征。
其他文献
本文考虑一类时间分布阶和空间Riesz分数阶扩散方程初边值问题的数值求解。首先,对分布阶中的积分项用复化中矩形公式进行离散,这样分布阶分数阶微分方程转变成了多项的时间C
社会单配制鸟类中婚外配现象普遍存在,超过70%的雀形目鸟类存在婚外交配行为,严格的遗传一夫一妻制不足25%。前期研究发现,左家地区白眉姬鹟(Ficedula zanthopygia)婚外配发
在我国现阶段的城市建设中,建设“新城”已经成为普遍的城市现象。同时,城市气候在新城规划中的应用研究逐渐走入人们的视野,城市风道尤其引起规划者们的注意。但是,我国新城
含间断系数扩散方程大量出现在工程应用领域,因此数值求解该类方程具有重要的意义。近三十年来,格子Boltzmann方法已成为计算流体力学领域中的一种重要的数值计算方法,因此研
非定常线弹性模型是描述弹性问题的重要数学模型.本文针对一种二维非定常线弹性模型,建立了时空方向分别采用有限差分和线性有限元离散的全离散隐格式,数值实验表明了格式在
随着近年来水利工程和地下交通等建设的不断增加,地下空间的安全开挖及有效利用等问题越来越受到关注。开挖所带来的岩石变形与常规加载相比更为明显,同时,开挖工程周围赋存环境的变化也会影响岩石的形变。目前岩石卸荷的研究相对较少,因此,本文基于前人的卸荷研究成果,考虑在温度和水压(孔隙水压)等赋存环境下开展砂岩的卸荷(恒主应力差卸围压)力学特性试验研究。基于试验研究主要分析了不同赋存环境下砂岩的变形、强度和
Allen-Cahn方程是一个典型的相场模型。本文针对Allen-Cahn方程,研究其有限元方法。构造了基于梯度重构的后验误差估计,设计了基于重构型后验误差估计的自适应有限元方法,并
近年来,糖尿病因其高发病率一直困扰着人类的健康,临床上用药单一且副作用大,从天然产物中发现新型抗糖尿病药物——α-糖苷酶/淀粉酶抑制剂成为研究热点。桦褐孔菌在俄罗斯、中国等国被用作为民间药物治疗糖尿病、心血管疾病和癌症历史悠久。但由于其自然资源的稀缺,运用人工技术扩大培养成为新的趋势。本论文比较研究了桦褐孔菌野生菌核和液体发酵三萜类化合物对α-葡萄糖苷酶抑制和α-淀粉酶的抑制作用和组成的差异,明确
本文主要研究三维不可压Boussinesq方程恰当弱解的部分正则性,用类似于Ladyzhenskaya给出Navier-Stokes方程恰当弱解在某点正则的充分性条件的方法,得出了 Boussinesq方程恰
挥发性有机物(Volatile Organic Compounds,VOCs)是一类非常重要的大气污染物。由于其对环境和人类健康有害,许多VOCs被美国(Environmental Protection Agency,EPA)归类为有害空气污染物。挥发性有机物与OH自由基、臭氧和氮氧化物(NOx)的反应会生成二次有机气溶胶(secondary organic aerosol,SOA)。VOCs在强