DNA图谱分析算法与软件研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zengbiao2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因工程的一个重要目标是发展自动化、高速的DNA测序技术。目前主要采用四色荧光标记的毛细管电泳DNA测序。由于环境噪声、染料激发光谱重叠、电泳展宽效应、染料迁移率漂移等因素的影响,造成DNA图谱的信噪比和分辨率下降,不利于碱基排序,需要对原始图谱做必要的处理。本论文主要研究了DNA图谱处理的算法,并设计了相应的软件。软件主要功能包括DNA图谱的预处理、四色校正、后处理三个部分。 首先,软件对DNA图谱做预处理。预处理包括数据段选取、基线调整、噪声滤除、峰值识别四个模块:数据段选取删除前段冗余数据;基线调整使得四色荧光信号的基线高度一致;噪声滤除去除信号中的脉冲噪声和白噪声;峰值识别选取峰值数据,作为求解串扰矩阵的数据。 其次,软件对DNA图谱做四色校正。四色校正是DNA图谱处理中的重要部分,它解决四种特定波长的荧光亮度到四种荧光团浓度的转换问题。用于标记DNA片段的四种染料的发射光谱有部分重叠,导致四色荧光串扰,需要对原始DNA图谱做四色校正。四色校正关键在于串扰矩阵的求解,主要有峰值法、斜率法、四维空间聚类法。软件实现了斜率法和四色空间聚类法求解串扰矩阵,通过对DNA图谱做矩阵转换,消除了四色荧光串扰。 最后,软件对DNA图谱做后处理。后处理包括去卷积、迁移率校正、归一化三个模块:去卷积等效于展宽效应的逆过程,可以减小峰宽,消除峰的重叠,提高了四色峰的分辨率:迁移率校正调整四色峰的相对位置,使得四色峰谱分布均匀;归一化使得四色峰的高度基本一致,提高了图谱的视觉效果。 DNA图谱处理改善了DNA原始图谱的质量,为后续的碱基排序做准备,有利于实现自动化、准确的DNA测序。自主设计的GelRead软件能浏览、处理ABI和DAT格式的DNA图谱。GelRead软件对原始DNA图谱处理达到了很好的效果,可以与ABI商业软件相媲美,实现了预期的目标。
其他文献
在古代汉语中,“宰”最常见的含义就是“官吏”的通称;现代汉语中,“宰”的基本义是“宰杀”.关于“宰”的本义是什么,学界看法不一.本文通过分析“宰”的词义演变,探讨其本
受大气湍流的影响,大口径地基望远镜观测到的空间目标图像往往降质非常明显,影响了空间目标的识别、监测和姿态判断。为了克服大气湍流的影响,获得高分辨率空间目标图像,目前
汽车的行驶安全性一直都是人们所关注的热点问题。制动性能尤其是半挂汽车列车的制动性能是汽车行驶安全性的重要内容之一。由于半挂汽车列车自身结构的原因,半挂汽车列车制
作为21世纪的新能源,太阳能的发展是世界关注的重点。其中,高效能的半导体太阳能电池的制作与应用一直备受瞩目。在激光加工太阳能电池的技术领域,各国已发表了大量的文章,而关于激光辐照太阳能电池的损伤效应鲜有报道。针对半导体材料对不同波长激光的吸收系数不同,与不同脉宽激光的作用机理不同的特点,本文采用532 nm、1064 nm两种波长,纳秒、皮秒及连续激光对单结异质结GaAs/Ge、单晶硅两类太阳能电
“到头来”是现代汉语“头”类副词中的一个副词.“到头来”一般位于句首和句中,前项多搭配转折标记,后项多搭配转折关系词语、并列关系词语、“只”和“还”等等.“到头来”
采用液相还原法和水热法,基于硅片,玻璃片与二氧化钛薄膜,制备了不同形状的纳米银SERS(Surface Enhanced Raman Scattering)基底,并且对每种基底进行了结构表征和拉曼光谱特性表征,对基底的均匀性和灵敏度进行了研究。以制备的优良SERS基底应用于咖啡因与抗生素的检测,分别建立了咖啡因浓度,抗生素浓度与SERS特征峰强的线性相关曲线。主要的研究内容及结论如下:1、利用液相
学位
针对复杂温度环境下激光陀螺捷联惯性系统的使用情况,本文对机抖激光陀螺温度建模与补偿技术进行了研究。论文主要完成了以下工作:建立了激光陀螺传热学物理模型,理论分析了
基于USB2.0总线接口方式非接触同步测量弹性材料在两个方向上的拉伸变形量是当今材料科学对提高材料弹性特性的重要测量手段。系统采用两个独立的线阵CCD光电传感器为测量头,
高速公路的安全运营受恶劣天气的影响显著,尤其是在极端恶劣天气情况下。以往由于经济技术、设施以及道路交通管理水平的落后,都会采取封路的办法,这会使运营车辆和公路管理
星敏感器作为一种高精度的姿态测量敏感器,以天球坐标系作为参考坐标系、星空为作用对象,具有自主性强、无累积误差等优点,能够为航天器提供准确的空间方位与基准,在航天工业