纳米孔测序数据分析方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xxxmmm1236
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA是人类及所有生命的天然说明书。自DNA的遗传物质地位被确立后,人类便开展了一系列基因组测序工作。基因测序技术在众多领域都有其用武之地,例如有助于精准医疗的实现、改良农作物、身份鉴定、治愈肿瘤和癌症等。可见,基因测序的研究和发展具有十份重大的意义。从20世纪70年代第一代测序技术脱氧链终止法的问世,到更为精准的第二代高通量测序,再到以纳米孔测序为代表的第三代单分子测序。基因测序技术在岁月流逝中日渐成熟,日臻完善。最新的纳米孔测序技术通过电流信号识别碱基序列,具有低成本、速度快、易携带、实时性、读长长等众多优点。但由于采用了新的测序方式,纳米孔测序仍存在着准确率有待提高的问题。本文参考语音识别,在纳米孔测序数据分析中引入了一种无需电流信号分割的端到端的碱基识别方法。首先,将纳米孔测序仪Min ION针对λ噬菌体的测序数据进行一系列预处理工作,包括质量控制、长度筛选以及比对参考基因校正错误等,构建出模型训练所需数据集,并将数据集分成训练集、验证集以及测试集,用于模型训练,以及模型效果检验。识别模型方面,以卷积神经网络(CNN)与长短时间记忆网络(LSTM)相结合构成基本的前向传播网络结构,以连接时序分类器(CTC)作为损失和解码机制。模型训练过程中,本文对不同网络层数、神经元数目以及卷积核尺寸进行了调节和对比,以选取合适的超参数优化模型性能。在此基础上,本文还引入了批标准化及注意力机制实现模型的进一步优化,并对优化前后模型效果进行比对分析。最后,本文引入了集成模型思想,通过权重参数将基本模型和注意力模型进行融合,构建出集成模型,并验证了不同权重参数下的集成模型效果。经实验验证,本文所构建模型具有良好的纳米孔测序数据碱基识别性能。
其他文献
近年来,在国家和政府的推动下,装配式建筑逐渐进入我们的视野,对传统建筑行业也带来一定的冲击,对于采用装配式的建筑需满足装配率的要求项目才能得以审批。目前常采用叠合楼板、预制楼梯和预制阳台等构件来提高装配式建筑的装配率。基于此背景下,吴方伯等人提出PK预应力混凝土预制底板,其肋部预留孔洞增加预制底板与现浇混凝土的接触,使PK叠合楼板共同受力,但在生产的过程中PK预应力混凝土预制底板肋部支模复杂。因此
溴铅铯(CsPbBr_3)纳米晶体材料是一种具有较好光学性能的全无机纳米材料,它具较高的荧光量子产率(PLQY),较窄的半峰宽(FWHM)和较好的稳定性等,被认为可以成为下一代照明材料的重要组成部分。对于CsPbBr_3纳米晶体材料本身的制备来说,通过简单易行且可提高其性能的方法为核心。本论文通过对CsPbBr_3纳米晶体材料制备方法的研究,成功采用一锅法和两相乳液萃取法合成具较好的光学性能,尺寸
目的探讨白芨多糖载紫杉醇纳米粒(BSP-PTX)对人肝癌Hep G2细胞体内及体外增殖、凋亡的影响以及其结合能力研究。方法1、以疏水改性的白芨多糖作为载体,搭载紫杉醇而制备呈纳米粒BSP-PTX;2、纳米粒的形态通过扫描电子显微镜进行观察,纳米粒的电位和粒径则通过马尔文粒度仪进行;3、采用四甲基偶氮唑蓝还原反应法(MTT法)测定BSP-PTX和PTX在1.0ng/ml,2.0ng/ml,4.0ng
目的:研究TPX2及Aurora-B蛋白在人体不同宫颈组织(正常宫颈组织、上皮内瘤变组织、宫颈鳞癌组织)中的表达情况,分析TPX2、Aurora-B蛋白在宫颈鳞癌组织中的表达与患者临床病理参数的关系及二者的相关性。并探讨二者的表达水平与宫颈鳞癌放疗敏感性的关系。方法:1.根据本研究纳入标准,选取2017年10月至2019年9月我院经病理诊断的ⅡB-ⅣA期的宫颈鳞癌标本60例(均为初治患者,年龄30
目的:本研究旨在观察和比较电针颈夹脊穴结合穴位注射治疗神经根型颈椎病的临床疗效。方法:将60例神经根型颈椎病患者随机分为治疗组和对照组各30例。对照组予电针颈夹脊穴治疗,取两侧颈2、颈4、颈6夹脊穴。治疗组在电针颈夹脊穴治疗基础上加用穴位注射疗法,选用甲钴胺注射液(1ml:0.5mg)作为穴位注射用药,取主要病变颈椎棘突下两侧一对颈夹脊穴,每穴注入0.5ml药液。两组疗程均为每次治疗15min,隔
油气长输管道存在穿越农田的管段,由于介质温度大多高于土壤自然温度,并且农作物根区对温度比较敏感,其生长发育和产量可能会受到影响,因此需要研究在管道运行过程中农作物生
猪革拉斯氏病(Glasser’s disease)是由副猪嗜血杆菌(HPS)引起的以多发性浆膜炎、关节炎、脑膜炎为主要临床特征的一种高致病率和致死率的细菌性传染病。抗生素和疫苗接种是
紧身运动装作为一类高性能运动装备受运动员和健身爱好者的喜爱,而由于其特殊功能性也受到了研究者的广泛关注。据报道,在运动中穿着紧身运动装有助于促进血液循环,减少肌肉
母猪饲喂一直以来都伴随着养猪业的发展,在养猪的过程中,起着至关重要的作用,饲喂系统的精确与否直接影响着母猪的生产性能,所以实现母猪的精确饲喂已经成为养猪业发展的关键技术之一。本课题在已有的养殖方式和养殖设备的基础上,结合相关的机械与自动化知识,对现有的小群母猪智能化饲喂系统存在的不足进行改进,设计了一种自动化程度较高的妊娠母猪智能饲喂系统。主要包括对母猪电子饲喂站各部件方案的设计,关键零部件的设计
目的:探讨20MHz和50MHz高频超声在平坦型鲜红斑痣的临床应用价值。方法:根据纳入标准、排除标准筛选出2018年06月至2018年12月在桂林医学院附属医院皮肤科门诊就诊的准备进行脉冲染料激光治疗的54例面颈部平坦型鲜红斑痣患者,共计有60个皮损。治疗前采用20MHz、50MHz高频超声检测患者皮损部位和邻近正常部位真皮厚度值及密度值,运用SPSS25.0软件进行统计,独立样本t检验比较两种不