基于邻接的单面基因组片段填充问题研究进展

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:caijunever
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随生物测序技术的不断发展,大量基因组片段的后续处理问题亟待解决.基因组片段填充是有效解决方法之一,受到广泛关注.基于普通序列的单面基因组片段填充问题是将缺失的基因序列填充到一个不完整基因组片段B中,得到B′,与完整的参考基因组A对比,使得A和B′之间的邻接数最大化.基于片段重叠群的该问题区别在于基因组片段通常由一组连续的片段重叠群(contig)构成,缺失基因只能在contig两端进行插入.针对这两个领域的相关问题进行深入研究,对已有算法及算法复杂性进行详细的分析与比较,为未来基因组片段填充问题的研究及生物测序技术的发展提供有价值的参考.
其他文献
为快速构建大尺度、高质量中国人脸识别数据集,本文提出一种半自动构建方法.相较于现有的数据集构建方法,该方法可以快速地构建大尺度中国名人人脸数据集,将此数据集命名为CCFace(Chinese Celebrities Face).CCFace数据集包含431个人物,506874张人脸图像,平均每个人物包含1176张不同年龄、姿态的图像,该构建方法在一定程度上解决了当前社区中可用的中国人人脸图像数据集短缺问题.在实验部分中以多个模型测试该数据集的有效性,表明其可以作为SOTA(State Of The Art
自然场景乌金体藏文文本信息作为高度浓缩的高层语义信息,不仅具有较大的研究和实用价值,而且可以用于协助藏文场景文本理解领域的研究.目前针对自然场景下乌金体藏文的检测与识别的相关研究甚少,本文在人工收集的自然场景乌金体藏文图像数据集的基础上,对比了目前常见的文字检测算法在自然场景乌金体藏文上的检测性能以及在不同特征提取网络下基于序列的文字识别算法CRNN在自然场景乌金体藏文图像数据集上的识别准确率并分析了在314张真实自然场景下乌金体藏文识别出错的特殊例子.实验表明本文在文字检测阶段采用的可微分的二值化网络D
卷缩轮(Autonomic Nerve Wreath,ANW)是虹膜诊断学中一个重要的诊断标志.而如何提取易受光斑、色素斑及睫毛等干扰影响的卷缩轮在目前仍是一个难题.本文提出了一种基于遗传算法的虹膜卷缩轮提取方法.该方法以区域点密度作为适应度,并通过轮盘赌来选择最优个体,比较相邻两染色体间基因适应度来进行父本的选择.实验结果表明提出的方法能有效避免光斑、色素斑及睫毛等信息的干扰,提高了算法的搜索效率和准确率,提取出的卷缩轮与实际的卷缩轮较一致.
针对标准编码解码模型(Encoder-Decoder Model,EDM)对于时间序列数据提取能力弱的问题,提出一种融合双向长短时记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)和注意力机制(Attention)的编码解码模型.通过Bi-LSTM对输入数据从正反两个方向进行特征提取,基于注意力机制将所得到的特征根据不同时刻分配不同权重,根据解码阶段的不同时刻生成相应背景变量,进而实现对机场客流量的预测.选取上海虹桥机场为例用该算法进行实验仿真,实验结果
代码管理是软件开发过程的一个重要的环节,随着软件需求和功能的日益复杂,多分支开发场景越来越普遍,使得代码管理的难度直线上升,分支间代码漏合问题也应运而生,严重影响了开发的效率和版本的交付质量,本文根据个人的代码管理经验,对常用的分支管理模式进行了研究与分析,并主要基于分支开发、分支发布模式对多分支代码漏合问题进行了解决途径的研究.实践应用结果表明可以有效避免分支代码漏合问题,优化代码管理过程,提高整体代码管理的效率.
针对三峡升船机船厢结构复杂,设备巡视路线难以选择的问题,以升船机船厢巡视路线为研究对象,将设备巡视点检路线规划转换为TSP旅行商问题.通过巡视路线无向加权图及点位空间坐标,建立升船机设备巡视点检点位空间结构模型.结合蚁群算法在Matlab软件中分别计算出白班及中班的最佳巡视路线.实验结果表明,基于蚁群算法计算的最佳巡视路线符合三峡升船机设备巡视要求.
为解决非接触式睡眠监测系统中混合信号的可靠获取以及生理特征参数的有效分离和识别等问题,采用压电薄膜传感器获取人体睡眠状态下压力信号,并采用电荷放大电路和信号调理电路进行实时采集;信号处理过程中先利用经验小波变换方法分离心冲击(BCG)和呼吸信号等单一模态分量,然后使用K-means算法对分离出的心冲击信号中不同类型的波峰聚类,进而通过平均心跳周期计算心率.实验结果表明,所设计的监测系统具有较强的自适应性,能有效提取呼吸和心跳信号.
污水处理工艺是针对城市生活污水和工业废水的处理问题所提出的一套完整的解决方案,并且被广泛应用于各个领域.城市污水处理工艺应根据处理规模、水质特性、受纳水体的环境功能及当地的实际情况和要求,在工艺技术特性与经济成本的衡量中选择优化方案确定,其可以看作是一种特殊形式的多参数优化问题:首先统计污水处理的工艺方法并设计污水处理工艺知识库;其次将各工艺的参数和环境信息作为输入,以工艺知识库作为支撑,依托设定好的智能算法自动生成由工艺知识库中的工艺组合而成的方案,方案包括各工艺模块的顺序、工艺内部组件的尺寸、预测运行
微信是现代互联网的主要应用之一,到目前为止有关微信流量特性分析与建模的研究较少.本文以微信流量为研究对象,分析验证微信流量同时具有自相似性和突发性.针对这两种特性进行微信流量建模,采用线性分形稳定噪声模型刻画微信流量特性,完成了模型的参数估算和效果分析.本文的研究成果是后续的网络性能分析、网络流量监管等的基础.
射频识别系统中电子标签与读卡器之间基于无线方式交互数据,因无线方式固有的开放性,使得二者间交互数据易被第三方人员获取,为确保数据安全性,文中设计一种轻量级的认证协议.文中选取轻量级的伪随机函数作为数据加密算法,能够使得射频识别系统整体计算量降低,且同时确保交互数据的安全性;伪随机函数可以对任意输入长度参数进行运算,使其输出结果长度相同.通过安全角度、计算量角度、门电路角度综合分析文中协议,表明协议具备较高安全需求的同时,整体计算量优于其他对比协议.