基于长读数和多序列比对的间隙填充方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:qqqqq770627
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
间隙(gap)填充方法有助于获取更加完整和准确的基因组序列,可以促进基因表达与调控、结构变异分析和物种进化的研究.虽然已有较多填充gap的方法被提出,但是填充的准确性和完整性仍有待提高.设计一种基于长读数和多序列比对的gap填充方法GapLM.将包含gap的序列集合切割成不含gap的序列集合,基于长读数和序列之间比对位置的差异对结果进行修正.通过分析比对确定覆盖每个gap区域的左侧、右侧和跨过3个序列集合.针对1个gap和其相关联的3个序列集合,采用多序列比对方法分别对3个集合中的序列进行处理和融合,并生成一致序列对gap区域进行填充.将GapLM与GMcloser、PBjelly、LR_Gapcloser 3种填充方法在2个真实数据集上进行比较,实验结果表明,GapLM具有更加完整和准确的填充结果.
其他文献
针对现有可搜索加密方案中密文检索效率低、搜索结果不精确以及不支持数据使用者身份验证等问题,在无证书密码体制下,提出一种指定使用者且多服务器多关键字的可搜索加密方案.使用多服务器和多关键字技术在降低服务器负荷的同时提高用户检索密文的速度,使搜索结果更加精确.在搜索验证阶段,搜索服务器验证数据使用者的身份,若身份合法则存储服务器根据关键字向数据使用者返回相应密文.性能分析结果表明,在随机预言机模型下该方案可以抵抗内外关键字猜测攻击,且能够在降低计算开销的同时提高搜索效率,在安全性和效率方面均具备一定优势.
Tor等匿名流量的分类与识别对运营商监管网络安全具有重要意义,但目前To r流量的分类检测技术普遍存在识别准确率低、缺乏实时性、无法有效处理高维数据等问题.为此,提出一种To r流量在线识别方法.通过搭建基于逻辑回归的深度神经网络,提取To r流量特征匹配度以实现特征增强,并使用人工蜂群机制代替梯度下降等常见迭代算法,得到流量分类及识别结果.在此基础上,构建一套实时流量检测工具应用于实际生产环境中.在公开Tor数据集上的实验结果表明,与逻辑回归、随机森林、KNN算法相比,该算法的精确率和召回率分别提高了1
为解决交通拥堵和交通硬件资源分配不足等问题,提出一种基于多组件融合与空洞图卷积的车道占用率预测模型MCFDGCN。针对交通数据的非线性和受多种隐式因素影响的特点,利用图卷积提取交通数据的空间相关性,使用空洞卷积提取时间依赖特征,将车流量和车辆速度作为2个隐式因素引入模型中,对多组件提取的影响车道占用率的多模态特征进行融合,以完成车道占用率预测任务。在PeMS7(O)、PeMS7(4)数据集上进行实
大气湍流会导致图像发生畸变和模糊,为对单幅大气湍流退化图像进行复原,提出一种基于多尺度生成对抗网络(GAN)的图像复原方法。采用GAN框架,在生成器网络中添加多尺度注意力特征提取单元与多层次特征动态融合单元,从而提升模型的感受野范围。在此基础上,引入特征融合机制以实现湍流退化图像复原。实验结果表明,相比标准GAN、SIU-Net模型,多尺度GAN能显著提高图像的视觉质量,有效降低图像的模糊和几何畸
经典Logistic映射存在系统参数范围受限、混沌序列分布不均等问题。对Logistic映射进行改进并将其应用于图像加密中,设计一种置乱与扩散同时操作的图像加密算法。对经典Logistic映射增加模运算并对其所生成序列进行二进制比特重排,利用改进Logistic映射生成具有更好混沌特性的伪随机序列并用于加密系统的置乱和扩散阶段。将所生成的伪随机矩阵与明文图像矩阵进行异或操作以实现明文图像预加密。在
图像攻击是指通过对图像添加小幅扰动使深度神经网络产生误分类。针对现有图像攻击算法在变分自编码器(VAE)防御下攻击性能不稳定的问题,在AdvGAN算法的基础上,提出基于对抗机制的AntiVAEGAN算法获取对VAE防御的稳定攻击效果。为应对AntiVAEGAN算法防御能力提升时攻击性能不稳定的问题,结合生成器与鉴别器、生成器与VAE的双对抗机制提出改进的图像攻击算法VAEAdvGAN。在MNIST
复句是自然语言的基本单位之一,复句的判定及其语义关系的识别,对于句法解析、篇章理解等都有着非常重要的作用.基于神经网络模型识别自然语料中的复句,判断其复句关系,构造复句判定和复句关系识别联合模型,以最大程度地减少误差传递.在复句判定任务中通过Bi-LSTM获得上下文语义信息,采用注意力机制捕获句内跨距离搭配信息,利用CNN捕获句子局部信息.在复句关系识别任务中,使用Bert增强句子的语义表示,运用Tree-LSTM对句法结构和成分标记进行建模.在CAMR中文语料上的实验结果表明,基于注意力机制的复句判定模
为消除脉冲超宽带(IR-UWB)雷达系统采集的人体呼吸回波信息中的干扰信号,并准确估计出人体呼吸频率和到达时间(TOA)范围,提出一种基于IR-UWB雷达的非接触式呼吸检测方法.对IR-UWB雷达回波信号进行线性趋势消除与滤波得到平滑的回波信号,在每个慢时间域上对回波信号使用傅里叶变换估计出人体呼吸频率,并设计基于回波信号均方根和超值峰度的EK-RMS算法确定TOA范围,同时将人体呼吸频率与TOA范围进行信息比对,最终得到受试目标的呼吸频率.实验结果表明,与Phase-Based、FFT和WT-Windo
现有的深度学习方法在处理点云分割任务时,难以有效地学习点云的局部特征,存在分类分割精度低和鲁棒性差的问题。构建深度神经网络RMFP-DNN用于多特征点云分类分割。分别利用自注意力模块和多层感知机提取点云的局部特征和全局特征,并将两者相互融合,提高分类分割的准确率和鲁棒性。实验结果表明,RMFP-DNN平均分类准确率和整体分类准确率分别为88.9%和92.6%,与PointNet、PointNet+
针对移动边缘计算中无线城域网环境下的边缘服务器放置(WESP)问题,建立时延和能耗模型并将WESP问题转化为带约束条件的单目标优化问题,进而提出一种基于混沌麻雀搜索算法的边缘服务器放置方法.使用精英反向学习策略初始化种群,增加初始种群的多样性,加快算法搜索速度.通过设计新的个体编码方式准确描述WESP问题,优化算法更新过程.采用逻辑混沌映射策略改进麻雀个体,保证迭代后期的种群多样性,加快算法收敛速度.仿真结果表明,与主流放置方法相比,该方法在时延和能耗优化方面表现突出,并且系统开销下降了18.1%.