生物序列数据K-mer频次统计问题的算法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:jdalian1417
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物序列的k-mer频次统计是生物信息处理中一个非常基础且重要的问题.本文针对多序列在对齐模式下,不同偏移处一段长度范围内的k-mer频次统计问题进行了研究.提出了一种逆向遍历k-mer计数算法BTKC.该算法能够充分利用长度的k-mer统计信息,快速得到长度的k-mer统计信息,从而避免了统计任意长度的k-mer频次信息时都需要对所有序列进行遍历.算法的时间复杂度分析及实验结果表明,相比于传统的前向遍历FTKC算法,BTKC算法性能提升非常明显,且其时间复杂度与k-mer长度的变化范围无关,非常适合于在k-mer长度变化范围较大的情况下使用.
其他文献
<正> 网上做贸易,从买家的查询开始。出口商建了网站以后,就天天盼着有买家来查询。可是,网上查询好比“自由市场”问价,有人无意,有的却有心,你怎样筛选?买家不跟你见面,就
期刊
为了对柴油机特性曲线进行仿真和对燃油消耗率进行预测,考虑到影响柴油机的各种因素,采用非线性的建模方法,并使用数据处理的分组方法(GMDH)对柴油机特性曲线进行建模仿真,同
提出了构建基于HowNet和SentiWordNet的中文情感词典方法。将词语自动分解为多个义元后计算其情感倾向强度,并且使用词典校对方法对词语情感倾向强度进行优化。将所构建词典
博山素有"陶琉之乡"之美誉,为全国五大陶瓷基地之一,是博山工业的支柱产业。随着经济一体化进程的加快,该行业的竞争越来越激烈。本文通过对山东博山陶琉产业的发展现状进行
高校校友资源是高校资源中不可缺失的一个重要部分,是促进高校发展不可忽视的一股力量。本文通过对比研究国内外高校校友资源的开发管理模式,吸取国外成功的高校校友资源的开
目的探讨引起2型糖尿病合并周围神经病变患者的心理状况及改善生活质量的护理对策。方法对62例2型糖尿病合并周围神经病变患者进行病史采集、体格检查后,采用抑郁自评量表(SDS
在介绍EAP(员工帮助计划)、石油行业员工心理特点及在石油企业实施EAP项目必要性的基础上,提出了在石油企业实施EAP的主要程序、工作内容及目的,并指出实施EAP项目对提升石油
临洮大丽花是20世纪50年代初引入甘肃临洮栽培,至今已筛选出适宜盆栽的临洮大丽花品种40多个,并总结出一套比较先进的大丽花繁育栽培技术,可极大增加引进大丽花良种的繁殖系
一直以来窃电行为频频发生,不仅侵犯了供电企业财产权,损害了国有资产所有者权益,而且随时可能造成电力安全事故,给国民经济和社会秩序带来重大损失。窃电行为之所以屡禁不止
<正>案情简介职工陈某,男,1953年4月10日出生,2005年5月到某制造有限公司(以下简称某公司)工作,2012年10月在工作中受伤,2013年1月被依法认定为因工负伤,2013年4月30日被鉴定