k-mer相关论文
甘薯属(Ipomoea)是旋花科(Convolvulaceae)中最大一个属,有800-900个种,具有二倍体、四倍体和六倍体等不同倍性水平。栽培甘薯(Ipomoea ......
益生菌因其对宿主产生有益的影响广受消费者的青睐,包括调节宿主的免疫功能和调节肠道菌群等。尽管有部分益生菌菌株已被广泛的使......
Chor et al found that tetrapods animals (including all mammals) the frequency distribution of k-mer is showing multiple ......
ANALYSIS OF THE GENOMIC DISTANCE BETWEEN BAT CORONAVIRUS RATG13 AND SARS-COV-2 REVEALS MULTIPLE ORIG
The severe acute respiratory syndrome COVID-19 was discovered on December 31,2019 in China.Subsequently,many COVID-19 ca......
Genetic and Epigenetic Signals Are Found Predictive to the Distribution of Intra-individual Divergen
Alternative splicing is a major mechanism for creating multiple mRNAs from a single gene and plays critical role in ......
植物长非编码RNA(lncRNA)主要通过与RNA结合蛋白的相互作用,在许多生物过程中发挥着重要作用。为了了解lncRNA的功能,一种基本方法......
随着高通量测序技术的快速发展,在许多物种中,包括人类、小鼠等常见的哺乳动物,发现了大量的转录本序列。这些转录本序列中,长非编......
基因组岛是基因组中的特定区域片段,与水平基因转移密切相关,具有特殊的结构,常常携带致病、耐药及与适应性等功能相关的基因。通......
...
摘 要 本文研究了DNA序列的k-mer index 问题,通过对大量基因组数据的考察,我们改进了由暴力算法延伸的Donald Knuth的算法,即KMP算法......
生物序列分析中的基于k-mer的非比对统计算法作为对传统比对方法的补充和发展已逐渐成为生物信息学研究中的一个热点领域。非比对......
Analysis method and algorithm design of biological sequence problem based on generalized k-mer vecto
K-mer can be used for the description of biological sequences and k-mer distribution is a tool for solving sequences ana......
蛋白质的序列、结构和功能多种多样。大量研究表明蛋白质的结构与其氨基酸序列的排序有关,并且局部的氨基酸序列环境对蛋白质的结......
多序列星比对算法在确定中心序列时需要计算任意两个输入序列的距离及分数,其较高的时间复杂度耗费了大量时间,因此提出了通过综合......
转录组拼接是基因组测序与功能注解问题的一个重要组成部分。为了提高转录组拼接的精度和效率,文中提出了一种新的转录组从头拼接......
采用支持向量机(SVM)结合K-mer分布特征预测piRNA.利用多种生物的非编码RNA序列数据库,从中挑选出piRNA序列作为正样本,并以由该数据......
以大肠杆菌基因组为研究对象,基于体外组装的核小体序列中k-mers频数信息,采用多样性增量结合二次判别算法对核心DNA和连接DNA进行......
寻找物种基因组中k-mer频数分布的特征,对大肠杆菌、枯草杆菌、甲烷球菌、疟原虫(部分)等四个典型物种的基因组全序列进行了统计分......
寻找物种基因组中k-mer频数分布的特征,对几个典型物种的基因组序列进行了统计分析.区分“字”域和“频数”域。运用两种求信息熵的......
文章基于k-mer编码建立了Hash线性索引模型。其基本思想是统计碱基字符出现的频数,将字符进行哈弗曼编码以得到最短的字符编码方式......
在详细阐述了生成DNA序列分形图像的Hao方法后,提出一种能够直观显示k-长DNA子序列频数分布差异性的三维频数分布图生成方法。把3D......
k-mer频率是进行宏基因组分类时的一种重要的数字特征,然而该特征的维数随参数k的增加呈指数增长,利用该特征进行宏基因组分类易陷......
研究基因组拼接算法,进而更高效地实现全基因组拼接、获取生物体遗传信息,对于生命科学研究具有重要的意义。拼接之前对数据进行一......
用非序列比对方法研究微生物菌群的分类是目前生物信息学中的一个热门领域.文中开发了一种基于k-mer统计的非序列比对软件SeqDistK......
真菌基因组较其他真核生物基因组结构简单,长度短,易于测序、组装与注释,因此真菌基因组是研究真核生物基因组的模型。为研究真菌......
本项研究工作分为两个部分: (一)、通过对大肠杆菌、枯草杆菌、甲烷球菌、疟原虫(部分)、人(部分)等十五种进化水平不同的典型物......
随着“人类基因组计划”的完成,生命科学研究进入了信息共享与分析的“后基因组”时代。在探索和分析生物基因数据的过程中,DNA序......
RNA和蛋白质之间的相互作用在调节生物体各种细胞过程(例如基因表达调节)中发挥着至关重要的作用,而对于它们之间的相互作用网络研......
系统发育学是研究生物进化关系的一门学科,在系统发育学中,最常用于研究进化关系的方法就是系统进化树。基于多序列比对法的经典的......
随着近些年来测序技术的飞速发展,人类产生了海量的生物序列数据,亟需通过有效的计算手段进行分析和处理。而在众多的生物序列分析......
生物序列的k-mer频次统计是生物信息处理中一个非常基础且重要的问题.本文针对多序列在对齐模式下,不同偏移处一段长度范围内的k-m......
近年来,随着分枝杆菌多重耐药菌株的产生、人口的频繁流动、人类免疫缺陷病毒感染人数的增多等原因,使结核病的发病人数居高不下,而且......