离散增量相关论文
随着功能基因组学的飞速发展,对非编码RNA(non-coding RNA,nc RNA)转录产物功能的研究越来越引起人们的关注,尤其是对其中占比较高的......
随着人类基因组计划的实施和推进,数据库中出现了大量未注解的蛋白质序列,如何获取这些蛋白质序列的功能信息已成为当今生物信息学......
酶的类型与其功能和催化性能关系密切,对于新发现的酶,可以通过确定它的类型来表明其生物功能。目前研究酶的生化实验方法不仅费时......
随着生物信息学的飞速发展,出现了大量的未知功能的蛋白质序列,其中细胞凋亡蛋白质得到研究人员越来越多的关注。在生命体中,细胞凋亡......
简单串联重复序列在真核生物基因组中广泛存在.对重复序列的研究,有助于揭示生物基因表达的较高层次上的调控机理.该文主要分析了......
分泌蛋白质(secretory protein)是合成在细胞内的蛋白质,通过各种分泌途径分泌到细胞外,在生物体中,蛋白质的分泌发生是一种普遍的......
从蛋白质序列出发,我们首先将每条蛋白质序列分成等长的15段得到离散增量值、低频功率谱密度值、N端和C端的打分值和模体频数构成......
基于已知的人类Pol Ⅱ启动子序列数据,综合选取启动子序列内容和序列信号特征,构建启动子的支持向量机分类器.分别以启动子序列的6......
蛋白酶的类型与其功能和催化机理关系密切,而且对药物的开发和研究有着至关重要的作用。本文从蛋白酶的一级序列出发,以氨基酸组分......
首先把线虫、酵母和拟南芥三种模式生物基因组中的内含子、外显子和基因间序列归为三类,滑动统计这些序列中64种三核苷的重复出现......
基于氨基酸一级序列,应用离散增量的方法识别ArchDB数据库中的6 100个β发夹模体和2 701个非β发夹模体.模体按照二级结构中无规卷......
启动子是基因转录起始最重要的调控单元。本文在深入分析大肠杆菌启动子区和非启动子区序列结构特征的基础上,利用离散增量结合二......
基于蛋白质的结构类型决定于它的二级结构序列的概念,用二级结构序列参数Nα,Nβ,Nβαβ,N(βαβ)构成离散源,并计算离散量D(Xα......
从蛋白质的氨基酸序列出发,应用离散增量的方法对3088个蛋白质的β发夹模体和非β发夹模体进行了识别.以氨基酸(20种氨基酸和一个空......
细胞凋亡蛋白对生物体的发育、维持内环境稳定及人们理解细胞凋亡机制非常重要.文中提出了一种新的蛋白质序列特征提取方法-三肽离......
基于对β-发夹模体预测的探索,文章尝试使用新的预测方法,即随机森林算法,以离散增量、矩阵打分值和预测的二级结构信息为特征参数......
给出了一种基于信息理论的广义距离系数.这一新的信息系数较离散增量信息系数有所改进,并可应用于聚类分析.......
基于蛋白质的结构类型决定于它的二级结构序列的概念,将蛋白质二级结构含量和二级结构序列参数Nα,Nβ,Nβαβ结合起来构成离散源,分......
根据蛋白质的亚细胞定位,将蛋白质分为四类,用离散量的数学理论,提出了预测蛋白质的亚细胞定位理论方法.利用蛋白质中氨基酸组分,......
基于不同亚细胞位置中蛋白质的氨基酸组成及序列信息不同这一观点,以单个氨基酸含量及两两组合氨基酸含量为信息构成离散源,分别计......
将拟南芥基因组全序列,按内含子、外显子及基因间序列区分为三类.在统计分析的基础上,选取21种三联体的概率,作为信号参数,并以这......
细胞凋亡蛋白的亚细胞位置与它的功能紧密相联.基于一个凋亡蛋白的亚细胞位置主要决定于它的氨基酸序列这一观点,提出了一种新的预......
把基因组中的内含子、外显子和基因间序列分为三类序列,从这些序列中取64种三核苷的重复出现次数作为离散源的状态参数,计算三类序列......
根据最近的SCOP库,依据2616个蛋白质结构域折叠类型的分类和PDB库中这些蛋白质的主二级结构序列,计算了这些蛋白质中α螺旋、β折......
用自洽聚类方法判定大肠杆菌蛋白质编码基因SD序列强弱,给出构成强SD序列的17种碱基关联模式.将全部SD序列按作用强弱不同分为三类:强......
动物毒素是一种具有非常广泛用途的生物毒素,有必要提出一种能够快速、准确预测动物毒素的理论算法.基于动物毒素蛋白质序列的二肽组......
利用离散增量结合协变判别函数,选取氨基酸组份和N端氨基酸二肽组份为信息参数,对蛋白质亚核定位进行预测.在序列相似性小于等于25......
蛋白质二级结构预测是三级结构预测的一个非常重要的中间步骤,而折叠子识别和结构类型的准确预测则可以提高二级结构和三级结构预测......
MicroRNAs(miRNAs)是一类约为21—26个碱基长度的非编码单链RNA.根据Mi—croRNAs前体序列(pre—miRNAs)的碱基保守特征和二级结构特征,应......
在构建小鼠蛋白质亚细胞定位和小鼠跨膜蛋白类型数据库的基础上,利用离散增量结合协变判别函数分别对小鼠蛋白质亚细胞定位和小鼠跨......
基于对β-发夹模体的预测探索,本文使用随机森林和支持向量机两种算法,对ArchDB40数据库及自建数据集中的β-发夹模体进行预测.对......
通过对果蝇pol Ⅱ启动子和非启动子的序列特征分析,计算了序列每个位点单碱基保守性M1(l)值和六联体保守性M6(l)值。从而分别选取两个......
用离散量的方法,对2208个分辨率在2.5A以上的高精度的蛋白质结构中四类超二级结构进行了识别。从蛋白质一级序列出发,以氨基酸(20种氨......
基于蛋白质序列,提出了一种新的超二级结构模体β-发夹的预测方法。利用离散增量构成的向量来表示序列信息,并将6个离散增量输入支持......
真核生物剪接位点的识别作为基因结构注释的重要环节,一直以来倍受关注。利用离散增量和权重矩阵构成的向量来表示序列,用支持向量......
通过对27类蛋白质折叠子的统计分析,发现位点氨基酸及氨基酸二肽组分可以在一定程度上反映蛋白质折叠子信息.文中采用整体分类策略.基......
从蛋白质一级序列出发,以氨基酸紧邻关联为参数,用离散量的方法,采用5交叉检验,对蛋白质中的strand-loop-strand模体进行了分类.文......
本文以紧邻氨基酸出现的频数为参数,用离散增量方法预测了6种类型膜蛋白.并用自洽、留一法和独立检验三种方法对算法进行检验,均获......
从蛋白质的氨基酸序列出发,采用"全体分类"的分类策略识别27类折叠子.当使用5种矩阵打分的方法识别27类折叠子时,预测结果并不理想,......
基于果蝇polⅡ启动予的序列特征,利用结合了离散增量和位置权重矩阵的贝叶斯判别函数对果蝇启动予进行了预测。对预测算法进行10交......
通过选取人类启动子与非启动子序列中不同的k-mer作为预测算法的基础特征,分别以三个区域(-249~-1;0~+50;-30~+30)的6-mer频数作为离散源参数......
从酶序列出发,提出了一种新的酶的亚类的预测方法。利用物化特性编码和离散增量得到特征向量来表示序列信息,并将这些特征向量输入......
根据膜蛋白的特点对特定的氨基酸片段进行打分,将打分值与离散增量值共同作为序列的信息参数,使用支持向量机的方法对膜蛋白的类型......
随着对酶分类预测的研究需要,本文采用Shen建立的数据库,从蛋白质序列出发,将每条蛋白质序列分成等长的15段得到离散增量值、低频......
提出了基于广义信息距离的直接聚类算法.基于信息理论给出了离散量的基本概念,讨论并证明了离散量的一个基本不等式,进而给出了离......
真核生物基因序列包括编码的外显子序列和不编码的内含子序列,在转录过程中内含子被切除,外显子将有序的拼接在一起形成mRNA。而选......