离散增量相关论文
随着功能基因组学的飞速发展,对非编码RNA(non-coding RNA,nc RNA)转录产物功能的研究越来越引起人们的关注,尤其是对其中占比较高的......
随着人类基因组计划的实施和推进,数据库中出现了大量未注解的蛋白质序列,如何获取这些蛋白质序列的功能信息已成为当今生物信息学......
酶的类型与其功能和催化性能关系密切,对于新发现的酶,可以通过确定它的类型来表明其生物功能。目前研究酶的生化实验方法不仅费时......
基因转录调控一直是生物信息学研究的一个重要内容,转录因子结合位点和启动子的识别是研究基因转录调控的重要环节,是构建基因调控网......
随着生物信息学的飞速发展,出现了大量的未知功能的蛋白质序列,其中细胞凋亡蛋白质得到研究人员越来越多的关注。在生命体中,细胞凋亡......
随着人类基因组计划的顺利进行,数据库中出现了大量的未知功能的蛋白质序列,分析这些未知功能的蛋白质成为当今的首要任务。目前,亚细......
简单串联重复序列在真核生物基因组中广泛存在.对重复序列的研究,有助于揭示生物基因表达的较高层次上的调控机理.该文主要分析了......
种系发生树问题是生物学的基本问题,它在分子生物学中主要是帮助理解分子的进化关系.现在随着序列信息的大量出现,开展分子进化的......
从蛋白质序列出发,我们首先将每条蛋白质序列分成等长的15段得到离散增量值、低频功率谱密度值、N端和C端的矩阵打分值和模体频数......
从蛋白质序列出发,我们首先将每条蛋白质序列分成等长的15段得到离散增量值、低频功率谱密度值、N端和C端的打分值和模体频数构成......
基于已知的人类Pol Ⅱ启动子序列数据,综合选取启动子序列内容和序列信号特征,构建启动子的支持向量机分类器.分别以启动子序列的6......
蛋白酶的类型与其功能和催化机理关系密切,而且对药物的开发和研究有着至关重要的作用。本文从蛋白酶的一级序列出发,以氨基酸组分......
首先把线虫、酵母和拟南芥三种模式生物基因组中的内含子、外显子和基因间序列归为三类,滑动统计这些序列中64种三核苷的重复出现......
基于氨基酸一级序列,应用离散增量的方法识别ArchDB数据库中的6 100个β发夹模体和2 701个非β发夹模体.模体按照二级结构中无规卷......
启动子是基因转录起始最重要的调控单元。本文在深入分析大肠杆菌启动子区和非启动子区序列结构特征的基础上,利用离散增量结合二......
基于蛋白质的结构类型决定于它的二级结构序列的概念,用二级结构序列参数Nα,Nβ,Nβαβ,N(βαβ)构成离散源,并计算离散量D(Xα......
从蛋白质的氨基酸序列出发,应用离散增量的方法对3088个蛋白质的β发夹模体和非β发夹模体进行了识别.以氨基酸(20种氨基酸和一个空......
细胞凋亡蛋白对生物体的发育、维持内环境稳定及人们理解细胞凋亡机制非常重要.文中提出了一种新的蛋白质序列特征提取方法-三肽离......
基于对β-发夹模体预测的探索,文章尝试使用新的预测方法,即随机森林算法,以离散增量、矩阵打分值和预测的二级结构信息为特征参数......
给出了一种基于信息理论的广义距离系数.这一新的信息系数较离散增量信息系数有所改进,并可应用于聚类分析.......
基于蛋白质的结构类型决定于它的二级结构序列的概念,将蛋白质二级结构含量和二级结构序列参数Nα,Nβ,Nβαβ结合起来构成离散源,分......
根据蛋白质的亚细胞定位,将蛋白质分为四类,用离散量的数学理论,提出了预测蛋白质的亚细胞定位理论方法.利用蛋白质中氨基酸组分,......
基于不同亚细胞位置中蛋白质的氨基酸组成及序列信息不同这一观点,以单个氨基酸含量及两两组合氨基酸含量为信息构成离散源,分别计......
将拟南芥基因组全序列,按内含子、外显子及基因间序列区分为三类.在统计分析的基础上,选取21种三联体的概率,作为信号参数,并以这......
细胞凋亡蛋白的亚细胞位置与它的功能紧密相联.基于一个凋亡蛋白的亚细胞位置主要决定于它的氨基酸序列这一观点,提出了一种新的预......
把基因组中的内含子、外显子和基因间序列分为三类序列,从这些序列中取64种三核苷的重复出现次数作为离散源的状态参数,计算三类序列......
根据最近的SCOP库,依据2616个蛋白质结构域折叠类型的分类和PDB库中这些蛋白质的主二级结构序列,计算了这些蛋白质中α螺旋、β折......
用自洽聚类方法判定大肠杆菌蛋白质编码基因SD序列强弱,给出构成强SD序列的17种碱基关联模式.将全部SD序列按作用强弱不同分为三类:强......
动物毒素是一种具有非常广泛用途的生物毒素,有必要提出一种能够快速、准确预测动物毒素的理论算法.基于动物毒素蛋白质序列的二肽组......
利用离散增量结合协变判别函数,选取氨基酸组份和N端氨基酸二肽组份为信息参数,对蛋白质亚核定位进行预测.在序列相似性小于等于25......
蛋白质二级结构预测是三级结构预测的一个非常重要的中间步骤,而折叠子识别和结构类型的准确预测则可以提高二级结构和三级结构预测......
MicroRNAs(miRNAs)是一类约为21—26个碱基长度的非编码单链RNA.根据Mi—croRNAs前体序列(pre—miRNAs)的碱基保守特征和二级结构特征,应......
在构建小鼠蛋白质亚细胞定位和小鼠跨膜蛋白类型数据库的基础上,利用离散增量结合协变判别函数分别对小鼠蛋白质亚细胞定位和小鼠跨......
基于对β-发夹模体的预测探索,本文使用随机森林和支持向量机两种算法,对ArchDB40数据库及自建数据集中的β-发夹模体进行预测.对......
从酶的一级序列出发,以20种氨基酸和其紧邻与次邻的氨基酸二联体在序列中出现的个数为参数,用离散量算法对酶的亚类进行预测.通过用Se......
通过对果蝇pol Ⅱ启动子和非启动子的序列特征分析,计算了序列每个位点单碱基保守性M1(l)值和六联体保守性M6(l)值。从而分别选取两个......
用离散量的方法,对2208个分辨率在2.5A以上的高精度的蛋白质结构中四类超二级结构进行了识别。从蛋白质一级序列出发,以氨基酸(20种氨......
基于蛋白质序列,提出了一种新的超二级结构模体β-发夹的预测方法。利用离散增量构成的向量来表示序列信息,并将6个离散增量输入支持......
根据凋亡蛋白的亚细胞位置主要决定于它的氨基酸序列这一观点,基于局部氨基酸序列的n肽组分和序列的亲疏水性分布信息,采用离散增量......
真核生物剪接位点的识别作为基因结构注释的重要环节,一直以来倍受关注。利用离散增量和权重矩阵构成的向量来表示序列,用支持向量......
通过对27类蛋白质折叠子的统计分析,发现位点氨基酸及氨基酸二肽组分可以在一定程度上反映蛋白质折叠子信息.文中采用整体分类策略.基......
从蛋白质一级序列出发,以氨基酸紧邻关联为参数,用离散量的方法,采用5交叉检验,对蛋白质中的strand-loop-strand模体进行了分类.文......
本文以紧邻氨基酸出现的频数为参数,用离散增量方法预测了6种类型膜蛋白.并用自洽、留一法和独立检验三种方法对算法进行检验,均获......
从蛋白质的氨基酸序列出发,采用"全体分类"的分类策略识别27类折叠子.当使用5种矩阵打分的方法识别27类折叠子时,预测结果并不理想,......
基于已知的人类PolII启动子序列数据,综合选取启动子序列内容和序列信号特征,构建启动子的支持向量机分类器.分别以启动子序列的6-mer......