【摘 要】
:
β转角是蛋自质的一种二级结构类型,它实际上是蛋白质三种基本二级结构类型中无规卷曲中的一种局部有序结构。它在蛋白质折叠、蛋白质稳定性和分子识别过程方面起着重要的作用。迄今为止,人们已经提出了多种用十预测蛋白质β转角结构的方法,它们可以分为统计学方法和机器学习方法两大类。一般地,机器学习方法具有更优良的预测性能。有趣的是,它们中没有一种方法试图直接从如PDB等的结构数据库中找寻已知的现有同源结构,并将
论文部分内容阅读
β转角是蛋自质的一种二级结构类型,它实际上是蛋白质三种基本二级结构类型中无规卷曲中的一种局部有序结构。它在蛋白质折叠、蛋白质稳定性和分子识别过程方面起着重要的作用。迄今为止,人们已经提出了多种用十预测蛋白质β转角结构的方法,它们可以分为统计学方法和机器学习方法两大类。一般地,机器学习方法具有更优良的预测性能。有趣的是,它们中没有一种方法试图直接从如PDB等的结构数据库中找寻已知的现有同源结构,并将它们映射到待预测的蛋白序列上。由于PDB中存储的结构数据越来越庞大,目前已经存储了超过70,000个结构,对于一条新鉴定的序列来说,找到一个同源结构的可能性是很大的。在本工作中,我们提出了一种新的预测蛋白质p转角结构的方法,该方法将两方面的信息结合在一起,一是从PDB中提取的同源信息,二是NetTurnP的预测结果,NetTurnP是一个基于双层神经网络的从头预测器。我们利用两个数抓集对我们的方法进行评估,一是经典的BT426数据集,二是自己构建的EVA937数据集。对两个数据集中的任何一条序列,只有先于该序列存储到PDB中的同源结构才可利用。对两个数据集进行预测,我们得到的马修斯相关系数值(Matthews correlation coefficient, MCC)分别为0.56,0.52,而仅用NetTurnP预测结果分别为0.50,0.46;我们得到的总预测准确率(prediction accuracy, Qtotal)分别为81.4%,80.4%,而NetTurnP仅分别得到78.2%和77.3%。这些结果表明将同源信息与先进的p转角的预测器NetTurnP相结合可以有效地提高预测精度。当待测序列的同源序列具有不同水平的序列相似度的时候,为了探究在这种情况下本方法的预测表现,我们以步长为0.1,从0.2到1.0改变Imax的值以控制长度大于100个残基的BLAST hits的选择。结果显示通过结合同源序列信息,即使在Imax值较低时,NetTurnP的预测精度也有增加。本方法中的参数’byDate’也可以控制BLAST hits的选择,只有比早于’byDate’值代表的时间存储于PDB中的hits才能用于结构映射。因此,在’byDate’取不同值的时候,我们试图探究本方法的预测性能是否改变。最后,我们得到的结论是:随着’byDate’值的增加,也就是它所代表的时间值越晚,MCC和Qtotal的值都随之增长,即预测精度提高。我们认为如果’byDate’所代表的时间值越接近现在,对于一条待测序列或者查询序列就可以找到更多更相似的同源结构,这样就容易提高预测精度。我们写了一个名为BTMapping的Java程序用以实现整个方法,它连同相关的数据集可以从网站http://www.bio530.weeblv.com免费下载。
其他文献
由于温室效应不断推高全球气温,植物不可避免的要受到高温的影响,温度逐渐成为影响植物生理过程的重要因素之一。所以,科学研究目前亟待解决的关键问题是增强植物的耐热性。MicroRNA (miRNA)是一类由内源基因编码的长度约为22个核苷酸的非编码单链小RNA分子,它在转录后水平调节靶基因表达。MicroRNA作为基因表达调控的新成员正不断受到科学家们的重视,它能够在转录后水平对基因表达实施准确的调控
加强党员教育管理,是党的建设基础性、根本性、经常性任务,是马克思主义政党的鲜明特征。国家能源集团谏壁发电厂探索党员教育管理新路径,强化党员"积分亮绩"管理,抓实基础环节,落实基本要求,坚持党员教育、管理、监督、服务相结合,推动形成科学规范的工作链条,努力建设信念坚定、政治可靠、素质优良、纪律严明、作用突出的党员队伍,激发基层党组织的生机与活力。
为有效解决传统隧道衬砌工艺中衬砌拱顶脱空、浇筑混凝土厚度和强度不足等二次衬砌质量通病,提高衬砌整体性并提升二衬标准化施工水平,文章针对景文高速耙齿岩隧道项目工程,采用了新型可带模注浆的衬砌台车以替代传统的混凝土浇筑方式,并对台车模板和分流系统进行综合改造设计以更好的适配耙齿岩隧道衬砌工程的施工特点,在此基础上提出了完整的逐窗入模和浇筑混凝土施工流程。此外,针对带模注浆施工前的特殊情况提出了局部超前
项目点击近年来,温江区积极适应党员队伍多样化、差异化特点,按照局部试点、总结经验、全面推广的工作思路,分类探索社区流入党员和离退休人员党员管理办法,不断增强党员教育管理针对性和实效性,推动党员教育管理工作水平整体提升。
特征选择是数据挖掘和模式识别领域的研究热点之一。为了提高对高维数据所建模型的泛化推广能力,有必要去除无关、冗余特征。从m个特征中选取P(P≤m)个最优特征子集理论上有2m种可能,已知这是一个完全多项式非确定性问题,在m较大时无法穷举。本文针对现有多数非穷举特征筛选方法易陷入局部最优的弊端,充分利用支持向量机的优点,发展了一种新的高维特征非线性快速筛选方法。对于分类问题,针对现有特征选择算法缺少通用
SDG26(SET domain group26)是一个组蛋白甲基转移酶基因。拟南芥SDG26基因功能缺失突变体sdg26具有莲座叶数量增多,叶片肥大,茎杆增粗,分枝增加,晚花和生长周期延长等表型。本研究以sdg26突变体为研究对象,观察其细胞学特征,对SDG26基因起始密码子上游序列进行了生物信息学分析。在此基础上对突变体sdg26在干旱和盐胁迫下,SOD、MDA、可溶性糖和脯氨酸含量等生理生化
细胞自噬是植物体内极其重要的功能之一。拟南芥细胞自噬相关基因的研究对深入了解细胞自噬具有重要意义。Atg8是细胞自噬的一个重要蛋白,Atg8融合GFP是检测植物中细胞自噬的重要途径。在前期的研究中,我们以AtAtg8e为诱饵蛋白,通过酵母双杂交实验,从拟南芥cDNA文库筛选得到了35个与AtAtg8e互作的蛋白。本研究采用荧光素互补技术(LCI)进一步探讨这些蛋白在烟草中与AtAtg8的互作关系。
生物的捕食与被捕食行为是生态系统中的普遍现象.自上世纪Volterra和Lotka研究的捕食与被捕食模型开始,捕食-被捕食模型就一直被广泛关注.许多相关方面的研究人员在原有模型的基础上,考虑了时滞、功能反应、种群年龄阶段结构和亲代抚育等诸多因素,并且对模型的稳定性、持久性和耗散性等性质进行详细分析论述,得到许多重要结果.但这些研究大多是基于连续型模型的.在实际问题中,对一些世代不重迭的种群的繁殖规
“双减”背景下,为了更好地提升学生的语文素养,作业设计需提高精准度,让目标与任务一一对应;需拓宽灵活度,让任务与活动步步转化;需增强评价贴合度,让活动与结果层层进阶。
胸腺肽β4(Tβ4)是β胸腺肽家族的一员,由43个氨基酸残基组成,N-末端Ser残基位点被乙酰化修饰,具有多重生物学功能,在组织再生、重塑、创伤愈合、维持肌动蛋白平衡、肿瘤发病与转移、细胞凋亡、炎症、血管生成、毛囊发育等生理、病理过程中扮演着极为重要的角色。美国雷根内克斯公司化学合成出Tβ4对其作为治疗用药的研究已经进入Ⅱ期临床阶段。由于生物提取和化学合成的局限性,人们尝试生物制备Tβ4,但生物合