基于间隔二肽组分和递归特征消除法的DNA结合蛋白的鉴定

来源 :生物化学与生物物理进展 | 被引量 : 0次 | 上传用户:coosi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA结合蛋白(DNA-binding proteins,DBPs)的鉴定在原核和真核生物的基因和蛋白质功能注释研究中具有十分重要的意义.本研究首次运用间隔二肽组分(gapped-dipeptide composition,Gap DPC)结合递归特征消除法(recursive feature elimination,RFE)鉴定DBPs.首先获得待测蛋白质氨基酸序列的位置特异性得分矩阵(position specific scoring matrix,PSSM),在此基础上提取蛋白质的Gap DPC特征,通过RFE法选择最优特征,然后利用支持向量机(support vector machine,SVM)作为分类器,在蛋白质序列数据集PDB396和LB1068中进行夹克刀交叉验证(jackknife cross validation test).研究结果显示,基于PDB396和LB1068数据集,DBPs预测的准确率、Matthews相关系数、敏感性和特异性分别达到93.43%、0.86、89.04%和96.00%,以及86.33%、0.73、86.49%和86.18%,明显优于文献报道中的相关方法,为DBPs的鉴定提供了新的模型.
其他文献
一场“疫”外让2020年的寒假成了“超长待机”,为响应国家号召,确保学生“停课不停学、学习不延期”,让“疫”外不意外,郑州财经技师学院的老师们纷纷行动起来。面对严峻的疫
高职院校开展毕业论文写作教学,有助于提高学生的综合能力,也有助于提高教师的科研水平。但在实际的操作过程中发现,学生写作态度和写作基本功、教学时间安排及写作指导等方面都
沁源秧歌,是在沁源小调的基础上发展起来的地方曲艺,深受当地群众的喜爱,距今已有二百多年历史。沁源秧歌以百姓的生活故事为题材,具有较强的娱乐与教育功能。但沁源秧歌作为
“95后”正在大量涌入高职院校中,他们已然成为学院的主要力量。只有了解“95后”学生的特点才能更好的开展有针对性的学生管理教育服务工作。本文以浙江金融职业学院国际商
【目的】降低中文物种描述文本语义标注的学习成本。【方法】设计基于Bootstrapping的弱监督学习方法,以少量数据为基础,迭代执行学习和标注过程。在迭代过程中,利用置信度最
研究了不同Al含量和Ni/(Ti+Al)原子比对NiTi-Al基合金显微组织的影响。结果表明:在Ni50Ti50-xAlx(x=0,5,7和9)合金体系中,当Al≤7 at%时,合金的微观组织并未发生明显的变化,均由N
目的:探讨CD147在卵巢癌细胞中的表达和卵巢癌细胞与鼠成纤维细胞共孵育对基质金属蛋白酶产生及活性的影响.方法:Western blot方法检测不同卵巢癌细胞系HO-8910,3AO,SKOV3,TC
蛋白质棕榈酰化是一种可逆的蛋白质翻译后修饰,在蛋白质稳定性和亚细胞定位等方面发挥重要作用。构建了一种预测蛋白质棕榈酰化位点的新模型(PSSM-CKSAAP-RFE)。采用蕴含进化
本文主要针对银川市视觉障碍人群的相关特点进行阐述,同时分析了视觉障碍群体钢琴教学的影响因素,提出针对这一类视觉障碍人群的钢琴教学方式,笔者希望以自己多年在银川地区
目的 了解社区卫生服务机构薪酬现状,为基层卫生机构薪酬改革提出参考依据.方法 采用分层抽样的方法,在中部两省各选8家社区卫生服务中心,共272名社区卫生技术人员进行问卷调