联合特征驱动方法和模板方法预测蛋白质的核酸绑定残基

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:asjkdhfjkhasdjklfhjk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质-核酸相互作用在基因表达和调控等诸多生命过程中发挥着极其重要的作用,利用计算方法准确识别蛋白质中与核酸发生物理接触的区域有助于阐明这类相互作用机制。目前大多数算法仅独立地采用特征驱动方法或模板方法预测核酸绑定残基,但是其预测精度仍有待提高。针对现有算法的不足,本研究通过联合上述两种策略,分别构建了基于结构信息和基于序列信息的混合算法。RBRDetector算法结合蛋白质结构的局部相似性和全局相似性构建RNA绑定残基的预测模型。具体而言,基于蛋白质局部相似性,开发了一种特征驱动的预测方法。该方法抽取了残基的进化保守性、局部几何指标、网络拓扑指标等属性,并将这些属性联合残基的局部微环境组成支持向量机的输入特征。同时,利用RNA绑定蛋白的全局相似性,开发了一种基于结构比对的模板方法。该方法将查询蛋白与模板库中的RNA绑定蛋白质进行结构比对,选择最优的模板构建预测的蛋白质—RNA复合物,进而利用该复合物识别相应的绑定区域。最后,通过分段函数将上述两种预测方法的结果进行联合,使混合算法的预测精度大幅提高。通过对不同类型的数据集(如绑定结构、非绑定结构、理论模型等)进行测试,结果显示RBRDetector算法显著优于现有同类算法。虽然利用结构信息能够较为精确地识别核酸绑定残基,但是现有蛋白质结构数据的匮乏限制了其适用范围,而基于序列信息的预测方法则具有更广泛的应用价值。为此,本研究开发了依据序列信息识别核酸绑定残基的混合算法SNBRFinder。该算法采用基于隐马可夫模型的序列谱比对方法寻找查询序列的最优模板,并将位置特异性打分矩阵和互补的序列特征通过序列微环境构成特征组合,最后结合这两种方法的输出结果作为预测值。为了验证该算法的有效性,本研究运用广泛的核酸绑定蛋白数据集进行了严格的测试。实验结果显示模板方法的预测性能与结构比对方法相当,额外序列特征的加入能有效提高特征驱动方法的预测效果。利用上述两种方法的互补性,混合算法SNBRFinder展现出更好的核酸绑定残基识别能力。
其他文献
欧李(Cerasus humilis(Bge.)Sok)又被称为中国矮樱桃,属于蔷薇科樱桃属,是中国特有植物,分布在13个省、自治区和直辖市。该植物是一种小型落叶灌木,其果实含有多种高营养和具有药用价值的化合物,因此在我国长期用于保健和制药。近年来,研究主要集中在欧李果树和新品种的培育上,对其果实中的活性物质研究仍比较少,因此在果实活性物质研究工作的基础上,本研究以欧李果实为材料,利用超声辅助提取
知识管理系统在组织的IT系统中不是孤立的存在,必须跟其他已经存在的业务系统、其他管理系统紧密结合。
我国的科技企业孵化器已经进入由量变到质变的发展时期。本文从品牌的角度探讨孵化器实施品牌战略的意义, 深入解析品牌战略和孵化器之间的内在联系,并提出:孵化器在实施品牌
电信公司运维监控管理一直处在半手工半自动化管理阶段,各种IT设备或者IT系统的维护与管理都是被动进行,不能实时跟踪并主动发现问题。随着电信信息化建设加快发展,各运维部
稀有金属(包括Nb-Ta-W-Sn),具有一定的经济价值,被称为“战略资源”或“重要材料”。通过对稀有金属花岗岩中造岩矿物及副矿物的研究,有助于了解稀有金属元素在岩浆热液阶段
从煤层气开采的地质评价、钻井工程、储层改造和排采生产4阶段建立煤层气开采影响因素体系。其次融合熵权法和决策实验室方法(DEMATEL)构造了影响因素分析模型,最后以华北、
由于数据业务的发展以及网络的普及,存储技术正经历着一场深刻的革命.海量信息的存储呼唤新的存储技术出现,网络附属存储与存储区域网络技术正是在这一形式下产生的,本文试图
传统村落是农耕文化的发源地和民俗民风的传承地,是华夏文明的根基。随着现代生活的加快,城市飞速发展,村落空心化日益严重,问题突出致使村落走向衰败。同时,在城镇化与新农
父母体罚是指父母为了纠正或控制儿童的错误行为而故意引起儿童身体上的疼痛但不会对其造成伤害的行为。国内外的研究表明,父母体罚存在代际传递性,即儿时经历过体罚的父母更
<正> 在经济生活中,消费行为是广大消费者最普遍的对商品或物质的需求与支配行为。广大城乡居民的消费实践证明,一定时期的消费行为及其结构取向不仅取决于社会生产力水平和