蛋白质序列中RNA结合位点的预测

来源 :东南大学 | 被引量 : 0次 | 上传用户:thd111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着后基因组时代的到来,使用机器学习方法对生物数据进行数据挖掘已经成为生物学研究的一种新方法。本课题主要利用支持向量机方法,结合蛋白质序列的特征提取,实现在氨基酸残基的水平上对蛋白质序列中的RNA结合位点进行预测。 蛋白质-RNA相互作用在许多生物活动中起着重要的作用,如蛋白质的合成、基因表达的调节等。为了在只给定一条蛋白质序列的情况下,判断它的哪些位点是RNA结合高发区,哪些是不容易发生RNA结合的位点,我们使用位置特异性打分矩阵和支持向量机相结合的方法建立了一个全新的RNA结合位点预测模型。结果表明,我们的预测模型净预测值达到了72.2%(敏感性为61.0%,特异性为83.3%)。与之前的同是在氨基酸残基水平上对蛋白质序列中RNA结合位点进行预测的两个模型相比,我们的模型有更高的准确性和更好的推广性。 在新建立的RNA结合位点预测模型的基础上,我们结合计算机网络技术,开发了RISP在线预测系统(http://grcseu.edu.cn/risp)。用户在预测系统输入界面输入任意一条蛋白质序列,就可以得到蛋白质序列上的RNA结合位点的预测结果返回。除了以‘+’或‘.’的形式来对蛋白质序列中每一个氨基酸残基是否是RNA结合位点进行标记之外,我们还提供了每个位点预测结果的预测可信度,并且分别给出了具有较高预测特异性和较高预测敏感性的预测结果,以满足不同用户的需求。
其他文献
连云港拥有江苏省典型的海洋渔村,基于对目前连云港渔村文化推广和发展的现状研究,连岛渔村特色内容还没有得到充分的研究和展示.本课题研究在乡村振兴视野下,展开美丽渔村品
高职院校是一个热门的院校,也是人才培养的重要基地,体育课程是其中不可或缺的一部分,通过体育教学能够推动学生身心健康发展,促进学生社会适应能力的不断提升.当前随着素质
目前,心血管慢性疾病和运动性损伤开始成为导致人类残疾和死亡的重要原因,已经严重影响人们的生活质量和健康水平。可穿戴式检测技术具有便携、保护用户隐私等诸多优势,开始
电镀污泥作为一种重要的二次资源受到人们的高度重视,在电镀污泥的资源化利用过程,关键技术是焚烧灰渣的高效浸出及浸液中有价金属的分离与回收。本研究采用硫酸和氨水-碳酸铵盐两种体系对电镀污泥脱铬渣中的铜、镍和锌进行浸出,并对氨水-铵盐浸液中有价金属的分离与回收工艺进行了研究。硫酸浸出脱铬电镀污泥的较优条件为:硫酸浓度为5.5mol·L~(-1),液固比为3.5:1,浸出温度为85℃,浸出时间为65min
2015年9月1号开始,新广告法正式实施,在此大背景下,传统广告受到了极大的限制,同时也让人们更多的看到了植入式广告的优势以及发展前景.本论文主要从新广告的背景下出发,简述
本文试将书籍+文创设计与文化产业线下场景有机结合.分析河南省文化产业发展现状、河南省出版业发展现状,以书籍+文创设计与体验场景为结合点,探讨文化产业跨界融合创新的必
学前教育是国民教育体系的重要组成部分,是基础教育的基础,被喻为是整个教育事业这棵大树的根.如果“根基”薄弱,那么整棵大树势必倒下.学前教育不仅仅关系到儿童的成长和家
军事训练是和平时期军队工作的中心任务之一,尤其是随着对台军事斗争准备的逐步深入和新的《军事训练考核大纲》的实施,部队训练强度逐渐加大,对训练伤的防治提出了更高的要求。
二十一世纪是信息时代,使信息技术成为社会成员必须具备的技术之一.当前,计算机与网络逐步渗透于各行各业,并与人们的日常生活越来越贴近,网络电话、智能小区、网上银行逐一
本文以新媒体的角度,探索自媒体在媒体转变过程中的平台产生与种类,并阐述了自媒体的传播过程特征与应用.