基于淀粉样蛋白区域预测的特征提取方法的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:angus000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
淀粉样蛋白是一种不溶性的纤维蛋白,这类蛋白质在人体内错误折叠的结构可能会导致一些疾病,如:阿尔茨海默综合症、帕金森症等。且目前不断增加的证据表明,无论在体内还是体外,只要在某些特殊定环境下,许多蛋白质都可以转化为高度组织的淀粉样纤维结构,其稳定和不易可逆的特性也使其成为纳米级的新型材料,因此对淀粉样蛋白形成的研究具有重要意义。淀粉样蛋白的形成与序列的部分区域发生聚集有关,于是预测判断序列段是否为聚集的热点区域是本文的主要目标。关于序列的分类预测作为生物信息学中的核心内容之一,其中的特征提取对预测性能的表现起着关键作用。本文着重从理化性质数字表达后的序列和进化信息两个方面,对特征提取方法展开讨论和研究,主要成果概括如下:(1)提出了一种新的特征表示方法:Phy Ave_PSSMDwt,它包含两方面的信息:一种是基于氨基酸亲水性、疏水性、聚集倾向度、堆积密度期望值和氢键作用这五项理化性质的序列数字特征而提取的15维向量;另一种是利用离散小波变换(DWT)分析位置特异性打分矩阵(PSSM),并通过递归消除法提取的60维特征。基于Pep424数据集的实验结果证明,PSSM包含的进化信息对淀粉样蛋白预测有很高的贡献。另外,提取到的特征通过SVM分类器预测,并在交叉验证下与其它方法的最优预测结果相比,总精确度、特异度、马氏相关系数和AUC的值均有3.0%、3.3%,0.026,0.055的提高,说明该表示方法是有效且极具竞争力的。(2)提出了新的特征提取方法:PN_AC,它包含了自协方差特征,又对序列的正负值信息单独作了考虑。我们首先根据该特征向量和Phy Ave特征分类预测所得到的结果,从AAindex1数据库中筛选出了与序列聚集相关的15项理化性质。并利用这一信息构建了性质矩阵,再通过矩阵相乘融合进化信息,然后对融合矩阵的每一列提取PN_AC向量,组合15项性质的Phy Ave特征,经过最大相关最小冗余的特征选择,进行分类预测。实验结果表明,PN_AC的提取方式对淀粉样蛋白区域的预测是有效的,且其预测性能优于自协方差特征。另外,将Phy Ave_PSSMDwt与筛选出的理化性质特征组合,预测结果中总精确度、敏感度、马氏相关系数、以及AUC值分别提高了0.6%,2.6%,0.013和0.004,说明了氨基酸理化性质的丰富对预测敏感度的提高确实是有积极意义的。
其他文献
腔光力学是一个新兴的研究方向,其主要用于研究光场与机械运动之间相互耦合的物理现象[1]。得益于微纳加工手段的日益进步,腔光力学获得了迅速的发展与应用。一方面,腔光力学可以用来研究宏观物体(机械振子)的量子效应等物理问题;另一方面,腔光力学在测量微小位移,微弱的力甚至引力波探测中可以发挥重要作用。目前,机械振子受到周围环境热噪声的影响,其运动无法进入量子研究领域。针对此问题,我们研究小组进行了薄膜谐
本文以福建省南平市峡阳国有林场15年生杉木人工林为研究对象,对比研究3种采伐剩余物管理方式(去除采伐剩余物和地被层、保留采伐剩余物和火烧采伐剩余物)对表层(0~10 cm)土壤
目前城市热岛效应已经成为影响生态环境可持续发展的重大问题之一。选取合适的城乡区域并准确的计算地表城市热岛强度(Surface Urban Heat Island Intensity,SUHII)有助于全面揭示城市热岛现象。目前,较多研究关注城市内部地表温度(Land Surface Temperature,LST)的空间分布特征,对于城市区域外的LST关注较少,尤其更少的研究会关注不同城乡选取方法
随着经济全球化的不断进行,各国在经济上的联系日益紧密商品和服务贸易交流日渐增多,为各国带来了丰富的商品资源也为发展中国家提供了发展的机会。但是,优于经济全球化引起的全球经济金融的联动,使得世界经济更加脆弱,各个国家内部的经济、金融危机走出国门蔓延到其他国家;近期的例子又欧洲国家主权危机、2008年全球金融危机、1997年亚洲金融危机等,更远的例子还有七十年代的石油危机等等。在经济全球化和金融危机频
随着农业经济的发展,害虫的控制问题逐渐受到各国的重视.如何更有效地控制害虫成为农业部门关心的问题.目前,控制害虫常用的两种方法是化学控制和生物控制.考虑到长期单一地
钛合金具有比强度高、密度小、耐腐蚀和生物相容性好等特点,已在航空航天、石油化工、船舶、医疗器械等领域得到了广泛的应用。但钛合金耐摩擦磨损和高温抗氧化性能不足,制约其作为关键零部件的使用。研究表明,利用表面改性技术在钛合金表面制备耐磨性好、抗高温氧化的涂层是一种可行性方法。激光熔覆技术制备的涂层与基体之间呈冶金结合,熔覆层组织致密、涂层厚度可控,在众多表面改性技术中成为改善零件表面性能的有效途径之一
森林土壤碳库是陆地生态系统土壤碳库的主体,是森林生物量碳库的2-3倍和大气碳库的1.4倍,其微弱的变化都将引起大气CO2浓度的极大变动,在如今全球气候变暖的大背景环境下,对
光热治疗是利用近红外吸收试剂将激光的光能转换成热能杀死肿瘤,而化学动力学治疗是通过芬顿或类芬顿反应将肿瘤中高表达的H_2O_2转换为高毒性的羟基自由基(·OH)来杀死肿瘤。但是高表达的热休克蛋白以及芬顿试剂的低催化性能分别限制了光热治疗和化学动力学治疗的效果。另外,纳米药物在活体内很容易被正常组织所截留,造成信号干扰和治疗的副作用。基于此,我们设计开发了谷胱甘肽(GSH)触发的Au@MnO_2智能
在当今建筑业体制机制改革和转型升级需求不断增强的市场环境下,全过程工程咨询开展地如火如荼。《关于推进全过程工程咨询服务发展的指导意见》中首次提出重点培育发展投资决策综合性咨询和工程建设全过程咨询,为工程造价咨询企业转型全过程工程咨询提供了重要的指导思路。工程造价咨询企业可发挥自身服务优势,提升工程建设全过程咨询服务能力拓展企业咨询业务。现阶段工程造价咨询企业对自身工程建设全过程咨询服务能力的自我评
学位
结构整体抗震性能系数是保证结构整体安全性的关键因素。纤维增强混凝土(FRC)相比于普通混凝土有超高的受拉应变-硬化和多裂缝开展性能。本文将FRC用于钢筋混凝土(RC)框架结构梁