蛋白质分类预测中的新方法研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:zxqminibear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质结构与功能预测是蛋白质组学中一个发展已久且极具挑战性的研究热点,已成为后基因组时代生命科学中的重大研究课题之一。随着现代生物科学与技术的迅速发展,大量蛋白质序列数据不断涌现,深入研究这些序列数据进而达到对蛋白质化学和生物意义的深入理解,是现代生物信息学研究的主要任务。尽管蛋白质的结构和功能可以通过实验方法来确定,但采用实验方法具有耗时和费用昂贵等不足。因此,发展仅仅基于蛋白质氨基酸序列就能自动可靠地对蛋白质结构与功能进行预测的方法具有十分重要的理论意义和实用价值。基于蛋白质结构与功能的研究现状,本文创新性地提出将支持向量机与小波变换有机结合,构建了-小波支持向量机新模型,用于蛋白质结构与功能的分类预测,取得的主要成果如下:1.将小波支持向量机模型用于G蛋白质偶联受体家族的预测。预测模型主要包括三个步骤:首先利用氨基酸物理化学性质将蛋白质氨基酸序列转换为数字信号,再利用离散小波变换对氨基酸序列进行分解,提取G蛋白质偶联受体家族的特征向量,同时对小波基和分解层次优化选择,最后将所获得的特征向量输入到支持向量机进行分类预测。预测分为三个层次进行:首先分类识别G蛋白偶联受体三个家族,再进一步确认A家族类视紫红质受体蛋白的三个亚家族,最后确认G蛋白偶联受体的亚亚家族。小波支持向量机对G蛋白偶联受体三个层次的蛋白质家族预测准确率分别为99.72%、97.64%和99.20%,与文献结果相比,本方法具有预测简单、直观和预测准确率高等优点。2.将所构建的小波支持向量机模型用于酶家族和氧化还原酶亚家族的分类识别。酶蛋白分为六类家族,其中氧化还原酶含有16类亚家族,为了解决多类分类难题,本文分别采用一对一和一对多的分类策略对酶家族数据集C1200和C2640进行Jackknife检验,预测准确率分别为91.90%和99.17%,明显优于文献报道方法。同时,本文还对小波分解尺度、小波函数、支持向量机核函数以及氨基酸物理化学性质等参数进行了探讨和优化。结果表明,离散小波能有效地解析氨基酸序列信号,并有效地从小波分解系数中提取出酶蛋白的结构特征,从而获得了极高的预测准确率。3.将小波支持向量机模型与多类氨基酸物理化学性质相融合,利用小波变换多分辨原理对氨基酸序列进行特征提取,进而将筛选的特征向量输入到支持向量机中用来识别蛋白质二级结构。采用文献常用的蛋白质数据集对模型进行jackknife检验,结果令人满意。同时,还深入研究了低同源性蛋白质序列对预测准确率的影响,即分别采用W1189(同源性低于40%)和25PDB(同源性低于25%)进行了测试,预测结果分别为76.47%和85.72%比文献方法提高17%和23%。上述结果表明,本方法有效地克服了低同源性对理论预测方法的影响,满足生物信息学对蛋白质结构预测的要求。以上基于小波支持向量机模型的各类蛋白质分类预测技术都已编写了较完整的自动运行程序,可共享使用。本文获得了国家自然科学基金和江西省自然科学基金的资助。
其他文献
随着城市化进程的加快,传统文化开始受到极大冲击,现有的城市功能已经无法满足人们的需求,人们更加渴望有味道、有情感的居住环境。而传统改造的分析方法大多是依靠的是主观经验,没有一套完整的理论体系,致使改造后的街区无法达到应有的效果,市民精神需求难以满足。因此,如何进行前期客观的分析,以及如何将分析结果运用到规划设计中就显得尤为重要,同样也是本论文研究的重点。本文首先阐述历史街区、空间句法及规划设计所运
本文介绍了在一台50mL 二冲程汽油机上进行的传热和零件负荷的研究工作。研究中,用一种新型的表面温度传感器测量了局部的不稳定壁面传热过程,并将由此得到的局部壁面热流密
以俄克拉荷马州立大学技术学院为例,全面介绍和分析了美国高等技术学院课程设置及其特点,并对如何进一步改进我国高等职业教育课程这一问题进行了深入思考。
从旅游开发的角度,对三汊河湿地资源,运用定性和定量的方法,就资源类型结构、质量等级和地区综合条件等方面进行了系统的评价.研究得出湿地区域旅游资源类型较丰富,质量等级
建设用地作为产业发展的基础载体,对产业发展具有空间约束性,建设用地不同功能用地支撑着产业结构不断演进;产业结构的调整是建设用地结构变化的主要推动力,影响着建设用地的空间布局、建设用地的利用方式,改变着建设利用结构。然而随着近年来建设用地的总量控制和结构性控制,建设用地显得更稀缺性,这已经已成为制约产业结构调整的主要因素。因此厘清城市建设用地结构和产业结构间的相互关系,对统筹城市建设用地资源合理配置
甘露糖作为一种具有重要功能的六碳糖,在生物,化学等领域有着广泛的应用。传统生产方法主要是从某些天然植物中提取甘露糖的聚糖,再将其水解解聚制得;或是用葡萄糖为原料,通
<正> 1.前言就混合气靠火花塞点火的燃烧来说,二冲程汽油机的燃烧和四冲程相比并无本质区别。有关四冲程汽油机的燃烧问题,以前就进行过许多研究,并对发动机各运转条件对燃烧
目的:本研究在规范肺炎敷背散辅助治疗小儿肺炎的操作流程的基础上,观察肺炎敷背散外敷结合西医常规治疗对于肺炎喘嗽(痰热闭肺证)患儿的临床疗效,为小儿肺炎的综合治疗提供更多有效手段。方法:将符合纳入标准的60例住院患儿,随机分为三组,对照组(即常规治疗组)20例、规范治疗组(即常规治疗+肺炎敷背散外治组+操作按前期研究制定的操作规范进行)20例、非规范治疗组(即常规治疗+肺炎敷背散外治组+未规定具体的
山阳县位于陕西省商洛市西南部,地处秦岭南坡山地,境内地质环境差,地质灾害发育。其中堆积层滑坡是研究区内发育数量最多、分布范围最广、危害最严重的地质灾害类型,具有典型的降雨型滑坡特点。因此,研究山阳县堆积层滑坡的发育特征及降雨诱发堆积层滑坡形成演化机理,对当地地质灾害的防治工作具有重要的意义。本文以山阳县地质灾害调查资料为基础,通过统计分析和野外核查,归纳总结出山阳县堆积层滑坡的结构特征和发育规律。