基于SVM的蛋白质可溶性预测及HBV中变异的模式分析研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:qwe136172081
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是人类生命活动息息相关的生物大分子,本文从计算科学的角度研究分析蛋白质。本文主要分为两个部分:第一部分通过分析提取蛋白质的特征然后应用SVM的方法从蛋白质的一级结构出发预测蛋白质的可溶性;第二部分从统计模式分析并应用计算机软件方法,探索乙肝病毒氨基酸的变异模式。1)在机器学习中,特征作为学习数据的表示,特征选择结果的好坏直接影响着分类器的分类精度和泛化性能,因此有效的特征选择方法至关重要。支持向量机作为目前应用最广泛的机器学习模型之一,在文本分类、图像识别、生物信息学等各个方面都有重要的应用。蛋白质作为一切细胞、组织的重要成分,在生命活动中扮演着决定性的作用,蛋白质的是否可溶,决定了它是否能发挥功能,而且有一系列的疾病都是由于机体的蛋白质可溶性发生变化造成的,因此,蛋白质的可溶性的重要程度毋庸置疑。本文应用SVM的模型,根据蛋白质氨基酸的理化性质以及蛋白质的序列特征,从计算科学的角度出发,训练出蛋白质可溶性预测的模型,然后应用得到的模型预测新的蛋白质序列的可溶性。经过与前人工作的比较,我们得到分类效果较优的蛋白质可溶性特征以及预测模型。2)乙型肝炎是一种流行性广、危害严重的传染性炎症疾病,目前尚无彻底的根治方法,只能通过有效的疫苗接种来预防。本文应用统计分析的方法,研究乙型肝炎病毒蛋白质的变异数据,分析该病毒四种蛋白质中氨基酸的变异趋势,找到部分氨基酸变异的模式;然后运用模式分析软件,分析乙型肝炎病毒四个蛋白质的抗原表位,结合氨基酸的变异信息,得到变异比较活跃的抗原表位,为该病毒的抗病毒药物和疫苗设计提供有效的帮助。经过本文对乙型肝炎病毒氨基酸变异数据的整理分析。我们发现在乙型肝炎病毒四个蛋白质中,DNA聚合酶和表面蛋白的变异数量都高于另外两个蛋白质。四个蛋白质中丝氨酸、苏氨酸和丙氨酸发生的变异较多,变异成丝氨酸、苏氨酸的数目也比较多;发生变异数目最少的是色氨酸和甲硫氨酸。
其他文献
虚拟现实技术涉及众多研究和应用领域,被公认为21世纪重要的发展学科以及影响人们生活的重要技术之一。全景图拼接技术是一种基于图像绘制生成真实感图形的虚拟现实技术,由于
多自主无人地面车辆(Multiple Unmanned Ground Vehicles,MUGV)系统的研究由于智能机器人技术的进步得到了快速发展,目前在多个领域的应用越来越广泛。多自主无人地面车辆系
随着计算机技术的高速发展,IM(Instant Messaging,即时通信)软件成为人们手机上必备的软件,例如:QQ、微信等。无线局域网络的快速发展和大面积的覆盖,使得在手机上进行音视频
面向服务计算已经成为一种新的计算范型,尤其是服务组装成为一种重要的软件开发方式。语义网络是未来网络的一个核心技术,它可以表达更加复杂的概念及其之间的相互关系。Web
随着网络的普及和信息技术的日新月异,信息膨胀与冗余给人们的社会活动和商务活动带来了信息选择的困惑,因此为每个用户提供快捷准确,满足个人实际需要的个性化信息服务成为
数字家庭是个与时俱进的概念,具有保持在线、智能控制、服务交付等特征。随着信息技术的不断发展,数字家庭所涵盖的内容也在不断变化。研究数字家庭实现过程中的关键技术具有
学位
随着嵌入式系统和网络技术的不断发展,嵌入式Internet技术以其易于集成、开销低以及应用广泛等特点成为现代社会各个领域的热门技术,在远程控制领域也发挥了其强大的优势。无
本文首先对移动Agent技术和NS2(Network Simulator Version 2)网络仿真器结构和功能的研究现状进行了分析,了解到虽然移动Agent技术具有很多传统分布式计算模型所没有的优势,
伴随着互联网技术的迅速发展,网格计算技术也日益发展壮大,它是专门针对复杂科学计算领域的新型分布式计算方法。简单地讲,网格是把整个因特网整合成一台巨大的“超级虚拟计