核蛋白的亚核定位和植物、非植物及小鼠蛋白质的亚细胞定位预测研究

来源 :内蒙古大学 | 被引量 : 6次 | 上传用户:chengxiulong33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的实施和推进,数据库中出现了大量未注解的蛋白质序列,如何获取这些蛋白质序列的功能信息已成为当今生物信息学的研究热点。蛋白质的功能与其亚细胞定位密切相关,因此,研究蛋白质的亚细胞定位,可以为了解蛋白质的功能提供重要线索。本文分别以核蛋白、植物和非植物蛋白以及小鼠膜蛋白为研究对象,利用离散增量(ID)、离散增量结合协变判别式(CDA)以及离散增量结合支持向量机(SVM)方法,通过提取蛋白质一级序列中多种特征参数,分别对它们在细胞中的亚核定位和亚细胞定位进行预测。论文的主要研究工作概括如下:(1)首次利用相异有限系数(DC)算法和离散增量结合协变判别式的(ID CDA)算法两层分类器对核蛋白的亚核定位进行了预测。在DC算法中,选取全序列的氨基酸组份和氨基酸序列亲疏水性二肽组份为信息参数,ID CDA算法中选取N端氨基酸1-gap二肽组份和氨基酸2-gap二肽组份为信息参数,对单定位蛋白质总预测成功率为75.4%,多定位蛋白质总预测成功率为80.4%。单定位蛋白质总预测成功率比Lei-SVM方法高8.9%,多定位蛋白质总预测成功率比Lei-SVM方法高15.2%。在序列相似性小于等于25%时,该方法也取得了较高的预测成功率。(2)通过选取氨基酸组份和赝氨基酸组份为信息参数,首次利用离散增量结合支持向量机的(ID SVM)算法,预测真核植物和非植物蛋白质的亚细胞定位,Jackknife检验总预测成功率分别是88.3%和92.4%,预测结果好于现有的其它方法对该数据库的预测结果。文章中对单一参数的离散增量的预测结果和离散增量结合支持向量机的预测结果作了详细比较,并对多种参数组合利用ID SVM算法进行预测。结果表明,利用多参数的适当组合,采用ID SVM算法可以得到较好的预测结果。(3)以12类真核生物为研究对象,对12类真核生物蛋白质分别选取全序列氨基酸组份、氨基酸二肽组份,采用离散增量(ID)的方法进行预测,通过对离散增量的进一步组合,取得了较高的预测成功率。(4)构建了小鼠蛋白质和小鼠膜蛋白两个数据库,通过选取全序列的氨基酸1-gap二肽组份,N端序列的氨基酸二肽组份为信息参数,采用离散增量结合协变判别式(ID CDA)方法对小鼠蛋白质的亚细胞定位和小鼠膜蛋白的类型进行预测,取得了较好的预测结果。(5)分别选取全序列中氨基酸组份、氨基酸二肽组份、氨基酸序列的亲疏水性分布信息、N端和C端氨基酸二肽组份为特征参数,利用离散增量(ID)算法,对原核生物中的革兰氏阴性菌蛋白质的亚细胞定位进行预测,分别讨论了单个参数和组合参数对预测结果的影响。
其他文献
认知语言学从20世纪70年代兴起到现在为止已成为语言学最热门学科。它的出现不仅对语言学领域带来诸多新理论和新方法,还通过认知这一窗口观察到了人类大脑活动,并促进了认知科学自身的发展。延伸出神经语言学等新兴语言学领域。本论文沿着认知语言学热潮对蒙古语最有标志性的语法特点元音和谐和多年成为当代蒙古语言学家们关注的热点问题之一的蒙古语词重音做了词汇识别研究。蒙古语论著中已有些许利用认知语言学角度研究蒙古
《哈木尼堪蒙古语研究》一文是对生活在呼伦贝尔市陈巴尔虎旗鄂温克苏木哈木尼堪鄂温克人所使用的蒙古语进行系统性研究的成果。以往国内外专家学者用哈木尼堪语来命名并进行过一些研究,但系统性研究甚少。因此本人基于多次到哈木尼堪鄂温克人所在地区进行的田野调查,并利用有关专家相关研究基础上,对哈木尼堪蒙古语进行了全面的梳理与研究。本论文由导论、第一章、第二章、第三章、第四章、结论、参考书目、附录等内容组成。导论
1978年党的十一届三中全会之后随着民族文化意识的回升蒙古文期刊的种类开始增多,除了自治区和各盟市公开发行的蒙古文期刊之外,蒙古文内部期刊也陆续出现。这些蒙古文内部期刊的种类多,内容丰富,地域特征明显,是蒙古文期刊的重要组成部分。旗县内部期刊也是外人了解当地历史、文化、风俗、人民生活的窗口和媒介。并有将这些历史文化、习俗、传说等用文字记录下来传承子孙后代的作用。本论文对赤峰市《美丽富饶的阿鲁科尔沁
始编于乾隆四十四年(1779)的《钦定外藩蒙古回部王公表传》,是研究清代蒙古史必不可少的基本史料。时至今日,该史料有以下几种不同的称呼,如《钦定外藩蒙古回部王公功绩表传》、《钦定外藩蒙古回部王公表传》、《钦定蒙古回部王公列传》、《蒙古王公表传》,《王公表传》,甚至可以直接称之为《表传》。长期以来,国内外史学界将《表传》广泛应用于他们的研究领域,对该书的史料价值予以了充分的肯定。但是在蒙古国,人们还
乌梁海土语属于卫拉特方言,是跨越中国和蒙古国的蒙古语土语之一。在蒙古国已经出现了为数不多的乌梁海土语研究成果,但是大都属于语音研究资料。在国内,乌梁海蒙古人散居于新疆阿勒泰市及其辖属汗德尕特蒙古族乡、青河县、布尔津县、富蕴县、福海县等地,他们至今较完整地保留着自己独特的民俗文化与方言土语。然而,学界至今尚未对他们的蒙古语土语进行过调查研究。新疆地区的乌梁海蒙古人长期以来一直和人口众多的哈萨克族混居
清代伊克昭盟的人口研究既是鄂尔多斯地方史研究的重要组成部分,亦是清代蒙旗社会史研究的重要课题。涉及清代伊克昭盟人口研究成果不少,这些研究成果从不同角度研究伊克昭盟人口,然而从人口学角度研究人口数量、结构、移动、管理等诸多内容的专题研究成果很少。本文在前人研究的基础上,主要利用新近出版的伊克昭盟蒙旗衙门档案和其他相关文献,对清代伊克昭盟比丁制和人口若干问题进行了全面系统的梳理和阐释。第一章,详细分析
随着政府管理体系问责的加强,第三方评估逐渐兴起。第三方评估被认为具备公平、公正的特征,同时具有"以评促建"的功能。然而,在具体的实践过程中,第三方评估是一个各利益方不断博弈、不断建构的过程,最为突出的是评估专家秉持的科学理性逻辑与行政官员身处的行政运作实践逻辑之间的碰撞。本文运用参与式观察法,从建构主义视角对所参与的社区治理评估项目进行研究。文章从评估交谈语言分析入手,将交谈者与其社会结构位置关联
通过黄竹坑生活垃圾填埋场渗滤液技改工程的实例,分析MVR技术在渗滤液处理方面的效果。工程运行结果表明该工艺运行稳定,氨氮去除率99.91%,SS去除率97.69%,COD去除率99.37%,BOD去除率99.53%,出水水质达标。
期刊
构建与国际接轨、本土结合、可执行落地的社会工作伦理守则是当前重要议题,然而既有研究与实践存在诸多不足。通过定性比较分析方法,选取了全球12个国家和地区,根据政策执行过程模型与本土发展情境,对社会工作伦理守则的执行力结果进行评估。结果发现,影响国家和地区社会工作伦理守则执行力的因素有以下核心条件及组合:文本内容、执行主体、执行环境,其中后两者组合覆盖率更高。围绕分析结果进一步讨论了内容结构、伦理困境
印记是一种表观遗传学现象,即亲本等位基因的选择性表达取决于亲本的来源,与正反交无关。植物中,多数印记表达是在发育种子的胚乳中观察到的。首个在分子生物学水平确定的印记基因为拟南芥MEDEA (MEA)基因,为母本特异性表达基因,对种子发育具有重要作用。目前,拟南芥和玉米中各有11个已报道的印记基因,水稻胚乳中已报道的有200多个印记基因。但印记基因依赖于亲本来源的特异性表达调控机制尚不清楚。本文通过