感应蛋白的数据整合及生物信息学分析

来源 :郑州大学 | 被引量 : 0次 | 上传用户:dmjian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物对环境中信息的感应对其生长、发育、繁殖等一系列生命活动至关重要。在感应过程中,一些蛋白在光、机械力、化学分子等信号的直接作用下发生活性变化,进而作为关键节点起到环境信息输入终端的作用,这些蛋白被称为感应蛋白(Sensor Proteins)。感应蛋白作为关键成分参与对生物过程的调控,而其表达紊乱或功能异常会导致生物过程紊乱,进而引发疾病。近年来,随着对感应蛋白研究的深入,其实验数据在不断积累,如何整合这些数据并为相关研究提供帮助成为一个亟待解决的问题。因此,本研究围绕感应蛋白开展了数据整合、注释、数据库构建及生物信息学分析的工作。首先,利用多个关键词在Pub Med数据库中检索文献,并整合Bitter DB和ORDB两个公共数据库,手动收集整合了实验验证的感应蛋白相关数据。通过文献收集和公共数据库整合,从399篇科学文献和两个公共数据库收集整合了712个实验验证的感应蛋白,来自109个物种,涉及7种感应类型。进一步手动收集了蛋白质感应类型、蛋白质特性数据、证据、组织分布、亚细胞定位、功能等实验验证信息。通过对已收集的实验验证的真核生物感应蛋白进行直系同源搜索,获得了43种真核生物的7种感应类型的477个直系同源蛋白。然后,对获取的感应蛋白进行注释并构建了dbSP数据库(Integrative database of sensor proteins)。使用从Uni Prot、Bio GRID、CDD等14个公共数据库下载的数据对感应蛋白进行了包括基本信息、组织分布、亚细胞定位、功能、蛋白质翻译后修饰位点、蛋白质-蛋白质相互作用、结构域信息和3D结构在内的8个方面的注释。基于注释完成的感应蛋白数据,使用Python、PHP、Java Script和HTML等多种编程语言搭建了一个在线数据库网站dbSP,网址为http://dbsp.omicsbio.info/。该网站提供了多个搜索和浏览选项,方便用户快速查询感兴趣的感应蛋白并进行批量下载。与其它感应蛋白数据库相比,dbSP拥有更多的感应蛋白类型和更丰富的物种,同时注释也更为全面。最后,基于dbSP数据库中的人类感应蛋白数据,进行了一系列的生物信息学分析。GO、KEGG、药物靶标蛋白和人类疾病蛋白富集分析发现:人类感应蛋白主要参与各种感应过程,与离子转运、味觉转导等密切相关;同时多个人类感应蛋白显著富集在疾病相关蛋白和药物靶标蛋白中,表明人类感应蛋白与疾病的密切关系。人类感应蛋白互作网络与生物过程及人类疾病关系的研究表明:人类感应蛋白互作网络参与调控离子转运等生物过程,同时调控肿瘤等疾病的发生发展。人类感应蛋白跨膜区与非跨膜区的癌症突变差异分析发现:与非跨膜区相比,错义突变显著富集在人类感应蛋白的跨膜区上。综上所述,本论文通过对感应蛋白进行收集整合及综合注释,构建了dbSP数据库,并进一步分析了人类感应蛋白及其互作网络对生物功能及疾病的潜在调控作用。本工作将为深入探索感应蛋白的调控机制提供数据资源和新的研究思路。
其他文献
高脂饮食(High fat diet,HFD)是最为常见的致肥胖及其并发症的因素。随着生活水平的提高,人们接触到高能量、高脂肪食物的机会越来越多,超重和肥胖及其并发症在全年龄层和多地区流行。所以,建立动物模型研究肥胖及其并发症的发病机制就变得尤为重要。关于高脂食物对人类和动物的体型、生理及心理的影响已经有较多报道,但目前高脂饮食对动物空间认知、代谢影响的研究仍不充分。本研究以成年昆明小鼠(Mus
学位
随着我国经济发展由高速增长阶段转向高质量发展阶段,传统经济对经济持续增长的影响减缓。而数字经济利用信息通信技术向传统产业渗透,大力推动生产力增长并促进产业结构优化升级,推动经济高质量发展,因此我国开始大力发展数字经济。根据信通院公布的数据显示,2018年数字经济发展对GDP增长的贡献率为67.9%,数字经济已逐渐成为驱动中国经济发展的新引擎。为了对数字经济发展质量进行测度研究,以便促进数字经济高质
学位
在经济全球化和一体化背景下,世界旅游业进入快速发展阶段,旅游发展已成为国内外共同关注的焦点。它不仅带来了旅游经济的飞速增长,更是促进了区域经济的增长集聚,因此研究旅游业的发展特点具有重大意义。而当前我国已经逐渐步入经济“新常态”发展阶段,旅游产业的发展也由原本的只关注增长速度转变为注重发展质量及效率。提高全要素生产率是当前新常态背景下促进旅游业可持续发展的核心动力,也是有效保障旅游业发展质量提升的
学位
鼠曲草族(Gnaphalieae Cass.ex Lecoq&Juill.)隶属于菊科(Asteraceae Bercht.&J.Presl),紫菀亚科(Asteroideae Lindl.),约178属2100种,世界广布,多样性中心在南非,澳大利亚,新西兰和南美洲。Flora of China记载我国有12属121种,其中63种为中国特有种。截至目前,对于鼠曲草族的系统学研究主要针对南半球的物
学位
研究新的建模方法和时空分析方法,对于理解社会现象和环境动态过程具有重要的理论意义和现实意义。混合时空地理加权回归模型相较于传统的线性回归模型,它不仅仅将时间、空间因素同时纳入到模型中,还将自变量分为全局平稳特征以及局部非平稳特征,其能够有效的解决空间数据的时空非平稳性以及空间异质性。论文将空间滞后回归应用在混合时空地理加权回归模型中,建立能够反映空间相关性的混合时空地理加权空间滞后回归模型,对该模
学位
气候变化、能源替代和经济增长之间存在着十分复杂的关系,三者之间相互依存相互影响又相辅相成。三者之间的不均衡发展势必会破坏气候与能源以及经济系统,而均衡发展有助于气候的改善和能源的充分利用以及提高经济的发展水平。因此,研究三者之间的相互关系,寻求新的均衡条件具有很大的现实意义。本文借助文本挖掘技术对气候变化、能源替代和经济增长进行前期可视化探索性研究,寻找三者之间的相互关系以及该领域的研究前沿和研究
学位
互联网技术的飞速发展带来了一个全新的时代—大数据时代,人们随时随地都在产生和使用大量的数据。海量的数据资源给人们的生活带来了极大便利,但人们想要很快地找到自己需要的信息变得十分困难,这就是“信息过载”问题。在推荐系统中,协同过滤技术是解决信息过载问题十分有效的方法之一。因此,本文以协同过滤推荐算法为研究对象,对其在实际应用中存在的问题进行了研究分析,基于矩阵填充算法提出了新的改进算法。首先,针对原
学位
党的十八大以来,中国特色社会主义进入新时代,世情国情党情都发生了深刻变化,我们既拥有难得的发展机遇,也面临许多矛盾问题和风险挑战。在此背景下,党中央高度重视伟大斗争,将伟大斗争摆在了十分突出的位置。以习近平同志为核心的党中央顺应时势变化及时提出了“四个伟大”理论,伟大斗争就是其中之一,并提出要胜利实现我们党确定的目标任务,必须发扬斗争精神,可以说,发扬斗争精神是中华民族步入新发展阶段的客观要求,是
学位
基层是党执政的根基和力量的源泉。只有基层党组织足够强大,党员充分发挥自身作用,我们党的根基才会牢固,党也才有战斗力。基层党组织是我们党开展各项工作和保持自身长久战斗力的基础,也是我们党与广大群众保持紧密联系的重要纽带,做好基层党组织建设工作是保证我们党能够长期执政下去的关键举措。党的十八大以来,习近平非常重视基层党组织建设工作,指出要把基层党组织真正建设成为战斗堡垒,同时还要发挥好自身在这一方面的
学位
健康扶贫政策是国家精准扶贫中防止因病致贫、因病返贫的重要战略举措,健康扶贫效果研究对贫困人口实现稳定脱贫具有重要意义。本文利用2018-2019年在全国5省进行的“精准健康扶贫与人口发展”专项调查数据,对健康扶贫的效果进行评估,以期为提高健康扶贫实效提出合理化建议。首先,对健康扶贫的现状进行了描述性分析,并对各区域进行对比。然后根据多维贫困理论,从教育、健康、生活水平、生产条件、村居环境及村卫生室
学位