基于元胞自动机的蛋白质进化模型

来源 :景德镇陶瓷大学 | 被引量 : 0次 | 上传用户:chinamp3jgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成,生物信息学的研究重点已悄然的从生物数据的积累转到生物数据的处理和信息提取。然而对蛋白质进化机理的研究还局限于简单的生物实验和统计分析,本文引入元胞自动机,对蛋白质结构域架构的融合、裂变、插入和删除过程设计了一整套的演化规则,从而仿真自然状态下蛋白质的进化过程。同时,本文采用元胞自动机和图像特征处理算法,将病毒的基因组数据转换为特征图像,对其进行分析,具体研究内容及结果如下:1)构建蛋白质结构域编码模型。使用结构域架构来代替传统的蛋白质氨基酸序列,既可以简化蛋白质信息的表达方式,又能关联各个保守区域的联系。该编码方式能够捕获蛋白质关键的结构和功能特征,将蛋白质在进化过程中各个氨基酸的变化转变为其所在区域的结构域变化,为序列的同源性比较和分子进化提供了思路。2)建立蛋白质结构域演化规则。为了模拟蛋白质在自然状态下的进化过程,本文设计了“继承规则”、“由后向前规则”、“由前向后规则”和“保持?规则”作为元胞自动机中元胞更新状态的映射函数,同时通过分析数据集中各个蛋白质的结构域架构,统计两两结构域之间的位置信息得到两个概率矩阵,通过轮盘赌算法,将各个结构域的位置信息与演化规则联系起来,从而模拟自然环境的多样性和随机性。通过使用人类的Rho GEF蛋白质家族对模型进行测试,结果显示模型准确率最高能达到90.27%,同时对仿真出来的结构域架构进行分析,发现该模型实现了结构域的融合、裂变、插入和删除过程,且各个结构域和其邻居的分布符合幂规律和超结构域概念。这种模型对研究蛋白质结构域架构的进化方向具有应用前景。3)构建基因序列可视化模型。本文依据碱基的结构类别对其进行编码,将一维的基因序列编码成一维的二进制序列,并在此基础上使用元胞自动机构建病毒基因的可视化模型,同时使用Canny边缘检测算法对图像进行处理。结果显示在冠状病毒图像中以向左的“/”形斜条纹为主,SARS相关病毒(2019-n Co V和SARS-Co V)的特征图像均含有六个“V”字形交叉区域,而非SARS相关病毒的MERS的特征图像只有一个“V”字形交叉区域;非冠状病毒的Ebola病毒的特征图像虽然有三个“V”字形交叉区域,但其图像以向右的“\”形斜条纹为主。同时,通过计算特征图像之间的结构相似性发现,蝙蝠冠状病毒Ra TG13与2019-n Co V之间的特征图像结构相似性达到了77.12%,穿山甲冠状病毒与2019-n Co V之间的特征图像结构相似性为73.36%。该模型能解决基因序列数据的转换、处理、显示、分析等问题,为科研人员分析基因序列的特征和功能提供了一条新的途径。
其他文献
随着科技的进步及全球经济的快速增长,环境问题也日益恶化。其中,碳排放问题在全球十大环境问题中位居首位。人口总量占全国40%的长江经济带,碳排放量占比山高达45%,虽然国家已相继出台多项碳减排实施方案,但效果并不显著。现有的研究中多从生产侧角度测算部门碳排放,但该方法只考虑了自身的碳消费,没有考虑因使用其他部门产品而产生的碳排放。隐含碳排放是在直接碳排放的基础上,衡量产品或服务在生产过程中,直接与间
本论文在课题组已有的较为成熟的SO3微热爆预处理技术的基础上,对中药材先预处理后再提取,以提高中药材有效成分的提取率,并且进一步拓展SO3微热爆技术预处理的底物范围。后
鲟鱼自古以来就是营养保健食品,有补虚益气的功效。本论文以鲟鱼肌肉副产物为原料,通过酶解和超滤技术高效制备抗炎酶解产物,基于体外细胞模型和体内动物模型综合评价了酶解
黄曲条跳甲Phyllotreta striolata(Fabricius)属鞘翅目,叶甲科,在我国分布广泛,是危害十字花科蔬菜的主要害虫。该虫繁殖能力强,幼虫、成虫分别危害植株的根系、叶片,从而对
目的:探讨瘤周微环境的CT影像组学特征诊断纯磨玻璃结节肺腺癌浸润性的价值方法:回顾性分析2017年1月至2019年5月期间在吉林大学第一医院经外科手术治疗,并于术前行胸部CT平扫检查,术后经病理证实为肺腺癌的患者的100个纯磨玻璃结节,按6:2:2的比例,随机分为训练组、验证组及测试组,选取瘤周5mm的肺组织作为微环境,从中提取1389维影像组学特征,经最小绝对收缩和选择算法降维得到16维特征,通
在现代汉语中,副词“直”在口语及书面语中被大量使用,但是相关的多角度研究及其结构研究并不全面,关于副词“直”,我们经常会用于表达较为强烈的情感甚至夸张地表达生命体的状态,如:“冻得直哭、气得直冒火、这孩子直闹得我心里发慌”,这些与副词“直”共用的结构也是一种述补结构。一般情况下在状态补语中,用形容词进行描述的情况非常常见,而其中以动词或动词短语作为状态补语的情况非常少见,如:“疼得直哭、气得直叫”
本文以玉米秸秆木质素为原料,优化了木质素水热解聚的实验工艺,确定了环氧化木质素的最佳合成配方,并探究了环氧化木质素/环氧树脂-聚酰胺共混体系的固化反应,确定体系固化工
张量互补问题和多项式互补问题不仅是线性互补问题的自然推广,而且是非线性互补问题的一个特例。一方面,由于张量自身结构的复杂性,很多线性互补问题的相关性质不能直接推广
目的:测定新生血管性年龄相关性黄斑变性(Neovascular Age-Related Macular Degeneration,n AMD)患者初始连续三针抗VEGF(anti-vascular endothelial growth factor,anti-VEGF)基线治疗前后视力与CMT(Central Macular Thinckness)、及房水中胎盘生长因子(placenta grow
为获得以代森锌为代表的乙撑双二硫代氨基甲酸酯类农药在农业生态环境中残留含量的简易快速检测方法,采集土壤、蔬菜、水果样品,分别与盐酸–氯化亚锡共蒸馏,其中的代森锌农