基于特征提取方法的p53家族基因信息表达及分析

来源 :江南大学 | 被引量 : 0次 | 上传用户:hyzxp01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
p53基因是迄今为止发现与肿瘤相关性最高的基因,家族成员p63、p73在结构和功能上与其具有很高的同源性,因此如何使用有效的数学方法挖掘更准确的p53家族的生物信息,将对肿瘤的预防和控制具有重要意义。本文以p53家族的mRNA完整CDS序列为研究对象,采用特征提取方法对序列的表达信息进行识别,并运用层次聚类分析方法对p53家族基因序列进行分析。具体工作概括如下:(1)基因签名是一种新兴的基于特征提取的基因表达信息识别方法,能够有效的识别基因的一些生物信息。本文在原基于CGR方法的基因签名上,引入具有一定物理特性的核苷酸游离电子平均能量(EIIP),建立了一种新的E基因签名方法。同时,定义两序列间的E欧氏距离及e均方差公式,并对相关物种进行层次聚类分析。通过对16个物种的p53家族基因mRNA完整CDS序列进行E基因签名得出,在每种基因中均有物种关系越近,基因签名相似度越高的结论。(2)除了根据CGR图形构造原理进行基因签名外,本文还利用CGR方法构造一个12维特征向量对mRNA序列进行数值刻画,并定义了欧氏距离为序列间的距离。再依据此欧氏距离对16个物种的p53家族基因序列进行层次聚类分析,并将聚类结果与原来仅利用8维特征向量得到的聚类结果作对比,发现使用12维特征向量刻画基因序列的方法更合理。(3)为避免序列有效信息的丢失,综合序列CGR游走,平均功率谱,EIIP值和碱基实数化4个特征指标,建立一种多指标物种相似性分析方法,并对多个物种的p53家族基因的mRNA序列作出聚类谱系图进行层次聚类分析。聚类结果与实际相符,说明使用四重特征指标方法对基因序列进行刻画,能够较全面反映序列的生物信息。
其他文献
生物种群的发展受各种因素的影响,其中食饵捕食关系是影响生物种群发展的主要原因之一.另外,人类的活动也可以直接影响生态的变化,导致生物种群的灭绝.因此研究食饵捕食系统
为了探究脂肪酶盖子结构域对其催化底物特异性的影响,本研究将Burkholderia sp. ZYB002菌株脂肪酶LipA活性中心上方的α-螺旋盖子结构,分别与Ophiostoma piceae胆固醇酯酶(OPE
拟南芥是第一个基因组被完整测序的植物,被广泛地应用于分子生物学、植物遗传学以及发育生物学的研究,成为科学研究中典型的模式植物。拟南芥的表皮毛是覆盖在植物表面的一种
本文主要研究在单位圆盘D上的Area Nevanlinna空间,Zygmund型空间,Bloch-Orlicz空间,混合范数空间等全纯函数空间上的乘积型算子和积分型算子,得到了从一个空间到另一个空间
本文讨论了一类一阶线性时滞微分方程和一类二维线性时变微分系统的稳定性问题,是时滞微分方程稳定性研究中的典型问题之一.我们首先考虑一类一阶线性时滞微分方程,方程的系
本文应用循环扩张的方法完全分类了导群p阶的子群均二元生成的有限p群,其中p≥5.
作为快速无损的植物色素估测方法,高光谱植被指数对研究植被生长状态具有重要意义。类萝卜素作为植物色素中的第二大类主要色素,其浓度能提供很多关于植被生理状态的信息。目
本文研究一类变系数双相Stefan司题自由边界的实时控制问题.自由边界的变化可以由自动控制器实时观测到.考虑的控制问题是通过自由边界的两个控制器C1,C2,把信号反映给两个加
虎尾草是丛生型一年生禾草,在松嫩平原盐碱化草地广泛分布。虎尾草生育期短,从春季到夏季萌发的虎尾草均可完成生活史。因此,开展不同播种时间对虎尾草生殖分株生长与籽实生
在陆地生态系统中,温度能显著影响生物地球化学过程;氮沉降能引起生物地球化学循环的诸多变化;外来植物入侵对生态环境造成重大破坏,主要体现在生产力、土壤营养、土壤水分、