论文部分内容阅读
目的:从胃癌高频率杂合性缺失区域8p21着手,克隆染色体8p21-22区域EST(DA931869)所代表的胃癌相关新基因,初步分析预测该基因的结构及编码的蛋白质分子与功能,为进一步鉴定胃癌发病相关新基因奠定坚实的工作基础。方法:收集42例胃癌手术切除新鲜标本,切取胃癌组织为实验组,以远离癌组织(≥5cm)胃黏膜组织作为正常对照组,所有样本均经病理学确诊,分别提取胃癌及正常胃黏膜组织总RNA,运用RT-PCR方法验证EST的表达水平;将EST作为起始序列,通过BLAST分析dbEST数据库,进行电子克隆(in silico cloning),以DNASTAR软件进行序列拼接与延伸,获得该基因的全长cDNA序列;采用生物信息软件,预测该cDNA序列的开放阅读框,染色体定位,及其所编码的蛋白质同源性分析,二级结构及其功能预测等;运用染色体步移(Chromosome walking)技术实验验证EST所代表的未知基因全长序列。结果:RT-PCR验证结果:EST在42例胃癌组织中阳性表达率为40.48%(17/42),在正常胃黏膜组织中阳性表达率为83.33%(35/42),两者差异有统计学意义(p<0.05)。电子克隆及基因结构预测结果:将EST通过BLAST进行dbEST数据库检索,寻找同源序列进行拼接延伸,第一次延伸往3’端方向延长87bp,随后往5’端方向依次延长443bp、343bp、421bp和473bp,经五次延伸拼接之后,此cDNA序列达最大长度为2326bp。将该cDNA序列与人类基因组草图大规模测序数据库中的序列NT-167187.1进行比较分析,将此cDNA精确定位于8p21,在染色体上跨度770Kbp(24,080-24,850Kbp),由3个外显子和2个内含子组成。ORF FINDER在线软件预测最大开放阅读框长度为354bp,编码117个氨基酸,起始密码子预测分值为0.78。在线软件预测分析结果显示,于序列367位碱基发现TATA盒信号:TGTATAAAAA;加尾信号位于第1932位碱基:GAAATAAAAT;在序列202-587位存在一CpG岛,G+C%为59%。运用DNAMAN软件进行限制性酶切分析到60个酶切位点。将该cDNA序列与nr数据库BLAST比对,结果显示,EST(DA931869)所代表的未知基因序列与神经丝中间多肽基因序列覆盖率为55%。蛋白质结构及功能预测分析:利用DNASTAR软件的Protean程序对编码蛋白进行蛋白质理化特性分析,该蛋白相对分子质量为13016.04 Daltons,等电点为11.70,为一碱性蛋白质。蛋白质二级结构预测显示,α螺旋分别为1-9,13-18,40-49,β折叠为111-117,其余为β转角及无规则卷曲。蛋白质疏水性预测分析显示该蛋白为一亲水性蛋白质。利用SMART数据库进行蛋白质结构域分析,结果显示28-37和71-91位氨基酸残基存在低复杂性区域,32-43位氨基酸发现一膜占位识别连接结构域。在此编码蛋白中未发现跨膜片段及信号肽片段。同源性蛋白质分析结果显示,此编码蛋白与蛋白质转运蛋白Sec16B及视交叉上核昼夜节律振动蛋白SCOP相似。染色体步移结果:逐步设计特异性引物进行RT-PCR扩增,T-A克隆后测序,经两次步移,共获得此cDNA3’末端序列641bp,经BLAST比对基因组序列,结果一致。结论:1.采用电子克隆,得到EST(DA931869)所代表基因序列长度为2326bp,由3个外显子和2个内含子组成,ORF长度为354bp,精确定位于染色体8p21,含有加尾信号。2.该基因编码一个由117位氨基酸组成的蛋白质分子,含有一个MORN结构域(为32-43位氨基酸),为亲水性蛋白质。3.染色体步移,获得EST(DA931869)所代表的未知基因3’末端cDNA序列641bp。