论文部分内容阅读
研究了两个方面的问题.首先,对E.coli(121个基因),B.subtilis(111个基因)、Yeast(107个基因)三种生物的核酸序列,将同义密码子按使用频率统计值分成三种特性的密码子:最适密码子、非最适密码子和稀有密码子.对每一序列的编码区,算出它们各自出现的概率后,用信息聚类法聚类.发现每种生物的高低表达基因明显分开,将三种生物基因聚类结果综合来看,基因表达水平被分为四级:甚高表达基因(VH)、高表达基因(H)、较低表达基因(LM)和低表达基因(LL).每类基因的表达水平与实验结果保持了很好的