论文部分内容阅读
本文提出了一种编码方案,同时聚类正共调控基因和负共调控基因.基于这种编码方式,两个正共调控或负共调控的基因都具有相同的编码,因此被聚集到同一个共调控基因类中.进一步提出了一个基于这种编码方案进行最大子空间共调控基因聚类的新算法及一些新的相关削减策略.一个最大子空间共调控基因聚类聚集了某个条件序列上的一组共调控基因,而且不被其他的子空间共调控基因聚类包含.从多方面分析了该算法的性能,并将其用于白血病和酵母细胞的真实表达数据集及人造数据集聚类.理论分析和实验结果都表明,相对于已有的基于模式/趋势的聚类算法,该算法能发现更多具有生物意义的共调控基因聚类,并且性能优于目前的共调控基因聚类算法.