论文部分内容阅读
DNA基因表达芯片可以高通量地同时分析基因在不同条件下的表达水平,揭示细胞内哪些基因是表达的,哪些基因是不表达的。分析基因表达数据的关键一步是寻找具有相似表达模式的基因组。如果两个基因的表达模式是相似的,则它们或者是执行相似的功能,或者参与同一个生物学进程。因而,如果一个新测序基因的表达模式与一个已知的表达模式相似,那么生物学家就有理由猜测这两个基因可能执行相似的功能。基因表达分析的另一个重要应用是揭示调控途径,相似的表达模式通常意味着协同调控。因此,分析基因表达数据的关键就是寻找这样相似的“模块”。
本论文的主要特点有:
1.从数学角度介绍了常用的聚类分析的优点和缺点及相关的选择方案。
2.对比分析了聚类分析的缺陷以及与双聚类分析的异同点。
3.详细介绍了双聚类方法中的Cheng和Church方法以及基于模拟退火的双聚类算法,前者为贪婪式的算法,后者为随机智能优化算法。
4.作者将遗传算法和禁忌搜索算法整合应用与基因表达数据的双聚类分析,避免了传统双聚类方法中随机数覆盖技术的使用,并且不用预先设定阈值。