论文部分内容阅读
基因芯片技术的出现使得人们能够同时测量成千上万个基因的表达水平,这给生物学研究带来很大的帮助,但同时也给数据分析带来了新的难题.利用基因表达谱识别病例对照样本中的差异表达基因集合,多元统计检验是一种常用且有效的方法.然而,获取每个样本的基因集合整体表达水平有利于疾病的个体化研究,这就促进了基因表达数据降维方法的发展. 本篇论文对基因表达数据进行了通路(常用的先验基因集合)差异表达分析.文章的关键方法是表达数据的降维方法,在介绍了几个经典的数据降维方法之后,我们基于对局部保留投影的改进提出了一种更适用于多维基因表达数据的降维方法.然后,文章对两组真实数据利用本文方法进行了分析,同时也利用了几个其他的降维方法进行了分析,将这些分析结果分别与经典的差异表达通路分析方法(基因集富集分析法)的结果进行了对比,最终得到本文方法的可行性.