论文部分内容阅读
癌症的分类是在生物信息学的一个主要研究话题。然而,与基因表示数据联系的高维数和小尺寸的性质使分类相当挑战性。尽管主要部件分析(PCA ) 具有为高度维的数据的特别兴趣,它可以过分强调一些方面并且忽略在丰富地复杂的数据包含的一些另外的重要信息,因为它在第一二维或三维的 PC subspaces 显示仅仅差别。基于 PCA,一个主要部件累积(PCAcc ) 方法被建议。它采用在多重 PC subspaces 包含的信息并且改进癌症的班可分性。现在的方法的有效性被四通常使用的基因表达式数据集评估,并且结果证明方