论文部分内容阅读
针对基因芯片数据缺失问题,利用蛋白质相互作用关系与基因表达的内在联系,提出了一种利用蛋白质相互作用信息提高基因芯片缺失数据估计精度的方法.将蛋白质间的相互作用关系与基因表达数据间的距离相结合来计算基因间的表达相似度,根据这个新的相似性度量标准为含有缺失数据的基因选择更为合适的用于估计缺失值的基因集合.将新的相似性度量标准与传统的KNNimpute、LLSimpute方法相结合,描述了对应的改进算法PPI-KNNimpute、PPI-LLSimpute.对真实的数据集测试表明,蛋白质相互作用信息能有效改善基