论文部分内容阅读
随着大量生物基因组测序工作的完成,人们迫切需要探索生物基因序列背后所隐藏的生命密码,在此背景下DNA微阵列技术应运而生。微阵列是由近年来生物科技不断发展而产生的一种新的分子生物学技术,它在人类探索生命奥秘,揭示各种疾病本质,以及改善和利用生物资源方面具有重大价值。微阵列技术可以同时对大量基因同时进行表达量检测,从而产生规模宏大的基因表达数据集。科研工作者的主要研究目标就是从这些大规模的数据中获取有价值的信息,并寻找这些信息背后所隐藏的生物学规律,最终解锁生物代谢过程以及疾病的根源。但是微阵列技术客观存在一些系统性或非系统性干扰因素,使得通过该技术所获取的大量基因表达数据中包含不同程度的缺失值,这对很多针对微阵列数据的统计分析方法造成极大影响,因此微阵列数据的缺失值估计研究具有十分重要的科研价值与现实意义。本文的主要工作如下:(1)提出一种基于全局学习融合局部保护策略的缺失值估计方法GL2P(a global learning with local preservation method);(2)为了验证该方法的有效性,本文选取目前被广泛应用的多个缺失值估计方法作为参考方法并详细阐述它们各自的工作原理;(3)本文从公共基因数据库中选取多个微阵列数据集作为实验载体,并且所选数据集大部分来自其它参考方法的研究论文中,因此本文的对比实验结果具有较高的参考价值;(4)最后本文选取多个基于统计学及生物学意义的评价指标对所有缺失值估计方法的实际效果进行全面对比分析,最后根据各个评价指标的实验结果来反映本文所提方法以及所有参考方法的有效性。