论文部分内容阅读
20世纪90年代初产生了一项新的以基因芯片为先导的生物技术,即生物芯片技术。它是一项高度交叉的新技术,涵盖了电子学、生物学、物理学、化学、工程学、计算机科学。因其能对生物学问题进行量化和高通量的研究,这是以前的技术难以完成的,因此自它出现就引起了国内外的普遍关注,被广泛应用于临床疾病诊断、药物发现和基因组等领域。生物芯片技术主要包含样本采集、芯片制作、扫描成像、生物芯片图像处理和数据分析五个环节。生物芯片图像处理是生物芯片技术的一个重要环节,主要包括图像预处理、网格化、样点分割、信息提取四步。因此我们对生物芯片的研究,主要是对其数字图像处理的研究。目前很多的研究员是针对网格化和样点分割这两部分进行相关研究的。因为只有确定了生物芯片图像上样点的位置和形状之后,才能对带有生物信息的像素进行准确有效的提取。可以说网格化是图像处理和数据分析的基础,因为网格化处理后,我们可以确定样点的位置,这样会大大降低样点分割和信息提取的难度,提高处理效率;同时全自动的网格化处理是生物芯片图像进行批量化分析的关键。因此本文将以生物芯片数字图像作为研究对象,研究其网格化算法,为此我们做了以下工作:第一,提出一种结合最大内间距(Otsu)和改进网格校准的网格定位方法。它可以解决网格线冗余、缺失及出现在信号点上的情况。具体过程如下:首先求出原始图像灰度值在水平方向和垂直方向的投影情况,结合数学形态学膨胀重构的思想,利用最大类间距求出最佳阈值;其次利用最佳阈值得到生物芯片图像的二值参考图像,确定初始网格;接着对初始网格进行测试、校准;最后获得网格化结果。实验结果表明,文中提出的网格化算法的网格准确率明显高于其他算法,并且该算法简单、可实现性高。第二,设计基于多孔硅微阵列的反射光图像的网格化系统。该系统是用MATLAB的图形用户界面(GUI)设计实现的,这个系统将包含完整的网格化处理过程,其包含的功能有:输入原始图像、获取重要参数、重要参数展示、网格化效果图展示以及退出系统。在这一部分我们将重点叙述设计图形用户界面的整个过程,展示效果图片,方便我们从整体上把握本文所提算法的性能。总的来说基于MATLAB的生物芯片图像网格化处理系统的功能强大,用户界面简单,操作容易。