论文部分内容阅读
生命科学与人类健康息息相关,而基于光理论和光技术的光生命科学已成为近年的热点和前沿研究,引起了国内外科学家的广泛关注。基因是生命的关键因素,对细胞生长、发育和衰老起重要作用。基因表达直接调控蛋白质表达,影响疾病的发生和发展。利用光技术扫描基因芯片,经图像处理和数据采集获取基因表达数据,基于信息处理技术研究基因表达与疾病之间的关系,选取导致人体疾病的致病基因,对降低疾病诊断成本和提高疾病治疗效果有着极其重要的意义。 本文基于光学图像扫描基因芯片,以缩小基因研究范围和有效分类肿瘤样本为目的,研究基因芯片图像处理和肿瘤特征基因选取等关键问题。针对基因芯片图像特点,基于模糊聚类算法和粒子群算法,研究自动模式下的基因芯片图像高亮斑点噪声降噪、基因芯片图像样点定位和前景分割;根据取自光学图像扫描基因芯片的基因表达数据集的结构特点,基于模糊聚类算法、粒子群算法和遗传算法,研究基因与肿瘤类别关系选取肿瘤特征基因,并分析集成加权方法对提高特征基因选取稳定性的作用;基于光学扫描、芯片图像处理和特征基因选取技术,结合生物信息学和肿瘤医学相关理论,构建肿瘤致病基因鉴别系统。 论文主要的研究内容和创新工作如下: (1)针对光学图像扫描基因芯片,基于芯片图像样点形态和像素灰度,提出一种芯片图像样点定位和前景分割方法。首先,通过水平和垂直投影定位样点中心坐标的初始范围;然后在粒子群算法中植入粒子邻域内最佳个体信息,以芯片图像样点中心坐标和半径作为粒子个体的元素,以样点前景和背景像素灰度值的相对关系作为适应度函数,利用粒子历史最佳、群体历史最佳和粒子邻域内最佳的个体信息指导粒子搜索样点最佳位置和半径;最后利用模糊聚类算法对样点区域像素聚类,以分割样点前景像素。芯片图像处理结果表明,该方法能自动完成对不同类型基因芯片图像的样点定位和前景分割。 (2)以取自光学图像扫描基因芯片的肿瘤基因表达数据为研究对象,提出基于特征灵敏度的特征选取方法。根据模糊 ISODATA算法分析特征对样本隶属度的灵敏度,在递归特征选取过程中以灵敏度作为特征的类别可分性指标筛选高灵敏度值特征,以分类和聚类正确率作为评价函数选取分类特征集合。特基因征选取结果表明,该方法能从取自基因芯片的基因表达数据中选取具有良好分类和聚类能力的肿瘤特征基因,证明了将基于灵敏度分析的特征选取方法与基于Bhattacharyya距离的特征过滤方法相结合进行高维特征选取的有效性和可行性。 (3)基于光学图像扫描基因芯片技术,设计一种肿瘤致病基因鉴别系统。基因杂交芯片经过光学扫描和图像处理后生成基因表达数据,利用多种特征选取方法从中选取特征基因,集成、统计特征基因的表达信息并绘制高频特征基因表达伪彩图和差异表达图,基于生物信息学和肿瘤医学等理论分析高频特征基因与肿瘤类别间的关系,确定肿瘤致病基因,进而为肿瘤诊断和易感人群甄别提供分子水平上的支持数据。系统鉴别出的致病基因在异类样本中的表达差异及其编码产物表明肿瘤致病基因鉴别系统的可行性,也进一步验证本文所提出特征选取方法的有效性。研究结果为本文研究成果应用提供了有力支撑,具有实际应用意义。 论文基于光学图像扫描基因芯片,研究芯片图像分析和肿瘤特征基因选取中的一些关键问题,以缩小肿瘤致病基因筛查范围。论文研究成果对发现肿瘤致病基因、提高肿瘤诊治效率具有一定的参考和借鉴价值,对基于光学图像扫描基因芯片图像研究与分析提供了依据。