论文部分内容阅读
肺癌是当今世界各国常见的恶性肿瘤,已成为绝大多数国家癌症死亡的主要原因。肺癌早期多无症状或症状轻微,不易发现,待到发现时往往已有转移。因此,提高早期肺癌的检出率是提高肺癌患者生存率和降低死亡率的必要手段,也是肺部疾病检测诊断的难点之一。CT是目前应用比较广泛的肺癌诊断手段之一,但是由于肺癌CT片表现的复杂性和其他不确定因素,使临床医生在观察有些肺CT片时并不容易做出正确诊断。人工神经网络在医学领域已经有了广泛地应用,但对神经网络的结构设计和初始权值的设置尚缺乏理论支持,以及经典BP算法收敛慢、易陷入局部极小等都是需要改善的问题,遗传算法(GA)全局搜索能力强,正好可以弥补BP网络的缺陷。很多学者提出了GA与BP网络的融合算法,但传统的GA-BP算法往往是只对神经网络的权值或结构一个方面进行优化,这样就可能导致优化权值后的网络仍存在结构冗余,或者优化网络结构之后没有达到最佳权值分布,针对此问题,本文引入了多物种协同进化(CGA)思想,将结构和权值同时编码在染色体中;另外由于遗传算法局部寻优能力不强,传统的GA-BP算法在快速收敛到最优解邻域时却迟迟找不到最优解,以至于迭代次数太多,因此本文分别在适应度函数和变异算子上引入了模拟退火算子(SA),确保其局部随机搜索能力,加速向最优解收敛;在对遗传算子的选择方面本文采用了自适应改变交叉概率和变异概率的方法,在初期取较大的变异算子而维持种群的多样性,防止出现早熟现象,在已接近最优解邻域时,使变异算子减小,从而获得网络的最优设计。这种方法避免了依靠经验确定网络结构的困难,克服了由于神经网络初始权值的随机性和网络结构确定过程中所带来的网络振荡,有效提高了神经网络的泛化能力。本论文在分析大量肺癌患者数据的基础上,综合考虑诸多复杂影响因素,用改进的GA-BP算法得出与患肺癌关系最为密切的8大危险因素,并对肺癌CT影像的特征作了分析与研究。MATLAB仿真实验证明了改进GA-BP算法的预测结果准确率为97.5%,比传统GA-BP算法(94.2%)高,比放射医师的正确诊断率(96.7%)略高,其收敛速度也大大提高。使用该算法可以极大地扩大医生有限的个人知识和经验,有效地对肺癌与其他肺部病变的CT片特征加以区别鉴定,尽可能早的发现肺癌,为肺癌的早期诊断提供一条有效的决策依据。