论文部分内容阅读
癌症起源于正常组织在物理或化学致癌物的诱导下,基因组发生的突变,人类有史以来,癌症吞噬了无数人的生命。特别是20世纪50年代以后,癌症发病率和死亡率急剧上升,成为对人类健康危害最大的常见病和多发病之一。鉴于传统癌症诊断方法的诸多缺点和不足,以及计算机辅助诊断的优越性,计算机用于临床辅助诊断已是个不争的事实,将会给广大的癌症患者带来方便。论文的主要工作是在研究了基于自组织映射人工神经网络和基因特征选择的癌症自动诊断算法的基础上,建立了相应的数学模型,同时采用遗传算法对模型进行了进一步优化,论文的主要算法涉及以下三部分的设计思路:(1)对大量的基因数据进行两独立样本的T检验,实现了基因对癌症病理的差异性表达,从大量基因数据中选择有益于癌症分类的数据作为特征。对基因数据根据相伴概率值从小至大排序,依次选取对癌症诊断有明显作用的基因。(2)设计了结合T检验技术和自组织映射神经网络两项技术,实现了采用基因特征的癌症诊断模型。采用自组织映射神经网络设计了自动聚类模型,进行是否患有癌症的自动诊断,并研究基因数量与识别性能之间的对应关系。通过算法的设计和实验验证,选择了有益分类的基因特征,并确定了表达癌症性状的有效的基因数量。(3)结合遗传算法,对个体的编码控制基因的选择,以正常和癌症聚类结果中的识别率作为目标函数,以识别率最大化为目标,实现对基因选择的优化。其中遗传算法的操作在基于两独立样本T检验结果优选的基因数据基础上进行,保证了遗传算法搜索过程的有效性。综上所述,论文采用了数理统计、人工神经网络和遗传算法三部分内容,进行癌症的辅助诊断。目的是将广大的临床诊断医师从烦琐的、机械的数据分析处理中解放出来,避免人为因素所造成的误诊、漏诊,因此,对降低癌症的死亡率有着极其重要的现实意义。