基于遗传算法和支持向量机的癌症特征基因选择及分类

来源 :长春工业大学 | 被引量 : 2次 | 上传用户:wangxingchuang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症以其高死亡率严重影响我国居民的生命健康,在我国癌症每年导致上百万人死亡。癌症早期治愈率高但由于其没有明显的临床症状导致大量患者因延误治疗时机而死亡,因此早发现、早治疗是防癌治癌的重要准则。目前癌症筛查主要采取影像学手段,医师通过对CT等影像资料观察分析做出诊断,这使得癌症筛查严重依赖医生的临床经验,误诊、漏诊率较高导致大量癌症患者延误治疗时机。随着生命科学的发展,基因芯片技术应运而生,基于基因芯片的癌症早筛技术具有不依赖临床经验的特点,因而吸引了许多科研人员的关注。但目前应用基因芯片数据仍面临着许多困难,由于其实验成本高、实验复杂等原因导致数据具有高维度、小样本、高噪声等特点增加了分析利用其数据的难度。本文针对分析基因芯片数据的难点提出了基于遗传算法改进并以支持向量机作为分类器的癌症特征选择与分类方法,改进点如下:1)本算法提出了一种新的混合评价函数,该评价函数包含个体最大相关评价、个体最小冗余评价、个体种群多样性贡献评价,这些评价的加权和通过种群代数相关的系数与基于分类器准确率的评价相结合,该评价函数平衡了种群多样性和收敛速度,能够防止算法陷入局部最优解过早收敛。2)遗传算法中变异算子通过向种群中随机引入基因改善种群的基因多样性。本文依据遗传算法不同阶段种群特点设计了基于优势基因库和全量基因库的变异算子,该算子以一定概率选择一个基因库完成变异操作,选择概率与种群代数相关,使算法前期可以快速引入优势基因,此改进方法均衡了遗传算法的随机性和收敛速度。3)本文分析种群个体发现在算法的中后期,种群中出现大量冗余个体,冗余个体不利于算法继续搜索最优特征子集导致其过早收敛,基于此问题本算法在遗传算法中添加了种群去重操作,该操作能够去除种群中的重复个体改善种群个体和基因多样性。
其他文献
目的 总结有关提高重症心脏病瓣膜手术成功率的经验,为进一步降低死亡率提供参考.方法 回顾分析2001年10月~2005年12月的重症心脏瓣膜置换术178例,其中主动脉瓣与二尖瓣双瓣置换术112例,主动脉瓣置换28例,二尖瓣置换术25例,Bentall手术12例,主动脉瓣置换加三尖瓣成形术1例,三瓣膜置换术8例;同时行三尖瓣成形术53例,左房折叠术18例,主动脉瓣环扩大或窦管部扩大30例,左心室流出
目的:通过大鼠体内实验,研究运用3D打印技术制作的聚乳酸/羟基乙酸共聚物和羟基磷灰石(poly-lactic-co-glycolide/hydroxyapatite,PLGA/HA)支架在植入大鼠股骨缺损处后,对骨
目的分析小儿手足口病的临床特点、表现,诊治及预后。方法回顾性分析小儿手足口病住院的186例患儿的相关信息。结果对重症手足口病患儿及时转上级医院,提高治愈率,降低病死率。
本文回顾了35年来8次三中全会关于我国经济体制改革的路径走向;指出了每届三中全会都以改革开放为主旋律,推出一个个事关全局宏观战略的重大决策,改革开放成为中华大地发展进
随着知识经济时代的到来,技术创新逐渐成为各企业尤其是以先进技术为发展核心的高新技术企业及社会各界关注的重点,创新投入与企业价值的影响引起了广大学者的关注。论文基于
煤作为现今使用量最大的资源之一,其中包含的某些有害微量物质必然会对周围的环境造成一定的影响,怎样才能对这种危害影响进行有效的控制已经成为业界相关人员的关注重点。基
对于一维扩散方程的源项反演问题,探讨了反问题数据的相容性并应用积分恒等式方法建立了非线性源项反演的一种稳定性。
本文讨论了风险投资家向企业主融资时的投资期权,求出了投资期权的表达式,并对其中的一些参数进行了分析.
福利制度是国家重要的社会经济政策,中国的福利制度经历了计划经济下的单位体制上的低工资高福利模式到市场经济下的责任分担的"社会化"模式,受之影响,企业财务制度也随之发生
本文给出了伪补MS代数的主同余关系的等式刻划,并应用这种刻划研究了MS代数的主同余关系的可补性.