基于支持向量机的癌症诊断研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zhangjun3812
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计学习理论(Statistical Learning Theory,简称SLT)是由AT & T Bell实验室的Vapnik及其合作者提出的可应用于小样本分析的统计理论。支持向量机(Support Vector Machine, SVM)是基于统计学习理论和结构风险最小化原理提出的一种有监督的机器学习方法,被公认为小样本情况下统计学习的经典。SVM具有较好的泛化和学习能力,已被广泛的应用于诸多领域。本论文利用模式识别的方法(K-近邻分类器、概率神经网络、决策树、支持向量机等)分别根据人体血液元素浓度、乳腺肿瘤细针活检数据、乳腺癌患者基因进行了癌症的辅助诊断和预后评估。分析和比较了不同特征选择方法对分类准确率的影响,同时比较了支持向量机和其它分类器的分类能力。本文研究的主要内容有:①对模式识别中目前常用的特征提取和选择方法进行了综述,介绍了信噪比、熵标准、遗传算法(GA)、主成分分析法(PCA)、独立成分分析法(ICA)、粒子群寻优算法(PSO)、模拟退火算法(SA)和其他常用的特征选择方法的算法、及其优点和缺点等。②介绍了几种常用的分类方法及其分类原理。包括贝叶斯分类器、K-近临分类器、决策树、概率神经网络和人工神经网络。对支持向量机的分类原理进行了详细的叙述,并介绍了其算法、实现、发展和在相关领域中的应用。③利用人体血液元素(Zn、Ba、Ca、Mg、Cu、Se)浓度,应用支持向量机等多种分类器及特征优化算法,进行了癌症的辅助诊断,并分析了不同特征提取和特征选择方法对分类准确率的影响。其中,K-近邻分类器(基于信噪比特征排序)、概率神经网络(基于信噪比特征排序)、决策树(基于熵标准特征排序)、支持向量机(基于遗传算法)的分类准确率分别达到了95.95%、97.29%、91.89%和98.64%。④根据乳腺肿瘤组织的细胞形态数据,应用支持向量机等多种分类器及信噪比特征优化算法,进行了乳腺癌的辅助诊断。其中,K-近邻分类器、概率神经网络、支持向量机的分类准确率分别达到了96.09%、95.08%、96.24%。⑤采用乳腺癌患者的基因数据,结合支持向量机等多种分类器及特征优化算法对其预后状态进行了评估,并分析了不同特征提取和特征选择方法对预后评估准确率的影响。其中,K-近邻分类器(基于信噪比特征排序)、概率神经网络(基于信噪比特征排序)、支持向量机(基于信噪比特征排序)的准确率分别达到了83.39%、86.10%、88.81%。从研究结果可以看出,支持向量机的分类准确率均优于K-近邻分类器、概率神经网络、决策树等分类器,表明该方法有望进一步发展成为一种实用的临床癌症辅助诊断及预后评估工具。
其他文献
<正>血小板是血液凝固中重要的血液成分,其主要功能是生理性止血。血小板输注是用于预防和治疗血小板减少或血小板功能缺失病人的出血症状,恢复和维持人体的正常止血和凝血功
布莱克的创作灵魂就是他的诗学理论——"第一原则",而这一理论的核心是"诗性才思"。结合对其作品的分析,本文从独特的视角、浪漫的想象和理性的思考三方面对布莱克的"诗性才思"进行
网络安全防护水平随着网络规模的不断扩大被提升到一个新的高度。传统的入侵检测均基于单条链路或者单个节点,但是在大规模网络中大多数异常在单条链路或者单个节点的表征不明
对宁波市江东区18所小学学生实施《国家学生体质健康标准》测评,根据测评结果分析得出,宁波市江东区小学生体质健康总体处于"良好"水平;学生总体"超重"和"肥胖"比例高于全国总体比
当前我国的经济发展水平日益提高,改革开放后我国逐渐走入到新的经济发展阶段,且该发展趋势从快速增长转变为中速增长,在这一过程中,我国的交通运输行业也发生了非常明显的变
船舶火灾给船舶财产和人命安全造成严重危害,新型多功能海上消防救助艇是一种新型一体化移动武海上消防救助装备,主要应用于船舶火灾的快速、有效救援救助.该艇集舰艇主体、
目的研究与特发性肉芽肿性乳腺炎(IGM)发病相关的危险因素。方法收集2018年1~12月武汉市红十字会医院甲乳外科收治的58例IGM患者(IGM组)及91例良性乳腺病患者(对照组)的临床
<正>在与学生的交往中,每个教师都想自己的"人气"指数如东升旭日,露中鲜花,蓬勃旺盛,为不更事的学子所理解、接受、认同和支持。何谓教师的"人气"?是学生对教师的理解、谅解
儿歌教学是一种艺术型教学方式,在低年级的课堂教学中,儿歌有着不可代替的作用。教师在儿歌学习中进行听、读、诵、作等能力的培养,为儿童的乐学提供了必要的形式。在教学的实践
对宁波市江东区七所中学学生实施《国家学生体质健康标准》测评。对学生的身体形态、机能、素质和运动能力等4方面的测评得分及成绩分布等结果进行分析,得出结论:学生体质健康