机器学习中分类算法在癌症诊断中的应用——以乳腺癌数据为例

来源 :中南财经政法大学 | 被引量 : 1次 | 上传用户:chen17981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代的发展,医疗健康问题成为人们越来越关注的话题,而癌症是影响人类生命健康安全的一重大威胁。癌症由于其自身具有隐匿性和不易察觉的特点,在后期的治疗过程比较困难和复杂。由于计算机技术的快速发展,计算机辅助诊断在医疗事业中获得广泛应用,同时将机器分类中的算法用于到癌症的预测分类中,大大提高了癌症诊治的效率和精确率。乳腺癌是影响全世界女性生命健康的肿瘤疾病,因此本文以乳腺癌数据集为例研究不同种机器学习分类算法在癌症诊治中的应用。本文首先介绍了各种方法的理论基础以及评价不同分类模型的指标,为后续的机器学习的分类算法的实证分析奠定理论基础。然后建立决策树、随机森林、SVM模型,对2018年的乳腺癌数据集为例进行实证分析,去研究不同种分类方法的预测分类效果,找到相对最优的分类方法。基于9个变量特征建立决策树模型,对癌症检测结果进行预测分类,然后通过剪枝等处理,找到具有最优节点的决策树。最后经过实证分析可得,最优节点是11个,模型预测准确度达到了83%。在决策树的基础上,采用随机森林的算法对乳腺癌样本继续进行分类处理,当设置变量参数为3时,模型表现出了优良的分类效果,模型分类预测准确率达到了94.73%。将Lasso特征选择方法与SVM结合,筛选出影响显著的3个关键变量,然后进行SVM分类,在样本测试集上预测分类准确率达到了97%。然后从基因层面出发,从GEO数据库中获得三阴性乳腺癌基因表达数据为样本,对复杂高维的基因数据进行差异化分析和可视化处理,实现对高维基因变量的有效直接降维。在得到差异化分析结果之后,根据p值显著性筛选出最显著的5个基因,基于这5个变量建立SVM分类模型,在测试集上取得了90%的正确率,从基因层面上有效解释了癌症发展过程中的差异。
其他文献
随着社会的进步与发展,人们的生产方式不断改变,生活水平逐渐提高,传统的婚姻观念不断受到冲击。日前,人民日报公布了近15年的离婚数据,从1987年到2017年,离婚数量从1987年的58.1万对增长到2017年的437.4万对,增长6.53倍,飙升的离婚率引起热议。受离婚率不断攀升,交通事故及急重症疾病的大幅度增大等因素影响,单亲家庭数量也不断增多。人们在关注单亲家庭时,往往将目光集中在成长于不完整
学位
报纸
期刊
自然语言处理(Natural Language Processing,NLP)可以让计算机理解人类的语言方式并进行学习,进而处理文本信息。中文文本由句子组成,句子由词语组成,词是最小的表达意义的单元,但是中文词语和英文单词不一样,没有空格将其分开,需要采用一定的手段来将中文词语从句子中分隔开来,即进行中文分词。中文分词是所有文本信息处理工作的第一步,分词准确与否会影响到后续工作。目前常见的中文分词
学位
受新冠疫情的影响,我国的经济社会发展出现下滑,导致大量人员失业以及消费萎靡不振等问题,党中央为解决此类问题,在2020年5月底提出放开地摊经济政策,至此地摊经济自被取缔多年以来再次出现在大众视野,迅速受到广大群众的关注和热议,网上用户对此各抒己见。地摊经济作为国家的一项政策,是市场经济的重要组成部分,对解决就业、刺激消费、复苏经济有重要作用,通过对微博用户的在线动态进行分析,能有效获取广大民众对地
学位
随着我国经济高质量发展的推进,创新已经逐渐成为提高综合国力与企业市场竞争能力的一个关键因素。习近平总书记曾明确指出,我国应该始终坚持将自主创新视为引导经济发展的第一驱动力,打造一个与科技、教育、产业、金融等行业紧密融合的创新型经济体系。作为制造业的主力军,高技术产业在推动产业结构升级、提升科技发展水平等方面发挥着重要作用。本文将高技术产业作为重点研究的对象,从投入、产出等角度出发,结合环境因素构建
学位
随着我国金融市场的日益强大,相关的法律法规更加完善,越来越多的企业和管理者希望通过上市来募集资金以完成企业的扩张、创新、研发、投资等行为。但是与此同时,由于市场的走向和发展有太多的不确定性,所以企业在这样的环境中面临更多的危机。上市公司的资金支持比较强大,能够在经济市场中扮演更加稳健的角色,但是其所面临的风险与竞争自然也更多,也有不少的上市公司没能在动荡的环境中渡过难关,陷入危机甚至是宣布破产。而
学位
互联网技术的快速发展催生了大量的智能设备,如智能电视、交互式车载系统等,这些智能设备的一个核心问题就是用户交互功能,成为各大厂商争相研究的重点,语音交互功能最大的优势在于方便快捷,极大解放了用户的双手,用户只需要通过语音将信息输入系统,就可以实现一系列的智能操作,比如播放音乐、打开空调等。同时智能设备拥有超海量的影音内容,与人们日常生活的联系越加紧密,在充分满足用户需求的同时,也使用户寻找所需内容
学位
互联网技术的快速发展和视频网站行业的蓬勃发展,带动了各大视频平台用户规模的不断扩大。根据中国互联网络信息中心发布的《中国互联网络发展状况统计报告》显示,截至2020年6月,我国网民总规模达9.4亿,互联网普及率达到67%,其中网络视频(含短视频)用户规模达8.5亿,占网民整体的94.1%。对于各大视频平台来说,这既是一种机遇,同时也带来前所未有的挑战。在这种情境下,部分新型视频网站采取了开放和用户
学位
乡村振兴是实现中国现代化发展的重要工程,乡村文化建设是乡村振兴的重要环节之一,同时也是提升农村地区文化底蕴的有效方式,通过乡村文化建设能够更好地推进乡村振兴战略的发展,完善基层地区的文化基础设施。党的十九大报告当中提出了实施乡村振兴战略。乡村振兴明确要进一步繁荣乡村文化,提高乡村的治理能力。在乡村振兴战略背景下,如何更好地加强农民群众的思想道德建设,提高乡村文明程度,如何培育文明乡风、淳朴民风已成
期刊