【摘 要】
:
近年来智慧医疗飞速发展,利用人工智能技术辅助医疗诊断已经成为趋势,国内外对机器学习辅助医疗的研究的也越发成熟,许多关于疾病的机器学习预诊模型都已建立。采用机器学习
论文部分内容阅读
近年来智慧医疗飞速发展,利用人工智能技术辅助医疗诊断已经成为趋势,国内外对机器学习辅助医疗的研究的也越发成熟,许多关于疾病的机器学习预诊模型都已建立。采用机器学习算法来辅助医生进行诊断,将会很大程度上提高诊断的科学性,也能有效地克服仅凭医生经验来诊断的主观性问题,还从一定程度上减轻了医生的负担。针对以上研究背景,本文依托于实验室研究项目,对肌少症这一疾病进行研究,建立一个适用于肌少症诊断的机器学习模型。本文在第二、第三章中对相关的理论基础进行的详细的阐述,主要包括数据的处理、模型的评价以及算法介绍几个方面。对机器学习算法的选择上,本文采用支持向量机(SVM)、随机森林(RF)、XGBoost和CatBoost四种算法进行对比研究,对于模型的评价指标,本文选择了准确率、精确率、召回率和F1值四个指标。值得一提的是,本文中的肌少症数据除了包含一些门诊数据之外,也包含了一些行为数据,在第四章中从特征的相关性研究和机器学习算法给出的重要程度排序两方面论证了这些行为特征对预诊模型建立的重要性,从医学诊疗上看也丰富了患者的数据类型。本文在研究的过程中还强调了分类问题中类别均衡对算法训练的重要性,并采用SMOTE算法对样本做了类别均衡处理,将均衡化处理前后的模型表现进行对比,发现处理后模型的各项评价指标均有显著提高,具体提高的百分比在文章第五章中的表10中给出,其中CatBoost算法在四个评价指标上分别提高了 2.76%,36.36%,82.50%,66.21%。最后将四种算法运用在肌少症数据集上,通过各个算法效果的横向和纵向对比,通过观察模型评价的四个指标:准确率、精确率、召回率和F1值,得出了CatBoost算法表现较佳的结论,并结合数据特征建议在样本量少特征较多的肌少症数据集上,采用CatBoost机器学习算法进行疾病预诊。除此之外,文章还对算法在各类数据集上的表现进行了对比研究,发现了CatBoost算法的稳定性,并结合不同算法的运行时间,给出了研究其他问题时算法选择上的相关建议。
其他文献
新闻话语与社会生活有着密不可分的联系和影响。新闻话语受到当下社会生活的影响,能够反映当下社会生活的特点和趋势。同样,新闻话语特征体现出来的社会价值对社会生活也有一
伴随着我国金融体制改革的深入发展,我国债券市场从无到有、从小到大,如今已初具规模。20余年来,我国债券市场不仅为国家财政政策和货币政策实施奠定了市场化的基础,而且为若
自从实施配电市场化的改革以来,如何有效地使得我国的配电网络自动化产业逐步发展成一个更加开放、公平的配电网络自动化产业,已经逐渐成为我国电力高科技配电网络产业发展者
随着通讯技术和计算机技术的飞速发展,云计算、物联网、社交网络等新兴服务促使人类社会的数据种类和规模正以前所未有的速度增长,世界已进入网络化的大数据时代。面对愈来愈
一、中国企业改革发展现状2020年,国际环境日趋复杂,不稳定性不确定性明显增加,新冠肺炎疫情影响广泛深远,经济全球化遭遇逆流,世界进入动荡变革期,单边主义、保护主义、霸权
近年来,人工神经网络的研究成为时下热门。在众多神经网络模型中,由Cohen和Grossberg提出的Cohen-Grossberg神经网络模型的发展尤为突出。因其独有的特性,被广泛应用于模式识
在很多现实问题中,数据很容易获得,但数据的标记获取需要花费高昂的人力物力资源。半监督学习是机器学习领域的一个重要研究方向,旨在对数据很多,标记很少的应用场景提供解决
随着互联网技术的不断发展和成熟,各种数字化信息的产生和发布速度呈爆炸式增长,海量文本数据占据较大比例。如何在海量文本数据中进行自动快速分类,已经成为了一项值得深入
森林资源是陆地生态系统和自然资源的基础,对人类生存发展和生产生活有着不可替代的作用,需要及时准确掌握森林资源信息以实现保护、利用。本文通过对国内外森林资源监测研究现状总结与分析,发现森林分类是实现森林资源精准监测的重要环节。高分辨率遥感影像的丰富为提高森林资源监测精度提供了更加优质的影像资源,但也对影像解译提出了新的技术要求。基于对象的深度学习分类方法可以有效利用高分辨率遥感影像的光谱、空间等信息
“V到”是现代汉语中使用频率较高的多义动补结构,其形式和语义的多元化组合使得“V到”在动补类型上存在诸多争议。前人研究多从句法、语义、语言习得等视角展开,集中于动词配价、语篇功能、习得偏误等层面,从认知视角对“V到”进行的系统性构式研究较少。本研究基于兰卡斯特汉语语料库,从Talmy的宏事件理论入手,首先探讨“V到”结构的认知语义特征。其次,借助认知构式语法下的压制理论探讨“V到”构式节点扩展背后