基于血液检测数据的计算机辅助医疗诊断系统构建

来源 :兰州大学 | 被引量 : 2次 | 上传用户:juannayuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,随着医学信息数据库的不断建立和完善,人工智能+医疗健康成为当今医疗健康行业转型的重要方向,而计算机辅助医疗诊断逐渐成为人们关注的热点领域。本文利用机器学习方法对临床检验数据进行深入挖掘,基于临床需求建立稳健的计算机辅助医疗诊断系统去识别恶性疾病,从而辅助医生快速识别恶性疾病并及时采取应对措施。这套系统的成功构建不仅意味着能够发现本文研究的疾病和常规血液指标之间的深层关联,更有助于探索其他类型疾病和多组分血液指标之间的相关性。第一章,首先简单介绍了常规血液检测的临床现状、方法和意义,大致概括了医学大数据在实施精准医疗过程中发挥的重要作用,同时阐述了目前组织活检和液体活检在临床应用方面各自的不足之处,还对计算机辅助诊断的研究进展和优势进行了总结,最后详细介绍了本文主要涉及的机器学习算法——随机森林。第二章,利用随机森林算法对筛选出的19个常规血液指标进行复杂组合构建的模型可以从肺结核患者和健康人群中准确地识别出肺癌患者。这项研究总共收集了277名具有49项常规血液指标的患者,其中包括183名肺癌患者和94名非肺癌患者。经过10折交叉验证之后,该模型的敏感性、特异性和准确度分别达到0.9630、0.9497和0.9570,这在一定程度上揭示出传统的血液检测数据与肺癌之间有着本质的相关性。这种识别方法被称为RBLC模型,在测试集中也表现出稳定的预测性能,其敏感性、特异性和准确度都超过0.85,分别为0.8571、0.9000、0.8824。这些常规血液指标的组合有望成为一种有效的工具帮助临床医生快速地从肺结核患者中识别出肺癌样本。第三章,为了进一步验证机器学习与常规血液检测数据之间的内在关系,我们尝试从多种胃部疾病和各种癌症中识别高发的胃癌患者。这次研究纳入了更加多元化的数据,总共收集了含有58项常规血液指标的2951例样本,其中交叉验证集2629例,测试集322例。随机森林算法最终选取了17个排名靠前的血液指标作为胃癌预警系统的输入值,并且该模型经过10折交叉验证后,在交叉验证集上的敏感性、特异性、准确性和AUC分别达到了0.9067、0.9216、0.9138和0.9720。这个预警系统叫做GCdiscrimination,不仅为快速、实时地识别胃癌样本提供了一种新的思路,也揭示出胃癌与常规化验指标之间深远的相关性,有助于进一步了解这些指标与胃癌之间的潜在联系,为以后临床价值的研究奠定了基础。第四章,为了在其它类型的疾病筛查上拓展上述方法,我们这次尝试从潜伏性结核中识别易传染的活动性结核感染患者。这次研究总共纳入了478例样本,随机森林算法从其58项血液检测指标中挑选出了36项常规血液检测指标和两项特异性的T-SPOT.TB检测指标,通过对这些指标的复杂组合开发出一种检测活动性结核感染的识别方法。该方法具有很好的分类性能,在交叉验证集和外部验证集的AUC分别达到0.9256和0.8731。这项工作不仅首次提出了利用常规血液检测指标和T-SPOT.TB结果的结合识别活动性结核感染的创新策略,具有及时、高效和经济的优点,它还为全面了解结核病提供了有价值的信息,有助于深入探索结核感染与常规血液检测之间深远的联系。
其他文献
随着网络教学工具的不断发展,一线教师得以灵活运用混合式教学法。本文基于雨课堂教学工具,开展了石油工程专业完井工程混合式教学设计与实践。研究表明,混合式教学法较好的
文章以1978-2007年间辽宁省金融发展与城乡收入差距的时间序列为基础对二者关系进行了Granger因果检验,结果表明辽宁省金融发展对城乡收入差距有单向Granger因果关系,进而以A
近年来,机械旋耕、机械灭茬、机械联合整地应用比较普遍,但耕层较浅,形成了一定的犁底层,不利于农业生产的发展,应大力推广机械深耕技术。目的在于为作物的播种发芽、生长发育提供
为保障教育的公平公正和社会的长治久安,近些年来国家和地方政府部门不断出台保障外来务工人员子女接受教育的政策法规,外来务工人员子女接受教育的条件正在逐渐改善。但是在
通过分析王曼丽运动成绩提高的原因,指出了有氧能力的提高所起的作用,并介绍了王曼丽有氧能力训练的方法,阐明了必须重视短距离速滑运动员的有氧能力训练,才能使达到一定程度
<正> 笔者自1983年在长春中医学院老中医李淑棠教授的指导下,采用培补脾肾,补中益气的方法治疗51例血尿病人,取得了比较满意的疗效,现总结如下。一、一般资料 51例均为17~52岁
阜蒙县位于辽宁省西部,耕地面积505万亩,且70%为丘陵地,无霜期150天左右,年均降雨量500毫米,主要农作物为玉米、花生、高粱、谷子、红绿小豆。其中2012年花生种植面积达170万亩,从业
<正>第一,让题目和作文贴近学生生活生活是写作的惟一源泉。学生的作文,也就是广义的创作活动。因此,让学生学会观察生活、摄取生活、感悟生活,从生活中获得写作素材,也就成
岬湾海岸海滩的稳定性及其演变是砂质海岸研究的重要内容。基于多期遥感影像、海滩沉积物粒度分布,并采用岬湾海滩平衡形态模型(MEPBAY),分析探讨了海南岛东部万宁4个典型岬
研究背景:目前的研究表明,食管癌的发病机制与病因尚不明确,其发生发展涉及到多种因素:吸烟、酗酒、缺乏营养、进食粗粮或热食、传染性病原体感染等;这些均已经被证实与食管癌的发生有一定关联,然而还有许多与食管癌发生有关的物理、化学、生物因素仍然未知。1982年有研究者最早提出食管癌的发生可能与人乳头瘤病毒(human papillomavirus,HPV)感染有关。此后许多研究者对HPV感染与食管癌发生