基于血常规指标的高危人群血液系统恶性肿瘤筛查模型研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:liongliong429
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景:血液系统恶性肿瘤(Hematological Malignances,HM)是一类严重影响人群健康的恶性肿瘤。早期诊断HM,无论是对提高患者生存率,还是对节约医疗费用,均至关重要。构建早期、廉价、无创、灵敏、特异、高效的HM筛查模型,从而及早筛查高危个体,是达到这一目标的前提。然而,目前已有的HM筛查模型,均采用基于医院场景的病例对照研究设计。此种设计类型,往往采用1:1或1:2等阳性样本与阴性样本的比例。此种情况下,样本中的患病率为50%或33%等,远远高于真实世界社区人群中的HM患病率。基于上述病例对照设计所构建的HM筛查模型,即使灵敏度、特异度均达到很高的水平,当其运用于真实目标人群时,阳性预测值也会很低,因而其实际应用价值大打折扣。研究目标及方法:基于“山东全人群全生命周期健康医疗大数据队列”和“山东多中心健康管理队列”,构建符合人群HM年龄、性别患病率分布实际情况的建模数据集;进而,采用血常规检测指标,通过对比XGBoost、LightGBM、随机森林三种集成学习算法,筛选适于真实世界目标高危人群的最优HM筛查模型,并开发HM筛查辅助APP在线工具。为基层医疗机构或社区人群提供廉价、安全且操作简单的辅助筛查手段,旨在尽早筛查出HM高危个体,缩短就医时限、提高早诊早治率、节省医疗成本、避免患者及家庭不必要的身心创伤。结果:1、人群中HM患病水平18岁以上人群HM总患病率为94.02/10万,男性和女性的HM患病率均随年龄增加而逐渐增大。从50岁开始,人群的HM患病率高于100/10万,本研究将50岁以上人群定义为HM高危人群,并作为本研究所构建的HM筛查模型的目标人群。该高危人群HM总体患病率为143.16/10万。2、构建HM筛查模型的数据集以HM高危人群(50岁以上)中具备完备血常规指标的3971例HM患者,作为构建HM筛查模型的病例组。依据HM高危人群(50岁以上)的年龄、性别构成及其HM年龄性别患病率(总患病率为143.16/10万),从队列中具备完备血常规指标的非HM人群中,按年龄性别构成抽取对照组(2769780人)。从而,构建了与真实世界随机抽样高危HM目标人群的患病率一致的模拟建模样本人群。确保了所构建的HM筛查模型在真实世界社区人群中的可行性。3、HM最优筛查模型(1)基于上述所构建的建模数据集,综合比较随机森林、LightGBM、XGBoost这三种模型的阳性预测值、灵敏度、特异度、阴性预测值和AUC发现:①在患病率由高到低的 B(50%)、C(30%)、D(10%)、E(5%)、A(0.143%)、F(0.072%)的训练集中所建立的训练模型,在符合真实世界患病水平的测试集T(0.143%)中验证时,随着训练集中的HM患病率与测试集中的HM患病率差距的逐渐减小,三种筛查模型的阳性预测值外推泛化能力逐渐增高;当测试集HM患病率与训练集HM患病率一致时,三种预测模型的阳性预测值均获得其最佳效果;但是,此时XGBoost模型的阳性预测效果仍然优于LightGBM模型与随机森林模型。②随着训练集中的HM患病率与测试集中的HM患病率差距的逐渐减小,三种筛查模型的灵敏度逐渐减小、XGBoost模型优于LightGBM模型与随机森林模型。③随着训练集中的HM患病率与测试集中的HM患病率差距的逐渐减小,三种筛查模型的特异度、阴性预测值、AUC均变化不大且维持在很高水平;其中,XGBoost仍表现良好。(2)以模型阳性预测值为核心评价指标,以灵敏度、特异度、阴性预测值、AUC为辅助评价指标的建模策略及模型筛选准则,选择了依据患病率符合真实世界社区人群HM患病率的训练集(A)与测试集(T)所构建的XGBoost HM筛查模型,为最优筛查模型。该模型的阳性预测值为86.81%,灵敏度为83.39%,特异度为99.98%,阴性预测值为99.98%,AUC为0.991。4、HM辅助筛查APP在线工具基于Flutter开发的HM辅助筛查APP在线工具,实现了 HM高危个体的在线识别和预警,为HM的早期发现,提供了适宜工具。结论:(1)真实世界社区人群中HM高危人群(50岁以上)患病率为143.16/10万,阳性组(HM患者)与阴性组(非HM患者)之间存在严重的数据不平衡问题。(2)针对此类数据不平衡问题,基于XGBoost算法所构建的HM高危个体筛查模型具有良好的表现,是在真实世界社区人群中,筛查HM高危个体的最佳模型;其阳性预测值高达86.81%,灵敏度为83.39%,特异度为99.98%,阴性预测值为 99.98%,AUC 为 0.991。(3)所开发的HM辅助筛查APP在线工具,为基层医疗机构或社区人群提供了廉价、安全且操作简单的HM高危个体筛查方法,为尽早筛查出HM高危个体,达到缩短就医时限、提高早诊早治率、节省医疗成本、避免患者及家庭不必要的身心创伤,提供了便捷的在线工具。
其他文献
研究目的在2019年国家癌症中心发布的最新癌症报告中显示,乳腺癌在中国女性发病前10位癌症构成中仍位居首位,乳腺癌严重威胁着妇女的健康。化疗一直是治疗乳腺癌患者的主要手
安全作为人类基本需求,关系到人民生命与健康,只有存在生命,才会有生活、生产活动,才会有发展。中国目前正处于改革以及经济高速发展的时期,随着产业结构调整和城市化进程速
酚羟基是一个很好的氢键供体,易与含有氢键受体基团的有机物形成氢键,将酚羟基作为功能基引入到聚合物的骨架上,可以制备酚羟基修饰的吸附树脂。单宁是一类广泛存在于植物体的多酚化合物,其分子结构中含有大量的酚羟基,能与蛋白质、生物碱、多糖结合;能与多种金属离子发生络合或静电作用等。本文以杨梅单宁、纤维素为原料制备了几种的纤维素固化单宁树脂,刚性的纤维素能为树脂网络提供支撑骨架,能增强树脂的强度,改善树脂的
《聊斋俚曲集》(以下简称《聊》)是以山东淄川方言创作而成的说唱文学作品集,口语色彩浓厚,对后期近代汉语研究具有重要价值。本文以《聊》歇后语为研究对象,利用定量分析与
目的建立间歇低氧大鼠模型,模拟阻塞性睡眠呼吸暂停(Obstructive sleep apnea hypopnea syndrome,OSAHS)发病过程,观察大鼠体重增量、肠道主要细菌组分核酸载量、血液氧化应
近年来,随着我国航母力量的不断发展壮大,无人机上舰已成为一种必然趋势。本文作为舰载无人机着舰的前期算法验证,以某大展弦比无人机为控制对象,旨在研究一种高精度的轨迹跟踪控制方法,解决定点着陆的引导与控制问题。主要内容包括:(1)建立了包含风扰动参数的动力学和运动学方程,结合无人机的气动特性、操稳特性和下滑能力分析了风扰动对着陆性能的影响。(2)针对定点着陆对轨迹跟踪的高精度要求,基于触地俯仰角、下沉
目的本研究旨在通过飞秒激光辅助下白内障超声乳化吸除术联合散光矫正型人工晶状体(Toric intraocular lens,Toric IOL)植入术,使用不同方法标记患者的散光轴位,通过对比直视
活性钎焊在Al_2O_3陶瓷复杂构件制造中有着广阔的应用前景。本文研究了Sn0.3Ag0.7Cu-Ti活性钎料在Al_2O_3上的润湿性,分别分析了Ti元素含量、温度和基板晶面取向对于润湿的影响。分析了活性元素Ti改善润湿的机制,并通过热力学分析建立模型,分析了钎料中Ti-Sn化合物生成对于润湿的不良影响。使用Sn0.3Ag0.7Cu-Ti(SAC-Ti)钎料实现了Al_2O_3的钎焊,分析了钎料
本翻译项目的文本材料取自于书籍《法律行业内外的语言交流:法律文本之旅》的章节节选。这篇报告主要阐述了在翻译学术文本材料时于概念隐喻方面遇到的显著难点,并基于纽马克
TiO_2光催化技术具有效率高、能耗低、操作简便、无毒无二次污染等优点是能源和环境领域具有重要应用前景的绿色技术,但TiO_2光催化剂不能吸收可见光,太阳能利用率低。利用量子点与石墨烯独特的性能可扩展TiO_2的可见光吸收范围和提高量子产率,可有效改善的光催化技术。本文以ZnS、ZnSe、CdS为量子点(quantum dots,QD),以十六烷基三甲基溴化铵(CTAB)为表面活性剂,以十六烷基三