论文部分内容阅读
目的基于真实世界的数据采用回顾性队列研究方法,评价中药贴敷治疗腹泻的有效性、不同贴敷方式疗效差异和适宜的贴敷疗程范围,以期提供中药贴敷治疗腹泻的真实世界证据。同时基于XGBoost机器学习算法建立中药贴敷治疗腹泻的第7天疗效预测模型,辅助临床医师识别疗效优势人群并进行治疗决策。方法研究人群为全国范围内2020年8月22日至2020年11月5日在春播万象云诊所病例注册登记平台数据库中有腹泻就诊记录的患者2280例,根据用药记录分为贴敷组和非贴敷组,观察贴敷治疗腹泻的第3、7、14和28天的临床疗效。本研究中部分变量存在缺失,采用哑变量处理缺失数据。研究中部分变量为连续变量,因此首先采用广义相加模型(GAM)检测各连续变量与腹泻痊愈之间是否存在可能的非线性关系,如果存在非线性关系,采用曲线拟合或多项式处理变量。为观察在不同调整策略下中药贴敷治疗腹泻的有效性,本研究根据STROBE声明同时展示了未调整、调整Ⅰ(仅调整性别和年龄)、调整Ⅱ(依据有向无环图+效应改变法调整混杂因素)和全调整(调整划分区域、年龄、性别、中药汤药处方、西药处方、腹泻天数、腹泻频率、水样便、粘液或脓血便、大便气味酸臭和大便气味不明显)模型共四套多元回归结果。同时为了更直接的体现贴敷组和非贴敷组的疗效差异,本研究采用增量法将中药贴敷疗效研究的四套多元回归模型效应量OR转换为RD,更直观的体现两组每百人腹泻痊愈相差人数的具体数值。为探查中药贴敷和其他变量是否对腹泻痊愈产生交互作用,本研究进行了分层分析和交互作用检验。分层分析采用分层logistic回归,按划分区域(北方和南方)、年龄(<3岁,≥3且<6岁,≥6且<18岁,>18岁)、性别(男女)、是否使用中药汤药、是否使用西药、腹泻天数(<2天,≥2天)、腹泻频率(<2次/日,≥2次/日)、是否水样便、是否粘液或脓血便、是否大便气味酸臭和是否大便气味不明显进行分层,调整除分层变量以外的所有变量,交互作用检验使用似然比检验方法探查效应量在不同层级水平上是否具有统计学差异。此外为评估观察性研究非随机化导致的混杂偏倚影响,本研究采用了倾向评分匹配(PSM),匹配变量包括全部混杂因素,匹配比例为4:1,容许倾向性评分(PS)相差值为0.01。在匹配好的人群中进行单因素回归和倾向性评分调整回归(CAPS)。由于PSM会损失样本量导致选择偏倚,因此本研究还使用了逆概率加权(IPTW)、标准化死亡比加权(SMRW)和重复匹配(GenMatch)等相关分析等方法进一步评估非随机化导致的混杂偏倚影响。此外本研究是一项观察性研究,存在未测量混杂因素,因此本研究引入E值量化存在未测量混杂时,未测量混杂需要同时与中药贴敷和腹泻痊愈具有多大的关联强度,才能完全抵消甚至逆转本研究得到的贴敷治疗与腹泻痊愈的关联关系。另外本研究根据患者使用的贴敷方式不同进一步将贴敷患者分为湿贴组和加药贴组,观察两种贴敷方式下第3、7、14和28天的腹泻疗效差异,采用多元logistic回归模型评价在不同调整策略下不同贴敷方式对腹泻痊愈的独立作用。同上本研究同时展示了未调整、调整Ⅰ、调整Ⅱ和全调整模型的四套多元回归结果。本研究采用了 PSM匹配湿贴组和加药贴组的全部混杂因素,容许PS相差值为0.01,匹配比例为4:1。在匹配好的人群中进行单因素回归和CAPS,方法同前。采用多元logistic回归模型评价在不同调整策略下用药天数对腹泻痊愈的独立作用大小。同上本研究同时展示了未调整、调整Ⅰ、调整Ⅱ和全调整模型共四套多元回归结果,同时应用趋势性检验分析贴敷天数和腹泻痊愈之间是否存在线性趋势以及是否存在可能的非线性关系。本研究进一步使用了平滑曲线拟合、递归法、交互作用检验和分段线性模型等方法探索贴敷天数和腹泻痊愈间是否存在饱和阈值效应关系,即寻找最佳的贴敷用药天数。最后为识别贴敷治疗腹泻的优势人群,我们基于XGBoost机器学习模型建立了贴敷治疗腹泻的第7天疗效预测模型,模型评价采用工作特征曲线下面积(AUC),并且和人工神经网络(ANN)、ANN+Boosting、ANN+Bagging 和支持向量机(SVM)共四种主流的机器学习和集成学习算法进行简单比较,比较的指标包括准确率、精确度和F1 Score。结果1 贴敷疗效研究在未调整和调整Ⅰ模型中,贴敷组第7、14和28天疗效优于非贴敷组。在调整Ⅱ和全模型中贴敷组第14和28天疗效优于非贴敷组。在调整Ⅱ模型中第14天腹泻痊愈:RD=0.07,95%CI:0.02~0.12,P=0.0060,第28天腹泻痊愈:RD=0.08,95%CI:0.03~0.13,P=0.0001。在调整混杂因素后中药贴敷对腹泻第3、7、14和28天痊愈的效应量方向在划分区域、年龄、性别、是否使用中药汤药、是否使用西药、腹泻天数、腹泻频率、是否水样便、是否粘液或脓血便、是否大便气味酸臭和是否大便气味不明显各亚组内基本一致(交互作用检验P>0.05)。本研究使用PSM匹配了划分区域、年龄、性别、使用中药汤药、使用西药、腹泻天数、腹泻频率、水样便、粘液或脓血便、大便气味酸臭和大便气味不明显等混杂因素,匹配PS相差值为0.01,贴敷组和非贴敷组按4:1比例进行匹配。在匹配队列中单因素回归和CAPS结果显示腹泻第3、7、14和28日痊愈的效应量与多元回归结果方向一致,但是效应量大小有所差异。IPTW和SMRW中腹泻第3、7、14和28日痊愈的效应量与多元回归结果大小和方向均一致。使用重复匹配方法按照1:1比例匹配贴敷组和非贴敷组的所有基线特征,匹配PS相差值为0.05,在匹配队列中单因素回归和CAPS中第3、7、14和28日腹泻痊愈的效应量与多元回归结果方向一致,而效应量大小有所差异。调整Ⅱ模型中腹泻14和28天痊愈效应量的E值经计算分别为1.83和2.20。2 不同贴敷方式疗效比较研究第3、7、14和28天使用湿贴和加药贴两种贴敷方式治疗腹泻的疗效在未调整、调整Ⅰ、调整Ⅱ和全调整模型的四套回归结果中未见明显差异。使用PSM匹配两组的划分区域、年龄、性别、中药汤药处方、西药处方、腹泻天数、腹泻频率、水样便、粘液或脓血便、大便气味酸臭和大便气味不明显,允许PS相差值为0.01,湿贴组和药物贴组按4:1进行匹配。在匹配队列中单因素回归CAPS中第3、7、14和28日腹泻痊愈的效应量与多元回归结果方向一致,效应量大小有所差异。3 用药天数研究在调整 Ⅱ 模型中 OR=1.08,95%CI:1.03~1.13,P=0.0013,即在第 2 至 28天范围内随着治疗天数增加,贴敷治疗腹泻的疗效增加。趋势性检验显示在四套模型中随着贴敷天数的三分位数等级增加,腹泻痊愈呈逐渐增加趋势,并且趋势显著性具有统计学意义(趋势性检验P<0.05)。当用药天数在第2天到第28天范围内,通过曲线拟合、递归法和似然比检验等找出平滑曲线最佳折点为4天。随着折点由第4天逐渐向第28天过渡,平滑曲线前段的OR值与后段OR值差距不断缩小,似然比检验P值趋于不显著,当折点为19天时似然比检验P=0.076>0.05,平滑曲线用药天数与中药贴敷腹泻痊愈的非线性关系变得不再显著,因此推断中药贴敷治疗腹泻的最佳用药天数范围应为4天至19天。4 基于XGBoost构建中药贴敷治疗腹泻的第7天疗效预测模型中药贴敷治疗腹泻的第7天疗效预测模型中,重要性排名前三位的变量是年龄、腹泻天数和划分区域(北方),模型区分度较好AUC=0.81,模型分类准确度和精确度较高,但是与ANN、ANN+Boosting、ANN+Bagging和SVM四种主流机器学习和集成学习算法相比并未显示出优势。结论1 在第14和28天时贴敷组治疗腹泻疗效优于未贴敷组,敏感性分析结果提示混杂因素的存在可能使本研究结论偏向无效假设(偏向阴性结果)。2 使用湿贴和加药贴两种贴敷方式治疗腹泻疗效在第3、7、14和28天时均未见明显差异。3 在第2到28天范围内中药贴敷治疗腹泻的最佳用药天数范围为4天至19天。4 中药贴敷治疗腹泻第7天的XGBoost疗效预测模型分类准确度和精确度较高,可用于贴敷治疗腹泻的疗效预测。