论文部分内容阅读
胎儿不满37周被娩出称为早产,世界卫生组织报告,每年早产发生率约为10%,已构成全球范围的公共卫生问题。近年随着我国“二孩”政策的实施,高龄高危产妇的激增,临床出现先兆早产症状的孕妇数量不断增加。早产儿的出生会给家庭及社会带来沉重的精神、经济负担。目前临床采取的监测方法,早产诊断准确率低,可能导致干预不及时或者过度治疗,因而迫切需要提出新的早产诊断技术。子宫肌电信号(Electrohysterogram,EHG)是利用电极从孕妇腹部表面记录到的无数子宫平滑肌细胞的综合电活动,是一种全新的、无创监测子宫电活动的方法,有望用于早产诊断中。
本课题在北京协和医院采集了156例孕妇的EHG信号,包括足月产(term labor, TL)113例,先兆早产(threatened preterm labor, TPL)43例。根据分娩结局,先兆早产中包括为结局早产(threatened preterm labor with the outcome of perterm labor,PPL)17例、结局足月产(threatened preterm labor with the outcome of term labor, PTL)26例。每位孕妇同步记录3040分钟的8通道EHG信号。研究过程如下:对EHG信号预处理以去除噪声;小波分解之后提取4个频率段下的信号;分别对这4个频率段下的信号计算10种特征值,其中特征值包括均方根值(root mean square value,RMS)、零穿越次数(zerocrossingtimes,τRxx)、峰值频率(peak frequency, PF)、中值频率(median frequency, MDF)、平均频率(mean frequency, MNF)、小波系数能量值(Energy)、奇异值(Variance)、时间可逆性(time reversibility, Tr)、样本熵(sample entropy, SampEn)、李雅普诺夫指数(lyapunov index,Ly),分析先兆早产与足月产组、先兆早产结局早产与结局足月产组状态下不同通道得到的EHG特征值,并使用Mann-whitneyU检验分析特征的显著性差异;建立分类器以识别先兆早产、先兆早产结局早产信号,建立的分类器包括决策树(decision tree,DT),随机森林(random forest,RF),Adaboost,梯度提升树(gradient boosting decision tree,GBDT),分类器在得到分类结果的同时对特征值重要性进行排序。本研究采用灵敏度,特异度和准确率等参数对分类器的分类能力进行评估,得到最优分类器与重要特征值。
结果表明,TPL和TL组SampEn、Energy、Variance在不同的通道和不同的频率段具有显著性差异,其中通道3、4、7、8具有显著性差异的特征值个数最多。Adaboost模型分类效果可达到最好,其中准确率0.90,灵敏度0.83,特异性0.98,特征重要性前三为:样本熵、能量值、均方根,特征子集通道4、5、6、7、8效果最佳;PPL和PTL组MDF、PF、Ly在不同的通道和不同的频率段具有显著性差异,其中通道2,通道8具有显著性差异的特征值个数最多。DT模型的分类效果为准确率0.88,灵敏度0.79,特异性0.96,特征重要性前三为:中值频率、峰值频率、样本熵,通道1、3、8效果最佳。
本课题提取了足月产和先兆早产状态下EHG信号的特征值,并根据先兆早产的不同妊娠结局进行分组讨论,对特征值进行选择、重要性排序,结果表明设计的分类器对不同妊娠状态的EHG信号进行了有效识别与区分,为产科临床提供了新的解决思路,为诊断先兆早产及早产提供了可靠依据。
本课题在北京协和医院采集了156例孕妇的EHG信号,包括足月产(term labor, TL)113例,先兆早产(threatened preterm labor, TPL)43例。根据分娩结局,先兆早产中包括为结局早产(threatened preterm labor with the outcome of perterm labor,PPL)17例、结局足月产(threatened preterm labor with the outcome of term labor, PTL)26例。每位孕妇同步记录3040分钟的8通道EHG信号。研究过程如下:对EHG信号预处理以去除噪声;小波分解之后提取4个频率段下的信号;分别对这4个频率段下的信号计算10种特征值,其中特征值包括均方根值(root mean square value,RMS)、零穿越次数(zerocrossingtimes,τRxx)、峰值频率(peak frequency, PF)、中值频率(median frequency, MDF)、平均频率(mean frequency, MNF)、小波系数能量值(Energy)、奇异值(Variance)、时间可逆性(time reversibility, Tr)、样本熵(sample entropy, SampEn)、李雅普诺夫指数(lyapunov index,Ly),分析先兆早产与足月产组、先兆早产结局早产与结局足月产组状态下不同通道得到的EHG特征值,并使用Mann-whitneyU检验分析特征的显著性差异;建立分类器以识别先兆早产、先兆早产结局早产信号,建立的分类器包括决策树(decision tree,DT),随机森林(random forest,RF),Adaboost,梯度提升树(gradient boosting decision tree,GBDT),分类器在得到分类结果的同时对特征值重要性进行排序。本研究采用灵敏度,特异度和准确率等参数对分类器的分类能力进行评估,得到最优分类器与重要特征值。
结果表明,TPL和TL组SampEn、Energy、Variance在不同的通道和不同的频率段具有显著性差异,其中通道3、4、7、8具有显著性差异的特征值个数最多。Adaboost模型分类效果可达到最好,其中准确率0.90,灵敏度0.83,特异性0.98,特征重要性前三为:样本熵、能量值、均方根,特征子集通道4、5、6、7、8效果最佳;PPL和PTL组MDF、PF、Ly在不同的通道和不同的频率段具有显著性差异,其中通道2,通道8具有显著性差异的特征值个数最多。DT模型的分类效果为准确率0.88,灵敏度0.79,特异性0.96,特征重要性前三为:中值频率、峰值频率、样本熵,通道1、3、8效果最佳。
本课题提取了足月产和先兆早产状态下EHG信号的特征值,并根据先兆早产的不同妊娠结局进行分组讨论,对特征值进行选择、重要性排序,结果表明设计的分类器对不同妊娠状态的EHG信号进行了有效识别与区分,为产科临床提供了新的解决思路,为诊断先兆早产及早产提供了可靠依据。