论文部分内容阅读
目的:调查乳腺癌患者整体的癌因性疲乏现状,了解患者癌因性疲乏水平;采集乳腺癌患者语音建立针对乳腺癌患者癌因性疲乏分类的数据集;应用径向基核函数支持向量机方法构建乳腺癌患者癌因性疲乏分类模型,并评价该模型的性能。方法:1.采用方便抽样法对长春市某三甲医院乳腺外科的乳腺癌患者进行问卷调查。研究工具是《一般资料调查表》和《Piper疲乏修订量表》,应用Epidata 3.1软件和SPSS 21.0软件来管理和分析调查数据,乳腺癌患者的一般资料和Piper疲乏修订量表得分使用描述性分析法,乳腺癌患者癌因性疲乏的影响因素分析使用单因素分析法。2.采用半结构化访谈的方式在长春市某三甲医院乳腺外科对乳腺癌患者进行语音信号采集,访谈内容包括患者目前所接受的治疗、住院的感受、治疗所带来的不良反应、情绪状态、疲乏症状体验等方面。对录音文件进行编号、备份、储存并利用Adobe Audition CC 2019音频处理软件进行噪音处理、剪辑和分段储存。应用预加重技术、分帧技术、加窗技术、端点预测技术对语音信号进行预处理,再依据扩展后日内瓦最小声学参数集通过openSMILE软件提取语音信号的声学特征参数。3.采用[0,1]区间归一化处理法对乳腺癌患者癌因性疲乏分类的数据集进行数据归一化处理,利用LibSVM软件采用10次10折交叉验证法训练和调优基于径向基核函数的乳腺癌患者癌因性疲乏支持向量机分类模型,再利用获得的模型对测试集数据进行预测以评价该模型的性能。结果:1.本研究于2018年11月至2019年6月期间共调查110名乳腺癌患者,回收有效问卷101份,101名乳腺癌患者的平均年龄为49.89±9.57岁,其中80%患者正在接受或接受过化疗,平均化疗3.50±2.85周期,癌因性疲乏发生率为60.40%,101名乳腺癌患者癌因性疲乏得分中位数为3.27,癌因性疲乏四个维度中得分最高的是认知/情绪维度,61名出现癌因性疲乏症状的乳腺癌患者的癌因性疲乏平均得分为4.20±1.24。单因素分析结果显示仅有年龄是癌因性疲乏的影响因素,不同年龄的患者癌因性疲乏得分差异具有统计学意义(P<0.05),年龄较小的乳腺癌患者癌因性疲乏程度较重。2.本研究采集了101名乳腺癌患者的语音信号,每位患者录音持续约15~60分钟,经噪音处理和剪辑后,共获得无噪音、句型完整且发音时长在5s以内的语音段1130段,其中存在疲乏症状的患者语音段为542个,无疲乏患者语音段588个。根据声学特征参数的特点对所有语音段进行选择性预处理,依据扩展后日内瓦最小声学参数集提取1130个语音段的88维语音信号声学特征参数并完成数据集的构建。3.本研究使用训练集获得基于径向基核函数的乳腺癌患者癌因性疲乏支持向量机分类模型,平均训练集准确率为84.99%,在测试集中正确分类样本数的平均值约为96个,平均准确率为84.66%;参数选择和调优后的模型性在训练集上的10折交叉验证的平均准确率为98.17%,在测试集中的正确分类样本数的平均值为94个,测试集平均准确率达82.39%。结论:1.乳腺癌患者癌因性疲乏水平整体处于中等强度,年龄较小的乳腺癌患者癌因性疲乏程度越重,提示医护人员应对该部分人群给予更多关注。2.基于径向基核函数的乳腺癌患者癌因性疲乏支持向量机分类模型平均准确率超过80%,证明语音信号声学特征参数在预测癌因性疲乏症状方面的有效性和实用性。