基于超声特征集成学习的甲状腺结节分类方法研究

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:jrelt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:甲状腺结节是一种比较常见的疾病,并且发病率有逐年上升的趋势。如何及时并准确地鉴别出结节的良恶性,采取相应的治疗措施,是甲状腺结节治疗过程中的核心问题。超声作为甲状腺结节初步诊断的主要检查方式,其特征数据对于鉴别结节良恶性具有指导意义。本文针对甲状腺结节超声特征数据存在稀疏和不平衡的问题,通过在目标函数中加入自定义项对集成学习算法进行改进,提出一种基于改进集成学习的甲状腺结节良恶性鉴别方法。实验在真实医疗数据集和UCI标准数据集上分别对比了本算法与随机森林、支持向量机、神经网络算法,结果表明该方法具有最高的准确率,分别达到92.43%和94%。
  关键词: [甲状腺结节; 超声特征; 不平衡性; 改进的集成学习
  中图分类号: TP391
  文献标志码: A
  文章编号: 2095-2163(2016)06-0012-05
  0引言
  在甲状腺结节的临床治疗过程中,医生的首要内置目标即是判别结节的良恶性,而对于恶性结节患者需及时采取有效重要的手术治疗。但是在临床实践中,为了准确判别患者结节的良恶性特征属性,医生首先对疑似或确诊为甲状腺结节的患者设计指定超声检查,然后根据超声检查的各项指标,对疑似恶性结节患者增加细针穿刺活检,由此方可初步确定患者的良恶属性,最后才会得出推荐手术治疗的终诊论断[1]。不难看出,患者诊断结果的准确性主要依赖于医生的主观判断。由于不同医生的临床经验和医院医疗设施等存在差异,势必会造成不同程度的结果误诊。如此一来,将不仅严重影响患者正确治疗的展开推进,危及患者身体健康,而且也将对医疗资源造成一定的损失和可观浪费。
  为了帮助提高医生临床诊断的准确性,同时降低患者误诊率,简化患者前期检测的定制流程。近年来,越来越多的学者试图通过机器学习、专家系统等人工智能方法进行甲状腺结节良恶性鉴别。其中,集成学习作为使用上具备广阔领域的机器学习算法之一,设计思路就是在对新的实例进行分类的时候,把若干个单一分类器集成起来,通过对多个分类器的分类结果构建某种组合来确定最终的分类,以取得比单个分类器更好的性能。因此在一般情况下,集成学习预测效果均要优胜于绝大多数机器学习算法。
  但是目前大多数研究都是基于甲状腺超声图像数据,或者经过挑选之后比较完整的文本特征数据,再采用已有的机器学习方法直接送入模型训练,而却未曾考虑到真实医疗数据的稀疏性和不平衡性问题,因此得到的结果都存在一定的改进余地与完善空间。进一步研究可知,医疗数据的稀疏性主要体现在数据提取的缺失性上,由于患者病症的不同,提取的规则不同,难免会导致许多缺失数据,也即稀疏数据。而不平衡性则体现在患者的实际诊断结果上,由于大部分结节都是良性结节,造成数据中良恶性样本失衡。
  为此,本文通过在目标函数中加入自定义项对集成学习算法来设计实现改进,提出一种基于改进集成学习的甲状腺结节良恶性鉴别方法,最大程度上消除数据的稀疏性和不平衡性对实验结果造成的影响,同时提高预测结果准确率。具体而言,该方法主要包括:在真实医疗数据集上,先通过有放回的抽样方法独立地从数据集大类样本集中随机抽取多个样本子集,使每次随机抽取的样本数量与小类样本数量一致,再将各抽取的样本子集分别与小类样本集组合成多个新的训练样本集。对多个新样本集的特征子集以集成学习的方式采用投票机制进行投票,数据集的最终特征子集以得票数目超过半数的特征共同组合而成[2]。然后利用改进的Boosting算法,在节点分裂过程中自动利用特征的稀疏性,加快模型训练速度。实验结果表明,本算法相对于已有的机器学习方法具有更高的准确率,在真实医疗数据集和UCI标准数据集上分别达到92.43%和94%。
  文章第1节概述了在甲状腺结节判别方面的相关研究;第2节展现了对数据的基础预处理设计;第3节具体描述了改进的Boosting算法;第4节通过与传统机器学习方法的实验对比,论证本算法的优异性;第5节给出本文的结论并对未来工作做出展望。
  [BT4]1相关工作
  通过机器学习方法提高对疾病的诊断预测准确率已经成为智慧医疗的一个重要实现途径,当下则有很多学者在甲状腺结节的诊断分类方面开启、并推进了相关研究。具体展开如下。
  在数据的不平衡性处理上,David Masko对正例样本进行过抽样处理,人工注入样本使得正例样本的数目增加,使得正负样本达到平衡[3];Rok Blagus对少数类数据集规划执行数据预处理后,即运用过抽样和欠抽样相结合的改进方法,再利用交叉验证的方法来得到效果验证,改进效果明显[4]。
  在甲状腺结节的预测鉴别研究上,熊伟等人提出了一种利用局部纹理特征与多示例学习相结合的方法,从感兴趣区域提取其局部纹理特征,将感兴趣区域看作由所有局部特征构成的示例包,最后利用KNN算法来实现对甲状腺结节的分类,准确率达85.59%[5];Jieming Ma等人提出一种基于SVM的甲狀腺结节预测方法,并且为了防止模型的过拟合,在普通SVM模型的代价函数中加入惩罚项生成设计优化,准确率达86.6%[6];李前程等人将结节的良恶性作为因变量,以超声表现作为自变量,采用二分类logistic 回归分析筛选出对甲状腺结节良恶性有显著鉴别作用的超声指标并建立回归模型,准确率可达89.91%[7];张振宇等人对基于k-means聚类的动态集成算法研究了创新改进,提出了一种选择加权动态集成方法,采用多个分类器进行并联集成,以此来增加分类模型的稳定性,准确率则达到了90.2%[8]。
  [BT4]2数据预处理
  针对甲状腺结节患者治疗的临床经验以及某三甲医院患者的实际超声指标特征,实验前先将非结构化的医疗数据进行结构化处理[9],提取出研究需要的指标以及对应的文本描述。然后将表示特征指标程度的文本变量转换为算法能够处理的数值型变量[10]。   为了降低信息重叠造成的结果失真,研究中利用主成分分析法对诸多的特征作出选择,在最大化保留原始数据信息的前提下,去除不必要的特征,提升模型训练速度和结果准确度。首先对原始数据设定修正达到标准化,计算其相关系数矩阵,求出特征值与特征向量,然后选取累计贡献率达到85%以上的特征值对应的主成分,替换原始特征变量[11]。[JP2]经过主成分分析后,选择使用血流模式、血供程度、回声分布、包膜接触面积、甲状腺实质血供、结节边界等16项指标作为输入特征变量,以其对应的结节病理诊断结果作为预测输出变量。[JP]
  在数据平衡性方面,研究则利用改进的SMOTE算法对恶性结节样本进行过抽样处理,人工注入样本使得样本数量增加;对良性结节样本进行欠抽样处理,将谱聚类算法引入其中,选取样本的子集即可使数据集在良恶性样本的数目上趋于平衡,提高试验结果的准确性。
  4实验结果与模型评估
  [BT5]4.1参数确定
  为了找到算法的最优结果,需要通过实验确定各参数的最佳值。一般情况下,各参数需要同时考虑,才能得到全局最优值,但是考虑到此处的特殊性,当迭代次数足够大时,模型的分类准确率趋于稳定,因此实际调参过程中通过设置足够大的迭代次数、如1 000次,可以得到最优的树深度,然后在此最优深度下选择最优的迭代次数,避免不必要的空间和时间浪费。在此,将给出预测准确率与树深度间的对应关系,如图1所示。
  从图1中可看出,当树深度为3时,模型的预测准确率达到最大,具体为92.43%。分析原因在于:原则上当树深度增加时,模型复杂度也随之增加,对数据的分类也就越准确,但当树深度达到一定数量(在这里是3)后,再增加树深度只会造成过拟合,在测试集上的准确率反而会出现下降。
  接下来,研究中进一步给出了预测准确率与迭代次数之间的统计关系,结果示意如图2所示。
  从图2可以看出,当迭代次数达到400次以后,预测准确率达到最大,具体为92.43%。至此,本模型参数确定为树深度为3,迭代次数为400次。
  [BT5]4.2模型评估
  模型评估是检验设计模型是否具有使用价值的重要依据,是模型建立过程中必不可少的基础有益环节。本文拟将从混淆矩阵和ROC图像两个方面进行模型评估。
  4.2.1混淆矩阵
  混淆矩阵主要用于比较模型预测值同实际真实值之间的差别,是一种常用且有效的模型评估方法[13]。实验以297名患者的数据作为测试集,对比预测值与实际值之间的差别。实验结果如表1所示。
  从表1可以看出,算法预测准确率达到92%。其中恶性结节预测准确率达到86%,召回率达到96%,也就是说几乎所有的恶性结节患者都能获得正确识别。作为对比,该医院的真实临床数据却清晰地显示出,被医生诊断为恶性结节并实施相应手术治疗的患者中,实际恶性患者占比仅为63%。
  4.2.2ROC图
  ROC(受试者工作特征)曲线常常用来检查在找出真阳性和避免假阳性之间的权衡,曲线上的点表示不同假阳性阈值上的真阳性的比例。简单来说,ROC曲线下面积越大,模型效果越好[14]。本次研究模型的ROC曲线则如图3所示。
  从图3可以看出,ROC曲线距离完美情况比较接近,经计算也可得出AUC(ROC曲线下面积)为0.935,说明模型预测性能非常好。
  4.3算法对比
  为了验证本算法的实际性能,本文选择了3种常用的数据挖掘模型展开对比测试。实验采用真实临床医疗数据和UCI标准数据集new-thyroid分别进行分类预测效果对比,且各模型都选取最佳参数下的效果,对比结果如表2、表3所示。
  从表2、表3中可以看出,本文提出的方法预测准确率较之前已有的研究方法均呈现有一定程度的提高,证明了本文算法的优异之处,对于疾病的诊断预测研究有一定的帮助。
  [BT4]5结束语
  近年来,甲状腺疾病、尤其是甲状腺结节的诊治医疗已然成为研究学界的一个重点课题。如何在临床施诊过程中能够有效提高良恶性结节的诊断准确率,正确及时制定、推荐治疗方案,无论对患者的病情进展控制还是对医疗资源的合理配置都将具有重要的意义。本文提出的改进的Boosting算法,在真实医疗数据集和UCI标准数据集上都呈现出一定的优异性,具有较高的预测正确率。并且考虑到实际医疗数据的不平衡性和稀疏性,使结果更具说服力、及优良可行性。
  未来的工作主要从3个方向入手:首先,在更趋宏观科学的指导下确定鉴别结节良恶性的特征属性;考虑其他忽略的特征属性对鉴别结果的影响。其次,提升特征属性的质量;包括特征属性的提取、转换和选择。最后,要重视算法的优化,针对医疗数据的特征作出相应的模型优化,让算法对数据集分类的结果更具普适性和高效实用性。
  [HS1*2][HT5H]参考文献:[HT]
  [WTBZ][ST6BZ][HT6SS][1] [ZK(#〗
  [HJ*2]
  [JP3]HAUGEN B R, ALEXANDER E K, BIBLE K C, et al. 2015 American Thyroid Association[JP] Management Guidelines for adult patients with Thyroid Nodules and Differentiated Thyroid Cancer[J]. Thyroid, 2016, 26(1): 1-133.
  [2]鄒权,郭茂祖,刘扬,等. 类别不平衡的分类方法及在生物信息学中的应用[J]. 计算机研究与发展, 2010,47(8):1407-1414.
  [3] Masko D, Hensman P. The impact of imbalanced training data for convolutional neural networks[D]. Stockholm:KTH Royal Institute of Technology, 2015.   [4] LUSA L. Joint use of overand undersampling techniques and crossvalidation for the development and assessment of prediction models[J]. BMC bioinformatics, 2015, 16(1): 1-10.
  [5]熊偉,龚勋,罗俊,等.基于局部纹理特征的超声甲状腺结节良恶性识别[J]. 数据采集与处理, 2015,30(1):186-191.
  [6] MA J, LUO S, DIGHE M, et al. Differential diagnosis of thyroid nodules with ultrasound elastography based on support vector machines[C]// Ultrasonics Symposium (IUS), 2010 IEEE. San Diego, California, USA: IEEE, 2010:1372-1375.
  [7] 李前程,孙丽娜,吴双,等. 高频超声及弹性成像对甲状腺结节性质鉴别诊断的logistic 回归分析[J]. 中国地方病防治杂志, 2015,30(4):291-293.
  [8] 张振宇. 改进集成技术在甲状腺超声图像分类中的应用研究[D]. 保定:河北大学, 2014.
  [9] 陈德华,冯洁莹,乐嘉锦,等. 中文病理文本的结构化处理方法研究[J]. 计算机科学,2016,43(10):272-276.
  [10] 戚湧,陈俊,李千目. 基于冗余消除和属性数值化的XACML策略优化方法[J]. 计算机科学,2016,43(2):163-168.
  [11]Furuya S, Tominaga K, Miyazaki F, et al. Losing dexterity: patterns of impaired coordination of finger movements in musician’s dystonia[EB/OL]. [2015-08-20]. http://sci Rep.2015;5:13360.
  [12]Chen T, Guestrin C. XGBoost: A Scalable Tree Boosting System[EB/OL]. [2016-03-09].https://arxiv.org/pdf/1603.02754v1.pdf.
  [13]DENG X, LIU Q, DENG Y, et al. An improved method to construct basic probability assignment based on the confusion matrix for classification problem[J]. Information Sciences, 2016, s340/341:250-261.
  [14]FAWCETT T. An introduction to ROC analysis[J]. Pattern Recognition Letters, 2006, 27(8):861-874.
其他文献
我国的第一只期权——上证50ETF期权于2015年2月9日在上海证券交易所正式上市交易,为了研究上证50ETF期权交易与标的收益率之间的关系,本文选用认沽/认购比例(P/C)作为衡量上证
东莞市某猪场在1998年12月发生了一场疫情,其特征是病猪精神沉郁,体温升高至41~42℃,呼吸困难,耳、四肢内侧和腹下等部位皮肤发绀,有出血点,发病率为65.3%,死亡率为85%,经临床
2000年8月,江门市某养猪场,由于栏舍长期使用夜照明灯光诱来了棘头虫的中间宿主-金龟子,猪只吞食了金龟子而感染了棘头虫病,致使猪群发病,造成猪只死亡6头.根据发病情况、剖
2005年4~10月,广东省湛江市某养殖场的小尾寒羊出现一种以极度贫血、衰弱、消瘦为主要症状的疾病。笔者通过流行病学调查、病理剖检、血液检验、寄生虫体鉴定及微生物学诊断,确
利用佛山科学技术学院科研禽场饲养的仙湖肉鸭,在49日龄时随机抽取50只(公、母各半)进行屠宰,以活重、屠宰率、全净膛率、腿肌率、胸肌率、腹脂率6个屠宰性状指标为自变量,以49日
重组禽流感灭活疫苗(H5N1,Re-1株)3批,按重组禽流感灭活疫苗(H5N1,Re-1株)规程规定的检验方法免疫28日龄SPF鸡,免疫后定期采集血样,测定血清HI抗体效价,绘制各批疫苗免疫鸡HI效价消长曲
目的探析盆底超声用于压力性尿失禁诊断中的价值。方法选取就诊于我院的压力性尿失禁女性患者100例为研究组,再选取同期就诊于我院的盆底功能正常且已生育的女性患者100例为
进出口总额代表着一国参与对外贸易的程度,是国民经济的关键性指标之一。文章以我国1994~2016年进出口总额的月度历史数据为研究样本,利用时间序列检验方法对其进行了相关分析
以森林资源调查的森林分布图和固定样地资料作为主要信息源,以ARC/INFO作为空间信息处理工具,采用平均斑块面积,形状指数,连接度,分维维,积聚系数,稳定度6个评价指标分析了1983-1994年浙江临安森林景观