论文部分内容阅读
目的:研究开发基于深度学习的高血压性视网膜病变严重程度及分级的智能辅助检测模型,并评估其在临床上的应用价值。
方法:本研究选取2010年1月至2019年12月就诊于汕头大学·香港中文大学联合汕头国际眼科中心(JSIEC)的高血压患者及正常人的眼底图像。采用Wong-Mitchell分级,将病变分为正常、轻度、中度、重度,经过人工标注后,分别建立二分类(正常和轻度vs中度和重度)及四分类(正常、轻度、中度、重度)数据集,数据集根据人数8:1:1被随机分为三部分:训练集、验证集和测试集,其中训练集用于算法训练;验证集用于评估模型的性能并调整参数;测试集用于评价训练后模型的最终性能。使用深度学习的卷积神经网络在训练集进行迭代训练,分别建立二分类模型和四分类模型,直到模型收敛误差后在测试集上进行评估。采用准确性、灵敏性、特异性来评估该算法的性能,通过灵敏性及特异性绘制ROC曲线,计算ROC曲线下面积(AUC)及AUC的95%可信区间。
结果:最终共纳入1080例受试者1224张眼底图像,包括正常图片665张,高血压性视网膜病变图片559张,其中轻度病变166张,中度病变219张,重度174张。二分类(正常和轻度vs中度和重度)各模型在测试集的准确率、灵敏度、特异度均大于0.97,各模型ROC曲线下面积(AUC)均达1.0(95%CI, 1.000-1.000)。最好的结果模型为Xception、InceptionResnetV2&Xception、Inception_V3&InceptionResnetV2&Xception,准确率、灵敏度及特异度均为1.0。最差的结果模型为Inception_V3,准确率为0.983,灵敏度为1.0,特异度为0.976。四分类(正常,轻度,中度,重度)在各模型测试集的准确性均高于0.86。最好的结果模型为InceptionResnetV2,准确性为0.904,最差的结果模型为Inception_V3,准确性为0.861。
结论:本研究开发基于深度学习的HR严重程度及分级的智能辅助检测系统。二分类系统能够用于临床辅助筛查HR的严重程度,四分类系统可以用来协助医生检测HR的分级,表现出了较大的临床应用潜力。
方法:本研究选取2010年1月至2019年12月就诊于汕头大学·香港中文大学联合汕头国际眼科中心(JSIEC)的高血压患者及正常人的眼底图像。采用Wong-Mitchell分级,将病变分为正常、轻度、中度、重度,经过人工标注后,分别建立二分类(正常和轻度vs中度和重度)及四分类(正常、轻度、中度、重度)数据集,数据集根据人数8:1:1被随机分为三部分:训练集、验证集和测试集,其中训练集用于算法训练;验证集用于评估模型的性能并调整参数;测试集用于评价训练后模型的最终性能。使用深度学习的卷积神经网络在训练集进行迭代训练,分别建立二分类模型和四分类模型,直到模型收敛误差后在测试集上进行评估。采用准确性、灵敏性、特异性来评估该算法的性能,通过灵敏性及特异性绘制ROC曲线,计算ROC曲线下面积(AUC)及AUC的95%可信区间。
结果:最终共纳入1080例受试者1224张眼底图像,包括正常图片665张,高血压性视网膜病变图片559张,其中轻度病变166张,中度病变219张,重度174张。二分类(正常和轻度vs中度和重度)各模型在测试集的准确率、灵敏度、特异度均大于0.97,各模型ROC曲线下面积(AUC)均达1.0(95%CI, 1.000-1.000)。最好的结果模型为Xception、InceptionResnetV2&Xception、Inception_V3&InceptionResnetV2&Xception,准确率、灵敏度及特异度均为1.0。最差的结果模型为Inception_V3,准确率为0.983,灵敏度为1.0,特异度为0.976。四分类(正常,轻度,中度,重度)在各模型测试集的准确性均高于0.86。最好的结果模型为InceptionResnetV2,准确性为0.904,最差的结果模型为Inception_V3,准确性为0.861。
结论:本研究开发基于深度学习的HR严重程度及分级的智能辅助检测系统。二分类系统能够用于临床辅助筛查HR的严重程度,四分类系统可以用来协助医生检测HR的分级,表现出了较大的临床应用潜力。