论文部分内容阅读
第一部分:界面皮炎的反射式共聚焦显微镜诊断评价及数据集的建立目的:评估使用反射式共聚焦显微镜(Reflectance confocal microscopy,RCM)检测皮肤界面皮炎的诊断水平,比较不同年资医师使用RCM诊断界面皮炎准确度的差异,总结界面皮炎的RCM特征,建立界面皮炎RCM影像数据集。方法:回顾性纳入2019年9月至2021年2月武汉市第一医院皮肤科同时行RCM和皮肤组织病理学检查的界面皮炎患者97例,其他炎症性皮肤病患者64例。分别让3名高年资医师和3名低年资医师,在不提供临床和病理诊断结果的情况下,根据RCM图像进行诊断。以组织病理学检查结果为金标准,分别计算高年资医师和低年资医师使用RCM诊断界面皮炎的灵敏度、特异度、正确指数、阳性似然比、阴性似然比、准确度、Kappa值、阳性预测值、阴性预测值,通过卡方检验比较不同年资医师诊断准确度是否存在统计学差异。归纳总结界面皮炎的RCM特征表现。由2名皮肤影像医师按照图像质控标准对RCM图像进行筛选,记录并保存所有患者的基本信息、临床图片、RCM图片、病理诊断结果,构建用于深度学习的RCM图像数据集。结果:1.高年资医师根据RCM图像诊断界面皮炎的灵敏度、特异度、正确指数、阳性似然比、阴性似然比、准确度、Kappa值、阳性预测值、阴性预测值分别为87.29(85.57~88.66)%、96.88(95.31~98.44)%、84.16(80.88~87.10)%、27.93(18.25~56.74)%、13.12(11.52~15.14)%、91.10(89.44~92.55)%、0.8191(0.7858~0.8484)、97.69(96.51~98.85)%、83.41(81.33~85.14)%。低年资医师根据RCM图像诊断界面皮炎灵敏度、特异度、正确指数、阳性似然比、阴性似然比、准确度、Kappa值、阳性预测值、阴性预测值分别为70.10(69.07~71.13)%、88.02(84.38~90.63)%、58.12(53.45~61.76)%、5.85(4.42~7.59)%、33.97(31.85~36.66)%、77.23(75.16~78.88)%、0.5501(0.5075~0.5835)%、89.87(87.01~92.00)%、66.02(64.29~67.44)%。2.通过卡方检验比较高年资医师和低年资医师的诊断结果,其中灵敏度分别为87.29%、70.10%(χ~2=8.94,P=0.003),特异度分别为96.88%、88.02%(χ~2=3.91,P=0.048),准确度分别为91.09%、77.23%(χ~2=12.33,P<0.001),证明高年资医师与低年资医师的诊断灵敏度、特异度和准确度有统计学差异(P<0.05)。3.总结RCM诊断界面皮炎的特征,最具代表性的三个特征分别为真表皮交界处(Dermoepidermal junction,DEJ)结构紊乱、真皮浅中层炎症细胞浸润、真皮内丰满明亮的噬黑素细胞。4.建立RCM图像数据集,由2名皮肤影像医师按照图像质控标准筛选出84例界面皮炎的DEJ处RCM图像329张以及53例其他临床表现与之相似的皮肤疾病的DEJ处RCM图像180张。结论:RCM辅助诊断界面皮炎准确度良好,可有效的辅助医师诊断。应用RCM诊断界面皮炎的结果受到检查者经验的影响,低年资医师诊断准确度偏低,且一致性低于高年资医师。因此需进一步开发智能化RCM辅助诊断方式,以排除检查医师对诊断效果的影响。本研究建立了界面皮炎RCM影像数据集,可作为构建深度学习辅助RCM诊断界面皮炎模型的数据基础。第二部分基于深度学习的界面皮炎反射式共聚焦显微图像辅助诊断模型构建及评价目的:构建基于深度学习(Deep Learning,DL)的界面皮炎反射式共聚焦显微镜图像的二分类模型,评价该模型的临床应用效果,并与皮肤科医师们进行比较。方法:回顾性纳入2019年9月至2021年2月间武汉市第一医院皮肤科影像数据集中84例界面皮炎的真表皮交界处(DEJ)RCM图像329张,以及53例其他炎症性皮肤疾病的DEJ处RCM图像180张为对照。图像由2名皮肤影像医师按照病理诊断结果进行标注。通过随机角度变换等图像预处理方法增大数据量,得到界面皮炎组RCM图像2632张及其他炎症性皮肤病组RCM图像1440张,按8:1:1比例划分为训练集、验证集和测试集,选用深度学习中经典的卷积神经网络(Convolutional neural network,CNN)模型VGG16进行训练和验证,得到模型的训练(train)精度和验证(test)精度,并用测试集对VGG16模型进行测试。为评价该VGG16二分类模型的临床应用效果,新纳入2021年3月至2021年4月武汉市第一医院皮肤科影像中心RCM图像共75张,包括13例界面皮炎患者的DEJ处RCM图像38张以及12例临床表现与之相似的其他炎症性皮肤疾病的DEJ处RCM图像37张,图像未经筛选或其他处理。应用VGG16模型对该75张RCM图像进行测试,计算并比较该模型和皮肤科医师诊断的灵敏度、特异度、阴性似然比、阳性预测值、阴性预测值、准确度、Kappa值。绘制受试者工作特征(Receiver operating characteristic,ROC)曲线,并计算曲线下面积(Area Under the Curve,AUC)。同时让12名皮肤科医师包括2名皮肤影像专家和10名皮肤科住院医师/住培医师对图像进行判读,比较VGG16二分类模型与皮肤科医师诊断效果。结果:1.构建基于深度学习的界面皮炎RCM图像VGG16二分类模型。观察损失变化拟合情况,选择第156次训练模型为最优模型,经过训练后模型的训练(train)精度99.63%,验证(test)精度99.26%。采用测试集对模型进行测试,其中测试集共407张测试图像,该VGG16二分类模型正确识别398张,错误9张,测试识别精度97.78%。2.使用临床上新收集的75张未经筛选及处理的RCM图像对该模型进行测试,评价该模型的实际临床应用效果,结果显示VGG16二分类模型的灵敏度为89.47%、特异度为100%、阴性似然比为10%、阳性预测值为100%、阴性预测值为90.24%、准确度为94.67%、Kappa值为0.893。同时让皮肤科医师判断,结果显示灵敏度为75.22(52.63~94.74)%、特异度为81.98(72.97~94.59)%,阳性似然比为4.17(2.14~17.53)%,阴性似然比为30.23(5.56~62.59)%,阳性预测值为81.09(68.75~94.73)%,阴性预测值为76.31(60.87~94.59)%,准确度为78.56(64.00~94.67)%,Kappa值为0.571(0.282~0.893)。3.该模型ROC曲线显示12名皮肤科医师诊断的灵敏度和特异度对应点均位于曲线右下方,计算曲线下面积AUC为0.997。采用卡方检验比较VGG16模型与皮肤影像专家的灵敏度分别为89.47%、92.11%(χ~2=0.157,P=0.692),特异度分别为100%、93.24%(χ~2=2.056,P=0.152),准确度分别为94.67%、92.67%(χ~2=0.118,P=0.731)。采用卡方检验比较VGG16模型与皮肤科住院医师/住培医师灵敏度分别为89.47%、71.84%(χ~2=4.07,P=0.044),特异度分别为100%、79.73%(χ~2=8.97,P=0.003),准确度分别为94.67%、75.73%(χ~2=10.44,P=0.001)。皮肤影像专家诊断灵敏度、特异度、准确度与VGG16二分类模型无统计学差异(P>0.05),皮肤科住院医师/住培医师诊断灵敏度、特异度、准确度均低于VGG16二分类模型,具有统计学差异(P<0.05)。结论:基于深度学习的界面皮炎RCM图像VGG16二分类模型可良好辅助诊断出皮肤界面皮炎,与皮肤影像专家的水平相当,对界面皮炎与其他炎症性皮肤疾病的分类能力优于皮肤科住院医师/住培医师水平。在临床应用中该VGG16二分类模型可帮助皮肤科住院医师/住培医师诊断界面皮炎。