论文部分内容阅读
背景:近年来,随着卷积神经网络的迅速发展,计算机视觉算法广泛应用于医疗行业,尤其是依赖视觉与图像进行诊疗的皮肤学领域。已有的研究提示我们卷积神经网络可以在皮肤病的鉴别中取得很好的效果,譬如2017年斯坦福团队鉴别恶性黑素瘤与良性色素痣,以及角质形成细胞癌与良性脂溢性角化的两项任务。寻常痤疮是一种常见的皮肤病,但因为缺少国际统一的严重程度分级标准,造成治疗不规范、临床试验难以开展的现象。在痤疮严重程度分级中应用深度学习的研究很少。目的:试图将不同的卷积神经网络算法应用于面部痤疮的分级评估中,并研究深度学习辅助评估特定皮肤疾病的最佳思路与方法。方法:回顾现存数十种痤疮严重程度分级标准的优缺点后,研究选定了面部作为此次研究的评价部位,并采纳了日本皮肤学家Hayashi等人建立的计数与图像结合的分级标准。在北京协和医院皮肤科门诊招募符合入选标准的寻常痤疮患者,征得口头知情同意后,用数码微型单反相机拍摄左、右两侧面部的照片。模拟分级与计数两种不同的评估思路,分别采用图像分类和物体检测两种算法模型来完成痤疮的分级任务。即由有资质的皮肤科专科医生,在经过Hayashi标准培训后,对样本进行分级;再在MATLAB软件中对样本标注丘疹、脓疱。将标注好的样本分为训练集、测试集,让ResNet和FasterR-CNN两种网络分别学习训练集,再对测试集给出预测的分级结果,并对预测的效果进行分析、对比。结果:1)共收集到临床图像样本1503张,其中轻度、中度、重度、极重度各550、638、185、130张;共标注脓疱边框2658个,丘疹边框13644个;2)ResNet网络对轻、中、重、极重度分级的灵敏度(召回率)分别为0.78、0.72、0.57、0.71,ROC 曲线的 AUC 分别为 0.7707、0.7244、0.6008、0.7185,整体的精确度为0.722;3)Faster R-CNN网络在取不同得分阈值时,得到的分级性能有所不同,整体精确度在0.7-0.76之间;阈值为0.4时,总精确度最高,为0.759,但此时极重度的灵敏度仅为0.04。结论:1)ResNet、Faster R-CNN两种卷积神经网络对于面部痤疮的严重程度分级评估都具有不错的性能,在进一步增大样本量、提高计算机运算能力后,分级的性能尚有很大提升空间;2)对于皮损面积较小、分布密度较高的皮肤疾病,图像分类的计算机视觉算法模型更适合用于严重程度的评估中;3)卷积神经网络算法的进一步研究,将对统一痤疮的分级标准、客观评价临床试验结果、规范治疗手段有帮助。