论文部分内容阅读
第一部分 基于深度学习的人工智能判断肺结节良恶性的研究目的:以单纯人工阅片为对照,探讨基于DenseNet网络深度学习的人工智能肺结节自动检测系统鉴别肺结节良恶性的价值和优势。材料和方法:收集经2015年1月至2017年12月在苏州大学附属第一医院就诊的胸部患者510例。其中良性病变160例,恶性病变350例。实验分为医师组和人工智能组。医师组指的是四名放射科医师(2名初级医师为从事胸部CT诊断工作满2年者;2名高级医师为从事胸部CT诊断工作满5年者)采用双盲法对510例患者的胸部CT图像进行良恶性诊断,主要从肺结节大小、密度、形态、边缘以及含气支气管征等方面进行诊断。人工智能组指的是将510例患者肺结节CT图像输入至DenseNet网络系统中,通过网络学习自动提取结节特征,并通过特征对结节进行分类归纳,获得肺结节的良、恶性诊断。两组之间的数据通过卡方检验进行统计分析。结果:初、高级医师组(AR组)与人工智能组(AI组)分别对510例肺结节图像进行良、恶性判断。对于160例良性肺结节诊断结果而言,AI诊断准确率显著高于AR组(p=0.000<0.05),差异具有统计学意义;初级AR组与高级AR组诊断准确率无明显差异(p=0.651>0.05)。对于350例恶性肺结节诊断结果,高级AR组诊断正确率高于初级AR组;AI组诊断恶性肺结节准确率最高。初级AR组与高级AR组、初级AR组与AI组比较,差异均具有统计学意义(p<0.05);高级AR组与AI组的差异无统计学意义(p>0.05)。在此基础上,根据肺结节直径,对510例肺结节进一步细分为直径≤1Omm、直径>10mm≤20mm以及直径>20mm三个范围。不同直径范围内的肺结节,应用AI组进行良恶性诊断的准确率均高于医师组(除外直径>20mm范围的恶性肺结节,AI组诊断准确率等同于高级AR组)。而医师组对不同直径范围内的肺结节良恶性诊断存在一定程度的差异,即在直径≤10mm的范围内,高级AR组诊断良性肺结节准确率低于低级AR组(64.79%VS.85.92%),两者之间具有统计学差异(p<0.05);在直径>10mm≤20mm的范围内,高级AR组诊断良性肺结节准确率稍高于低级AR组(51.67%VS.43.33%),两者之间无明显统计学差异(p>0.05);而在直径>20mm范围内,初级医师组与高级医师组对恶性肺结节的诊断准确率无统计学差异(p>0.05)。结论:应用人工智能(DenseNet网络深度学习)能够对肺结节的良、恶性诊断进行有效鉴别;人工智能可有效地辅助影像医师对肺结节进行更加准确、可靠的诊断。对于单纯人工阅片,高级医师对良、恶性肺结节的诊断准确率高于初级医师,而初级医师对肺结节的良、恶性诊断准确率最低。然而,初、高级医师对不同直径范围内的肺结节诊断准确性存在一定程度的差异。相比之下,人工智能组可获得良好、稳定的诊断准确性。第二部分 基于深度学习的人工智能对肺结节具体病变的诊断研究目的:人工智能组(DenseNet网络深度学习)对肺结节的应用不能仅局限于对良、恶性结节筛查,而需对肺结节具体病变进行明确诊断。在本研究中,将入选肺结节按病理结果分类,进一步探讨人工智能在对肺结节具体病变的分类诊断中的效能。材料和方法:收集经2015年1月至2017年12月在苏州大学附属第一医院就诊的胸部患者510例。其中良性病变160例,按病理类型分为炎性组、肺内淋巴结、非典型腺瘤样增生三组;恶性病变350例,按病理类型分为原位腺癌、微浸润性腺癌、浸润性腺癌三组。将510例患者肺结节CT图像输入至DenseNet网络系统中,通过网络学习自动提取结节特征,并通过特征对结节进行分类归纳,获得肺结节的明确诊断。结合已知病理结果,计算各组人工智能对肺结节明确诊断的准确率,并通过卡方检验进行统计分析。结果:人工智能(AI)对510例肺结节图像进行具体病变进行诊断。对于160例良性肺结节而言,按病理分类,AI对于各组的诊断效能无明确统计学差异(p均大于0.05)。对于350例恶性肺结节而言,按病理分类,AI对于微浸润性腺癌诊断的准确率显著高于浸润性腺癌(p=0.005<0.05),而对原位癌与微浸润性腺癌诊断准确率无明确统计学差异(p=0.669>0.05)。结论:人工智能(DenseNet网络深度学习)CT肺结节诊断系统可对肺结节具体病变进行有效诊断;对于各类良性肺结节的具体病变诊断效能类似;在各类恶性肺结节的具体病变诊断中,微浸润性腺癌诊断准确率最高,原位腺癌与浸润性腺癌的诊断效能类似。