论文部分内容阅读
近几年基于人工智能的医疗大数据分析受到越来越多的关注,特别是基于影像组学的研究成为了热点。在基于影像组学的研究中,拥有充足的数据量来保证影像组学分析的一般性和普适性变得至关重要。由于从单个医疗机构获得的数据量往往不大,因此研究人员会将多家医疗机构的数据整合在一起形成多中心数据集。由于多中心数据在收集过程中使用不同的采集设备、设置不同的采集参数,使得数据在存储格式、规格、亮度和对比度等方面存在较大差异,对于临床医生进行鉴别诊断和影像组学分析都会产生干扰。针对该问题,本文基于磁共振的脑胶质瘤影像数据,对多中心数据标准化过程中的信息增强、数据统一等关键问题进行分析,提出了一套医学影像多中心数据的标准化方案,能够降低数据之间的差异,提高数据的适应性和可靠性。本文的主要研究内容如下:(1)针对目前多中心图像数据标准化过程中,不同图像对比度和亮度存在较大差异的问题,提出了基于自动直方图规定化的图像标准化方法HSASR。在HSASR方法中,直方图规定化能够在适当的参考帧的作用下,统一规范整体数据的对比度和亮度的动态分布,同时还能有效地增强肿瘤区域信息;另外,考虑到在规定化过程中,往往由放射科医生选取规定化映射的参考帧,但随着数据量的增加,手工选择的工作量繁重、极度费时的弊端逐渐暴露出来,并且也无法保证选出最佳的参考帧。因此,本方法在直方图规定化的基础上结合网格搜索实现参考帧的自动选择,从而选择出最优参考图像模板来对图像对比度和亮度分布进行标准化处理。最后,将本方法处理后的数据通过影像组学进行验证,实验结果表明,通过该方法处理过的数据比未处理之前的数据在影像组学的分级预测中的AUC、准确率等性能指标平均提高13%左右。(2)针对数据标准化方法处理后的图像存在域边界模糊的问题,提出基于多峰直方图的标准化方法MPH。HSASR方法虽然对整体图像亮度范围进行了统一,突出了肿瘤和其他组织之间的对比度,但是部分图像数据中存在肿瘤各组织区域间界限模糊问题,例如,脑胶质瘤的肿瘤区域一般可分为增强,坏死,水肿区域等,不同区域共同决定了脑胶质瘤的分级。为了提供更加丰富的肿瘤信息,MPH方法能在保证多中心数据图像亮度一致性的基础上着重突出肿瘤各区域的信息。实验结果表明,MPH方法的评价指标比HSASR方法的提升2%,由此验证了本方法的有效性。