论文部分内容阅读
临床诊断决策依赖于推理等复杂的感知和认知活动:医生首先提出有病假设,然后通过观察影像等信息验证假设;经过多轮推理,在充分消除信息非确定性的基础上,形成最终的诊断结论。相较于目前应用于辅助诊断决策的计算机视觉算法,尽管它们能充分挖掘影像特征和诊断结论之间的映射关系,却还无法像医生一样处理影像中的非确定性信息,进而无法“充分”融入到基于推理的诊断工作流程中。
围绕医生如何消除影像信息非确定性的感知和认知规律这一基本问题,本文开展了系统、深入的研究。考虑到诊断任务的复杂性,本文仅聚焦于“初级视觉感知”规律,具体来说,即视觉系统利用整体信息消除局部信息歧义的上下文工作机制。通过模仿该机制,提升了传统计算机视觉算法自适应性。本文五个研究内容概括如下:
(1)本文分别从“人类视觉行为表现”、“神经信号处理机制”以及“计算算法流程”三个不同角度说明了视觉上下文工作机制的作用,然后对其计算过程建模,提出上下文计算视觉模型。上下文计算视觉模型能够“自适应性”地生成约束、消除歧义解,避免了传统计算视觉模型依赖手动设置(手设)约束的局限。
(2)本文提出了“上下文感知超像素”算法,以模仿形成视觉上下文的方式,生成图像上下文。该算法自适应地生成超像素数目,避免了传统算法手设参数的局限。实验结果表明,其分割大脑MRI影像的结果比传统算法更优,而且其应对噪声干扰更鲁棒。此外,本文提出结构熵,用以衡量超像素编码“影像信息”的代价。而本文提出算法的结构熵最小,符合理论预期。更进一步地,利用皮尔逊相关性分析,本文得出了灰度一致性编码和分割准确率之间强相关的结论。
(3)本文提出了“多核滤波器”,扩展了双边滤波器滤波核的自适应性。该算法利用图像上下文信息自动生成滤波参数,避免了传统算法依赖噪声先验知识手设参数的局限。实验结果表明,在受到噪声干扰时,本文提出的滤波核比双边滤波器的更鲁棒;此外,在应对非平稳噪声方面,多核滤波器比三种传统算法的定量性能表现更好。
(4)本文应用“多核滤波器”,提出了空间自适应的相位校正技术,以应对弥散加权影像中信噪比大幅变化和噪声级别随空间位置变化的挑战。在本文的实验结果中,相较于四种经典的滤波器,多核滤波器不仅展示出更好的滤波性能,其相位校正性能也更优,能估计出更准确的各向异性分数。
(5)本文提出了神经纤维分类网络RAMBundles,通过融合神经纤维上下文几何特征和感受野局部空间位置特征,以应对难分神经纤维束在空间上重叠,其几何特征具有非确定性的难题。实验结果表明,RAMBundles大幅提高了难分的神经纤维束的召回率,而且其生成的假阳纤维比传统算法更接近真阳结果。
围绕医生如何消除影像信息非确定性的感知和认知规律这一基本问题,本文开展了系统、深入的研究。考虑到诊断任务的复杂性,本文仅聚焦于“初级视觉感知”规律,具体来说,即视觉系统利用整体信息消除局部信息歧义的上下文工作机制。通过模仿该机制,提升了传统计算机视觉算法自适应性。本文五个研究内容概括如下:
(1)本文分别从“人类视觉行为表现”、“神经信号处理机制”以及“计算算法流程”三个不同角度说明了视觉上下文工作机制的作用,然后对其计算过程建模,提出上下文计算视觉模型。上下文计算视觉模型能够“自适应性”地生成约束、消除歧义解,避免了传统计算视觉模型依赖手动设置(手设)约束的局限。
(2)本文提出了“上下文感知超像素”算法,以模仿形成视觉上下文的方式,生成图像上下文。该算法自适应地生成超像素数目,避免了传统算法手设参数的局限。实验结果表明,其分割大脑MRI影像的结果比传统算法更优,而且其应对噪声干扰更鲁棒。此外,本文提出结构熵,用以衡量超像素编码“影像信息”的代价。而本文提出算法的结构熵最小,符合理论预期。更进一步地,利用皮尔逊相关性分析,本文得出了灰度一致性编码和分割准确率之间强相关的结论。
(3)本文提出了“多核滤波器”,扩展了双边滤波器滤波核的自适应性。该算法利用图像上下文信息自动生成滤波参数,避免了传统算法依赖噪声先验知识手设参数的局限。实验结果表明,在受到噪声干扰时,本文提出的滤波核比双边滤波器的更鲁棒;此外,在应对非平稳噪声方面,多核滤波器比三种传统算法的定量性能表现更好。
(4)本文应用“多核滤波器”,提出了空间自适应的相位校正技术,以应对弥散加权影像中信噪比大幅变化和噪声级别随空间位置变化的挑战。在本文的实验结果中,相较于四种经典的滤波器,多核滤波器不仅展示出更好的滤波性能,其相位校正性能也更优,能估计出更准确的各向异性分数。
(5)本文提出了神经纤维分类网络RAMBundles,通过融合神经纤维上下文几何特征和感受野局部空间位置特征,以应对难分神经纤维束在空间上重叠,其几何特征具有非确定性的难题。实验结果表明,RAMBundles大幅提高了难分的神经纤维束的召回率,而且其生成的假阳纤维比传统算法更接近真阳结果。