论文部分内容阅读
随着医学超声成像设备的普及,近年来可供临床、研究和教学使用的心脏超声图像数量正在以爆发式速度增长。如何从海量的超声图像中快速检索到相似病理的图像,根据相似图像的标签信息,大致推断出疾病类型,以此作为辅助医生诊断和病理研究的参考依据,这一直是医学研究的一个热点。针对大数据背景下超声图像检索面临的难题,开展近似最近邻搜索分析以及深度哈希网络结构的研究工作具有重要意义。 首先介绍了超声心动图像成像原理和噪声模型,实验分析了多种图像预处理方法的优缺点。针对基于内容的图像检索框架介绍了各种图像视觉特征以及视觉特征的相似性匹配技术。 其次,针对原始图像特征穷尽匹配的高复杂度和内存消耗,分析了基于哈希和矢量量化的近似最近邻搜索优缺点,提出了应用多索引加法量化的近邻检索算法,使用较少的内存消耗、提高搜索速度和准确率。利用多索引技术把原始数据空间划分成很多密集的小区域,在搜索阶段只需在少量的小区域中搜索,避免与数据库中所有图像特征进行暴力匹配。使用加法量化方法编码多索引阶段产生的残差,在搜索阶段不用存储原始高维的图像特征,大大减少内存消耗。 针对海量超声心动图像检索,提出了基于类别标签的深度哈希网络提取图像二值码特征,用端到端的方法把图像的表示学习和特征的压缩编码结合起来,最终使用二值码串来表征每幅图像。网络优化的目标是尽可能保留原始图像的语义信息,使得相似图片对的二值码特征汉明距离小,不相似图片的二值码特征具有较大的汉明距离。在AlexNet网络基础上增加一层哈希潜在层,完成哈希映射的降维和量化功能。在7个超声心动切片数据集上验证了该算法的有效性,使用GPU提取图像特征只需要10毫秒,使用汉明距离度量查询图像与图像库二值码特征的相似性,整个匹配过程只需要50毫秒。 最后,设计并实现了基于深度哈希网络的医学超声心动图像检索的原型系统。将基于内容的图像检索框架应用于超声心动图像检索中,把图像预处理,深度哈希提取特征并进行压缩编码等关键技术在原型系统中实现,验证了这些理论和方法的正确性,为今后更加深入的研究奠定了基础。