论文部分内容阅读
光谱检测技术以其无创、便捷、高效等优点已成为生物医学领域的先进研究手段。随着光谱分辨率的不断提高以及波段范围的拓展,生物组织的测量光谱蕴含着更为丰富的反映组织细胞生理、病理变化的微观结构及成分信息,使医学活体无创光谱检测技术具有很高的可行性。然而个体差异及各组分诊断光谱的大量交叠使得组织的光谱信息与待测目标间关系存在着很强的模糊性及复杂的非线性,以致于对这些高维、强相关的光谱数据分析及处理面临着严峻挑战。亟需借助并构建合适的数据挖掘智能算法用以提取客观表征测量目标的光学特性,以期能揭示组织生理、病理变化与光谱信息之间隐含的客观规律。舌是观察体内功能变化及疾病信息的重要窗口,是人体医学无创检测的最佳测量点之一。基于舌部特征信息进行临床诊断是无创医学检测的重要命题之一。本文以光谱技术用于舌诊客观化为研究背景,将血清多种蛋白含量定量检测作为研究载体,针对光谱数据与血清蛋白含量间的复杂模糊的非线性映射,致力于对高维医学光谱数据智能分析方法的若干关键技术进行研究,以为推动此类医学无创光谱检测进一步的探索及发展提供思路、方法及技术支持。1.鉴于舌与生理病理信息之间存在着复杂且模糊的映射关系,针对当前舌诊客观化信息采集的局限性及处理模式存在将混合信息体割裂提取以致重要内涵丢失的缺陷,提出了采集携带组织微观结构变化的舌象高光谱信息来改善信息获取方式,将舌体交叠混合的图谱信息作为一个整体进行分析,结合多种线性与非线性数据挖掘算法以黑箱模式关联生化、生理或病理信息,提取特异性光谱指标群的新模式;所提取的光谱指标群有望作为病因病机分析的客观依据。该模式为后续相关研究提供了可借鉴的思路。2.探讨了一种基于舌近红外光谱的人体血清白蛋白、球蛋白和总蛋白三种生化指标的无创检测方法。并以此为载体分析了不同建模算法的拟合非线性映射的能力。运用不同的数据挖掘方法建立了蛋白成分的定量预测模型,通过实验分析证明了基于舌的近红外光谱进行血清蛋白含量检测具有较高的可行性,将有望为临床蛋白成分检测提供一种便捷、无创的先进手段。同时也验证了支持向量机可有效抵抗活体检测定量分析中存在的非线性因素,提高模型的鲁棒性,进一步地能够作为最佳波长选择的评判依据。3.针对体内各组分的特征谱峰存在严重混叠现象,从而导致诊断光谱信号微弱且存在不确定性,提出了一种对非线性映射敏感的波段组合提取方案。该方案以支持向量机交叉验证预测精度作为各波长或波长组合的非线性映射辨识能力的评判标准,分别设计了非线性区间选择法和自适应遗传寻优算法,其中前者针对高维光谱数据进行粗选以锁定特征波长所在区间,后者则在这些区间内通过全局寻优搜索策略精选最佳波段组合。将该方案用于舌的近红外光谱数据的波长挑选,在降低了三种血清蛋白含量检测模型复杂度的同时,有效的提高了非线性模型的预测能力,进一步克服了因谱峰混叠及个体差异等引起的非线性因素。4.提高模型泛化能力及普适性需要对大动态范围的大规模样本集进行深度挖掘。基于这个前提,针对智能分析算法中最耗时的支持向量机交叉验证的计算效率问题,选择性价比高的GPU并行平台,提出且开发了支持向量机交叉验证的细粒度并行算法。通过对不同中、大尺度基准集的测试,该算法充分调度了并行资源,有效并发交叉验证计算任务,在保证计算精度的前提下,显著的提升了计算效率,特别对高维光谱等此类稠密数据性能提升更为明显。这对将智能分析算法推广到中大尺度光谱数据中进行深度挖掘提供了技术支持。此外,针对该方案对小样本数据集加速不显著问题,进一步扩展并提出了一种基于GPU支持向量机网格搜索并行策略,在对58例近红外光谱数据的参数选择测试中获得了36.02倍的加速比。