论文部分内容阅读
核磁共振(NMR)是目前应用和发展最为广泛的分析技术之一,如何对核磁共振数据进行分析,以此来获取更为全面详尽的信息始终是NMR技术发展关注的焦点之一。正是由于技术进步与数据科学发展的相互促进为核磁共振数据分析带来了更有效、更有针对性的处理手段,因此对核磁共振数据分析而言,有很多处理手段值得尝试与改进。在这个背景下,本文讨论了核磁共振数据分析中的两个问题与解决方法。第一个问题是利用支持向量机方法对代谢异常产物进行检测。首先对代谢组学数据处理中常用的偏最小二乘方法(PLS)与隐结构正交投影(OPLS)的辅助数据处理方法(PLS+OPLS为主要处理手段的方法记作O-PLS)、交叉验证进行了描述。然后介绍了应用较少但是新兴的L1-norm支持向量机(L1-norm SVM)方法。通过比较O-PLS方法与L1-norm SVM对小鼠感染血吸虫后的代谢数据进行的分析,表明了L1-norm SVM不仅可以得出原本O-PLS方法对代谢异常物的_检测结果,而且对可能的次要代谢异常产物有所注明,同时L1-norm SVM剔除了冗余信息带来的影响。包括L1-norm SVM在聚类与特征选择方面具有的优势在内,这些都表明L1-norm SVM在代谢组学领域的应用有着潜力和前景。第二个问题是CPMG脉冲序列获得的NMR数据的多指数反演方法的改进。首先对需要考察问题的多指数模型及其反演进行了介绍,然后给出了处理多指数反演问题中常见的非负最小二乘(NNLS)方法。通过对其数值模拟计算,发现了现有NNLS方法在对低噪声有要求(SNR≥50),而且全局的计算思想不利于得出较为精确的易谱分布。因此在新方法中加入贪心算法思想以及非平稳性度量,新的NNLS-NS算法可以在噪声更大(SNR≥30)的情况下得到比原NNLS算法更有效的结果,并且为多指数模型反演问题带来的新的思考方式。