论文部分内容阅读
在分析化学数据解析的过程中,如果实际数据不符合线性回归模型的理想分布或有异常的数据出现时,经典的最小二乘估计会受到很大的影响甚至得到完全错误的结论。本文在比较、回顾一些现代分析化学稳健分析研究成果的基础上,重点解决了大样本数据用经典的方法计算时间太长的问题,并有效地解决了由于多个奇异点存在而产生的掩蔽效应。同时尝试提出对现有方法的改进,以找到对于不同的实际分析体系的更有效的稳健方法。(1)概要介绍了稳健统计方法的起源、定义及其分析的目的与主要的研究内容。描述了稳健回归估计及奇异点诊断方法的基本思想,强调稳健性应与估计的一致性、有效性、无偏性等一样成为评价某一统计分析技术的重要指标。经典的分析方法是属于相应稳健方法的特例。同时对于目前的一些较好的化学计量学中的稳健统计方法进行了介绍,讨论了这些方法在分析化学数据解析过程中的应用。(2)结合稳健性理论的有关内容对稳健回归估计技术作了回顾与评价,在此基础上详细讨论了线性回归模型的最小中位方差估计,在稳健标量最小化的基础上通过定义主灵敏度矢量来删除奇异点,进行迭代运算,获得最终解答。这个算法能应用于大数据的回归估计,当一般的算法不适宜或要花费大量的时间时,将它与其他的稳健多元校正方法相结合,就能够提高方法的效率,得到较好的结果。此方法对仿真实验及实际多组分药物的分析均取得了满意结果,表明该方法是多元校正研究中一个很有前景的估计方法。(3)在前面方法的基础上作了进一步的研究,首先改变所删除主灵敏度矢量中极值点的百分比p ,再进行一个检验过程,最后考虑用方差修剪r来代替中位方差s,对模拟体系应用所提出的回归分析方法,得到了很好的分析结果。(4)回顾了经典诊断方法和稳健诊断方法的基本原理,讨论了奇异点诊断中的掩蔽与淹没现象,再定义主灵敏度矢量,可知其中的极值点就是可能的奇异点。通过对模拟体系的分析,发现此方法能有效地解决强杠杆点的掩蔽效应,得到比较满意的结果。