蒙特卡洛交叉验证用于偏最小二乘建模数据质量的评价(英文)

来源 :计算机与应用化学 | 被引量 : 0次 | 上传用户:zhaogaoheng123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于蒙特卡洛交叉验证(MCCV)建立了一种用于近红外光谱偏最小二乘建模数据质量的评价方法。该方法首先通过蒙特卡洛交叉验证计算交叉验证均方根误差(RMSECV),同时计算交叉验证中建模样本的预测误差,记为建模样本的均方根误差(RMSECVc)。如果数据中部存在奇异样本、噪声、非线性相应等干扰因素,RMSECV和RMSECVc随因子数的变化应该保持一致,否则,二者的变化趋势将不同。因此,利用RMSECV和RMSECVc随因子数的变化趋势即可对数据的质量进行评价。采用模拟数据和12组实际样品的数据对该方法进行了考察,并对四组实际数据中的奇异样本进行分析,说明了方法的效果。本文为偏最小二乘建模方法提供了一种数据质量的评价方法。 A method based on Monte Carlo cross validation (MCCV) was developed to evaluate the data quality of partial least squares modeling in near infrared spectroscopy. The method first calculates cross validation root mean square error (RMSECV) using Monte Carlo cross-validation and calculates the prediction error for the modeled sample in cross-validation as the root mean square error (RMSECVc) of the modeling sample. The RMSECV and RMSECVc should keep the same with the number of factors if the central part of the data has singular samples, noise and non-linear perturbations, otherwise the trend of the two will be different. Therefore, RMSECV and RMSECVc can be used to evaluate the quality of the data with the changing trend of the number of factors. The method was investigated by using the simulated data and the data of 12 groups of real samples. The analysis of the singular samples in the four groups of actual data shows the effect of the method. This article provides a method for evaluating data quality for partial least squares modeling.
其他文献
开封市文物商店收藏的两件明代万历年间的器物———大明万历青花龙纹梅瓶和龙纹景泰蓝盘,造型优美,图案精致,现分别作一介绍。一、大明万历青花龙纹梅瓶所谓青花,是指运用钴
患者28岁。住院号:9800。平素身体健康,末次月经2003年9月1日,停经40余天,有恶心、呕吐反应,尿妊娠试验阳性,12孕周建立孕册,体检血压100/70mmHg(1mmHg=0.133kPa),停经5个月
Objective: To investigate the efficacy of the tension- free vaginal tape (TVT) procedure for the management of stress urinary incontinence (SUI) in elderly wome
针对无机及分析化学课程传统考试方法存在的问题和弊端,结合本课程的教学任务和生物工程专业特点,对无机及分析化学课程的考试方法进行了研究,并提出了具体的改革方案和科学
氢键是一种非共价键的分子间相互作用,在超分子构建和功能材料合成领域已经得到广泛运用。氢键作用也被应用于可控自由基聚合体系中,以实现对分子量、立构规整性以及序列分布
为了降低线控液压制动系统轮缸压力波动,采用稳态压力变化值表征轮缸压力变化率,研究了轮缸压力变化率在轮缸工作压力范围内的变化规律,推导了轮缸稳态压力变化值的计算公式,
In the present study, we measured urinary hCG after assisted reproductive technology to accurately calculate normal doubling time (DT) of hCG, and we compared D
仡佬族支系繁多,服饰亦随之各异。唐宋时期仡佬族,男子穿左衽大袖、大口袄,右肩上斜束皮带一根,并以螺壳、虎豹、猿猴之毛及犬羊之皮为外饰;女子用布2幅制为筒裙,穿时从头上
Intrinsic properties of the clay coin mould depends on it’s mineral composition and mineral processing technique. By means of petrography analyses and XRD meth
目的:探讨拉曼光谱用以鉴别正常精子和死精子的可行性。方法:以10例捐精者正常精子为实验组,5例死精子为对照组。伊红染色法鉴别死活精子,分别按照形态学对精子核仁、顶体、