基于相关性组合变量的色谱数据分析方法

来源 :第21届全国色谱学术报告会 | 被引量 : 0次 | 上传用户:shgandang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
色谱作为一种分离和分析技术,由于其分离效率高、速度快、灵敏度高等特点,在分析化学、蛋白组学、代谢组学、石油化工以及医药卫生等领域有着广泛的应用.基于色谱技术的生物化学等数据通常维数较高,包含噪音,如何从色谱大数据中挖掘出富含信息的特征,是色谱技术应用研究的一个关键问题.主成分分析(PCA)、偏最小二乘法判别分析(PLS-DA)、SVM-RFE,随机森林(Random forest)等数据分析方法大量应用于色谱数据分析,滤去其中的噪音和无关变量,筛选富含信息的特征变量,建立有效的分类模型。在实际应用中,特征变量存在着相互关联,单一的、不含信息的特征变量相互关联,组合起来表征所研究的问题。因此,本文提出基于相关性特征和最大信息系数的特征选择算法(MICCOR),该算法采用线性相关构建特征的组合方式,扩大信息搜索空间,同时采用最大信息系数[2]评价原始变量和所构建的基于相关性的组合变量,选择富含信息的特征变量。
其他文献
本文详细研究了在1-烯丙基-3甲基咪唑氯盐离子液体(AmimCl)中和吡啶作为缚酸剂条件下,纤维素与8种苯环上带有不同取代基团的苯甲酰氯的均相酯化反应。发现苯甲酰氯的反应活性与
会议
近年来,亲水作用色谱(HILIC)在分离极性和亲水性样品方面得到越来越多的关注,其中,固定相的开发一直是研究热点之一.针对目前亲水作用色谱固定相种类有限、对极性化合物覆盖
氨基酸是细胞和新陈代谢不可缺少的营养素.氨基酸分析在分析化学、生物学以及医学等方面均起着基础性的作用,因此,氨基酸分析方法的研究具有重要意义.目前氨基酸分离方法主要
会议
超临界流体色谱(SFC)具有分析速度快、时间短和分离效率高等优点,作为一种环境友好型的分析分离技术在药物、食品和环境分析检测等领域得到了迅速的发展和广泛的应用.二氢杨
会议
生物系统以及人类对手性化合物是非常敏感的.比如说,L型的味精是具有味道的,而其D型的异构体是没有味道的;沙利度胺作为一个手性化合物,其R-构型具有抑制妊娠反应活性,而S-构
会议
VDAC-1作为线粒体内膜上的一种离子通道蛋白,是代谢物质和能量物质进出线粒体的主要效应器,在细胞生存和凋亡中扮演着重要角色,与癌症等发病过程密切相关.本研究采用固定化仿
  Two doubly tethered aminoalkyl chiral crown ether stationary phases were prepared by covalently bonding(+)-(18-crown-6)-2,3,11,12-tetracarboxylic acid to do
会议
近年来,亲水作用色谱(HILIC)已引起科研工作者们极大的兴趣.HILIC能够很好地被应用于极性化合物的分离分析中,是反相色谱和正相色谱的一个有益补充,而且,由于使用高含量乙腈
药物活性成分筛选方法主要包括传统药理法、血清药理法、分子对接技术、高效亲和色谱技术等.传统药物筛选方法虽然已取得了一定进展,但存在筛选周期长和工作量大等的问题.本
巴豆醛性质较为活泼,能够与DNA脱氧鸟苷反应生成多种DNA加合物,其中最主要同时也是研究最广泛的DNA加合物为1,N2-丙基-脱氧鸟苷(1,N2-Propano-dG,ProdG)。巴豆醛与脱氧鸟苷环外的
会议