偏最小二乘优化及其在中医药数据分析中的应用研究

来源 :江西中医药大学 | 被引量 : 4次 | 上传用户：cc_7722

【摘要】

：

【作者】

：

曾青霞

【出处】

：

江西中医药大学

【发表日期】

：

2019年01期

【关键词】

：

偏最小二乘法中医药信息深度置信网络特征选择非线性特征提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

中医药物质基础研究是中医药现代化的重要内容,通常采用高效液相和质谱联用仪来获取实验数据。此类实验数据通常包含成千上万种物质,呈现出高维数据特点;同时由于实验样本数的限制,呈现出小样本的特点。中医方药在治病的过程中,往往呈现出多成分、多疗效以及非线性的特性,而中医药实验过程复杂、时间长、实验动物有限以及一些客观因素造成的实验误差等原因,导致有效实验数据样本较少。中医药领域的数据的复杂性使其难以直接使用传统的机器学习方法进行分析。因而,需要对数据进行适当的处理,使其能够适用于传统的数据分析模型。本文主要是基于偏最小二乘的优化对中医药数据进行处理,偏最小二乘的优化主要从特征选择、非线性特征提取和回归模型的非线性改进三方面着手。本文所做的主要工作有:(1)提出了一种基于特征相关的偏最小二乘特征选择方法。针对传统的偏最小二乘法只考虑单特征的重要性以及特征之间存在冗余和多重共线性等问题,将特征之间的统计相关性引入到传统的偏最小二乘分析中,构造了一种基于特征相关的偏最小二乘模型。首先利用特征相关度对特征进行评估预选出特征组,然后将其放入偏最小二乘模型中进行训练,评估该特征组是否可取。结合前向贪心搜索策略依次评价候选特征,并选中使目标函数最小的候选特征加入到已选特征。分别采用麻杏石甘汤君药止咳、平喘和UCI数据集进行分析处理,实验结果表明,该特征选择方法能较好寻找较优的特征组。(2)提出一种融合随机森林的偏最小二乘法方法。针对偏最小二乘法的线性本质,而随机森林算法组合多个分类器,具有自适应性,适合非线性回归。将偏最小二乘法外模型中的提取的自变量主成分和原始因变量构建随机森林,根据残差信息递归建树,直到满足事先设定的条件为止。在麻杏石甘汤君药平喘实验、麻杏石甘汤君药止咳实验和UCI机器学习数据集上进行了实验分析,结果表明,融入随机森林的偏最小二乘法能较好表达中医药数据的特征,提高非线性数据的预测精度。(3)提出一种基于深度置信网络的偏最小二乘法优化方法。针对偏最小二乘内部采用的交叉核验方法会导致主成分急剧减少,从而降低回归方程的精度,而中医药数据对主成分的选取尤为敏感。该方法主要是利用深度学习模型抽取原始数据的上层特征,将抽取的特征放入偏最小二乘模型进行多元线性回归,在规避对主成分的个数选取问题的同时,还反应了中医药数据中所包含的非线性结构。分别采用大承气汤实验数据和UCI数据集的数据进行分析处理,实验结果表明,基于深度置信网络的偏最小二乘分析方法对中医药数据有很好的适应性。(4)针对参附注射液治疗心源性休克的物质基础实验数据展开分析,首先将原始数据的内源性物质和外源性物质区分开,使用单因素方差分析对数据进行预处理,去掉那些取值变化小的特征,采用十一种有监督的单变量特征选择方法,对剩余的内源性物质进行特征重要性排序,取重要特征的交集。再利用无监督的特征选择方法去除冗余特征。将所得特征集合作为生物标记物(内源性物质)。最后,通过所得的生物标记物分析外源性和内源性物质之间的关系。(5)在基于以上研究成果的基础上,按照中医药领域的数据分析需求,采用PYTHON相关编程语言和开发工具,设计并开发了中医药数据分析系统。

其他文献

80例复发脑胶质瘤患者挽救治疗的疗效分析

目的:脑胶质瘤是起源于大脑胶质细胞的原发性恶性脑肿瘤,发病率逐年增长。成年人中,脑胶质瘤占原发恶性脑部肿瘤的80%,它有着发病率高、复发率高、病死率高及治愈率低的特点。约8086%的患者初次诊断后两年内复发。脑胶质瘤一旦复发,预后更差,且目前尚无疗效肯定的治疗方案。因此寻找能够延长复发患者生存的有效的治疗手段迫在眉睫。本研究回顾性分析了80例复发性脑胶质瘤患者的临床资料,分析不同治疗方案对预后的影

学位

二次放疗复发性脑胶质瘤阿帕替尼生存分析

中级水平越南学生汉语语篇逻辑连接偏误研究

汉语国际教育学界普遍认为,越南语和汉语之间具有诸多相似之处,印证了越南学生在学习汉语时可能会呈现出得天独厚的优势。但在具体的教学过程中发现,汉语中级水平越南学生对语篇中各要素的把握依然存在很多问题,尤其体现在写作时连接成分的运用上。但是,目前为止学术界对于越南学生汉语语篇习得方面的研究成果不多见。鉴于此,本文主要分析了中级水平越南学生汉语语篇逻辑连接成分的掌握情况,并发现连接成分的遗漏和误用是中级

学位

越南学生中级水平语篇连接成分偏误

江海不择细流,温润可助其成——以“温润教育”思想对“特殊学生”转化的实践探索

在小学教育中,“特殊学生”的转化是老生常谈的问题,却也是学校必须面对的、常谈常新的问题,其思想理念、方式方法多种多样。以“温润教育”思想为指导开展“特殊学生”转化

期刊

特殊学生温润教育教育思想

基于Ansys/AQWA的极大型浮式结构总体强度分析

以极大型浮式结构的单模块为研究对象,采用大型通用有限元软件Ansys/AQWA进行极大型浮体水动力响应分析并预报波浪载荷,进而调用ASAS模块进行极大型浮体总体强度分析。分析结

期刊

极大型浮体总体强度Ansys/AQWA

低钾血症的病因及临床诊治

低钾血症是临床常见的电解质紊乱之一,其病因繁多,包括摄入不足、排出过多以及细胞内外分布异常,其中肾性失钾较为常见且容易漏诊、误诊,如利尿剂不当使用、Cushing综合征、

期刊

MOPEFGHBCUC

体验式道德学习学术研讨会述要

<正>2005年7月21-27日,中央教育科学研究所学校教育研究部主办的“体验式道德学习”学术研讨会在内蒙古自治区克什克腾旗召开,来自全国各地的200多位专家学者参加了这次学术

期刊

生态体验教育体验式学术研讨会

蒸汽管道热应力分析及补偿装置的安装

蒸汽管道在工业生产中应用广泛,正确设置管道补偿装置,可以有效保障管道安全运行。通过对管道受热膨胀应力和热膨胀量的分析,介绍了几种常用补偿装置的工作原理,并结合江铜清

期刊

蒸汽管道热膨胀应力固定支座滑动支座补偿器制作安装

基于农校对接的高校食品安全管理研究

从高校食品工作的特点出发,总结了高校食品安全的特点,提出了＂农校对接＂的解决途径,并分析了开展农校对接的意义,从高校食品安全管理者、食品供应者、物流等角度阐述了开展农校

期刊

食品安全农校对接农产品基地高校食堂

沐川黄丹石英砂岩加工玻璃工业用石英砂试验研究

为了给四川沐川黄丹石英砂岩加工玻璃工业用石英砂提供科学依据,根据有害杂质Al2O3,Fe2O3等主要以粘土矿物以及黄铁矿细小颗粒赋存于矿石中的特点,开展了选矿提纯试验研究,通

期刊

石英砂岩石英黄铁矿机械擦洗矿物加工工程

基于复杂度分析的脑胶质瘤患者认知功能评估研究

脑胶质瘤患者普遍存在认知功能下降、手术预后差等问题,给患者生活质量带来极大影响。如何在术前对患者的功能认知进行评估,并准确判断肿瘤对重要功能区的影响,就显得尤为重要。功能磁共振成像技术(functional Magnetic Resonance Imaging fMRI)的出现为脑肿瘤的诊断、治疗和功能认知的评价提供了丰富的信息,已广泛应用于神经外科。目前,对于大脑功能认知的研究,大多是把大脑看作

学位

样本熵Hurst指数肿瘤分级小世界网络功能认知

偏最小二乘优化及其在中医药数据分析中的应用研究

与本文相关的学术论文