互信息多元时间序列相关分析与变量选择

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:chenyanchendan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多元时间序列广泛存在于生产生活的各个领域之中。时间序列采样值之间,序列与序列之间往往存在复杂多变的关联特性。合理利用这些数据特性,分析变量之间的相关性,有助于识别出与预测对象不相关的无关变量,以及对预测对象作用相似的冗余变量。进而对输入变量进行有效选择,降低模型规模和计算复杂度,最终达到提高模型预测性能的目的。本文从多元时间序列的数据特点出发,在相关性分析的基础之上对变量进行有效降维,为预测模型构建合适的输入。由于互信息不需预先假设数据的分布类型,且能够有效捕捉非线性相关关系,本文提出以互信息作为相关性分析方法的变量选择算法。针对现有单一评价函数中相关项与冗余项不平衡的问题,提出一种基于互信息的分步式变量选择算法,通过两个步骤分别实现相关变量的选择和弱相关变量的剔除。同时将其应用于RBF网络隐含层节点的选择之中,实现网络输入层与隐含层的结构优化。封装式算法由于需要反复训练模型,往往计算复杂度较高,本文将互信息与具有快速训练机制的极端学习机模型相结合,提出一种封装式的变量选择算法,在网络的训练过程中,同时确定输入层与隐含层的规模。互信息估计的准确程度对于变量选择至关重要,而联合概率密度函数的估计一直是互信息估计中的难点。为解决该问题,将互信息估计转化为Copula熵的估计问题,分别提出基于不同Copula函数类型的参数方法和基于截断k近邻的非参数方法,并将非参数估计方法用于大连气象序列的变量选择之中。针对以矩阵形式出现的一类多元时间序列数据的分类问题,采用互信息提取序列的特征,在类可分离性的基础上提出变量可分离性的概念用以衡量各变量之间的区分程度。在UCI脑电信号数据集上的应用表明,所提算法能够选出对分类最为有利的变量,从而提高分类正确率。
其他文献
目的探讨奴卡氏菌致全身多发脓肿患者的诊断学特征。方法回顾性分析1例于2017年12月26日在济宁医学院附属医院神经内科就诊的奴卡氏菌感染患者的临床资料,并文献复习。结果患
最近,四川乐至县人武部召开党委扩大会议,传达了军委和两级军区有关会议精神,紧紧围绕“讲政治、严纪律,确保政令、军令畅通;尽职责、抓落实,推动人武部全面建设”这个主题
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的探讨结直肠癌脑转移的临床特点及预后。方法筛选1 714例结直肠癌患者中脑转移病例36例,对其临床资料进行回顾性分析。结果结直肠癌患者中脑转移2.1%(36/1 714),占同期脑转
针对战场声目标探测系统对目标识别及分类问题,提出了一种基于频率截止EEMD(cut-off frequency-EEMD,CFEEMD)的能量特征分析(energy feature analysis,EFA)方法。选取信号自
一、引言“小金库”是指违反国家法律法规及其他有关规定,侵占、截留单位应列入而未列入单位账簿的私存私放的各项资金(含有价证券)及其形成的资产。隐蔽的“小金库”,丰富的财源
目的:探讨督灸治疗强直性脊柱炎的临床疗效及护理。方法:中医督脉脊柱段施以“隔药发泡灸法”的特殊外治方法。结果:共96例,其中优30.2%,良59.4%,差10.4%,总有效率89.6%。结论:督灸是治疗强直
本工作用ESI-MS表征带反应基团的聚二甲基硅氧烷,可以得到分子量、分子量分布、线性和环化结构的低聚体、端基结构及反应基团结构数据.
近年来,我国商贸流通在发展过程中出现了许多问题。主要表现在:我国商贸流通网点建设缺乏整体规划;现代物流平台缺乏;现代商贸物流业发展水平低,结构比例失调;城乡商贸流通的
灵芝,是我国医学宝库中的一味珍贵药材,同时又是盆景工艺品绝佳素材,其开发应用潜力大,发展前景广阔。目前,灵芝栽培主要有代料栽培和段木栽培两种方式。段木栽培的灵芝菌盖