一种块增量偏最小二乘模型的研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:zhifuhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,各个领域的数据迅猛增长,我们进入了大数据(Big Data)时代。然而,数据量的增长不只带来了丰富的信息资源,更高的数据维数往往也相伴而至。为了能够顺利的对高维数据进行处理分析,就需要预先对数据进行降维处理。传统的数据降维算法一般采用批量方式(Batch Model)进行训练,这种训练方式需要在训练之前将所有样本数据载入内存;随着数据规模的不断扩大,传统的数据降维算法会因为所需的内存过大而无法使用。因此,如何让传统的数据降维模型适应并处理海量的高维数据是大数据时代研究的焦点之一。对于样本数量过多的情况,增量学习(Incremental Learning)技术是有效的解决办法之一。作为一种增量数据降维模型,增量式偏最小二乘(Incremental Partial Least Squares,IPLS)将增量学习技术与偏最小二乘模型相互结合,较好的解决了大规模数据的降维问题。但是,IPLS模型以单个样本为单位进行模型的更新,导致模型的计算效率不高、训练时间较长。针对这一问题,本文基于现有研究的基础上提出了一种块增量偏最小二乘(Chunk Incremental Partial Least Squares,CIPLS)算法,主要的创新性工作为:基于数据分块更新的思想对IPLS算法进行扩展,提出了一种块增量偏最小二乘算法。CIPLS模型将新增的样本数据划分为若干个数据块(Chunk),再以数据块为单位进行模型的在线更新,从而降低模型的更新频率,缩短训练时间。本文在K8版本的p53蛋白数据集和路透文本分类语料库上进行了大量的CIPLS算法与已有算法的对比实验。实验结果表明,本文提出的方法明显提高了增量式偏最小二乘算法的计算效率,大幅度缩短了训练时间,验证了块增量偏最小二乘算法的有效性。
其他文献
工作辊作为轧机最重要的组成部分,其使用性能和服役时间对于轧制生产效率和轧件质量都有很大影响。因而研究高性能高质量的冷轧工作辊具有重要意义。本文对一种新型冷轧辊用高速钢材料进行了热变形行为的研究及开坯锻造过程的工艺优化,为其之后的热加工过程提供理论基础。本文首先利用Gleeble-3800热模拟机在不同的应变速率(0.01-10s-1)和变形温度(950-1150℃)下,对新型冷轧辊用高速钢进行了单
随着无线通信网络的高速发展,人们对无线通信传输性能的要求也越来越高。相比有线网络,无线通信网络具有很大的开放性、移动性等特点,由于其传输信道不稳定,因此更容易受到攻
三维人脸重建是计算机视觉研究领域中一个活跃的研究课题,具有广泛的应用场景,如在游戏动漫的人物设计、虚拟现实领域中的交互应用以及在医疗领域中进行仿真建模等。尽管三维
目前,汽车行业的发展已走向追求便捷化和安全化的道路。无人驾驶汽车的开发是这一领域的重大研究目标之一,对交通管理以及行车安全具有重要的意义。无人驾驶技术的实现依赖于
刚性接触网具有结构简单、载流量大、净空要求低等优点,已广泛应用于城市轨道交通中。随着我国城市化进展不断加快,城轨列车线路车站间距逐渐增加,电力机车运行速度的提升成为必然。相较于传统DC1500V刚性接触网,AC25kV刚性接触网具有更高的电压等级和更长的供电臂,适用于速度更高的城轨列车。但随着速度的提升,产生的问题是刚性接触网零部件是否能在更高速度等级下处于良好的服役状态。因此,针对AC25kV刚
本文以战时私立光华大学沪校的办学概况、师生生活为研究对象,试图揭示光华校方、师生在抗战中的坚守,从而展示出战时办学的多样性,亦可见战时留守区除军事外的另类抗战途径,
桥梁结构种类和形式的多样性及施工方案的不同,使得临时结构在桥梁施工中被大量采用。临时结构的功能是暂时性的,随着永久结构主体竣工,部分临时结构会失去其功能被拆除。临时结构设计的好坏不仅关系到桥梁施工的安全与经济还涉及到成桥时桥梁的状态和受力,临时结构的每一个安全隐患问题都将影响永久结构施工的安全性。本文以某公路预应力混凝土矮塔斜拉桥为依托,根据工程实际情况设计了两种0#段现浇支架的结构形式,并利用有
本文通过采用线性矩阵不等式(LMIs)、微分包含理论、积分不等式和驱动响应控制等方法,研究了忆阻神经网络系统的耗散性和有限时间同步性.第一部分,讨论了一类具有泄漏时滞、加性时滞和分布时滞的中立型忆阻神经网络的耗散性.应用合适的Lyapunov-Krasovskii泛函(LKF)、一些积分不等式技术、LMIs和自由加权矩阵等方法,得到了系统耗散性的充分条件.此外,还得到了全局指数吸引集和正不变集.最
随着科学技术的不断发展,生活方式不断趋于多样化,人们对于高速通信的需求不断增加。然而,在传统的无线通信系统中,日益紧张的频谱资源已经无法满足人们对于高速、高质量通信
在连续变量量子密钥分发(Continous Variable Quantum Key Distribution,CV-QKD)系统中,通信双方需要在距离较远,信噪比较低的条件下进行密钥协商,因此必须选用码率较低,码长