基于张量分解的缺失数据插补算法的研究

被引量 : 0次 | 上传用户:lilianmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术在各个领域的广泛应用,需要处理的数据维数越来越高。在网络交通分析,化学数据分析等领域,采样数据通常是部分缺失的高维形式。要想对这些部分缺失的高维数据进行分析和处理,通常需要对缺失的部分进行插补。传统的处理数据缺失的方法大部分是针对向量或者矩阵形式的低维数据,对于高维数据,往往将其展开成向量或者矩阵形式进行处理,但是这无疑破坏了数据本身的结构特性,插补准确度较低。近几年的研究将张量分解及高维数据的插补结合了起来,提出了一系列的算法。本文对这些算法进行了研究,提出了3种新的算法,并通过仿真实验与这些算法进行了比较。针对基于张量分解的缺失数据插补问题,本文所做的具体工作如下:1、针对小规模稠密张量的插补问题,提出了Tucker-ALS算法。经典的PARAFAC-ALS算法采用得是张量分解中的CP分解模型,采用最大期望值法解决最小二乘问题,但是速度慢,插补准确度不够高。本文提出的Tucker-ALS算法思想与其类似,但是采用的是Tucker分解模型,插补速度更快。2、针对中小规模稠密张量的插补问题,提出了Tucker-WOPT算法。目前较好的PARAFAC-LM算法通过求二阶偏导数解决最小二乘问题,而CP-WOPT算法通过求梯度值来解决最小二乘问题,这两种算法都是基于张量分解中的CP分解模型的。而本文提出的Tucker-WOPT算法采用Tucker分解模型,通过求因子矩阵的一阶偏导数解决最小二乘问题,并推导出了快速计算公式。Tucker-WOPT算法比这两种算法能够获得更高的插补准确度,并且随着数据缺失比例的增加,这种优势越来越明显。3、针对大规模稀疏张量的插补问题,提出了Tucker-SOPT算法。该算法和稀疏张量的CP-WOPT算法的思想类似,只不过本文采用的是Tucker分解模型。本文推导出了稀疏张量与矩阵的n-模积的计算方法,并推导出了稀疏张量的Tucker分解模型的因子矩阵的一阶偏导数计算方法。Tucker-SOPT算法与稀疏张量的CP-WOPT算法运算速度基本相同,但是插补准确度更高。
其他文献
研究了In液滴法生长InAs量子点时不同衬底温度,以及是否引入退火的量子点生长情况并建立了物理模型。发现In原子沉积在衬底表面会首先沿[11-0]方向形成条状量子线,由于表面能
目的:探讨流行性腮腺炎的流行病学特征,总结治疗方法,为防治该病提供理论支持。方法:2010年6月-2012年6月,在本中心门诊部用普济消毒饮治疗45例流行性腮腺炎,回顾性分析临床资
技术发展推动了社会进步,BIM技术应用于工程建设已经获得了一定发展,相比于传统技术,BIM技术的应用能够在工程质量,项目进度等方面获得极大提升。但是在利用技术时也需要结合
针对外浮顶油罐密封圈火灾特点,研究提出了外浮顶油罐火灾扑救的具体方法和技战术措施,为消防部队扑救此类火灾提供参考。 Aiming at the fire characteristics of outer fl
文章针对某种结构的石灰石粉仓进行受力分析,通过分析不带加强筋和带加强筋的粉仓受力情况,得到加强筋对粉仓结构稳定的影响重要性,并在此基础上对加强筋的大小、布置形式进
在激烈的市场竞争条件下,并伴随我国加入WTO,确立货币的时间价值观念非常重要,这不仅有利于提高企业管理水平,而且也有利于提高企业经济效益,从而促进企业的稳步发展。
师专体育专业必须加强对学生基本能力的培养:其具体的,行之有效的教学内容,包括:口令能力的培养;队列指挥能力的培养;讲解与示范能力的培养;观察、分析、纠正错误动作能力的
随着无线通信技术的飞速发展,相关的设备和应用也与日俱增,同时,有限的无线频谱资源也变得日趋紧张,越来越难以满足日益增长的用户需求。另一方面,在现有的机制下,许多无线频
<正>云南省红河州元阳县的哈尼梯田是世界梯田的代表,是世界农耕文明史上的奇迹,是人类"道法自然"与自然和谐相处的杰作,有着"中华风度,世界奇迹"、"摄影家的乐园"、"通往天
<正>应收账款周转率表明应收账款一年中转变为现金的平均次数,其计算公式为:应收账款周转率=营业收入/平均应收账款。一般情况下,应收账款周转率越高,说明应收账款的周转速度