基于张量理论的流量数据处理方法研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:XHR
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技和大数据产业的发展,数据的质量问题越来越受到人们的重视。在物联网和车联网中,完整的流量数据是保证准确的数据分析和应用的重要前提。如在网络操作系统中,网络流量数据是实现更好网络管理的基础。而在智能交通系统中,交通流量数据可以用于实时交通管理和长期交通规划。然而,损坏的数据严重影响了数据信息的准确性,甚至导致数据分析和应用的错误。因此,如何有效地处理损坏的流量数据是众多科研人员研究的热点。本文运用了张量模型对两类典型的流量数据进行建模,并根据它们的数据结构,采用了不同的方法来挖掘这两类典型流量数据的时空相关特性,提出了两种基于张量理论的流量数据处理方法,主要研究内容概括如下:(1)本文通过分析网络流量数据的低秩性,提出了一种基于张量填充的时空张量ALS填充算法。通过对网络流量数据张量进行CP分解得到多个因子矩阵,然后利用线性回归和托普利兹矩阵来挖掘网络流量数据的时空相关性,构造时空约束矩阵,并利用张量交替最小二乘法迭代更新因子矩阵,最后重构成近似的低秩数据张量,实现对网络流量缺失数据的恢复,提高数据恢复的准确性。本文使用真实的网络流量数据集对算法进行测试,并与现有的填充算法进行对比。实验结果表明,本文提出的方法在网络流量数据恢复方面的效果显著,并在数据缺失率高达80%以上时也能实现较好的恢复性能,提升了数据恢复的精度。(2)本文在张量鲁棒主成分分析方法的基础上,提出了一种时空张量鲁棒主成分分析算法。通过将包含离群值的交通流量数据张量分解成低秩近似张量和异常稀疏张量,并结合交通流量数据的时空相关性对数据进行异常检测。具体而言,在空间维度上,利用图的拉普拉斯矩阵来构造空间约束张量,在时间维度上,利用托普利兹矩阵来构造时间约束张量,并通过设置异常阈值来确定异常数据及其位置,达到异常检测的目的。本文提出的方法不仅利用了张量因子分解及其低维表示,还充分挖掘了交通流量数据的时空相关性,并在真实的交通流量数据集上对算法进行了测试。实验结果表明,本文提出的方法在异常检测和缺失数据恢复方面都优于其他先进的方法,特别是在数据严重损坏的情况下。
其他文献
微胶囊技术是指利用成膜材料将芯材包裹起来,形成具有半透性或密封囊膜的微小粒子的技术。微胶囊技术可以增加芯材稳定性,减少芯材扩散,降低芯材毒性并且实现芯材的可控释放,已经被广泛应用于生物、医药、化工等领域。将薄荷油等芳香植物油进行微胶囊化是提高其稳定性、延长其贮存时间、增强其可控性的一种有效方法。而利用液滴微流控技术制备所得的微胶囊单分散性好,结构可控,包封率高,生物利用率高。因此,本文以薄荷油为芯
学位
随着近年来河道治理中对生态环境问题的重视,丁坝逐渐开始用于改善河道局部物理生境条件,以修复河道生态。箱式丁坝是视双丁坝及其包围的内部区域为整体的一个单元体,在传统箱式丁坝的上游丁坝(即上游横向交界面)设置缺口后,可在箱体内创造出更丰富的水流结构和底床形态,从而改善局部物理生境条件,具有潜在的研究价值。而处于淹没状态下,丁坝其周边水流结构、局部地形变化的复杂性,更有利于多样性生境条件的创造。本文以淹
学位
长三角地区是我国经济发展最活跃、开放程度最高、创新能力最强的区域之一,经济社会快速发展与环境污染的矛盾也因此愈发突出。生态文明建设的提出强化了政府保护生态环境的意识,长三角地区也相继建立区域大气和水污染防治协作机制。环境为准公共物品,需要依靠国家财政给予支持和保障,长三角地区环保财政支出规模逐年增加,生态环境状况仍不容乐观。因此,研究长三角地区环保财政支出效率不仅能检验生态文明建设与防治污染攻坚战
学位
在“双碳”目标为牵引的能源革命大背景下,新型电力系统中的配电网是实现规模化新能源消纳、“源网荷储”友好互动等的关键,而配电网的安全可靠运行是保证能源系统发展的关键。其中,配电网小电流单相接地故障以及经弱导电性复杂介质接地的弧光高阻故障,统称为配电网弱特征故障,因其故障特征微弱难以达到保护动作阈值、带电运行易引发电力安全事件或事故,成为了影响配电网安全运行的核心问题。随着量测设备与电力物联网技术的发
学位
目的:本课题以缺血性脑卒中(stroke)发生时受损伤区域异常增高的过氧亚硝酸根离子ONOO-为检测靶点,以近红外二b区(NIR-II b)荧光量子点Pb S@Ag2Se为载体,在其表面修饰竞争性吸收小分子Cy7.5和内皮细胞靶向肽VCAM-1,构建一种激活型的近红外二区靶向纳米荧光探针VCAM-1&Cy7.5&Pb S@Ag2Se(V&C&Pb S@Ag2Se),利用脑卒中损伤早期细胞产生的ON
学位
创业活动是国民经济的重要引擎,熊彼特曾认为创业者的创新行为是经济周期性变化与经济发展的内在动力。在当前经济新常态背景下,政府对创业活动的重视达到了新的高度,国务院及各政府部门也下发了各类促进双创的政策文件,这标志着创业活动将成为国民经济发展规划的重要组成部分。创业也是学术界的热点话题,经济学、管理学与社会学等学科都积极研究创业活动,相关学者从许多不同的角度对创业活动进行了分析。由于资源是嵌入到社会
学位
水泥基材料成型简便、高强耐久以及生产原材料资源丰富,被广泛应用于土木工程中。但因抗拉强度低、易开裂,其应用范围受到了限制。而纳米材料掺入水泥基材料能减少纳米级裂缝的产生,改善其韧性,其中氧化石墨烯(GO)具有超大比表面积、优异的力学性能和丰富的含氧官能团,在水泥基材料中的研究受到广泛的关注。GO能影响水泥水化过程,改善水泥基材料的微观结构,增强其力学性能。目前,关于GO增强水泥基材料断裂性能的研究
学位
随着冯·诺依曼瓶颈的出现,传统计算机已难以满足人们的需求。构建类脑计算机被提上日程。突触可塑性被认为是神经学习和记忆的基础,突触可塑性的模拟对整个神经形态网络的构建举足轻重。忆阻器不仅有着结构简单、易集成和低功耗等特点,而且其独特的电阻变化和记忆行为与生物突触权重的调节具有较大的相似性,因而忆阻器在人工突触研究领域得到广泛的关注。本文基于氧化钽基忆阻器的阻变特性研究,引入氧化锌介质层来提升器件总体
学位
新时代人民对美好生活的需要已经发展为更高层次、更为全面的精神文化需要,追求更加丰富、形式多样的文化生活日益成为人民群众的热切期待。对此,如何发挥全党全社会力量积极提供充裕而多元的文化产品和文化服务,更好地满足人民对美好文化生活的需要,成为适应新时代我国社会主要矛盾的实践要求。为此,党的十八大以来,中央对社会组织参与公共文化服务的顶层设计日渐完善。党的十八届三中全会将“培育文化非营利组织”的工作提升
学位
信用风险是互联网消费金融行业所隐含的最主要的风险类型之一,信用风险的过分集聚会严重威胁行业的生存和健康发展,甚至是整个金融市场的稳定和有序运行。目前,我国互联网消费金融行业愈发严重的信用形势导致了巨大的防控压力,然而,我国互联网消费金融机构对消费信贷资产一般采取“发放-持有”的方式,缺乏有效规避和转移信用风险的工具,迫使金融机构只能被动、静态地承受风险。此种情形下,迫切需要一种合理、有效的管理手段
学位