【摘 要】
:
近年来物联网的发展加速了互联网接入设备数量的提升,这些接入设备每天都会产生大量的多模态时序数据。相对于单模态数据,多模态数据能够描述更加丰富的场景,因此不同模态数
论文部分内容阅读
近年来物联网的发展加速了互联网接入设备数量的提升,这些接入设备每天都会产生大量的多模态时序数据。相对于单模态数据,多模态数据能够描述更加丰富的场景,因此不同模态数据之间存在大量隐藏的关系有待挖掘。错误发现是数据质量控制过程中重要的一环,在数据采集、传输、处理过程中,出于设备原因、系统原因、外部环境原因、人为原因等可能会使数据产生错误。而对于多模态时序数据,当某个模态的数据出现错误时,我们不仅可以通过该模态错误数据出现时间前后的数据进行判断,还可以通过其他模态同一时刻的数据进行判断。因此研究多模态时序数据错误发现算法,可以对多模态时序数据的质量进行检测,评估数据中是否存在错误。本文的研究内容包括多模态时序数据集构建、预处理及初步特征提取研究,基于深度学习的多模态时序数据融合算法,多模态时序数据错误发现模型三个部分。首先,本文提出了多模态时序数据错误添加算法,可以对指定模态指定比例的数据添加指定种类的错误。本文实现了模态间的数据对齐,并提取了不同模态数据的初步特征。其次,本文提出了基于BiLSTM的特征提取方法,进而提出基于混合注意力的多模态特征融合方法,首先对各模态数据的Bi LSTM网络多输出进行融合,再对各模态间的深、浅层特征进行融合。并探讨了基于混合注意力的多模态特征融合方法和现有的Tensor-Fusion,Cascade-Fusion方法的优劣。最后,本文提出了基于混合注意力的多模态时序数据错误发现模型,并通过和现有方法的对比详细分析了模型各模块性能的优劣。实验中使用了4个不同的数据集,实验表明,本文提出的基于混合注意力的多模态时序数据错误发现模型在各方面性能都高于其他对比模型。
其他文献
随着材料制备及冶金过程的发展,金属气体相关热力学性质的研究受到越来越多的关注。作为一类特殊的金属,碱金属具有较低的熔沸点,广泛应用于工业中。压缩因子(Compressibilit
以人工智能、大数据等技术为基础的智慧教育是当今教育的发展方向,智慧教育的核心是个性化教育,即以学生为中心,围绕学生的学习需求开展教学工作。但是目前个性化教育在导学
聚酯纤维的适用范围日益广泛,市场需求量不断增长,生产规模急速扩大,使得聚酯纤维生产厂家之间的竞争日益激烈。随着高新技术产业的迅猛发展,聚酯纤维行业也开启了一个新的纪
由于原油性质、产品要求等因素变化,石化生产单元的实际操作常常偏离设计工况,造成能耗提高、产品分布变差等一系列问题。如何适应工况变化,在不改变流程和设备的条件下,契可
膜蒸馏技术是一种利用疏水性的微孔膜并以膜两侧温差为推动力使得热侧挥发性物质穿过膜孔在冷侧冷凝富集的一种物理分离技术,是膜技术中一种有效分离有机废水中氨氮、苯酚等
随着互联网信息技术的迅猛发展,文本数据出现爆炸式增长。面对繁杂的文本信息,如何有效地管理和分类文本数据,帮助用户快速、准确、全面地找到所需的信息,是一个很有意义的研
婚礼是中华优秀传统文化的重要组成部分,互联网时代下媒介技术的革新为中华传统文化的传承和创新式发展提出了新思路。在当今文化消费意识持续渗透背景下,大众通过何种渠道对
随着科技水平的不断提高,模数转换器(Analog-to-Digital Converter,ADC)在当代信息处理系统中得到越来越广泛的应用,但在高速信号领域仍无法满足人们对精度和采样速率的要求
政务信息化对于提高政府部门的工作效率,有效利用业务处理过程中的大量信息,降低整个过程的运营成本,提供更好、更快捷、更优质的服务,具有重要意义.本文面向缅甸海事部门的
燃料电池是一种能量转换装置,通过电化学反应将存储在燃料和氧化剂中的化学能直接转化为电能,拥有能量转化效率高、低噪音、无污染和长寿命等优点。在聚合物电解质膜燃料电池