面向空气质量推测的主动深度学习技术研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:rocwingw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空气污染对人类健康造成严重危害,已成为一个难以解决或不可逆转的全球性环境问题。虽然建立了空气质量监测站来收集空气中的污染物成分数据,但由于监测站的建设费用非常昂贵,为了节省成本,监测站只部署在少数地点,并且需要进行维护,仅在部分时间启动。因此,我们只能得到部分位置和时刻的空气质量数据。由于空气质量数据量多且特征复杂,现有的工作根据已有部分位置和时刻的空气质量数据,使用深度学习技术推测其它位置和时刻的未知空气质量,但是他们没有关注收集哪些数据用于训练和推测的效果最好。根据主动学习的观点,数量相同但位置时刻不同的已知数据可以得到不同的推测精度。因此,本文将深度学习与主动学习相结合,将深度神经网络模型作为主动学习中的推测器,通过主动学习中的选择器选择特定位置时刻的空气质量进行采集,使采样成本相同的情况下,推测器推测精度更高。本文主要内容包括:(1)基于深度学习的空气质量主动学习推测器:空气质量推测是根据现有的部分空气质量数据,最大程度准确地推测其它时刻和位置的未知空气质量。本文选用一种现有的基于深度神经网络的空气质量主动学习推测器,并结合数据增强进一步提升空气质量推测的精度。(2)基于样本集方差接近度的空气质量主动学习选择器:针对空气质量推测问题,主动学习采样策略可以主动地提出要对采样池里的哪些时刻和位置的数据进行采样,再将这些数据加入到训练样本集中对模型进行训练。本文提出了一种基于样本集方差接近度的空气质量主动学习选择器,通过计算待测样本方差与每个待采样集合的样本方差差异,选出最具价值的空气质量样本集进行数据采集。(3)基于新型混合采样策略的空气质量主动学习选择器:混合采样策略指先后选出体现不同方面贡献的样本集合,再通过交集、并集和多集选一集等混合方式,最终得到能同时体现多样性、代表性和不确定性的样本集。本文将聚类中心采样分别与变分对抗模型、最远距离采样和时空均匀采样进行混合,提出了三种基于新型混合采样策略的空气质量主动学习选择器。本文使用空气质量数据进行实验评估,验证了主动深度学习模型及数据增强的可行性;与基线主动学习采样策略相比,本文提出的基于样本集方差接近度的空气质量主动深度学习方法和基于新型混合采样策略的空气质量主动深度学习方法都能够在采样代价相同的情况下有效的提高模型精度。
其他文献
聚类算法是一种能将数据集中相似的点聚集起来的无监督学习算法。批量聚类算法虽然准确度较高,但不能有效利用上一次的聚类结果,每次运行都需要使用全部的数据集进行重新计算,导致资源浪费、耗时等问题。增量聚类指的是在新数据到达后,不必重新构建整个模型,只需要根据已经构建好的模型进行更新,这一特点非常适合于流式计算,但增量聚类算法准确度相对较低,并且无法满足流式数据需要实时处理的特点。流式聚类虽然能够实时处理
学位
信息技术的发展使得数据呈现高维化的趋势,而维度的增加会提升数据处理的难度,这一点在聚类分析中得以体现。由于高维数据的稀疏性和冗余性,许多传统的聚类算法在面对高维数据时会出现性能差的问题。为了解决这一问题,研究者们提出了许多新的聚类算法,子空间聚类(Subspace Clustering)就是其中比较有代表的技术之一。SubKMeans是一种基于K-Means的子空间聚类算法,其将原数据空间划分为一
学位
近几年雾霾天气频繁出现,给人们出行造成了极大的不便。雾霾天气下的场景能见度降低,进而导致一些成像设备获取的图像场景不清晰,不利于后续的场景内容分析。因此,图像去雾成为一个重要的研究方向,其旨在将有雾场景图像还原成无雾场景图像。本文围绕图像去雾这个主题,主要提出了三种基于深度学习的图像去雾算法。本文的主要研究内容如下:(1)提出了一种基于编码-解码结构的图像去雾算法。此算法首先使用三种不同卷积核大小
学位
机器阅读理解的目标是使机器具备理解自然语言文本的能力,已逐渐成为自然语言处理领域中的热点问题和重要研究方向之一。近年来,随着深度学习技术的兴起和大规模数据集的发布,该领域的相关研究取得了令人瞩目的进展。尽管如此,仍然存在诸多挑战如:以往方法中的问题-段落匹配结构难以准确刻画观点型问题中的语义关系;现有模型在多类型问题任务上尚不能很好解决答案类型多样化和数据不平衡带来的模型泛化性下降的问题;已有方法
学位
人体姿态估计,又称人体姿态识别,指对于给定人物图像或视频回归出人体关节点位置的过程。作为计算机视觉领域的热门研究课题之一,人体姿态估计在智能安防、人机交互、新零售、生物力学等多个领域有广泛应用。然而,当前人体姿态估计面临诸多难点。例如,视频背景复杂,人物相互遮挡,拍摄角度多变,光照强弱不均和人体姿态歧义等因素都会影响人体姿态估计准确度。现有的视频人体姿态估计模型主要利用光流或三维卷积网络来捕获视频
学位
近年来,随着医学信息的飞速发展,各种医学影像数据也越来越丰富,医学图像目标检测不断发展完善。针对腔镜甲状腺切除手术这一场景,甲状旁腺损伤可导致甲状腺患者术后终身的低钙血症,医生在腔镜手术时需要保障其不受到损伤。然而,甲状旁腺是很小的腺体,且在腔镜甲状腺切除手术中可能会出现充血和阻塞,这使得经验丰富的外科医生也很难识别它们。因此,通过计算机视觉中基于卷积神经网络的目标检测技术识别并定位甲状旁腺的位置
学位
现实世界中的复杂系统可以抽象为复杂网络,如蛋白质交互网络、科学家合作网络、文献引用网络等。复杂网络中的一大重要特征是社区结构,其含义为复杂网络中具有紧密内部连接的子图。在复杂网络中发现社区结构有助于揭示复杂网络的内在特性、了解复杂网络内部节点关系及演变趋势,为现实世界中的许多实际应用提供强有力支撑,因此社区发现逐渐成为复杂网络中的研究热点。然而,随着大数据技术的高速发展,复杂网络的规模呈指数倍数增
学位
随着地球村概念的提出以及经济的发展,金融市场变得更加开放,我国经济正在逐步进入信用经济时代,在这个时代,信用消费已成为人们常用的一种消费方式。随着各类信用用户的增多,信用缺失、信用欺骗等问题逐渐显现,这说明我国信用体制还有待完善。为了避免上述问题的发生,分析用户的信用成为关键环节。本文主要研究用户信用体系中的用户画像和信用评级,主要工作可分为以下几个部分:第一,介绍了金融数据的不平衡性并研究了不同
学位
图像修复的目标是利用图像中已知内容,按照一定的修复规则,自动地恢复丢失的内容,具有极其广泛的应用价值。而近年来深度学习在图像修复领域取得了一定的突破,但仍然存在一些问题,比如修复区域较大时,边缘容易产生伪影干扰等。且基于深度学习的模型大多数是基于自然图像进行设计训练,因此在自然图像上表现优秀的模型移植到特定样本经常难以达到预期效果,如医学图像。基于以上问题,本文主要的研究内容和工作创新点如下:(1
学位
近年来,人们在机器阅读理解的研究上取得了很大的进展。机器阅读理解的主要任务就是通过给定的文章和相对应的问题,利用模型的理解和推理能力给出问题的对应答案,因此如何提升机器阅读理解模型的推理能力,成为了机器阅读理解的重要研究方向之一。在机器阅读理解领域,大部分模型是针对特定阅读理解任务与数据集。本文分别针对离散推理和文本跨度预测类阅读理解问题提出相应的深度学习模型,并分别基于DROP(Discrete
学位