【摘 要】
:
随着近些年来各类数据的急剧增加,从海量数据中进行知识发掘已经成为各行各业中最迫切的需求。在可获取的数据中有高于80%的数据都与地理信息相关,时空大数据挖掘应运而生。时空异常数据探测作为时空大数据挖掘中的新兴领域,以其能快速准确发现时空事件的异常特性得到了快速发展。通过揭露时空数据异常背后所蕴含的未知信息,可以对尚未发生的某些事态变化发出预警,对于早期公共事件决策和部署有着重大意义。目前扫描统计方法
论文部分内容阅读
随着近些年来各类数据的急剧增加,从海量数据中进行知识发掘已经成为各行各业中最迫切的需求。在可获取的数据中有高于80%的数据都与地理信息相关,时空大数据挖掘应运而生。时空异常数据探测作为时空大数据挖掘中的新兴领域,以其能快速准确发现时空事件的异常特性得到了快速发展。通过揭露时空数据异常背后所蕴含的未知信息,可以对尚未发生的某些事态变化发出预警,对于早期公共事件决策和部署有着重大意义。目前扫描统计方法对于时空数据的探测已经由单一的时间和空间维度上的探测,发展到了时、空维度的立体探测。但作为时空异常数据挖掘主要方法的时空重排扫描方法,却一直受到传统最大扫描半径确定方法以及复杂环境中观测点间距离测量方法对模型扫描精度和时效性的限制。很少在公共卫生以外的其他领域得到应用。虽然近些年许多国内外学者对该方法所受限制进行了相关研究。并在此基础上取得了一些成果,但还存在着以下问题:第一,采用传统的最大扫描半径选取方法,过大的扫描半径会造成极大的资源浪费的同时也降低了模型预警的时效性,如何合理的选取最大扫描半径是需要深入研究的一个问题;第二,在传统公共卫生领域的时空重排扫描方法使用中,研究人员通过空间直线距离来测量两观测点间距,忽略了两点间障碍物等因素对真实距离测量带来的误差,在障碍物较多的应用场景中造成扫描结果精度下降。针对以上两个问题本文进行了如下研究:(1)针对在其他领域应用中如何合理的选取最大扫描半径的问题,本文提出了一种基于历史命中率的时空重排扫描最大搜索半径的选取方法。通过迭代不同最大搜索半径对历史性时空数据集进行时空重排扫描统计,根据不同最大搜索半径所得扫描结果计算预警命中率,选取命中率最高的最大搜索半径作为前瞻性扫描的最大搜索半径。避免了因最大搜索半径设定不合理导致的资源浪费和时效性降低的问题,提升了模型的效能。(2)针对空间直线距离来测量两观测点间距,忽略了两点间障碍物等因素造成的路径增长所带来的真实距离测量误差的问题,本文提出了一种基于时间距离的时空重排扫描优化方法。该方法使用交通时间对观测点间距离进行测量,将城市中障碍物对两点间实际距离造成的影响加入到距离测量中,以交通时间来代替表示两点间真实距离,提升了在障碍物较多的应用场景中扫描结果精度下降的问题。(3)本研究通过获取美国旧金山地区的火灾及盗窃事件数据构建实验样本数据库,利用Python语言完成模型搭建与算法实现。根据实验结果表明,基于历史命中率的时空重排扫描最大搜索半径的选取方法选取得最大扫描半径,使得扫描耗时有了显著减少。基于交通时间的时空重排扫描优化方法使得扫描结果在精度上有了2%~5%的提升。两种方法对于时空重排扫描方法的提升起到了良好的效果,改良后的时空重排扫描方法对时空异常的探测更快、更精确,其对该方法在其他相关领域的实际应用具有指导意义。
其他文献
近年来我国高速铁路发展迅速,2019年底全国高速铁路营业里程达到3.5万公里,居世界第一。在大规模建设新线的同时,进一步缩短高速铁路行车间隔,充分发挥既有高速铁路的运输能力,是今后我国高速铁路发展的关键。目前移动闭塞是我国列控系统发展的一个特征,但行车间隔最小的移动闭塞方法不能直接应用于既有高速铁路,尚处于研究阶段。CTCS-3级列控系统以多段轨道电路组成的长闭塞分区为行车间隔实现列车追踪运行,列
随着市场经济不断发展,市场竞争越来越激烈,人力资源作为一种战略性资源,越来越成为事业单位发展的根本动力。人力资源的核心就是“人”,如何激励人才,充分发挥其优势,调动其积极性,成为事业单位的生存和发展的关键因素。目前,事业单位员工激励机制明显存在很多问题和不足,未能起到实际的激励作用,导致员工满意度低下、工作积极性缺失。因此,研究激励机制的优化,具有一定的理论和实践意义。本文以事业单位云南省JL院为
蚧科昆虫在分类上隶属于半翅目Hemiptera,蚧次目Coccomorpha,蚧科Coccidae,其种类繁多,分布广泛,是农林重要害虫。在其体表具有多种泌蜡腺体及蜡泌物,是分类的重要依据。本文采用扫描电镜(SEM)技术,对日本纽棉蚧Takahashia japonica Cockerell、泰龙筛棉蚧Cribropulvinaria tailungensis Hodgson&Martin
数字化科技信息技术快速发展,许多新兴市场日渐繁荣,从QQ、微信、微博的出现,再到“抖音”短视频、“伙拍”小视频以及“快手”短视频等短视频软件的火热,其为社会新经济发展提供驱动力的同时,更是带动了互联网新产业的崛起。凡事有利便有弊,网络迅速发展,其带来许多新景象,亦使短视频著作权受到了前所未有的风险与挑战。本文旨在通过对司法案例进行分析,研究在短视频著作权领域的法律规定与司法实务之间相存在的差距以及
植被图像识别是智能识别的重要研究内容之一,它在农业种植、植被科普研究、稀有植被保护、生态文明建设、植被文化传播等方面扮演着重要的角色。现如今许多基于位置的服务(LBS)应用也融入了图像识别技术来提升用户体验。但是随着拍摄技术的不断发展,更多的图像细节也会被捕捉到并展现在我们眼前,图片的拍摄角度、分辨率、植被生长的地域、植被的千姿百态以及不同植被在不同生长时期的形态不同,都给传统的图像分类算法带来了
多输入多输出(Multiple Input Multiple Output,MIMO)技术和低密度奇偶校验码(Low-Density Parity-Check,LDPC)码是当前无线通信技术中研究的重点。LDPC码采用基于置信传播的迭代译码算法,具有良好的译码性能;MIMO技术对空间域加以利用,在时域、频域和码域之外极大的增加了频谱利用率,将LDPC码与MIMO相结合,研究二者间的联合检测译码算法
广西沿海地区经济迅速发展的同时对土地的需求也不断扩大,作为重要的土地后备资源——海洋滩涂被大规模的开发利用,这对满足经济发展需求具有重要的意义。沿海地区开发利用海
背景乳腺癌是女性最常见的恶性肿瘤之一[1]。目前,乳腺癌已经成为我国女性发病位居首位的恶性肿瘤[2]。微小核糖核酸(microRNA)是一种短小的内源性非编码单链RNA分子,主要参
随着当前网络技术迅猛发展,越来越多的人开始在网络平台发表自己的观点和对事物的评价,从而产生了海量的文本数据。面对如此巨量的文本信息,有效对其进行分类和挖掘,提取文本隐含的情感信息具有重大的社会和商业价值。本文采用深度学习中的门控循环单元网络和自注意力机制,针对目前基于深度学习的中文文本情感分类方法中存在的问题进行了改进,并进行了基于字向量的中文文本情感分类研究。首先,针对中文文本情感分类采用一种预
目的椎间盘退行性疾病是脊柱外科最常见的一类疾病,而软骨终板作为椎间盘的重要组成结构和营养途径,它的退变是造成椎间盘退变的主要原因。软骨终板退变的发生和发展是一个涉及细胞自噬、增殖、凋亡、侵袭和迁移等复杂的生物学过程,虽然Mirco RNA(微RNA)及HMGB1(高迁移率蛋白-B1)都参与了椎间盘退变的进程,但二者之间是否存在明确的关联及之间的相关机制仍不明确。因此我们通过探究mi RNA及HMG