针对预测过程的事件日志化简方法

来源 :华侨大学 | 被引量 : 0次 | 上传用户:fengliming33645
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息系统在业务运行的过程中记录了大量的事件日志数据,包括低价值、冗余的数据,若对这些日志直接做预测,会降低预测的效率。如何化简和压缩这些数据的同时保存有效价值一直是研究者们探讨的问题,现有的方法大多是从数据维度的角度考虑,通过删除冗余和不相关的特征进行降维。也有模型驱动角度,用模型简化规则来减少模型参数,将原始的数据集转换为新的简化数据集的同时保证一些有效价值。但其考虑更多的是结构化简,探讨结构和事件日志化简之间关系的较少。本文先提出了针对剩余时间预测过程的事件日志化简方法,主要是利用过程模型子结构的化简,生成不同简化子结构对应的事件日志数据。在此基础上,根据给定性能预算,对不同子结构的简化后日志数据引入预测性能误差,得到预测性能和化简结构的均衡最优解,最终得到简化后的事件日志。实验表明,简化后事件日志不仅保持了预测效能,在有些场景,甚至比原始事件日志的预测精度要有所提升。随后,本文针对下一重要事件的预测过程提出了化简方法,主要过程与针对剩余时间预测的事件日志化简方法相似,但是由于预测目标的不同,本文所提出的具体的算法略有不同。实验表明该方法有效减少了原始事件日志的数据量,且简化后的事件日志的预测性能与原始事件日志预测性能基本保持平衡。文章最后抽象化出了一种针对预测过程的事件日志化简框架。同时,由于数据的采集是化简工作开展的前提,本文还提出了一种采集数据的方法,通过传感器设备和软件应用程序收集人体的一些生理信息,并生成事件日志。上述的化简框架被应用在这些事件日志的处理和分析中。本文所提出的方法实现了从结构模型层面对事件日志的化简,保证了减少数据量的同时还尽可能的维持预测精度,为后续其他相关工作的开展奠定了基础。
其他文献
随着云计算和物联网等技术的发展,服务化成为软件的主要形态。越来越多的软件服务被开发和部署在互联网上,同时还有大量的虚拟化服务连接现实世界中各种物理服务资源,这些海量的服务通过特定的方式链接在一起形成服务互联网。在服务互联网环境下针对复杂的用户需求,为了实现服务体系的正常运营,服务组合优化技术成为解决这个问题的方法。目前传统的服务组合方法大多针对单一用户需求,在面对大量的同时出现的个性化需求时都是从
学位
汽车作为21世纪最重要的出行方式,极大地便利了人们的生活,其自动驾驶功能也越来越受到人们的关注。障碍物检测和测距是汽车感知周围信息的重要技术,能够为决策者提供重要依据。传统方法采用分类器检测车辆,激光雷达测距,具有鲁棒性差和价格昂贵的缺点。近年来,随着硬件计算能力的极大增强,基于深度学习的行车视觉测距技术已经逐渐成为研究热点。同时,5G的快速建设促进了边缘计算的发展,可以解决传统云计算传输时延大、
学位
目标跟踪是计算机视觉中一项基础但具有挑战性的任务。给予视频序列初始帧中的目标状态,跟踪器需要预测随后每一帧中的目标状态。目标跟踪以其重要的理论价值和广泛的应用价值,吸引了国内外众多研究员和研究机构的关注。虽然目标跟踪已经被深入研究了很多年,也有许多高性能的目标跟踪算法被提出,但在真实世界的场景实现快速、准确的跟踪依然具有挑战性。目标跟踪的挑战主要来自环境的复杂性和目标自身的因素(如背景混杂、非刚性
学位
由于电气原因导致的火灾给人民群众和国民社会造成了生命威胁和巨大的财产损失。故障发生隐蔽、难以及早发现、导致的损失特别巨大是引发火灾的电气故障的一大特点。借助新一代信息技术,在用电终端采集用电数据,并对用电数据进行分析,进而及时预测或识别电气故障给,及时向用户预警或自动切断电源,可以有效降低电气故障引发事故的风险,减小事故导致的损失。本论文主要介绍用电安全监控系统给的开发实现以及故障电弧识别和用电故
学位
信息时代下数据量激增,越来越多应用领域要处理大规模数据集。大量的数据从存储设备中传送到主机进行处理,不仅增加了主机中央处理器的负担,还产生了很大的传输时延。近数据处理提出将一部分基于主机的数据处理下移至存储设备中,以提高应用的整体执行效率。数据库作为近数据处理研究最优的载体之一,近年来得到广泛关注,目前已经实现用近数据处理模型来优化数据库系统。但是,已有的研究结果均为串行化近数据处理模型,主机和存
学位
随着计算机的逐渐普及和互联网技术的日益成熟,各个行业每天都会产生海量的数据,而这些数据往往具有规模大、维度高的特性,所以如何从中快速有效的提取有价值的信息给科学界带来了新的研究课题。在处理这些数据过程中一个重要的技术便是信息检索,而从数据库中查询相关信息最根本就是近邻搜索问题。最近邻查询是指在给定集合内寻找与查询点相距最近的点,它是当代信息检索的一种重要手段。基于k-d树的近邻搜索算法是近邻搜索算
学位
时序动作定位是视频理解中一项极具挑战性的任务,其不仅要在未剪辑的长视频中定位动作的开始与结束时间,还要识别动作的种类。该任务可用于智能视频监控、智能视频推荐、新零售和人机交互等领域,具有十分重要的研究意义。当前的时序动作定位方法几乎都遵循两阶段范式,即先进行时序动作提名生成再进行动作识别。动作识别方法已相对成熟,因此好的时序动作提名生成方法成为了提升时序动作定位性能的关键。现有方法存在召回率低、计
学位
压铸生产过程中,冲头卡滞问题时常发生,本文针对冲头卡滞的问题进行了分析及改善,生产效率、成本以及产品质量均可得以相应改善和控制。
会议
目的:探究前列泰联合坦洛新治疗慢性前列腺炎临床观察及对前列腺组织中细胞因子的影响。方法:慢性前列腺炎患者89例,按照数字表法将其分为对照组44例和观察组45例。对照组采用坦洛新治疗,观察组采用前列泰联合坦洛新治疗,对比分析两组患者的临床治疗效果,NIH-CPSI评分,前列腺液中的白细胞、PH及sIgA水平,尿动力学指标,勃起功能指数表评分及不良反应情况。结果:观察组患者治疗后的总有效率(91.11
期刊
随着云计算技术的快速发展,用户个人及企业将大量的数据存储在云中。因此,通过云数据共享,各服务提供商可使用数据挖掘和分析等技术为云用户提供优质的服务。尽管云数据共享有许多优点,但仍然面临许多安全问题。其中一个重点问题就是,如何保护云中数据的机密性。属性基加密技术实现了一对多的数据加密和细粒度的访问控制,已经被广泛地应用于学术界和工业界中。但考虑用户特性以及复杂的实际场景,属性基加密技术仍面临诸多安全
学位