动态数据上的高效用模式挖掘综述

来源 :计算机应用 | 被引量 : 0次 | 上传用户:jwk000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高效用模式挖掘(HUPM)考虑了项的购买数量及单位利润,提供了项更详细的信息,使用户能够做出更好的经济决策.针对大多数HUPM算法都应用在与不断产生数据的现实世界不符的静态数据集上的问题,近些年不断提出了动态数据上的HUPM算法.首先,对增量数据、数据流、动态删除和动态修改数据上的HUPM算法以及融合高效用模式(高效用序列模式、平均高效用模式、top-k高效用模式等)挖掘算法进行了总结;然后,对使用不同类型数据的算法进行了总结,包括动态利润数据、动态序列数据等数据类型;其次,从算法使用的数据结构、剪枝策略、窗口模型、优缺点等角度对HUPM算法进行分类总结;最后,针对目前研究的不足,提出了下一步动态数据上的HUPM算法研究方向.
其他文献
作为一种新型计算范式,边缘计算已成为解决大规模科学应用程序的重要途径.针对边缘环境下的科学工作流调度问题,考虑到任务计算过程中的服务器执行性能波动和数据传输过程中的带宽波动造成的不确定性,文中基于模糊理论,使用三角模糊数表示任务计算时间和数据传输时间,同时提出一种基于遗传算法算子的自适应离散模糊粒子群优化算法(Adaptive Discrete Fuzzy GA-based Particle Swarm Optimization,ADFGA-PSO),目的 是在满足工作流截止日期约束的前提下,降低其模糊执
软件定义网络(Software Defined Network,SDN)是由美国斯坦福大学Clean Slate课题组提出的一种新型网络体系架构,该架构通过解耦控制平面和转发平面的功能来实现网络流量的灵活转发.但是,由于经济开销和技术条件的限制,互联网服务提供商的骨干网必定长期处于传统设备和SDN设备共存的混合SDN状态.因此,在混合SDN网络中研究应对单节点故障情形的路由保护方法是一个关键的科学问题.文中首先描述了混合SDN网络中应对单节点故障情形时需要解决的问题,然后通过两种启发式方法来解决该问题,最
为了解决校园网中应用的BBR(Bottleneck Bandwidth and Round-Trip Time)拥塞控制算法在STARTUP阶段由于未收到ACK(Acknowledge Character)而引起的时延振荡和空窗问题,提出了BBR单边适应算法.该算法只运行在发送端,不受网络协议和上层应用的限制.通过改善时延估计器的加权系数,设计时延瞬时平均偏差估计器,将估算结果作为时延估计器的振荡平滑因子,提高时延估计器应对时延剧烈抖动的能力.为了尽可能解决不可避免的空窗问题和序号回绕,在发送端设计了流量
分布式星载多RTs(Remote Terminal)系统的任务主要基于功能进行分配,而数据处理任务的突发性往往会使不同计算机之间负载不均衡.运用灵活的负载调度机制,可以有效调节不同计算机间的负载差异,从而在一定程度上提升计算机系统的整体性能.文中提出了一种基于机器学习的分布式星载RTs系统负载调度算法,包含样本采集、任务吞吐率预测模型构建、吞吐率预测和负载调度等4个步骤.在构建任务吞吐率预测模型环节,通过机器学习的线性回归正规方程获取模型权重,缩短了构建模型消耗的时间.在负载调度环节,若RTs的吞吐率之和
针对多跳空中传感器网络(Aerial Sensor Network,ASN)中的负载不均衡问题,提出了强化学习(Reinforcement Learning,RL)理论辅助的队列高效地理路由(Reinforcement-Learning Based Queue-Efficient Geographic Routing,RLQE-GR)协议.RLQE GR协议首先将ASN路由问题抽象为强化学习(RL)任务,其中每个无人机抽象为一个RL状态,而数据包的每跳成功转发则抽象为一个RL动作.其次,RLQE-GR协议
响应时间是服务等级目标(Service Level Objective,SLO)的一个重要性能指标,与资源的使用量有关.资源充足可以保证请求的正常执行,响应时间短;资源不足,请求需要等待资源,响应时间长.在云计算虚拟化环境下,控制资源的访问既有对整体资源的控制,也有对CPU、网络带宽等单个资源的控制,但是目前很少有通过对网络I/O请求的直接控制来保证响应时间.为了获得更好的性能,虚拟化技术大多采用半虚拟化框架Virtio.网络I/O请求通过Virtio共享通道进行传输,使得在Virtio设立网络I/O请求
面对日趋庞大和复杂的智能应用,建立有效的云服务质量模型是评价云服务质量的重要手段.然而,由于智能云各层资源的多样性、动态性等特点,智能云服务效能的评估具有很大的难度.针对目前智能云计算领域缺乏标准和统一的云服务质量评价指标和云服务建模手段的问题,文中将智能云抽象的服务质量具体化为云服务效能,云服务效能被定义为反映云服务能力水平的服务可用性、可靠性,以及体现服务效率的性能,即通过云服务效能输出定量的评价智能云的整体服务能力水平.并且提出了一种基于BP神经网络的智能云效能模型,通过BP神经网络模拟智能云服务的
针对软件定义网络在移动自组织网络里部署传输路径时,需要控制器为路径上所有的节点下发相关流表项,从而造成传输开始需等待较长时间的问题,文中基于分段路由提出了一种快速下发数据转发规则的方法FDSR.控制器会以分段路由的方式,通过在数据包上添加转发路径对应标签的方式下发数据转发规则,并在处理最大堆栈深度问题时,利用标签粘连技术,将整条路径分为多个标签栈,通过算法选择后分别下发给能与控制器节点快速交互的转发节点,以减少路径配置时间.实验结果表明,相较于OpenFlow流表下发方式,FDSR在SD-MANET中能减
可微分架构搜索(DARTS)可高效、自动地设计神经网络架构,但其超网络的构建方式与派生策略的设计之间存在性能“鸿沟”.针对上述问题,提出了优化搜索空间下带约束的可微分神经网络架构搜索算法.首先,以候选操作关联的架构参数为量化指标来分析超网络的训练过程,发现在派生架构中未生效的候选操作none占据了权重最大的架构参数,从而导致算法搜得的架构表现欠佳,针对该问题设计了优化的搜索空间;然后,分析了DARTS超网络与派生架构之间的差异后,以架构参数为基础定义了架构熵,并把架构熵作为DARTS超网络目标函数的约束项
针对阅卷时由于卷宗内容繁多导致的信息过载和知识迷航的问题,提出面向随案电子卷宗的知识森林自动构建方法,以主题分面树以及主题间的认知关系作为卷宗的知识化表示.首先,对卷宗进行碎片化的预处理,从而将不同类型的文书分类并划分为多个单一主题的碎片;然后,针对不同碎片采取不同的信息抽取方法,并利用知识融合将同义信息进行合并,之后利用本体结构和规则构建主题分面树并抽取主题关系;最后,将知识森林构建的主题分面树和主题关系在数据库中存储起来,从而实现知识森林的可视化.实验结果表明,该方法可以较为完整、准确地展示卷宗信息,