基于关联归因与维度归因的指标归因体系研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:action005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网高速发展的时代,企业分析指标与数据纷繁复杂,统计学与机器学习算法对数据分析提供了重要的理论支持。当指标发生异常波动时,为维持业务稳定和拉动业务增长,对数据异动的归因分析起着至关重要的作用。业界关于归因算法的研究多为衡量维度对指标影响的维度归因,而没有考虑衡量指标间相互影响的关联归因,因此需要建立一个更加完善的归因体系,以更系统、全面地进行异动归因。本文研究将关联规则算法应用于指标关联归因,并扩展当前的维度归因算法,从而建立一个包含关联归因与维度归因的归因算法体系。在关联归因和维度归因两方面的具体工作如下。关联归因研究规则评价指标和频繁项集剪枝,提出Attri_apriori算法。针对原support-confidence-lift评价框架的不足,提出CITCE规则评价体系,并研究其中新评价指标的性质与区别,包括相关性提升度、因果性提升度、确定度、简洁度、创造度、效用性、不平衡性;最后实验输出更有用的规则。针对频繁项集剪枝的两大问题,提出相对支持度方法和项加权支持度方法,对具体案例证实其关于两大问题的处理效果。维度归因研究Adtributor算法的贡献度问题。分析原贡献度公式对于率型指标不适用的原因,提出基于Hot Spot的单层面贡献度——广义潜力分数,和基于控制变量思想的多层面贡献度——解构影响因子,并对结构因子进行两步优化以适用更多场景。最后,通过实验数据说明新贡献度算法关于率型指标的作用。
其他文献
Sine-Gordon方程可以用于描述某些重要的物理模型和现象,例如超导传输系统中横向电磁波的传播模型、耦合的同轴钟摆模型以及水晶错位现象.而空间分数阶sine-Gordon方程具有空间方向上的非局部效应,是经典sine-Gordon方程的推广.另外,通过引入延迟,微分方程能更准确地拟合一些具有历史记忆的模型和自然现象.因此在本文中,我们研究具分布型延迟的空间分数阶sine-Gordon方程.由于
学位
行人重识别作为监控系统中关键的一环具有重要的研究意义,不同数据类型间的行人重识别也具有各自的应用场景。而不依赖标签的无监督场景研究,可以充分发挥数据量优势,并节约人工成本。本文借助无监督问题中常用的对比学习方法,分别对图像、视频和跨图像视频三种场景的行人重识别方式展开了研究。着重解决了现有的无监督行人重识别方法在样本标签去噪、视频信息提取和模态差异减小等方面存在的问题。针对无监督图像行人重识别问题
学位
集群目标在自然界和社会生活中广泛存在,例如:无人机群、导弹群、战斗机群、鸟群和蜂群。因此,以空中集群目标为观测对象的研究对社会生活和军事国防均有重要的意义。但是,由于集群中目标数量多、间距小、表观特征相似等,在光学观测条件下运动轨迹多有交叉或遮挡,采用当前的一些跟踪手段,目标之间往往存在严重的跟踪干扰,其运动轨迹稳定跟踪是亟待突破的难点问题。针对以上问题,本文以开放空间中的蜂群目标为观测对象,对群
学位
我国房价在2022年以前逐年上涨,高额的房价成为了许多年轻人的负担。因此,租房居住成为了现代人的一种越来越常见的生活方式,但我国目前的房屋租赁系统还不够完善,仍然存在许多乱象。在此基础上,分析住房租金的影响因素以及运用机器学习方法来预测租金,对我国当前租赁市场的发展有着较为重要的意义。本文利用python从链家网爬取了武汉市2月28日出租房源数据共9930条。首先对原始数据进行数据预处理,通过各种
学位
在指标理论中,辛流形上量子化与辛约化可交换([Q,R]=0)是研究热点之一,且具有十分重要的理论意义.本文是一篇综述,旨在将紧致无边辛流形[Q,R]=0推广到紧致带边辛流形的情形.在本文中,我们首先介绍了辛流形(M,ω)上的一些基本概念与定义,简单回顾了辛流形上的Spinc-Dirac算子DL及其形变算子DTL和Hamilton群作用及相应的矩映射μ.同时,我们介绍了约化空间(MG,ωG)的一些知
学位
机载成像系统广泛应用于战场侦察、交通监管、安全巡检、灾区搜救等军民领域,机载目标检测识别是场景感知、目标搜索的重要手段。近年来,深度学习检测方法取得比传统检测方法更好的效果。然而,机载探测距离远,目标尺寸小而场景复杂;机载资源受限而实时性需求高,给机载检测带来挑战。本文针对检测模型庞大、小目标精度低、推理时间长的问题开展特征提取结构、空间上下文方法和端到端推理研究。针对特征提取中小目标特征匮乏易丢
学位
Lévy过程是一种具有独立平稳增量的左极限右连续(càdlàg)随机过程,在多个领域都有着相关应用,如应用力学、金融、云计算等领域。目前布朗运动的随机分析的理论研究已经较为成熟,但是因为Lévy过程的跳跃而导致的轨道的不连续,所以布朗运动等有关的一些定理无法运用于Lévy过程之中。在一致意义的拓扑下,连续函数无法一致逼近Lévy过程,所以为了得到在轨道意义下的Lévy过程的光滑逼近的收敛,本文引入
学位
在当今的数字经济时代,各个行业的数字化程度越来越高,系统架构越来越复杂,海量数据的出现导致运维工作的难度急剧增加。于是,智能运维的理念开始被提出和实践,而关键性能指标(KPI)异常检测也正是智能运维中的核心。关键性能指标为带有特定含义的时间序列。在实际场景中,时序数据的复杂程度很高,其规模也会随着时间的推移而不断增大。而现有的许多检测算法难以在保证较高精度的同时,还具备良好的可扩展性。本文根据先细
学位
改革开放以来,中国的经济迅速发展,人民开始用自己的积蓄来投资股票市场。虽然股票市场的收益可观,但是风险却巨大。为了能够在获取可观收益的同时,控制好相应的风险,建立一个有效的投资组合是十分有必要的。本文基于Barra多因子模型,使用30个行业因子、10个风格因子对股票的超额收益进行解释,不能被Barra因子解释的特质性收益率则使用机器学习模型去拟合。本文从A股市场的交易数据以及股票对应公司的财报数据
学位
近年来,分数阶微积分在流体力学、粘弹性材料、计算生物学、电磁理论、量子经济、电气化学过程、混沌等诸多领域得到了广泛关注与应用。与传统的整数阶微积分相比,分数阶模型能更准确地模拟具有记忆性与遗传性质的现象。时间分数阶Burgers方程由整数阶Burgers方程衍生而来,可以描述具有扩散效应和非线性传播效应的物理现象,在流体动力学建模中具有十分广泛的应用,因此对该方程进行数值求解具有重要的现实意义。本
学位