基于学习的用户异常行为分析方法研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:yangyupengmei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网和大数据的落地应用在各行各业不断开花,人们的行为被广泛记录并由此产生了大量包含用户行为信息的数据,这些数据对企业和行业具有重大的管理意义和商业价值。与此同时,当前各领域的用户行为不仅包含用户正常行为,也包含用户异常行为,而用户的异常行为在生产生活中常常导致了不同程度上的问题,如何分析发现用户的异常行为并采取相应的措施是当前诸多领域亟待解决的问题,当前火热的机器学习技术和海量的用户行为数据为解决用户异常行为分析问题提供了方向,通过基于机器学习的用户异常行为分析方法可以更加充分利用用户行为数据,准确地识别用户的异常行为,从而采取及时措施。通过调研机器学习在用户异常行为分析场景的研究成果发现,当前主要存在两方面问题,一是基于单一行为模式的传统机器学习方案缺乏有效性和普适性,二是大量用于异常行为分析的深度学习方案未能充分考虑用户行为的序列特征且缺乏区别对待用户行为序列信息的能力。针对这些问题,本文提出了一种基于学习的用户异常行为分析方法。具体来说,本文方法包含集成学习模块和深度学习模块以及结合两者优势的加权计算模块。集成学习模块创新地设计了一种基于Stacking方式的集成学习方法通过在基础分类器之上堆叠训练元分类器融合了多种用户行为模式,克服了单一行为模式下的问题;深度学习模块设计引入了一种添加注意力机制的双向门控循环单元网络(BiGRU),为用户行为序列建模,充分考虑了长期依赖问题和序列前后状态等特征,并筛选了序列中对分类的高价值信息;加权计算模块对两个学习模块的分类概率结果进行加权计算,充分结合了手动提取特征和自动提取特征的优势。本文在原始BPI Challenge 2011数据上生成四份数据样本分别进行了多组对比实验,模型评估指标不仅选用了 F1-score和AUC等分类模型综合指标,并对用户异常行为分析场景下漏报和误报的代价情况定义了 Cost指标,通过对比实验结果,充分验证了集成学习模块、深度学习模块和总体建模方案的合理性和优越性。
其他文献
近年来,由于常规油气产量逐渐下降,具有较大潜力的非常规油气资源则越来越受重视。致密油储层孔隙结构表征是对致密油储层研究的基础。本文在充分调研国内外关于致密油储层岩石微观孔隙结构研究方法的基础上,以长岭凹陷泉四段致密油储层为研究对象,主要研究了致密油储层孔隙结构表征以及流体赋存状态两部分内容。针对研究区致密油储层孔隙结构复杂,物性相关性较差的特征,首先,利用铸体薄片、扫描电镜镜下观察等方法,确定长岭
密集烤房是烟叶烘烤的重要载体,烘烤控制是获得优质干烟叶的重要途径。现阶段国内烟叶烘烤技术虽然有了很大改进,但仍存在不少问题。使用煤、生物质等作为主要燃料,造成资源浪费、产生有害气体污染环境,而且还导致烘烤过程可控性差;采用空气外排的除湿方式使得装烟室中的热量以及烟叶烘烤过程中析出的物质都被直接排出,不仅降低了烟叶评吸质量和外观色度,还增加了能耗。现有烤房控制系统和烘烤工艺主要是针对燃煤型密集烤房研
气动光学成像偏移是影响精确制导武器装备发展的重要因素之一,机载计算机能够快速获得当前状态的气动光学成像偏移数值,对提高命中率有直接的应用价值。针对风洞实验和数值模拟计算成本高、实施周期长、代价大的问题,本文研究基于改进优化算法的数据预测模型,对实际工程中气动光学成像偏移进行快速计算。首先,以极限学习机算法(Extreme Learning Machine,ELM)为基础,针对随机给定ELM初始权值
随着科技的快速发展,我国的汽车保有量不断增加,车辆在给生活带来极大便利的同时,也对交通管理提出了严峻的考验。人工智能技术的崛起使得智能化交通系统和无人驾驶汽车的概念迅速进入了社会的视野,而这些应用需要对交通图像进行场景理解。相关算法要在能够部署到有限计算资源设备的同时,需具备高精度和高效率的处理性能。针对这些问题,本文展开了面向交通图像场景理解的深度学习算法研究,本文主要研究和创新点具体如下:(1
困境儿童作为儿童当中的弱势群体,其生存发展需要社会各界的广泛关注。学业自我效能感是学生对自己学习自信程度的衡量,影响着困境儿童所获得的学业成就,关乎困境儿童的健康成长。本次实务中社工依托山西省太原市易源公益组织·彩虹圆梦坊困境儿童保护计划项目,运用参与观察法与行动研究法针对彩虹圆梦坊困境儿童学业自我效能感偏低问题进行社会工作干预,目的是提升困境儿童自我效能感,同时探讨小组工作介入困境儿童学业自我效
2008-2009年的金融危机对全球企业造成了重创,究其原因在于企业缺乏一定的流动性导致资金链断裂。金融危机后,企业加强了对流动性的关注,流动性管理成为理论界和实务界关注的
社会的发展会逐渐暴露出一些缺陷,往往给现有的社会制度带来新的挑战,孤儿作品就是其中之一,孤儿作品(Orphan Works)指由于享有著作权的人信息不明,或者即使信息清楚,仍处于著作权保护期内但作者却下落不明的作品,孤儿作品问题对世界范围内的版权制度提出了新的挑战。随着数字技术的爆炸式发展,著作权保护时间的不断延长,人们对知识产权的意识不断的提高,使得传统印刷时代的许多隐性版权问题逐渐扩大,出现了
对话文本情感分析研究是自然语言处理的一个研究方向,该任务通过计算文本中蕴含的情感特征,得出文本中蕴含的情感倾向。区别于传统情感计算任务,对话文本存在信息的交互,需在分析用户情感倾向的基础上,研究用户之间情感的变化与影响,存在较多技术难点。本课题基于对话文本构建了情感分类模型,实现交互式文本的情感分类任务,主要完成以下四点工作内容:(1)提出了字符级OOV解决方案,该方案在文本预处理阶段解决了未登录
随着通信领域的快速发展,第五代通信技术应运而生,5G信号源在此背景下,用于为通信系统或者基站提供各种频率、波形和输出电平电信号,以及不同频段信道模拟功能的设备。新一代通信系统要求数据传输速率高达10Gbit/s且低时延高可靠,对信道模拟的可靠性与速度性提出了新的挑战,更加复杂的信道环境影响着通信系统的性能。对信道模型和信号模拟来说,5G信号频率、带宽、协议标准不同,都对信号在相同场景中传输性能带来
近年来,随着大数据,云计算和物联网等新技术的大规模应用,数据存储量级开启了爆炸式增长,为了满足不断增长的数据存储需求,各个行业纷纷开始着手建设企业数据中心,提高业务效率,保证服务无间断,数据中心已经成为了企业运行不可分割的一部分。相对于传统的集中式数据中心,分布式数据中心具有更强的水平扩展能力并且能够按照业务需求实现分布式部署,可以更好的帮助企业提供服务。但构建分布式数据中心需要面临复杂的系统架构