基于数据挖掘的异常用户预测与识别

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hljxkbsyly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络在日常生活中应用占比越来越重要,人们开始将视线从Web端向移动端转移,无现金支付,二维码等移动端产品逐渐成为生活的必需品。APP之间为了用户量产生了激烈的斗争,随着APP利润的增加,黑产也随之而来,对企业而言,增创收益的同时,也要防止黑产利用不法手段盗取利益。为了能够有效的对抗黑产手段,我们需要深入了解用户的基本特征和黑产的惯用手段,发现正常用户和异常用户的实质区别。拉新-激励业务利益较小,黑产的行为痕迹也不是很明显,但如果可以对异常用户做出准确的识别,针对不同风险类别的用户给出不同的对抗策略,并将理论框架推广到其他业务,保证业务利益,对企业来说有着重要意义。本文基于数据挖掘方法对在线用户操作行为的异常用户进行识别研究,首先使用了Apriori算法和K-means聚类,分别对提取到的特征规则进行分析,评价特征规则以及规则集的合理性,根据置信度和聚类中心,优化特征规则,节省空间储存和减小规则叠加带来的高评分的代价;其次预测用户风险等级,对比了SVM模型,Logistic Regression模型和LightGBM模型在异常用户风险情况的预测结果,最后选择基于SVM模型的SVC算法,相比于其他算法,SVC准确率更高且速度更快,并且采用Rbf核函数的模型效果更佳,正确率达到了0.9715。最后提出了使用贝叶斯网络识别在线用户中隐藏的黑色产业用户,但是效果不是很好,原因是用户的关系网并不是很复杂,围绕一个用户的关系网人数小于1500,不便于贝叶斯网络的分析计算。但是这种方法可以给其他业务提供识别隐藏用户的思路,为异常用户拦截提供决策依据。
其他文献
“好久没逛夜市了,没想到现在这么热闹!”“90后”姑娘小刘一边笑着看向身边摩肩接踵的人流一边跟朋友在摊位前挑选自己喜欢的小饰品。她说自己以前就喜欢来健康路逛夜市,东
建设部:严查违法拆迁评估和野蛮拆迁;社科院:真正税改将始于2008年;交通部将清理已还贷款公路收费点;经济增速加快 三大特点突出;蔡日方:劳动力成本上升不会削弱中国经济竞争力;联合
刘江,1926年7月生,重庆万州人。原名佛安,号湖岸、知非。1945年中师毕业后,考入重庆国立艺术专科学校预科习绘画,得校长潘天寿教授书法、篆刻,两年后升入本科油画系学习。194
期刊
1背景与目的电离辐射在人们生产、生活的各个领域得到越来越广泛的应用,但放射线在造福人类的同时,过量照射能对人体造成有害的影响。快速的进行剂量估算显得尤为重要。目前
<正>从2019年下半年开始,区块链又火了起来,原因有二:一是数字货币Libra发行;二是央行准备发行国家主权数字货币,开启了区块链金融科技时代。面对神秘的比特币、难以理解的区
跨文化交际能力是语言能力和社会文化能力的总称,跨文化交际必须重视二者,清楚其中文化所具有的独特的特点和重要作用,而不仅仅局限于语言本身,以便于在语言的学习中特别是在
随着印染工业和核工业的高速发展,带来了大量含有印染染料以及放射性核素的废水,这些废水需经过合理的处理才能排入到生态环境中。层状双金属氢氧化物是一种常见的阴离子黏土或类水滑石化合物,由于其可调的层状结构、纳米尺寸等特点而受到广泛的关注。本文选取常作为三价锕系元素和镧系元素模拟替代物Eu(Ⅲ),以及U(Ⅵ)和常见的阴离子偶氮染料甲基橙为目标污染物,采用传统的水热合成法制备了Ni:Al为3:1的丙三醇改
2019年是打赢脱贫攻坚战、攻坚克难的关键之年,距离完成脱贫攻坚目标任务只剩下不到两年时间。习近平总书记在重庆召开解决“两不愁三保障”突出问题座谈会上指出,“两不愁”
声音作为人类的“第二张面孔”在人际交往的过程中起着重要的作用。人们会通过语音、面孔、行为等一些非言语信息的观察,不断捕捉交往群体对象的信息,形成他们感知到的可信任
电脑辅助调查通过将传统纸质问卷转变为电子化问卷,被调查者借助电脑回答问卷的一种问卷完成方式。本文以中国人民大学社会学系2006年“中国人的性行为和性关系调查”为例,具体