基于话单大数据的诈骗电话识别与响应模型研究

来源 :中国人民公安大学 | 被引量 : 2次 | 上传用户:etzhenghao2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,我国电信网络诈骗长期处于高发态势,人民群众财产安全面临严重威胁。其中,电话诈骗是最普遍、后果最严重的一种。但由于电话诈骗组织严密、诈骗手段隐蔽、犯罪涉案链条长,打击治理难;且对电话诈骗的事后打击并未达到治标治本的目标。如何在事前事中及时发现电话诈骗、阻止电话诈骗,防止电话诈骗的发生,将其对人民群众和社会的危害降到最低,就成为了一个非常重要的研究课题。本文从话单大数据的角度切入,通过数据挖掘的技术手段,对诈骗电话通话话单进行离线分析,构建诈骗电话识别与响应模型,识别出特定时间内的诈骗电话,为反电信网络诈骗平台提供有效的技术支撑。首先,实现了话单大数据的预处理。搭建了基于配置开放式的数据ETL架构,支撑了运营商将业务数据库中的MC话单数据保存到反电信网络诈骗中心的数据仓库中;基于PCA主成分分析法提取了MC话单数据的属性特征;通过号码所属类别对话单数据进行分类并增加了特征字段,实现了将通信运营商的MC话单数据处理为具有完备特征值的CDR话单数据。其次,提出了一种诈骗电话识别模型。提取了号码活跃度特征、号码通话行为特征、社交网络特征、配对特征、地区特征及虚拟配对特征,构建实施诈骗的行为事件流;基于随机森林算法离线训练得到诈骗电话识别模型,并通过调优测试提高了模型的性能。实现了诈骗电话的在线检测,基于Spark Streaming实时流框架,统计得到可疑号码通话行为特征,判定号码信用度;加载诈骗电话识别模型,通过建立公共分析逻辑、获取号码分析逻辑、获取通话记录分析逻辑,识别得到诈骗电话以及深浅度受害用户,并通过参数调优实验满足了大数据吞吐量需求。最后,提出了一种基于多方联动的诈骗电话响应模型。通过共享数据、协同处置,在电信网络诈骗的事前、事中、事后进行响应,通过阻止受害者受骗来降低诈骗分子的得逞率,保护人民群众财产安全。
其他文献
目前,我国的人口老龄化问题已然成为了国家生存与发展的主要问题之一,然而我国相对发达国家而言还处于经济水平较为落后的地位,不仅是国家和社会,还有家庭、个人都在承受着巨
随着时代的发展,我国的经济不断发展,人们的生活水平逐渐提高,与此同时人们也越来越关注生活质量问题。在人们的日常生活中食品是必不可少的,而提到食品,防腐剂问题就是人们
目的总结心脏介入治疗并发12例急性心包填塞的护理经验。方法回顾分析心脏介入治疗并发12例急性心包填塞患者的临床资料,总结护理要点。结果急性心包填塞发生在冠状动脉介入
"广大群众不要烧田埂地坎、不要野外用火,一旦起火,坐牢罚款……"连日来,湖南省隆回县的崇山峻岭响起森林防火铜锣声。据了解,隆回县自进入秋冬季森林防火期以来,全县每个村都
探讨了金在黑龙江省中部森林沼泽区A层土壤-10~+60目、-60~+100目、-100~+160目及-160目粒级中的含量分布特征和富集规律。经对比研究认为,-100目可以满足低密度深穿透地球化学详细
应用基于时间域有限差分法模拟软件GPRMax2D,对高铁隧道衬砌典型的不良情况,如厚度不足、空洞和钢筋布置不合理等进行了正演模拟,得到了隧道衬砌典型不良情况的正演模拟雷达图像
目的:通过对我院因男方不育因素行来曲唑(Letrozole,LE)促排卵的供精人工授精(Artificial insemination by donor,AID)临床病例进行统计分析,深入了解来曲唑促排卵的临床特点
从婴儿粪便中分离获得1株能够产生抑菌活性物质的菌株,经生理生化和16S rDNA鉴定,该菌为干酪乳杆菌,命名为Lactobacillus casei LZ55。在排除有机酸、过氧化氢的干扰后,该菌
通过对思茅盆地21条剖面,计1007个测点的大地电磁测深资料的分析认识,采用有效视电阻率数据对剖面进行反演处理,继而从电性特征方面对坳陷的双重基底构造进行了研究。研究成果表
本文对10%纳米钛粉改性的环氧煤焦沥青涂层在流动人工海水中进行了模拟实验,并应用电化学阻抗研究了涂层的电阻随冲刷时间的变化。研究结果表明含有质量分数为10%的纳米钛粉