浅谈多指标关联识别电信网络诈骗团伙的方法

来源 :中国新通信 | 被引量 : 0次 | 上传用户:Seanecn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】    随着互联网技术的不断发展,互联网诈骗呈现持续高发态势,诈骗分子呈现出专业化、团伙化的特点。为了更好识别诈骗团伙,通过接入诈骗事件,提取涉诈资源之间的关联关系,涉诈资源的行为特征,进行关联分析和相似度分析,得到涉诈资源关联图,再基于LPA算法进行诈骗组织切分得到准确结果。
  【关键词】    互联网    网络诈骗    安全分析模型
  一、背景
  近年来,我国电信网络诈骗总体形势严峻,诈骗分子呈现出专业化、团伙化的特点,警方抓获的电信诈骗团伙,都多达数百人,诈骗设备、诈骗卡号、诈骗账号都是数以万计[1]。随着移动互联网的普及,国家和公安机关对反诈的宣传,单纯依靠语音、短信或网络诈骗的场景越来越少,诈骗分子往往是三者结合才能诈骗成功[2]。这些诈骗分子可能实施了多次诈骗才被抓获,而且还有部分诈骗分子隐藏在其他地市或国外,诈骗设备也经过了多次更新,仅凭一次诈骗案件难以评估诈骗团伙整体规模。现有技术方案中基于单一场景的诈骗团伙分析已经越来越难以准确地挖掘出全部诈骗团伙了[3]。本方法提出一种基于语音话单、短信话单和上网日志进行关联分析发现诈骗团伙的方案。通过接入诈骗事件,提取涉诈资源之间的关联关系,涉诈资源的行为特征,进行关联分析和相似度分析,得到涉诈资源关联图,再基于LPA算法进行诈骗组织切分得到准确的诈骗组织。
  二、方法
  为了更好的识别诈骗团伙,设计基于语音话单、短信话单和上网日志进行关联分析的方案。通过接入诈骗事件,提取涉诈资源之间的关联关系,涉诈资源的行为特征,进行关联分析和相似度分析,得到涉诈资源关联图,再基于LPA算法进行诈骗组织切分得到准确的诈骗组织。
  本方案的基本设计概念和处理流程如下图所示:
  2.1诈骗事件接入
  分析系统需要接入多种诈骗事件:
  基于GOIP、多卡宝等多种远程部署的语音诈骗事件;
  基于短信网关群发诈骗短信的短信诈骗事件;
  基于社交网络的杀猪盘诈骗、刷单诈骗等网络诈骗事件。
  对语音诈骗事件需要获取以下主要字段:卡号、对方卡号、IMEI、时间、地理位置。
  对短信诈骗事件需要获取以下主要字段:卡号、对方卡号、IMEI、时间、地理位置。
  对网络诈骗事件需要获取以下主要字段:卡号、IMEI、社交账号、时间、地理位置、流量大小。
  2.2诈骗资源关联分析
  诈骗团伙分析包括两种方式:直接关联分析和相似度分析。
  2.2.1直接关联分析
  直接关联分析,通过涉诈资源之间的直接联系建立关联图,如下:
  通过卡号共享进行关联:多个诈骗卡号都给一个受害者卡号拨打电话;诈骗卡号之间的通信。
  通过设备进行关联:多个卡号共用了一个设备,即一IMEI多卡;一个卡号用在了多个设备上,及一卡多IMEI。
  通过社交账号进行关联:多个卡号共用了一个账号,即一账号多卡;多个账号共用了一个卡号,即一卡多账号;多个卡号共用了一个设备,即一设备多卡;多个设备共用了一个卡号,即一卡多设备。
  通过上述关联分析发现的涉诈资源节点和节点之间的连线用图数据库存储。后面不断接入新的诈骗事件,对诈骗事件进行接入,获取涉诈资源阶段,按照上述流程添加到图数据库,可发现更多的攻击组织。
  2.2.2相似度分析
  一个诈骗团伙作案都有相似性,包括空间上、时间上、行为上。取以下行为作为判定涉诈资源之间的相似性:
  地理位置:換算为经度和维度。
  活跃时间分布属性:按时间段划分24h为24个数值,若有话单则为1,否则为0,得到一个24元素的数组。分别计算语音活跃时间,上网活跃时间。
  连续工作时长:计算一整天的工作时长。
  上网流量:分为上行流量大小和下行流量大小。
  上网类型分布:按照上网日志的域名类型划分为9类域名:咨询门户类网站、企业品牌类网站、交易类网站、社区网站、办公及政府机构网站、互动游戏网站、有偿资讯类网站、功能性网站、综合类网站。若有则为1,否则为0,得到一个9个元素的数组。用余弦相似度计算涉诈资源之间的相似度,假设X1,X2为2个涉诈资源,X1X2相似度如下:
  2.3 LPA诈骗组织切分
  2.3.1团伙标签初始化
  LPA算法全称label propagation algorithm,即标签传递算法,是一种图聚类算法,如图3,节点代表团伙标签,边上的黑色数字代表边的权重。
  各节点和边初始化方式如下:节点初始化为1,团伙标签初始化为自己,边的初始化分为两种计算方式:
  直接关联分析的边关联程度用反正切函数计算,假设发现涉诈资源A和B之间有x次直接关联,则关联度为arctan(x)。相似度分析的边关联程度计算直接用余弦相似度。
  2.3.2团伙标签传递
  每个涉诈资源节点向邻居节点发送消息,消息权重为涉诈资源节点权重*边权重*分割系数(涉诈资源节点出度的倒数),每个涉诈资源节点对收到的权重累加,更新涉诈资源节点标签为累加权重最大的团伙标签,若多个涉诈资源节点的团伙标签的权重相等就随机选一个。反复执行发送消息和接收消息,直到标签稳定算法终止,最后相同标签的节点即为一个团伙。如下图4分析得出团伙1和团伙2。
  三、结束语
  技术创新是一把双刃剑,人工智能技术在不断促进防范治理技术发展和进步的同时,也开始被诈骗分子所利用,带来了一定程度的风险隐患。特别是随着基于人工智能的“深度伪造”、群聊群控等诈骗手法的传播和应用,这些风险被进一步集聚、放大,引起了社会各界的关注[4]。通过实践,本方法可有效甄别诈骗团伙,准确率高,覆盖范围广,帮助相关部门快速掌握诈骗团伙动态,有效挽回群众损失。下一步,我们将进一步完善改进方法,创新技术。
  
  参  考  文  献
  [1] 蒲黎明. 电信诈骗语义分类系统的设计与实现[D]. 北京:北京邮电大学,2019.
  [2] 李易.反电信网络诈骗全民指南[M]. 上海:上海社会科学院出版社,2016.
  [3] 李航.统计学习方法[M]. 北京:清华大学出版社,2012.
  [4] 电信网络诈骗治理与人工智能应用白皮书[M].北京:中国信息通信研究院安全研究所,2019.
其他文献
【摘要】 近年来,随着大数据、云计算、人工智能、物联网等技术的快速发展,水务行业迈入数据信息智能时代,但是水厂的智慧化建设仍存在自动化基础弱、新技术落地难等发展困境。本文通过收集智慧水厂研究进展及建设实践案例,综合分析智慧水厂的特性和要求,探索提出智慧化水厂的定义:在自动化水厂的基础上,综合运用现代科学技术,全方位、全过程实现信息数字化、控制自动化、决策智能化的一种理想化水厂运作模式。同时笔者认
【摘要】 随着5G新一代通信技术向各行各业渗透发展,智慧化服务与应用显得越来越重要。面向智慧医疗应用很少包含室内定位这一解决方案。本文提出一种基于超宽带(UWB)技术的高精度室内定位+5G承载网传输方案:由多个定位锚节点和目标节点组成定位系统;根据不同空间场景配置不同定位算法(TDOA、AOA、DS-TWR),以提高定位精度,并自主连接组成多簇树状网络用于数据传输,医、护、患可通过电脑,5G终端
【摘要】 为了提高信息推送的效率,精准推送技术受到关注,信息提供商为了获取商机、用户为了接收自己最需要的信息、网络运营商也希望有限的网络资源得到最有效的利用,因而精准推送以提高信息内容推送的精准度为主要特征,受到各方的关注。本文着眼于信息的精准推送,选取了适当的专利申请并加以统计和分析,介绍了与信息精准推送相关的技术,并针对信息精准推送技术在中国专利申请中的技术热点进行了介绍。  【关键词】
综合飞控计算机作为机载计算机,对安全性和可靠性有着较高的要求。机内自测试(BIT)技术由于其不依赖外部设备,仅使用自身软、硬件完成故障诊断及隔离的特点,目前成为提高机载计算机可测试性和可维护性的有效措施。本文从BIT的工作模式、常用测试方法以及故障诊断等方面对综合飞控计算机的BIT技术进行了详细的介绍。研究表明,本BIT设计测试覆盖率高,可以快速诊断出故障根源,进而提高机载计算机的安全性和可靠性。
【摘要】 本文研究了FC网络的时间同步问题,分析了系统RTC的同步误差,提出了通过实时修正和维护客户端在标准时间内的晶振跳动次数来达到提高时钟同步精度的方法。最后通过实验测试了本文所提出的时钟同步精度校准计算方法的有效性。  【关键词】 FC 时间同步  引言:  光纤通道(FC,Fiber Channel)是1998年由美国国家标准委员会(ANSI)研究出的,用于连接工作站、大型机、巨型机
随着视频技术发展以及系统在轨道交通运营管理、客流分析、安全防控等方面的重要辅助功能日益突出,云存储技术作为新兴的视频存储方案,本文探讨了几种基于轨道交通的云存储方案,简要分析了相关的数据管理模式,并对带宽需求、存储容量进了对比。
【摘要】 在大数据环境下,深入描述用户的基本属性和特征,将用户画像模型应用到当前图书馆的服务中,可以提高图书馆的个性化服务。本文首先对用户画像的概念进行阐述,然后介绍了当前图书馆在服务过程中存在的现状,然后从三个层面(数据的采集、分析以及个性化服务)来对图书馆进行用户画像模型的构建,最后对当前图书馆个性化服务的优化提出了几点建议。  【关键词】 大数据 用户画像 图书馆 个性化服务  引
【摘要】 本文介绍了卫星网络融合平台在应急行业中的应用,具体介绍了VSAT卫星通信系统、Ka卫星通信系统、天通一号卫星移动通信系统、北斗卫星导航系统、指挥调度系统五大业务模块。并对卫星通信装备管理、统一位置信息管理、应急信息发布、现场信息采集、在线会商、卫星通信调度、系统管理、卫星资源动态管控、综合态势分析等功能进行了详细的介绍。最后介绍了卫星网络融合平台应用的重要意义。  【关键词】 卫星网
健康查体是医院提供医疗服务的窗口,而体检系统一直是体现医疗服务信息化水平的重要信息系统.如何提高体检系统与医院各信息系统的集成度,实现数据流的自动化处理,达到系统间
【摘要】 数据传输在异构系统构架中是一个瓶颈问题,类似在计算机系统中的内存墙问题,此类问题的产生是因为,多年来计算机内部存储技术(主要是指内存)一直跟不上处理器技术在延迟和功耗方面的进步,此类问题也被称为“内存墙”(Memorywall)问题,体现近内存计算思想的计算机系统的第一次出现可以追溯到20世纪90年代初,用于数据处理的原型机则由 Kozyrakis 等人提出,当时被称之为矢量 IRAM