论文部分内容阅读
摘 要:针对目前洗钱交易行为的较低检测率的问题,通过对Radial Basis Function(简称RBF)神经网络技术的研究,提出基于APC-II和RLS的面向反洗钱的RBF神经网络模型,并通过分析与研究加以实现。RBF神经网络有较低的误检率和更高的检测率。
关键词:洗钱交易;神经网络;APC-III;RLS
中图分类号: D9 文献标识码:A 文章编号:16723198(2014)17015503
1 引言
当今社会面临着一个日益严重的犯罪活动——洗钱活动。洗钱行为顾名思义就是通过一些手段将非法收入合法化,目的是逃避法律的制裁。洗钱行为目前已经严重威胁到全社会的安全,也势必会影响到全球经济的发展。增强对洗钱犯罪活动的治理是目前金融工作中非常重要的的一项工作。
金融数据随着信息技术的飞速发展呈现出爆炸性的增长,但是当前的反洗钱技术却表现的十分落后,尤其是我国对金融犯罪的治理仍然主要是人为干预。根据当前计算机信息技术的发展,可以了解到利用RBF神经网络对数据进行持续性计算,提高反洗钱的智能化水平,帮助提高反洗钱手机情况和过程分析的技术水平。基于RBF神经网络提出的反洗钱行为监测的计算机模型,进而提供了新的办法来处理可疑交易和大额数据。
2 国内外洗钱交易监控研究发展趋势
在20世纪30年代随着洗钱行为的出现,欧洲国家开始对反洗钱进行描述性探讨,但20世纪70年代才开始真正意义上的反洗钱研究。尤其是9.11事件之后,国外金融领域有关反洗钱的理论研究更加深入。具有代表性的是美国的FAIS系统和澳大利亚的TRAQ系统。西方国家的反洗钱系统已经经历了三代,有基于客户行为模式识别可疑交易监控系统、欺诈扫描仪、基于智能代理技术整合神经网络等各项技术的分布式反洗钱系统。
我国的现行反洗钱交易数据报告也基本采用可疑和大额交易报告制度和了解客户制度这两种模式。在中国反洗钱这个课题起步很晚,但是反洗钱这个问题非常复杂,涉及的范围广泛,所以我国一直在探索反洗钱问题。国内对于洗钱犯罪的防范主要是建立法律法规和交易数据监控。反洗钱监测工作的落后严重制制约了我国反洗钱工作的质量和效率。
3 洗钱的起源和定义
洗钱一词最初来源于是美国。一个犯罪团伙,开了一个洗衣店,通过把洗衣的合法所得和犯罪的非法所得一同向税务机关申报,从而将非法所得合法化。法律上洗钱是指犯罪非法所得,包括通过恐怖组织、破坏金融秩序、诈骗以及贪污等的所得,通过一系列方式,使这些其合法化。金融上犯罪分子通过媒介,将犯罪活动资金通一系列金融操作等进行漂洗,来掩盖违法性质的行为。洗钱犯罪活动的与日俱增,现在洗钱行为中有非法资金合法化,同样也有合法资金非法化。洗钱行为的分类如图1所示。
图1 洗钱行为的分类 4 基于RBF神经网络的反洗钱交易行为识别研究
4.1 基于RBF反洗钱交易行为识别
洗钱行为从本质上讲是模式识别和分类的问题,具有良好非线性学习能力的人工神经网络能够处理复杂的模式,并且还能进行记忆、推测等功能,人工网络的实时性非常强,无需建立数学模型,可以这么说神经网络是特别适合可疑交易行为识别的。
根据对洗钱行为的分析能够发现,其具有多变性,需要采取的技术具有很好的适应性,来适应其不断发生的变化,只有这样才能降低分析中的误报率,RBF神经网络恰好具有这些特性,其不仅解决了非线性问题,还能使得训练样本保存到神经元当中,通过简单计算来解决网络输出加权值。
RBF洗钱行为识别是通过对洗钱案例数据的训练学校和训练学习以往经验,利用神经网络内部的连接权值表示理应学习的洗钱辨别知识,目的是做到对未知样本进行分类。RBF洗钱行为识别联想记忆、相似归纳和模式匹配三种强大的能力。利用本身的神经元不断的对训练数据学习,从而实现复杂的非线性映射,建立出不同的模型对资金流动进行揭示,分析并制定出最有利的反洗钱方案,帮助相关部门提高反洗钱的情报收集智能化水平。
4.2 研究RBF神经网络结构
RBF神经网络克服了RB神经网络的两个主要缺点,隐节点无法确定和训练时间普遍较长的问题。RBF神经网络描述如下:
x∈Rpφ(·)h∈Rmwjy∈Rn(1)
yj-f(x)=w0+∑mi=1wj(‖x-ci‖),i=1,2,…,n(2)
式(1)和式(2)中,x→i(x)是输入层,其主要是实现了非线性的映射,i(x)→yj是输出层,其主要是实现了线性的映射,wj表示的权值,主要为隐含层权值与输出层权值, ‖·‖表示欧氏范式。
(‖x-ci‖)=exp(-‖x-ci‖2σ2i),i=1,2,…,m
1,i=0
(3)
式(3)中,ci表示隐节点中心中的第i个,σi表示参数,这个参数是控制Gaussian函数衰减快慢的,m表示隐含层中节点的个数。RBF神经网络结构如图2所示。
图2 RBF结构图 5 建立基于RBF的反洗钱行为监控模型
通过交易数据信息与客户信息的调查和分析,从两个维度来判断金融交易行为正常与否。已知i,j∈银行账号集合,i≠j。将在t时刻账号i与j之间的资金流动数量假定为Qij(t)>0,将在t时刻账号i存款数量假定为Di(t)。
Di(t)=Di(t0)+∑j0j=j0∫tt0Qij(t)dt
其中i∈i0,i1,…,in=I,I表示在t-t0内发生交易的账号集合,j∈j0,j1,…,jn=J,J表示在t-t0时间内所有交易的账号集合。
训练集由一组数据库记录构成,一个训练样本数据即可表示为
E=(v1,v2,…,vp;s) (4)
式(4)中v1,v2,…,vp表示要输入的反洗钱属性参数。S表示分类标签属性值。
可知基于BRF反洗钱交易监测模型示意图如图3所示。
图3 基于RBF的可疑交易监测模型图 6 实现基于RBF的反洗钱行为监控模型
反洗钱行为鉴别中需要对可疑交易数据和大额交易数据进行识别。把提供的可疑的银行交易数据和洗钱案例数据归纳到训练样本中,之后系统在进行参数学习时利用训练样本,通过调用训练好的RBF神经网络来判断经过预处理的金融交易数据是否合理,通过一系列判断来确定这个交易确实为洗钱交易,便可以将该案例增加到可疑交易案例数据库当中,系统之后能够对其进行参数学习。该模型的流程示意图如图4所示。
图4 模型实现流程图 6.1 属性参数预处理
反洗钱部门在对洗钱交易行为进行鉴别的时候,需要利用一些其他知识,例如反洗钱知识,对某些跟洗钱无关的属性进行过滤,从而保证洗钱行为监测的高效。这些金融交易数据有时候系统不能直接鉴别,还需经过反洗钱部门的处理,将其转换成能够反应出洗钱特征的有关属性的集合。通常只有值型数据才是RBF神经网络能够处理的数据,因此第一步要做的是将反洗钱属性参数处理为定性的属性参数,按程度统一分类的输入,然后将定性属性参数予以量化。
6.2 学习过程
6.2.1 APC-III聚类算法
通常采用K-means来确定RBF的隐含层,但这种方法具有很多缺点,但APC-III聚类算法能够避免这些问题,其只需对样本集只学习一次,可以说其有很高的学习速率,其聚类半径为:
R0=α1p∑pi=1mini≠j( ‖Xi-Xj‖)
(5)
式(5)中,p是样本个数,α为常数,最后的聚类数由R0的大小决定。APC-III聚类算法的详细描述如下:
输入:训练样本X=xixi∈Rp,i=1,2,…,p
输出:聚类中心ci(i=1,2)
变量:L表示聚类数;ni表示第i个聚类中心拥有的样本数目;ci表示第i个聚类中心;dij表示xj到第i个聚类中心的距离。
(1)初始化:L=1,c1=x1,n1=1;/*对训练集中的每个样本*/
(2)For(j=2;j≤p;i++)/*对每个聚类*/
(3)For(i=1;i≤L;i++)
计算dji;
(4)if(dji≤R0)/*把数据xj加到第i个聚类中心范围*/
ci=(cini+xj)/(nj+1);nj=nj+1;
(5)if(xjic0)/*建立新聚类*/
L=L+1;cL=xj;nL=1;
6.2.2 确定宽度参数
当RBF的中心向量ci确定,Gaussian函数的宽度为:
σi=di2m
(6)
式(6)中,di是第i个中心向量与其他中心向量见的最大距离,m为选取的中心向量个数。
6.2.3 递推最小二乘算法
由于之前梯度下降算法在收敛速度方面表现出减慢,在寻求解决隐含层与输出层之间连接值的问题的时候,其实是一个线性优化问题,所以在本文中采用RLS算法。
设在第k步时,输出向量为:
(k)=1(k),σ,2(k),σ,…,nl(k)T
=1(l1(k)),σ,2(l2k),σ,…,nl(lnlk)T
(7)
第k步中第j个节点的估计输出为:
y∧j(k)=∑wijlli(k),σ
(8)
若实际输出为yj(k),则有误差
εj(k)=yj(k)-y∧j(k)
(9)
权值更新为
wj(k+1)=wj+μ(k)(k)εj(k)1λ(k)·
μ(k)μ(k-1)(k)T(k)μ(k-1)λ(k)+T(k)μ(k-1)(k)
(10)
式(11)中,μ(k)为误差方差阵,λ(k)(0<λ(k)<1)表示遗忘因子,其作用是慢慢的渐减弱当前计算值所受到历史样本对的影响。本文章采用的方法是动态地去调整遗忘因子λ(k)
λ(k)=1-exp-kτ0
(11)
式(11)中,τ0是根据经验进行设定的初始平滑因子。
7 总结
本文中提出基于RBF的反洗钱交易行为的监测模型,这个模型不仅做到了提升了确定洗钱行为的准确率,而且提高了洗钱交易行为的识别率,在不断变化的交易中真正做到能够适应其变化。本文提出的基于APC-II和RLS的RBF神经网络的反洗钱行为交易监测模型,有较低的误检率和更高的检测率,为洗钱交易分析和监测提供了新的思路。
参考文献
[1]晏银香.从反洗钱监管实践透析可疑交易行为核实查证的难点[J].武汉金融,2012,(03).
[2]安晨洪翀.浅谈网络银行的反洗钱监管[J].中国证券期货,2013,(1).
关键词:洗钱交易;神经网络;APC-III;RLS
中图分类号: D9 文献标识码:A 文章编号:16723198(2014)17015503
1 引言
当今社会面临着一个日益严重的犯罪活动——洗钱活动。洗钱行为顾名思义就是通过一些手段将非法收入合法化,目的是逃避法律的制裁。洗钱行为目前已经严重威胁到全社会的安全,也势必会影响到全球经济的发展。增强对洗钱犯罪活动的治理是目前金融工作中非常重要的的一项工作。
金融数据随着信息技术的飞速发展呈现出爆炸性的增长,但是当前的反洗钱技术却表现的十分落后,尤其是我国对金融犯罪的治理仍然主要是人为干预。根据当前计算机信息技术的发展,可以了解到利用RBF神经网络对数据进行持续性计算,提高反洗钱的智能化水平,帮助提高反洗钱手机情况和过程分析的技术水平。基于RBF神经网络提出的反洗钱行为监测的计算机模型,进而提供了新的办法来处理可疑交易和大额数据。
2 国内外洗钱交易监控研究发展趋势
在20世纪30年代随着洗钱行为的出现,欧洲国家开始对反洗钱进行描述性探讨,但20世纪70年代才开始真正意义上的反洗钱研究。尤其是9.11事件之后,国外金融领域有关反洗钱的理论研究更加深入。具有代表性的是美国的FAIS系统和澳大利亚的TRAQ系统。西方国家的反洗钱系统已经经历了三代,有基于客户行为模式识别可疑交易监控系统、欺诈扫描仪、基于智能代理技术整合神经网络等各项技术的分布式反洗钱系统。
我国的现行反洗钱交易数据报告也基本采用可疑和大额交易报告制度和了解客户制度这两种模式。在中国反洗钱这个课题起步很晚,但是反洗钱这个问题非常复杂,涉及的范围广泛,所以我国一直在探索反洗钱问题。国内对于洗钱犯罪的防范主要是建立法律法规和交易数据监控。反洗钱监测工作的落后严重制制约了我国反洗钱工作的质量和效率。
3 洗钱的起源和定义
洗钱一词最初来源于是美国。一个犯罪团伙,开了一个洗衣店,通过把洗衣的合法所得和犯罪的非法所得一同向税务机关申报,从而将非法所得合法化。法律上洗钱是指犯罪非法所得,包括通过恐怖组织、破坏金融秩序、诈骗以及贪污等的所得,通过一系列方式,使这些其合法化。金融上犯罪分子通过媒介,将犯罪活动资金通一系列金融操作等进行漂洗,来掩盖违法性质的行为。洗钱犯罪活动的与日俱增,现在洗钱行为中有非法资金合法化,同样也有合法资金非法化。洗钱行为的分类如图1所示。
图1 洗钱行为的分类 4 基于RBF神经网络的反洗钱交易行为识别研究
4.1 基于RBF反洗钱交易行为识别
洗钱行为从本质上讲是模式识别和分类的问题,具有良好非线性学习能力的人工神经网络能够处理复杂的模式,并且还能进行记忆、推测等功能,人工网络的实时性非常强,无需建立数学模型,可以这么说神经网络是特别适合可疑交易行为识别的。
根据对洗钱行为的分析能够发现,其具有多变性,需要采取的技术具有很好的适应性,来适应其不断发生的变化,只有这样才能降低分析中的误报率,RBF神经网络恰好具有这些特性,其不仅解决了非线性问题,还能使得训练样本保存到神经元当中,通过简单计算来解决网络输出加权值。
RBF洗钱行为识别是通过对洗钱案例数据的训练学校和训练学习以往经验,利用神经网络内部的连接权值表示理应学习的洗钱辨别知识,目的是做到对未知样本进行分类。RBF洗钱行为识别联想记忆、相似归纳和模式匹配三种强大的能力。利用本身的神经元不断的对训练数据学习,从而实现复杂的非线性映射,建立出不同的模型对资金流动进行揭示,分析并制定出最有利的反洗钱方案,帮助相关部门提高反洗钱的情报收集智能化水平。
4.2 研究RBF神经网络结构
RBF神经网络克服了RB神经网络的两个主要缺点,隐节点无法确定和训练时间普遍较长的问题。RBF神经网络描述如下:
x∈Rpφ(·)h∈Rmwjy∈Rn(1)
yj-f(x)=w0+∑mi=1wj(‖x-ci‖),i=1,2,…,n(2)
式(1)和式(2)中,x→i(x)是输入层,其主要是实现了非线性的映射,i(x)→yj是输出层,其主要是实现了线性的映射,wj表示的权值,主要为隐含层权值与输出层权值, ‖·‖表示欧氏范式。
(‖x-ci‖)=exp(-‖x-ci‖2σ2i),i=1,2,…,m
1,i=0
(3)
式(3)中,ci表示隐节点中心中的第i个,σi表示参数,这个参数是控制Gaussian函数衰减快慢的,m表示隐含层中节点的个数。RBF神经网络结构如图2所示。
图2 RBF结构图 5 建立基于RBF的反洗钱行为监控模型
通过交易数据信息与客户信息的调查和分析,从两个维度来判断金融交易行为正常与否。已知i,j∈银行账号集合,i≠j。将在t时刻账号i与j之间的资金流动数量假定为Qij(t)>0,将在t时刻账号i存款数量假定为Di(t)。
Di(t)=Di(t0)+∑j0j=j0∫tt0Qij(t)dt
其中i∈i0,i1,…,in=I,I表示在t-t0内发生交易的账号集合,j∈j0,j1,…,jn=J,J表示在t-t0时间内所有交易的账号集合。
训练集由一组数据库记录构成,一个训练样本数据即可表示为
E=(v1,v2,…,vp;s) (4)
式(4)中v1,v2,…,vp表示要输入的反洗钱属性参数。S表示分类标签属性值。
可知基于BRF反洗钱交易监测模型示意图如图3所示。
图3 基于RBF的可疑交易监测模型图 6 实现基于RBF的反洗钱行为监控模型
反洗钱行为鉴别中需要对可疑交易数据和大额交易数据进行识别。把提供的可疑的银行交易数据和洗钱案例数据归纳到训练样本中,之后系统在进行参数学习时利用训练样本,通过调用训练好的RBF神经网络来判断经过预处理的金融交易数据是否合理,通过一系列判断来确定这个交易确实为洗钱交易,便可以将该案例增加到可疑交易案例数据库当中,系统之后能够对其进行参数学习。该模型的流程示意图如图4所示。
图4 模型实现流程图 6.1 属性参数预处理
反洗钱部门在对洗钱交易行为进行鉴别的时候,需要利用一些其他知识,例如反洗钱知识,对某些跟洗钱无关的属性进行过滤,从而保证洗钱行为监测的高效。这些金融交易数据有时候系统不能直接鉴别,还需经过反洗钱部门的处理,将其转换成能够反应出洗钱特征的有关属性的集合。通常只有值型数据才是RBF神经网络能够处理的数据,因此第一步要做的是将反洗钱属性参数处理为定性的属性参数,按程度统一分类的输入,然后将定性属性参数予以量化。
6.2 学习过程
6.2.1 APC-III聚类算法
通常采用K-means来确定RBF的隐含层,但这种方法具有很多缺点,但APC-III聚类算法能够避免这些问题,其只需对样本集只学习一次,可以说其有很高的学习速率,其聚类半径为:
R0=α1p∑pi=1mini≠j( ‖Xi-Xj‖)
(5)
式(5)中,p是样本个数,α为常数,最后的聚类数由R0的大小决定。APC-III聚类算法的详细描述如下:
输入:训练样本X=xixi∈Rp,i=1,2,…,p
输出:聚类中心ci(i=1,2)
变量:L表示聚类数;ni表示第i个聚类中心拥有的样本数目;ci表示第i个聚类中心;dij表示xj到第i个聚类中心的距离。
(1)初始化:L=1,c1=x1,n1=1;/*对训练集中的每个样本*/
(2)For(j=2;j≤p;i++)/*对每个聚类*/
(3)For(i=1;i≤L;i++)
计算dji;
(4)if(dji≤R0)/*把数据xj加到第i个聚类中心范围*/
ci=(cini+xj)/(nj+1);nj=nj+1;
(5)if(xjic0)/*建立新聚类*/
L=L+1;cL=xj;nL=1;
6.2.2 确定宽度参数
当RBF的中心向量ci确定,Gaussian函数的宽度为:
σi=di2m
(6)
式(6)中,di是第i个中心向量与其他中心向量见的最大距离,m为选取的中心向量个数。
6.2.3 递推最小二乘算法
由于之前梯度下降算法在收敛速度方面表现出减慢,在寻求解决隐含层与输出层之间连接值的问题的时候,其实是一个线性优化问题,所以在本文中采用RLS算法。
设在第k步时,输出向量为:
(k)=1(k),σ,2(k),σ,…,nl(k)T
=1(l1(k)),σ,2(l2k),σ,…,nl(lnlk)T
(7)
第k步中第j个节点的估计输出为:
y∧j(k)=∑wijlli(k),σ
(8)
若实际输出为yj(k),则有误差
εj(k)=yj(k)-y∧j(k)
(9)
权值更新为
wj(k+1)=wj+μ(k)(k)εj(k)1λ(k)·
μ(k)μ(k-1)(k)T(k)μ(k-1)λ(k)+T(k)μ(k-1)(k)
(10)
式(11)中,μ(k)为误差方差阵,λ(k)(0<λ(k)<1)表示遗忘因子,其作用是慢慢的渐减弱当前计算值所受到历史样本对的影响。本文章采用的方法是动态地去调整遗忘因子λ(k)
λ(k)=1-exp-kτ0
(11)
式(11)中,τ0是根据经验进行设定的初始平滑因子。
7 总结
本文中提出基于RBF的反洗钱交易行为的监测模型,这个模型不仅做到了提升了确定洗钱行为的准确率,而且提高了洗钱交易行为的识别率,在不断变化的交易中真正做到能够适应其变化。本文提出的基于APC-II和RLS的RBF神经网络的反洗钱行为交易监测模型,有较低的误检率和更高的检测率,为洗钱交易分析和监测提供了新的思路。
参考文献
[1]晏银香.从反洗钱监管实践透析可疑交易行为核实查证的难点[J].武汉金融,2012,(03).
[2]安晨洪翀.浅谈网络银行的反洗钱监管[J].中国证券期货,2013,(1).