基于可疑金融交易识别的离群模式挖掘研究

被引量 : 24次 | 上传用户:toerrisme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的选题来源于对可疑金融交易行为的识别与监控理论原型体系研究。主要研究内容是利用机器学习和系统复杂性的理论和方法,从海量和复杂的金融交易数据中学习和识别客户金融交易的行为模式,从而挖掘出那些明显偏离正常行为范式的所谓离群模式,实现对涉嫌洗钱或欺诈的可疑金融交易行为的计算机自动甄别和监管。金融系统是一个非常复杂的大系统,一直以来对金融系统可疑交易判断的研究采用的大多是线性化和在严格假设条件下的简化模型,这样的确使问题得到了简化,但在实践过程中却导致高漏检率和高误报率。本文根据金融交易的非线性机制,引入了基于系统复杂性理论的混沌分析方法,对由内在确定动力学机制产生的具有外部随机性特征的金融交易时间序列进行分析和判别,主要研究成果与创新如下:(1)金融交易的混沌属性分析混沌行为是由确定性系统产生,但其行为却表现为类似随机的,具有短期可预测但长期不可预测的特性。本文利用相空间重构理论实现对金融时间序列的混沌属性分析,采用互信息法计算出最优时延,假近邻法计算最优嵌入维,轨道跟踪法求取最大Lvapunov指数,基于真实数据的实验结果表明,金融交易时间序列存在有限的关联维和一个正的最大Lyapunov指数,证实了对金融交易数据的时间序列进行混沌方法建模的可行性。(2)基于混沌原理的金融交易行为产生机制识别本文提出利用对金融交易行为的机制进行识别以获得对离群交易行为的预测。混沌数据所具有的短期可预测性为混沌背景中的细微差别行为检测提供了新思路。本文基于Takens定理重构混沌背景信号相空间,采用RBF神经网络对正常金融交易数据建立预测模型,以此对可疑金融交易数据进行预测,由于正常金融交易与可疑金融交易内在产生机理存在本质差异,因此可疑金融交易必然存在较大的预测误差。通过理想混沌时间序列与实际金融数据的仿真实验表明,基于混沌的误差检测方法对于离群模式能够有效检出。(3)金融数据的特征提取与相似性度量特征提取的目的是获得能够被机器识别的数学特征。区别于传统的金融时间序列的相似性度量方法,提出了一种基于RBF神经网络一步预测误差序列特征提取与相似性度量方法。该方法将时间序列之间的相似性度量换化成特征矢量之间的相似性度量,且特征矢量综合考虑了连续的时域功率特征和离散的客户背景特征。实验证明该方法相对于传统的直接距离、傅立叶变换、ARMA模型法具有明显优势。同时为了解决可疑交易数据分类中的异构数据集相似性度量问题,提出采用异构特征向量的距离度量函数HVDM以满足支持向量机自动分类要求。(4)基于一类支持向量机的离群分类判别针对金融交易数据量大、无训练集的特点,利用基于统计学习理论的一类支持向量机实现基于无监督的离群分类。最后用基于异构数据集距离度量HVDM的RBF形核函数,训练一类支持向量机,仿真数据以及实际金融数据的离群检测实验证明了该方法的有效性。通过上述四步前后相互衔接、具有严密逻辑联系的离群模式挖掘工作,构成了一套具备针对复杂金融交易行为内在细微机制差别的离群模式完整挖掘体系,这一体系还可推广应用于信号处理、网络入侵检测、危机预警、健康普查、财务审计、电子商务等众多应用领域。
其他文献
国防,就是为捍卫国家主权、领土完整与安全,防备外来侵略和颠覆而进行的军事及与军事有关的政治、经济、文化等方面的建设和斗争。所谓国防思想也就是在国防建设和斗争中所形成
以太湖西五里湖为研究对象,研究了环保疏浚区、环保疏浚并水生植被重建示范区、退渔还湖区及对照区沉积物中磷、氮的含量及其不同形态的分布特征,同时分析了水质状况。结果表
污染土壤修复标准是土壤环境标准体系中一个不可缺少的组成部分。为了响应污染土壤修复效果评定与污染应急事件处理的需求,我国需要尽快制定符合自身实际情况的污染土壤修复
黄酮甙,花色甙是茶叶中的一类重要的水溶性色素,对成茶汤色、叶底及茶叶品质有显著的影响,同时其本身也具有多种药理功效。本文建立了反相高效液相色谱测定茶叶中杨梅素、槲皮素
工作研究是提高生产率并降低生产成本的首选技术,是精益生产(LP)和企业资源计划(ERP)管理等的基础,因此对板式家具生产系统进行现场工作研究具有重要的意义。本文旨在通过一系
纪南城遗址松柏区30号台基(简称"松30号台基")2011~2012年发掘获取了一批东周和北宋时期遗存,其中东周时期遗存以窑址、房基和灰坑为主。遗存主体以位于火龙堤下的Y1、Y2两座
教学模式是一定的教学理念或教学思想的反映,是一定理论指导下的教学过程常态化范式。应用型本科院校相关专业职业化教学模式的建构,必须有明确的学科(专业)定位和人才培养目
采用田间小区试验方法,通过田间实地监测,在自然降雨条件下,对南方典型红壤坡耕地采取不同施肥量及不同耕作方式对作物养分利用率及地表径流的影响进行了研究。结果表明,萝卜
明傩与明剧麻国钧傩,在变化中求得了生存。周代的傩入于礼,为礼仪的一种,但不入于祭祀,非祭祀仪式,因此巫不入傩。汉、南北朝、隋各代的傩仪,都在不同程度,不同方面有别于前代。唐傩
以缓和曲线为例,通过Excel的表格特性进行坐标计算,有效地克服了使用计算机语言开发程序的过程和开发周期长的缺陷.充分利用Excel强大的功能和良好的人机交互对话界面和函数