论文部分内容阅读
本文内容研究的是中国现代化支付系统中支付模式建模的关键技术,目的是为了从中国现代化支付系统的日常支付信息中发掘出有效的社会金融活动特征,便于相关部门加强对日常金融活动情况的分析力度,通过加强金融监管来满足社会不断发展变化的需要。本文分析了支付系统聚类建模和资金流建模的具体问题,涉及到了如下主要技术内容:支付系统分析模型背景知识的表示、支付系统到支付分析系统的本体映射、传统聚类算法优化、针对概念网络节点的聚类、资金流建模模型的选择、关联规则中规则重要性的判断、支付模式分析系统的设计等。本文对以上各方面进行了较为深入的研究。对于支付系统分析模型背景知识表示方面,本文首先简要讨论了目前模式发现应用中背景知识应用的现状,然后针对银行和通信行业分析系统建模的不足,根据支付信息建模的实际情况提出了使用概念网络来表示支付信息的背景知识,以发现更有实际意义的模式。对于本体映射方面,本文先是分析了支付业务处理系统到支付模式分析系统的本体映射,然后概要说明了目前常用的本体映射方法,接着提出了在支付模式发现研究中使用的两种不同的本体映射方法:基于概念粒度规格化映射方法和基于统计的方法,同时本文讨论了它们的实现算法。在传统聚类算法优化方面,本文首先通过实验的方法比较了基于距离的经典聚类算法与基于概率的EM算法的执行结果差异,说明了基于概率的聚类算法具有更好的聚类效果。随后,针对EM算法,本文提出了一种一遍扫描数据库就能得出聚类结果的改进EM算法。最后本文通过实验比较了标准的EM算法和改进的EM算法的执行速度和执行精度。对于概念网络节点的聚类,本文提出了概念网络节点聚类的两个步骤,一是对概念网络的节点属性应用传统的聚类算法进行聚类;二是对节点的关系属性进行计算,以此来剪裁聚类空间,发掘更符合实际情况的分类。通过两阶段聚类方法弥补了传统聚类算法难以处理关系属性从而丢失细节信息的不足。资金流模式建模方面,本文首先研究和比较了目前各种主要的关系发现算法,指出关联规则发现算法是本文应用的最好选择,其中,本文比较独特的从随机概率的理论角度分析了PageRank技术的特点。此外,对于关联规则,本文还提出了一种评判规则有用性的指标,大大提高了结果规则集合的可靠性和实用性。系统实现方面,本文分析了模式发现系统的框架结构和算法实现的框架结构,随后在此基础上构造了原型系统,并且应用该原型系统针对八十多万条测试数据,给出了银行类别聚类、业务类型角度的资金流模式、地区角度的资金流模式的例子。本文的意义在于,提出并且成功的应用了不同的方法来实现了中国现代化支付系统支付信息模式建模的多种功能,并且这些方法对于解决其他模式发现系统的关键问题也有一定的参考和指导意义。