论文部分内容阅读
【摘 要】本文论述了住房公积金管理系统的研究设计过程。运用数据库原理设计实现了住房公积金管理中心的单位开户、个人开户、缴存基数调整等业务需求。分析了FP_growth算法原理与实现的过程并应用到公积金管理中,实现有效地帮助公积金管理中心以及相关部门对公积金业务的管理,对归集资金的控制与分配,提高公积金业务办理效率。
【关键词】公积金 数据挖掘 关联规则 FP_growth算法
一、研究背景
目前公积金业务的信息化已成为一种必然的趋势。建立完善的信息化平台,有效的提高业务的流程操作,通过规范住房公积金管理运作、促进住房公积金事业健康发展的需要,最终达到提高业务工作效率和优质服务的目标。
现在我国各地住房公积金行业数据化构建较为落后,处于原始数据阶段。对信息数据的处理、业务需求的预测分析、住房公积金发展趋势和状况相应的分析与预测,从而不能准确寻找目标顾客群以提高资金使用率,这就要求住房问题迫切的需求改变。
二、技术概述
本文设计一种UniEAP平台,基于UniEAP平台实现公积金核心业务系统。首先要形成模型,在平台中提取出可实现配置单元,建立组件库或方法库,然后通过UniEAP的管理和配置,使它适应各种纷繁复杂的业务和公积金算法。
基于UniEAP平台的应用
(一)做出系统分析,抽取出原子对象;
(二)整合公积金业务流程,抽取关键对象,
(三)从原子因素分析,找出相应的属性和操作方法。
这样,就能在以后的应用中实现各种复杂的业务流程,适应灵活多变的政策变更。
三、系统结构设计
住房公积金的产生就是为了筹集资金进行合理化分配。业务管理涉及职工个人、职工单位、受委托银行和住房公积金管理中心等多个法律关系主体。
公积金核心业务有很多,本文中主要对三个核心业务模块进行分析。即单位账户管理模块、个人账户管理模块、缴存基数管理模块。系统功能层次图如下所示。
四、FP_growth算法
通过对数据挖掘技术的分析,并根据当前对住房公积金管理系统的数据挖掘需求,确定使用FP_growth算法进行住房公积金管理系统的设计与开发。
(一)FP_growth算法步骤
FP的全称是Frequent Pattern,在算法中使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构。FP-growth算法的步骤:
1.扫描数据库,生成的FP-tree,得到支持度降序排列的L1;
2.通过这种排序,构建最初的FP—tree;
3.对FP-tree进行升序的挖掘,出现频繁的项更可能被共享。
(二)FP-growth算法实现方法
通过对数据库进行一次扫描生成单频繁项集,计算所有单个项目的支持度,生成长度为l的频繁项目集L。降序排列项目集L。删除非频繁项,生成单频繁项集FP-1,算法如下:
Algorithm FP-I
Input: 事务数据库TD,最小支持度min_sup
Output:TD中的频繁1项集Ll和排序后的TD
Method:Call FP-1(TD,min_sup)
Procedure FP-1(TD,min_sup)
{ L1={largel-itemsets};
for all transactions t∈TD
L1[ti]++;
for(k=l;k<=n;k++)
if(L1[k] L1[k]=0;
降序排列L。:
for all transactions t∈TD
按L1顺序排列t中属性;
return 重新排列过的TD与L1;}
并且构建最初的FP_tree在第二趟扫描中,生成FP_tree。生成FP_tree算法FP-2如下:
Algorithm FP-2
Input: 事务数据库TD,Ll
Output: FP_tree的根T和频繁l项集Ll的FH
Method:Call FP-2(TD,L1)
Procedure FP-2(TD,LI)
{T=Φ;
for all transactions ti∈TD
将ti中的频繁单项按L1中顺序排列成[x|X];
call Insert-Tree([x|X],T);
return T与FH;}
(三)基本思路
不断地迭代FP-tree的构造和投影过程。
构建各单频繁项的条件模式基对L1中各单频繁项,对于每个频繁项,构造它的条件投影数据库和投影FP-tree。对每个新构建的FP-tree重复这个过程,直到构造的新FP-tree为空,或者只包含一条路径。当构造的FP-tree为空时,其前缀即为频繁模式;当只包含一条路径时,通过枚举所有可能组合并与此树的前缀连接即可得到频繁模式。
本文对住房公积金决策支持系统的设计理念是将现有的公积金核心业务系统改造成为一个安全、可靠、易于管理、易于维护、技术先进的应用系统。将关联规则挖掘算法应用现实的住房公积金管理系统中,为群众提供更加优质、方便的服务。辅助各部门进行收缴公积金、银行存款投资和规划商品住房的建设等决策。
参考文献:
[1]陈旭辉.HIS构架及基于HIS的数据挖掘.安徽理工大学硕士学位论文.2009
[2]胡文瑜,孙志挥.数据挖掘取样方法研究.计算机研究与发展,2011.(1)
[3]王爱平,王占凤.数据挖掘中常用关联规则挖掘算法.计算机技术与发展,2010.(4)
[4]陈永当,王钰鑫.基于用户访问信息的数据挖掘方法及其算法.计算机工程与应用,2012.(15)
【关键词】公积金 数据挖掘 关联规则 FP_growth算法
一、研究背景
目前公积金业务的信息化已成为一种必然的趋势。建立完善的信息化平台,有效的提高业务的流程操作,通过规范住房公积金管理运作、促进住房公积金事业健康发展的需要,最终达到提高业务工作效率和优质服务的目标。
现在我国各地住房公积金行业数据化构建较为落后,处于原始数据阶段。对信息数据的处理、业务需求的预测分析、住房公积金发展趋势和状况相应的分析与预测,从而不能准确寻找目标顾客群以提高资金使用率,这就要求住房问题迫切的需求改变。
二、技术概述
本文设计一种UniEAP平台,基于UniEAP平台实现公积金核心业务系统。首先要形成模型,在平台中提取出可实现配置单元,建立组件库或方法库,然后通过UniEAP的管理和配置,使它适应各种纷繁复杂的业务和公积金算法。
基于UniEAP平台的应用
(一)做出系统分析,抽取出原子对象;
(二)整合公积金业务流程,抽取关键对象,
(三)从原子因素分析,找出相应的属性和操作方法。
这样,就能在以后的应用中实现各种复杂的业务流程,适应灵活多变的政策变更。
三、系统结构设计
住房公积金的产生就是为了筹集资金进行合理化分配。业务管理涉及职工个人、职工单位、受委托银行和住房公积金管理中心等多个法律关系主体。
公积金核心业务有很多,本文中主要对三个核心业务模块进行分析。即单位账户管理模块、个人账户管理模块、缴存基数管理模块。系统功能层次图如下所示。
四、FP_growth算法
通过对数据挖掘技术的分析,并根据当前对住房公积金管理系统的数据挖掘需求,确定使用FP_growth算法进行住房公积金管理系统的设计与开发。
(一)FP_growth算法步骤
FP的全称是Frequent Pattern,在算法中使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构。FP-growth算法的步骤:
1.扫描数据库,生成的FP-tree,得到支持度降序排列的L1;
2.通过这种排序,构建最初的FP—tree;
3.对FP-tree进行升序的挖掘,出现频繁的项更可能被共享。
(二)FP-growth算法实现方法
通过对数据库进行一次扫描生成单频繁项集,计算所有单个项目的支持度,生成长度为l的频繁项目集L。降序排列项目集L。删除非频繁项,生成单频繁项集FP-1,算法如下:
Algorithm FP-I
Input: 事务数据库TD,最小支持度min_sup
Output:TD中的频繁1项集Ll和排序后的TD
Method:Call FP-1(TD,min_sup)
Procedure FP-1(TD,min_sup)
{ L1={largel-itemsets};
for all transactions t∈TD
L1[ti]++;
for(k=l;k<=n;k++)
if(L1[k]
降序排列L。:
for all transactions t∈TD
按L1顺序排列t中属性;
return 重新排列过的TD与L1;}
并且构建最初的FP_tree在第二趟扫描中,生成FP_tree。生成FP_tree算法FP-2如下:
Algorithm FP-2
Input: 事务数据库TD,Ll
Output: FP_tree的根T和频繁l项集Ll的FH
Method:Call FP-2(TD,L1)
Procedure FP-2(TD,LI)
{T=Φ;
for all transactions ti∈TD
将ti中的频繁单项按L1中顺序排列成[x|X];
call Insert-Tree([x|X],T);
return T与FH;}
(三)基本思路
不断地迭代FP-tree的构造和投影过程。
构建各单频繁项的条件模式基对L1中各单频繁项,对于每个频繁项,构造它的条件投影数据库和投影FP-tree。对每个新构建的FP-tree重复这个过程,直到构造的新FP-tree为空,或者只包含一条路径。当构造的FP-tree为空时,其前缀即为频繁模式;当只包含一条路径时,通过枚举所有可能组合并与此树的前缀连接即可得到频繁模式。
本文对住房公积金决策支持系统的设计理念是将现有的公积金核心业务系统改造成为一个安全、可靠、易于管理、易于维护、技术先进的应用系统。将关联规则挖掘算法应用现实的住房公积金管理系统中,为群众提供更加优质、方便的服务。辅助各部门进行收缴公积金、银行存款投资和规划商品住房的建设等决策。
参考文献:
[1]陈旭辉.HIS构架及基于HIS的数据挖掘.安徽理工大学硕士学位论文.2009
[2]胡文瑜,孙志挥.数据挖掘取样方法研究.计算机研究与发展,2011.(1)
[3]王爱平,王占凤.数据挖掘中常用关联规则挖掘算法.计算机技术与发展,2010.(4)
[4]陈永当,王钰鑫.基于用户访问信息的数据挖掘方法及其算法.计算机工程与应用,2012.(15)