政府采购数据多要素关联分析算法研究与改进

来源 :西安石油大学 | 被引量 : 0次 | 上传用户:leefenbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于我国关于加入GPA(Government Procurement Agreement)谈判进程的加速以及政府采购改革的持续深入,政府采购规模逐渐增加[1]。政府采购在经济发展中也扮演愈发重要的角色,政府采购数据蕴藏着一定价值的信息。本文使用关联规则Apriori算法对政府采购数据进行处理,找出政府采购数据要素之间强关联关系,为政府采购工作的反腐倡廉提供参考的依据。随着政府采购产生了越来越多的政府采购数据,传统的数据挖掘手段对大量数据的分析显得无能为力,采用大数据与数据挖掘手段处理政府采购数据是本文研究的目标。为了提高原始Apriori算法在处理大量数据的效率以及使用Apriori算法对政府采购数据进行分析,采取基于Hadoop平台提高Apriori算法处理数据的效率。文章中详细描述了Apriori算法、基于Hadoop的h-Apriori以及改进后的mh-Apriori算法,并实现了这三种算法,采用数据集进行算法效率的验证。论文的实验分为三组,第一组,第二组实验结果说明数据集chess与mushroom在三种算法的处理下,基于Hadoop平台算法花费的时间要略长于原始Apriori算法,这是因为chess与mushroom数据集不大,而Hadoop处理少量数据并不具备优势。第三组实验结果说明基于Hadoop的两种算法处理accidents数据集效率明显优于原始Apriori算法,且mh-Apriori处理数据效率优于h-Apriori算法,改进后算法提高了大规模数据的处理效率。文章还阐述了关联规则可视化知识,并采用VOCAR方法对得到的强关联关系进行展示,更清楚展示各要素之间关联关系,为政府采购工作的反腐倡廉提供参考的依据。
其他文献
通过matlab的符号微分方程解法求出汽车滑行运动方程,在给定的阻力系数范围内找到计算数据和采样曲线之间有最小平均偏差的阻力系数,也就是最能拟合滑行采样数据的滚动阻力系
晴雯是红楼梦中生命历程最短的悲剧人物。本文运用社会角色理论、自我同一性理论对晴雯的悲剧命运进行层层剖析。通过对晴雯"拒客""跌扇子"等经典事件的解读分析造成晴雯悲剧命运
<正>近年来,物业管理的服务领域己从一般的房屋维修、保安、保洁等向房地产中介、装饰装修等多方面发展.可以说物业管理已深入到居民生活的诸多方面.(一)物业管理的功能在楼
目的探讨个性化心理干预在妇科围术期患者中的应用价值。方法选取我院收治的86例妇科围术期患者,分为对照组(39例)和实验组(47例)。对照组采用常规护理,实验组采用个性化心理
人力资源战略规划是管理主体基于组织战略需要,在人力资源管理层面的战略布局与筹划.人力资源战略规划不仅是一种战略性的规划,更是对人力资源管理系统未来的一种谋划.人力资
目的通过研究眼睑肿物的临床病理资料,探讨眼睑肿物的病理类型分布及临床特点。方法收集2003年10月至2014年1月在解放军总医院眼科进行手术的763例眼睑肿物患者的临床病理资
我国基础教育正从应试教育向素质教育转变,职业教育的发展处于困难时期,这些根本性的问题正影响着职业学校的德育工作。一、德育工作面临的挑战1市场经济对职校德育工作的影响
随着中国艺术的持续发展,女性艺术越来越为人们所关注。因此有必要从女性主义的渊源入手,在中国妇女解放运动的历史框架中,对发展中的当代女性艺术作出恰当的分析与评价。
目的分析心电图a VR导联ST段改变对急性心肌梗死的预测价值。方法回顾性选择2014年1月至2015年3月本院80例急性心肌梗死患者临床资料,所有患者均行十二导联心电图检查,并在1
“四上”企业是现阶段我国统计系统使用的名称,“四上”企业在国民经济发展中占主导地位,其行业结构、企业单位数量的变动反映出整体经济的行业结构和发展状态。本文主要从分