论文部分内容阅读
海关对报关单的审核通常是建立在了解商品属性的基础上,但审单关员不可能对所有商品都有所了解,因此必须对审单商品进行分组审核。一份报关单往往含有多项商品,涉及多个类别,这就需由不同类别的审单专家分别进行审核,这在无形中降低了报关单的流转速度,增加了审单关员的工作强度,制约了通关效率。如何对审单商品进行科学合理分组,已经成为海关当前研究的重要课题。 关联规则是数据挖掘研究中的一个重要分支,是对数据库中某些特定事件同时发生的概率的简单陈述。关联规则挖掘使用特定方法发现数据库中潜藏的关联规则,其在商业等领域的成功应用,使它成为数据挖掘中最要的研究内容,但关联规则在海关审单商品分组中的应用还是空白。 本文分析了现行海关人工审单商品分组方法的缺陷,提出了一个以商品关联规则为依托、辅以专业知识调整的全新的海关人工审单商品分组方法。最后结合Apriori算法,以大连海关2005年进出口报关单数据库为原始数据源,以从商品编码中发现频繁项集为分组基础,进行了实例验证。基于关联规则的分组方法较原方法相比,极大减少了报关单电子数据的流转次数,提高了海关通关效率。