论文部分内容阅读
HS(Harmonized System)目录是一种国际通用的进出口商品分类体系,在国际贸易中得到了广泛应用。目前,HS目录已成为执行各类监管政策和进行进出口统计的基本体系,而HS编码则是海关和检验检疫部门判断商品适用政策的直接依据。但是,HS编码的查询和确认工作枯燥耗时,且容易出现故意和非故意的错误,成为当前影响货物通关效率的重要因素。因此,HS编码的自动查询对实现检验检疫业务流程自动化和提高通关效率具有巨大意义。
为此,复旦大学软件学院电子商务研究中心和上海市检验检疫局机场分局合作,研究并提出了一套以实用、准确、高效为导向,面向进出口领域HS编码智能查询系统的设计方案。作为方案中的重要构件,作者负责了HS知识库设计与原型系统实现。
本文首先基于现有《HS编码目录》的结构和内容,分析了HS知识库的知识组织和表达方式,其设计借鉴本体的概念关系描述方法,支持修饰关系、否定关系、限制关系。该HS知识库可同时支持标准HS目录体系和检验检疫历史工作数据两个知识来源,通过对HS编码目录特征词的提取,并利用基于品类聚类的关联规则挖掘算法对历史工作数据的处理,实现了知识库的半自动构建。
同时,论文基于HS知识库,提出了高效、准确的HS编码查询处理方法和可信度算法,包括对商品名进行语义识别,基于知识库进行查询推理得到可能结果集,计算出相关可信度,并进行结果后处理的整个过程。
本文中还实现了HS知识库,并基于J2EE开发了的HS编码智能查询原型系统。系统的实现采用分层架构,结构清晰;缓存和PL/SQL技术的使用使系统具有很高的运行效率;系统对外提供包括B/S和Web服务两套前端支持,可以方便的实现跨平台集成;大量开源组件的使用降低了系统构建费用,也使系统搭建方便快捷。本文中对系统的双前端架构设计、开发实现、系统部署和Web服务发布进行了分析。从HS编码智能查询原型系统的测试以及在几大快件公司试运行情况看来,该系统具有较高的查询准确率,批处理的查询调用方式具有很高的处理效率,所发布的Web服务也可以方便集成到已有应用中,具有皂好的应用前景。