论文部分内容阅读
随着信息技术的发展和互联网的广泛普及,人们对于互联网办公也越来越认同。这股浪潮也推动银行不断加强创新,将越来越多的传统业务搬到网上,并扩展新的应用,为客户提供多渠道的丰富的快捷的服务。同时,随着业务的扩展和市场需求快速变化,网上银行系统代码越来越庞大,版本更新速度也越加频繁。当银行业务系统架构需要升级到银行中间基础平台的最新版本时,需要考虑银行业务系统的规模和对基础平台的依赖程度以评估升级所需要的人力和时间成本。由于系统的复杂性,项目管理人员和开发者很难在短时间内对海量系统代码的版本升级定量地给出准确的工作评估。
自动分析、识别、处理网上银行源码,并给出相应的版本升级评估代价成为了银行中间件新的研究课题。基于实际商业银行的项目需求、定量分析和数据挖掘技术,本文深入探讨源码文件特征,研究源码文件的表达、依赖以及特征提取方法,并提出了从宏观和分类两个方面评估网上银行对基础平台的依赖程度方法来计算其升级所需要耗费的代价。
本文的主要工作及贡献如下:
(1)基于Eclipse平台的JDT和AST技术构建抽象语法树,对源码进行向量化,为定量分析和分类训练做数据准备。
(2)针对源码之间的依赖特性,提出了改进的TFIDF特征权重计算方法,以提高分类处理的准确度。
(3)研究分析了不同的分类方法,采取基于准确率贡献度的分类融合方法进行代价评估。
(4)基于宏观处理和分类处理的版本升级评价方法,并通过与历史经验工作量的对比,帮助项目管理和开发人员提高对项目的整体认识和把控能力。
(5)基于上述的方法,结合商业银行的实际需求,使用定量分析和数据挖掘(文本表达、特征提取、分类训练)开发智能的版本升级评估程序,并将其应用于多家商业银行的日常软件开发和管理中。