论文部分内容阅读
统计分析软件用于对已有业务数据的分析,可以发现数据中隐藏的内在联系和潜在规律,可以有效支持各个行业的业务分析,给予决策者以有效的帮助。一般的统计软件把数据存储、数据整理、统计计算和结果显示集中单机模式上实现。这种构架模式在网络应用高度发展的今天,已不能满足实际应用需要。本文在研究和分析了当前主要的统计软件的基础上,分析了基于三层构架模式设计、开发通用统计分析软件的必要性及其相关技术优势。设计开发了符合中国国情和轨道交通AFC行业特点的数据分析系统。本文研究和实现的三层构架统计分析软件,把数据抽取、整理、统计计算和统计结果显示灵活部署在网络中不同的计算资源上,具有分布式处理技术特征,充分使用网络计算资源,提高计算性能。本文描述的主要研究工作有:1)通过对数据抽取技术的分析,采用元数据概念模型解决跨平台异构数据源数据抽取关键技术;2)在元数据概念模型中提出元数据相关信息的中文语义描述与使用,以规范的行业术语展现数据集市的数据结构信息,方便欲分析数据对象的选用;3)把部分关系运算和统计计算从宿主数据库系统剥离,降低了对业务数据库系统的资源占用;4)提出统计结果时间戳的缓存策略,以有效响应允许时间范围内的并发请求;5)以XML,格式文件定义层间接口协议,具有适用性和可修改性;6)研究和实现因子分析算法,提出其基于奇异值分解理论的改进算法,运用奇异值分解方法与主成分分析相结合的方法来寻找因子,并应用于轨道交通AFC终端设备的故障事件分析。上述研究工作1)至5)是作者参与的研究成果,6)为独立研究成果。本文研究的最终目的是设计和实现“轨道交通AFC运营管理数据分析系统”。该系统于2007年7月12日通过上海市科学技术委员会组织的科研项目验收;2007年8月7日获《科学技术成果证书》(登记号:9312007Y1168);2007年8月30日获国家版权局《计算机软件著作权登记证书》(登记号:2007SR13214)。