论文部分内容阅读
当前,证券行业随着牛市不断地快速升温,业务量也在节节攀升,那么如何保障证券集中交易系统的安全稳定运行呢?
1993年,世贸中心大楼发生爆炸,爆炸前约有350家企业在该楼中工作。1年后,再回到世贸大楼的公司变成150家,有200家企业由于无法存取重要的信息系统而倒闭、消失。1995年1月,日本神户地区大地震,摧毁了1700部电脑系统,造成1000多亿美元的损失。1996年1月,美国南加州洛杉矶6.6级地震损坏的计算机系统和网络,造成300亿美元的损失。1999年6月,美国一家著名的商业网站主机宕机,由于24小时内未能恢复访问,两个星期后,该公司的股票值下跌了36%……
由此可见,信息系统的灾难对于现代社会的影响是极其深远的,保证信息系统的安全不间断工作成为各个行业信息化建设的重要关注点。当前,证券行业随着牛市不断地快速升温,业务量也在节节攀升,那么如何保障证券集中交易系统的安全稳定运行呢?这是证券行业信息管理部门迫切需要考虑和解决的问题。
容灾系统的四大需求
证券交易系统的建设,对安全性、可靠性和业务连续性等方面提出了越来越高的要求,因为该系统是证券业得以正常运转的前提和保障。
证券交易系统的运行涉及数以百亿计的资金和众多客户,并且是一种实时交易行为,因此,系统的安全与稳定尤为重要。
因此,相比其他行业,证券交易系统中的安全灾备系统在需求上存在非常明显的特点,主要表现在如下几个方面。
可靠性要求非常高 证券集中交易系统的运行必须保证系统数据复制极高的可靠性,必须保证数据的准确。
要求延迟尽量小 因为大量的实时交易只有被及时地复制到容灾系统上以后,才具有抵御生产系统上各种风险的能力,因此,证券行业在复制的实时性上必须做到秒级的延迟,并且尽可能地缩短延迟时间。
带宽有限 大量的证券用户将租用电信线路,目前来看,各大证券行业的带宽大都只能确保在2M左右,如何在如此有限的带宽上实现实时复制,减少数据延迟,加快数据同步,将是非常重要的。
交易查询分离 为了提高证券集中交易系统的高峰期业务处理能力,提高系统查询响应速度及客户服务质量,证券业普遍要求将查询与交易分离,这样才能够获得更高的性能价格比。
灾备一体化
证券行业相关系统中的运营支撑系统主要面临的风险有两个:计划内风险和计划外风险。
计划内的风险包括应用软件的升级、备份、恢复、归档,数据中心的迁移、整合、测试、容灾演习等。
计划外的风险包括系统处理能力下降,人为操作故障,错误执行程序或命令,错误执行程序或命令造成系统瘫痪和系统软硬件故障,生产地点的灾难等。
业界研究表明,在以上各种导致系统下线的原因中,40%的系统灾难是由于人员操作失误而引起的;40%的系统灾难是由于应用软件的问题所引起的;20%的系统灾难是由于设备的物理原因所引起的,如硬件失效、掉电、自然灾害等。
由此可见,系统计划外风险主要是由于人为操作失误和应用软件问题造成的,而真正由于自然灾难带来的风险概率非常小。
系统下线的原因主要可分为两种:逻辑错误和物理错误。逻辑错误和物理错误的防范方法也应该不同,主要有以下两种:备份和容灾。
备份技术 备份技术是对业务运行过程中某一时刻的生产数据的保护。该保护在业务正常运行时生成,主要预防业务因生产数据的逻辑故障而造成的停顿。当生产数据因人为误操作或病毒破坏而损坏时,可以利用该定点拷贝将业务状态恢复到损坏发生时刻的正常业务状态。在具体的业务恢复过程中,辅以其他手段,可补充自定点拷贝生成时刻起至业务中断时这段时间业务运行新产生的生产数据。
容灾技术 容灾技术是对业务状态数据进行持续不断的复制。主要是为了预防业务系统遭遇灾难(如停电、火灾等)而造成物理错误时恢复应用进程。当灾难发生时,连续复制过程也终止。在进行业务恢复时利用复制结果可以恢复停机现场的生产数据,从而恢复业务。
实际上,业务系统不能运行的主要原因也由这两部分组成,因此在数据保护方面需要采用容灾和备份相结合的原则。
构筑三大系统
DSG公司针对证券业的数据保护需求,推出了两类数据保护产品:RealSync(容灾产品)和SnapAssure(备份产品)。
RealSync 该产品是通过交易实时同步的方式实现数据备份,其目的是保护证券系统的业务连续性。当生产系统出现硬件故障、数据库故障以及环境故障等而不能正常提供服务时,可在备份系统上快速接管,以确保业务的连续性。
SnapAssure 该产品是每天进行一次数据备份,其目的是保护证券系统的数据安全。当生产系统出现因人为误操作、应用程序错误或者其他故障导致数据丢失时,可从备份系统上找回这些数据,而且可以找回一段时间以前的数据。
在某证券公司,实现了SnapAssure RealSync的一体化系统保护架构,如图所示。
该公司采用了DSG SnapAssure RealSync灾备一体化的模式,系统由本地备份系统、本地容灾系统和异地容灾系统三部分组成。
本地容灾系统 采用DSG RealSync实时复制技术将交易系统的数据实时同步到本地容灾系统上。本地服务器上的数据延迟一般可控制在3秒左右。
本地备份系统 本地备份系统采用DSG SnapAssure产品,将集中交易的数据备份过来,形成两周的备份版本。通过这些备份版本,可以将数据恢复到14天内的任意一个时间点。
异地容灾系统 采用DSG RealSync实时复制技术将交易系统的数据实时同步到异地容灾系统上。
结束语:信息化的确是金钱的游戏
证券行业苦熬5年,证券信息化便偃旗息鼓5年,证券行业一朝风生水起,证券信息化便成大热门。一时之间,政府给与指导,用户不断加大投入,厂商开发新系统,专家多有建议,行业大会小会不断……笔者不由感叹,今天的中国,乃至全世界,信息化的确是金钱的游戏。
假若证券行业不是如今日这般红火,莫说对系统升级没有需求,即使系统真有升级需求,恐怕也会被一句“没有预算”打发过去。当需求不是跟直接利益挂钩之时,信息化往往是最先被牺牲的部分。如今证券行业信息化系统需求不断升级,信息化工作也自然成了重中之重,老板为了保住更多的利益,在现有的大笔收入中拨出上千万乃至上亿作为信息化预算,自是连眼睛也不眨一下。此时彼时,恐怕只有证券公司CIO们才最能品味其中的酸甜苦辣。
不过,银行、证券、保险这三大金融行业情况特殊,其信息化系统也正是企业的生产系统,是企业的命脉所在,因此业务一旦发展,第一个想到的就是信息化建设。换了其他行业,信息化仅仅作为管理的辅助手段与工具,CIO们一路走来更加不易。企业没有钱的时候,自然不会给信息化部门预算,企业一帆风顺的时候,更是不会想到信息化,非是要到企业经历一番大发展,积累一定财力,而又遭遇瓶颈无法解决之后,才会借助信息化手段。
然而亡羊补牢终究不如未雨绸缪,只是不知道公司老总有几个有这样的远见,也不知道有几个CIO能有这样的能力,在公司预算不足的时候,不仅能够虎口拔牙争取预算,还能在企业预算充足的时候,巧舌如簧让公司老板心甘情愿为信息化未来买单。
1993年,世贸中心大楼发生爆炸,爆炸前约有350家企业在该楼中工作。1年后,再回到世贸大楼的公司变成150家,有200家企业由于无法存取重要的信息系统而倒闭、消失。1995年1月,日本神户地区大地震,摧毁了1700部电脑系统,造成1000多亿美元的损失。1996年1月,美国南加州洛杉矶6.6级地震损坏的计算机系统和网络,造成300亿美元的损失。1999年6月,美国一家著名的商业网站主机宕机,由于24小时内未能恢复访问,两个星期后,该公司的股票值下跌了36%……
由此可见,信息系统的灾难对于现代社会的影响是极其深远的,保证信息系统的安全不间断工作成为各个行业信息化建设的重要关注点。当前,证券行业随着牛市不断地快速升温,业务量也在节节攀升,那么如何保障证券集中交易系统的安全稳定运行呢?这是证券行业信息管理部门迫切需要考虑和解决的问题。
容灾系统的四大需求
证券交易系统的建设,对安全性、可靠性和业务连续性等方面提出了越来越高的要求,因为该系统是证券业得以正常运转的前提和保障。
证券交易系统的运行涉及数以百亿计的资金和众多客户,并且是一种实时交易行为,因此,系统的安全与稳定尤为重要。
因此,相比其他行业,证券交易系统中的安全灾备系统在需求上存在非常明显的特点,主要表现在如下几个方面。
可靠性要求非常高 证券集中交易系统的运行必须保证系统数据复制极高的可靠性,必须保证数据的准确。
要求延迟尽量小 因为大量的实时交易只有被及时地复制到容灾系统上以后,才具有抵御生产系统上各种风险的能力,因此,证券行业在复制的实时性上必须做到秒级的延迟,并且尽可能地缩短延迟时间。
带宽有限 大量的证券用户将租用电信线路,目前来看,各大证券行业的带宽大都只能确保在2M左右,如何在如此有限的带宽上实现实时复制,减少数据延迟,加快数据同步,将是非常重要的。
交易查询分离 为了提高证券集中交易系统的高峰期业务处理能力,提高系统查询响应速度及客户服务质量,证券业普遍要求将查询与交易分离,这样才能够获得更高的性能价格比。
灾备一体化
证券行业相关系统中的运营支撑系统主要面临的风险有两个:计划内风险和计划外风险。
计划内的风险包括应用软件的升级、备份、恢复、归档,数据中心的迁移、整合、测试、容灾演习等。
计划外的风险包括系统处理能力下降,人为操作故障,错误执行程序或命令,错误执行程序或命令造成系统瘫痪和系统软硬件故障,生产地点的灾难等。
业界研究表明,在以上各种导致系统下线的原因中,40%的系统灾难是由于人员操作失误而引起的;40%的系统灾难是由于应用软件的问题所引起的;20%的系统灾难是由于设备的物理原因所引起的,如硬件失效、掉电、自然灾害等。
由此可见,系统计划外风险主要是由于人为操作失误和应用软件问题造成的,而真正由于自然灾难带来的风险概率非常小。
系统下线的原因主要可分为两种:逻辑错误和物理错误。逻辑错误和物理错误的防范方法也应该不同,主要有以下两种:备份和容灾。
备份技术 备份技术是对业务运行过程中某一时刻的生产数据的保护。该保护在业务正常运行时生成,主要预防业务因生产数据的逻辑故障而造成的停顿。当生产数据因人为误操作或病毒破坏而损坏时,可以利用该定点拷贝将业务状态恢复到损坏发生时刻的正常业务状态。在具体的业务恢复过程中,辅以其他手段,可补充自定点拷贝生成时刻起至业务中断时这段时间业务运行新产生的生产数据。
容灾技术 容灾技术是对业务状态数据进行持续不断的复制。主要是为了预防业务系统遭遇灾难(如停电、火灾等)而造成物理错误时恢复应用进程。当灾难发生时,连续复制过程也终止。在进行业务恢复时利用复制结果可以恢复停机现场的生产数据,从而恢复业务。
实际上,业务系统不能运行的主要原因也由这两部分组成,因此在数据保护方面需要采用容灾和备份相结合的原则。
构筑三大系统
DSG公司针对证券业的数据保护需求,推出了两类数据保护产品:RealSync(容灾产品)和SnapAssure(备份产品)。
RealSync 该产品是通过交易实时同步的方式实现数据备份,其目的是保护证券系统的业务连续性。当生产系统出现硬件故障、数据库故障以及环境故障等而不能正常提供服务时,可在备份系统上快速接管,以确保业务的连续性。
SnapAssure 该产品是每天进行一次数据备份,其目的是保护证券系统的数据安全。当生产系统出现因人为误操作、应用程序错误或者其他故障导致数据丢失时,可从备份系统上找回这些数据,而且可以找回一段时间以前的数据。
在某证券公司,实现了SnapAssure RealSync的一体化系统保护架构,如图所示。
该公司采用了DSG SnapAssure RealSync灾备一体化的模式,系统由本地备份系统、本地容灾系统和异地容灾系统三部分组成。
本地容灾系统 采用DSG RealSync实时复制技术将交易系统的数据实时同步到本地容灾系统上。本地服务器上的数据延迟一般可控制在3秒左右。
本地备份系统 本地备份系统采用DSG SnapAssure产品,将集中交易的数据备份过来,形成两周的备份版本。通过这些备份版本,可以将数据恢复到14天内的任意一个时间点。
异地容灾系统 采用DSG RealSync实时复制技术将交易系统的数据实时同步到异地容灾系统上。
结束语:信息化的确是金钱的游戏
证券行业苦熬5年,证券信息化便偃旗息鼓5年,证券行业一朝风生水起,证券信息化便成大热门。一时之间,政府给与指导,用户不断加大投入,厂商开发新系统,专家多有建议,行业大会小会不断……笔者不由感叹,今天的中国,乃至全世界,信息化的确是金钱的游戏。
假若证券行业不是如今日这般红火,莫说对系统升级没有需求,即使系统真有升级需求,恐怕也会被一句“没有预算”打发过去。当需求不是跟直接利益挂钩之时,信息化往往是最先被牺牲的部分。如今证券行业信息化系统需求不断升级,信息化工作也自然成了重中之重,老板为了保住更多的利益,在现有的大笔收入中拨出上千万乃至上亿作为信息化预算,自是连眼睛也不眨一下。此时彼时,恐怕只有证券公司CIO们才最能品味其中的酸甜苦辣。
不过,银行、证券、保险这三大金融行业情况特殊,其信息化系统也正是企业的生产系统,是企业的命脉所在,因此业务一旦发展,第一个想到的就是信息化建设。换了其他行业,信息化仅仅作为管理的辅助手段与工具,CIO们一路走来更加不易。企业没有钱的时候,自然不会给信息化部门预算,企业一帆风顺的时候,更是不会想到信息化,非是要到企业经历一番大发展,积累一定财力,而又遭遇瓶颈无法解决之后,才会借助信息化手段。
然而亡羊补牢终究不如未雨绸缪,只是不知道公司老总有几个有这样的远见,也不知道有几个CIO能有这样的能力,在公司预算不足的时候,不仅能够虎口拔牙争取预算,还能在企业预算充足的时候,巧舌如簧让公司老板心甘情愿为信息化未来买单。