论文部分内容阅读
摘 要:随着无纸化办公的普及,如何解决办公文档传输过程中面临的安全问题显得尤为重要。本文结合当前办公自动化系统应用实际,以高安全性为基本出发点,以优化加密文档生成方式、改进传输方式、创新分布式存储方式为手段,提出了一种低成本的办公文档加密传输方法。
关键词:办公文档 加密 传输 分布式 低成本
随着办公自动化系统的普及,无纸化办公已逐渐成为各企事业单位日常办公的主要方式。对于任何一个无纸化办公系统,用户与服务器之间文档存储服务的实现、用户之间的办公文档转递,都需要借助网络完成信息交换,而借助网络的信息交换,必然伴随一系列安全问题。
一、办公文档信息交换安全问题
为解决办公文档信息交换存在的安全隐患,各企事业单位多引入加密手段提高办公文档处理流程的安全性,但由于使用环境、实施条件、成本等原因,不少加密手段在加密文档产生、传输、存储等环节均存在一定的安全问题。
1.文档加密安全问题。众所周知,本地明文存储文档安全性最低,因此,多数办公自动化系统均采取了各种手段避免这一情况的出现,如使用无盘客户机、对本地文档加密等,无盘客户机使用方便且安全性高,但对于其他硬件配置(如内存容量、客户端处理器性能、服务器性能、网络传输性能等)要求也较高,因此,各企事业单位多依托原有办公计算机组建有盘客户端系统,若有文件安全需求,也通常采用本地加密存储或加密上传等方式。在加密文档生成这一环节,密钥安全至关重要,但在实际操作过程中,密钥的设置通常由用户自行完成,而且对于绝大多数用户来说,设置密钥种类通常较少,且在当前大数据环境下,对于特定人员,密钥设置是有一定规律可循,这就给基于字典破解加密数据提供了可乘之机。
2.文档传输安全问题。为了满足文档处理流程中的解密过程需求,通常会同时发送加密文档和密钥,对于多数办公自动化系统或用户来说,加密文档和密钥通常会使用同样的数据传输渠道,若对于特定传输渠道进行捕捉监控,同时获得加密文档和密钥绝非难事。
3.文档存储安全问题。对于一些安全性较高的系统来说,加密文档与密钥采用了分别存储的方式,但加密文档多为完整(非缺失部分)的结构。办公文档通常为WORD文档(.doc)、EXCEL文档(.xls)、POWERPOINT文档(.ppt)等,这类文档多有明显的固定结构特征,以doc文档为例,如图1.1所示:
任何doc文档首内容均为“D0 CF 11 E0”,而对于加密文档完整,且已知加密算法且已知内容或部分内容,进行解密运算的难度将大大降低。
无论加密过程如何实现,在各类加密手段中,以硬件加密方式最为安全,效率也最高,但必须要说明的是,硬件加密投入的成本也最高,这样的高成本对于多数企事业单位来说通常是不愿承受的。因此,本文结合上文所讨论的各类安全问题,提出一种低成本兼顾效率与安全性的软件加密方式。
二、方法描述
1.工作原理。使用RAR压缩包的分卷加密压缩方式,为确保数据安全,同时加密文件名,加密算法使用AES加密,安全性高;加密过程遵循“一事一密”原则,每次向数据服务器的传输过程之初随机产生12位密钥,并根据数据传输客户端身份信息与时间戳,每次传输对应不同的密钥;密钥与数据的主要部分经由不同数据线路传输;当文档处理流程完成或数据传输完成后,客户端、服务端保存的为不完整的数据信息。
2.硬件要素。服务端与客户端均配备双网卡,服务端与客户端的两张网卡应分别连接于不同网络运营商的数据连接通道(如线路1使用中国电信、线路2使用中国移动),目的是为了取得两条完全不同且相对随机的数据链路。
3.工作过程。
3.1加密环节。加密环节由数据源客户端发起,主要包含如下7个步骤:
(1)生成数据信息(含时戳),用于区分信息事件;
(2)生成12位密钥1并记录;
(3)使用密钥1对文档进行加密压缩,并指定分卷大小为100k,记录各分卷的CRC校验值;
(4)单独提取分卷1,并使用随机数法乱序排列剩余分卷,并重命名各个乱序后的分卷,记录分卷对应关系;
(5)生成12位密钥2并记录;
(6)使用密钥2将密钥1和分卷1进行加密压缩,形成压缩包1;
(7)使用密钥2将其他分卷进行加密压缩,形成压缩包2。
最终得到数据信息、压缩包1、压缩包2、密钥2、分卷对应关系共5部分数据。
3.2传输环节1(客户机至服务器)。如图2.1所示,若传输过程为客户端上传至数据服务器,当完成加密环节后,依次完成如下过程:
(1)密钥2、分卷对应关系留存本地;
(2)数据信息(含时戳)、压缩包1(密钥1+分卷1)由线路1(IP1)传输至文件服务器;
(3)数据信息(含时戳)、压缩包2(其他分卷)线路2(IP2)传输文件服务器;
(4)数据服务器将相同数据信息的数据集中存储(压缩包1、压缩包2、密钥1)。
此时,客户端留存数据信息、密钥2、分卷对应关系共3部分数据,数据服务器留存数据信息、压缩包1、压缩包2共3部分,其中,由于共有的数据信息部分存在,可以完成后续步骤的对应重组环节。
3.3传输环节2(客户机1至客户机2)。如图2.2所示,若传输过程为客户端1需要传输数据至客户端2,则在完成向数据服务器传输的环节后,依次完成如下过程:
(1)客户机1向数据服务器发出数据转递需求,并明确需求数据的信息;
(2)数据服务器根據数据转递需求,将数据信息及数据(含压缩包1、压缩包2、密钥1)转发至客户机2;
(3)客户机1通过线路1将数据信息、密钥2发送至客户机2; (4)客户机1通过线路2将数据信息、分卷对应关系发送至客户机2;
(5)客户机2根据数据信息组合数据(密钥2、压缩包1、压缩包2、分卷对应关系);
(6)经解密运算后,进入公文处理流程。
客户机2根据相同的数据信息,得到压缩包1、压缩包2、密钥2、分卷对应关系,各解密要素齐全,数据解密环节为加密环节的逆过程。
三、实验验证
由于不同的数据通信线路的源地址与目标地址不同,经由的数据转发链路也不同,大大增加了加密数据和密钥被同时拦截捕获的难度,并且,由于2次带有AES加密运算的RAR压缩过程的存在,除RAR文件头外,无法精确对应已知的部分明文,使得解密运算难以快速完成,如图3.1和图3.2所示,2次加密后的RAR文件内容并无明显规律可循。
原数据分卷经随机数法乱序后,在一定程度上增加了数据解密的算法复杂度。图3.3为第一次加密分卷乱序排列前后的文件情况,图3.4为分卷随机数乱序处理后的文件名对应表。
若使用穷举法進行暴力破解密码,经过实验,对于单一分卷、大小为300KB的AES加密RAR压缩包,在CPU测试AES吞吐量为237MB/S运算能力下(如图3.5),能够获得23个密码/S的穷举速度,而对于性能较高的GPU并行计算服务器,如NVIDIA Tesla C2050 GPU服务器,以其约60Gbps的AES加/解密数据吞吐量作为参考,则可以获得约750个密码/S的理论穷举速度。
若设置密钥由大小写字母和数字构成,密钥长度为12位,根据公式:
N=6212≈3.21×1021
有,穷举次数为不大于3.21×1021,理论耗时约1.36×1011年。由于AES加密环节共2层,并且服务端与客户端的信息均不完整,使得对加密文档的解密变得更加困难。
综上,本加密传输方法在仅少量增加硬件成本的情况下,通过优化加密方式、改进了明文和密文的传输与存储手段,实现了“一事一密”的高可靠性原则,实现了密钥与加密文档的分布式存储,且理论上对暴力破解密码耐受程度高。
四、结语
RAR压缩方式与AES加密过程算法成熟且通用性强,在有CRC校验参与、保证网络传输可靠的前提下,本加密传输方法在不显著增加硬件成本的情况下,实现了较高的安全性,同时,对于办公文档来说,数据处理过程额外开销并不明显,不会对用户使用体验造成影响。
参考文献:
[1]黄维江.OA办公系统文件传输的安全问题与管理措施[J].信息通信,2014(6):136-137.
[2]李勤俭,钟诚文,GPU上的AES实现与分析,硕士毕业论文,2015.01.
[3]K.Iwai, T.Kurokawa, N.Nishikawa. AES encryption implementation on CUDA GPU and its analysis[C]//Proceedings of the 2010 First International Conference on Networking and Computing. Washington DC: IEEE Computer Society, 2010:209-214.
关键词:办公文档 加密 传输 分布式 低成本
随着办公自动化系统的普及,无纸化办公已逐渐成为各企事业单位日常办公的主要方式。对于任何一个无纸化办公系统,用户与服务器之间文档存储服务的实现、用户之间的办公文档转递,都需要借助网络完成信息交换,而借助网络的信息交换,必然伴随一系列安全问题。
一、办公文档信息交换安全问题
为解决办公文档信息交换存在的安全隐患,各企事业单位多引入加密手段提高办公文档处理流程的安全性,但由于使用环境、实施条件、成本等原因,不少加密手段在加密文档产生、传输、存储等环节均存在一定的安全问题。
1.文档加密安全问题。众所周知,本地明文存储文档安全性最低,因此,多数办公自动化系统均采取了各种手段避免这一情况的出现,如使用无盘客户机、对本地文档加密等,无盘客户机使用方便且安全性高,但对于其他硬件配置(如内存容量、客户端处理器性能、服务器性能、网络传输性能等)要求也较高,因此,各企事业单位多依托原有办公计算机组建有盘客户端系统,若有文件安全需求,也通常采用本地加密存储或加密上传等方式。在加密文档生成这一环节,密钥安全至关重要,但在实际操作过程中,密钥的设置通常由用户自行完成,而且对于绝大多数用户来说,设置密钥种类通常较少,且在当前大数据环境下,对于特定人员,密钥设置是有一定规律可循,这就给基于字典破解加密数据提供了可乘之机。
2.文档传输安全问题。为了满足文档处理流程中的解密过程需求,通常会同时发送加密文档和密钥,对于多数办公自动化系统或用户来说,加密文档和密钥通常会使用同样的数据传输渠道,若对于特定传输渠道进行捕捉监控,同时获得加密文档和密钥绝非难事。
3.文档存储安全问题。对于一些安全性较高的系统来说,加密文档与密钥采用了分别存储的方式,但加密文档多为完整(非缺失部分)的结构。办公文档通常为WORD文档(.doc)、EXCEL文档(.xls)、POWERPOINT文档(.ppt)等,这类文档多有明显的固定结构特征,以doc文档为例,如图1.1所示:
任何doc文档首内容均为“D0 CF 11 E0”,而对于加密文档完整,且已知加密算法且已知内容或部分内容,进行解密运算的难度将大大降低。
无论加密过程如何实现,在各类加密手段中,以硬件加密方式最为安全,效率也最高,但必须要说明的是,硬件加密投入的成本也最高,这样的高成本对于多数企事业单位来说通常是不愿承受的。因此,本文结合上文所讨论的各类安全问题,提出一种低成本兼顾效率与安全性的软件加密方式。
二、方法描述
1.工作原理。使用RAR压缩包的分卷加密压缩方式,为确保数据安全,同时加密文件名,加密算法使用AES加密,安全性高;加密过程遵循“一事一密”原则,每次向数据服务器的传输过程之初随机产生12位密钥,并根据数据传输客户端身份信息与时间戳,每次传输对应不同的密钥;密钥与数据的主要部分经由不同数据线路传输;当文档处理流程完成或数据传输完成后,客户端、服务端保存的为不完整的数据信息。
2.硬件要素。服务端与客户端均配备双网卡,服务端与客户端的两张网卡应分别连接于不同网络运营商的数据连接通道(如线路1使用中国电信、线路2使用中国移动),目的是为了取得两条完全不同且相对随机的数据链路。
3.工作过程。
3.1加密环节。加密环节由数据源客户端发起,主要包含如下7个步骤:
(1)生成数据信息(含时戳),用于区分信息事件;
(2)生成12位密钥1并记录;
(3)使用密钥1对文档进行加密压缩,并指定分卷大小为100k,记录各分卷的CRC校验值;
(4)单独提取分卷1,并使用随机数法乱序排列剩余分卷,并重命名各个乱序后的分卷,记录分卷对应关系;
(5)生成12位密钥2并记录;
(6)使用密钥2将密钥1和分卷1进行加密压缩,形成压缩包1;
(7)使用密钥2将其他分卷进行加密压缩,形成压缩包2。
最终得到数据信息、压缩包1、压缩包2、密钥2、分卷对应关系共5部分数据。
3.2传输环节1(客户机至服务器)。如图2.1所示,若传输过程为客户端上传至数据服务器,当完成加密环节后,依次完成如下过程:
(1)密钥2、分卷对应关系留存本地;
(2)数据信息(含时戳)、压缩包1(密钥1+分卷1)由线路1(IP1)传输至文件服务器;
(3)数据信息(含时戳)、压缩包2(其他分卷)线路2(IP2)传输文件服务器;
(4)数据服务器将相同数据信息的数据集中存储(压缩包1、压缩包2、密钥1)。
此时,客户端留存数据信息、密钥2、分卷对应关系共3部分数据,数据服务器留存数据信息、压缩包1、压缩包2共3部分,其中,由于共有的数据信息部分存在,可以完成后续步骤的对应重组环节。
3.3传输环节2(客户机1至客户机2)。如图2.2所示,若传输过程为客户端1需要传输数据至客户端2,则在完成向数据服务器传输的环节后,依次完成如下过程:
(1)客户机1向数据服务器发出数据转递需求,并明确需求数据的信息;
(2)数据服务器根據数据转递需求,将数据信息及数据(含压缩包1、压缩包2、密钥1)转发至客户机2;
(3)客户机1通过线路1将数据信息、密钥2发送至客户机2; (4)客户机1通过线路2将数据信息、分卷对应关系发送至客户机2;
(5)客户机2根据数据信息组合数据(密钥2、压缩包1、压缩包2、分卷对应关系);
(6)经解密运算后,进入公文处理流程。
客户机2根据相同的数据信息,得到压缩包1、压缩包2、密钥2、分卷对应关系,各解密要素齐全,数据解密环节为加密环节的逆过程。
三、实验验证
由于不同的数据通信线路的源地址与目标地址不同,经由的数据转发链路也不同,大大增加了加密数据和密钥被同时拦截捕获的难度,并且,由于2次带有AES加密运算的RAR压缩过程的存在,除RAR文件头外,无法精确对应已知的部分明文,使得解密运算难以快速完成,如图3.1和图3.2所示,2次加密后的RAR文件内容并无明显规律可循。
原数据分卷经随机数法乱序后,在一定程度上增加了数据解密的算法复杂度。图3.3为第一次加密分卷乱序排列前后的文件情况,图3.4为分卷随机数乱序处理后的文件名对应表。
若使用穷举法進行暴力破解密码,经过实验,对于单一分卷、大小为300KB的AES加密RAR压缩包,在CPU测试AES吞吐量为237MB/S运算能力下(如图3.5),能够获得23个密码/S的穷举速度,而对于性能较高的GPU并行计算服务器,如NVIDIA Tesla C2050 GPU服务器,以其约60Gbps的AES加/解密数据吞吐量作为参考,则可以获得约750个密码/S的理论穷举速度。
若设置密钥由大小写字母和数字构成,密钥长度为12位,根据公式:
N=6212≈3.21×1021
有,穷举次数为不大于3.21×1021,理论耗时约1.36×1011年。由于AES加密环节共2层,并且服务端与客户端的信息均不完整,使得对加密文档的解密变得更加困难。
综上,本加密传输方法在仅少量增加硬件成本的情况下,通过优化加密方式、改进了明文和密文的传输与存储手段,实现了“一事一密”的高可靠性原则,实现了密钥与加密文档的分布式存储,且理论上对暴力破解密码耐受程度高。
四、结语
RAR压缩方式与AES加密过程算法成熟且通用性强,在有CRC校验参与、保证网络传输可靠的前提下,本加密传输方法在不显著增加硬件成本的情况下,实现了较高的安全性,同时,对于办公文档来说,数据处理过程额外开销并不明显,不会对用户使用体验造成影响。
参考文献:
[1]黄维江.OA办公系统文件传输的安全问题与管理措施[J].信息通信,2014(6):136-137.
[2]李勤俭,钟诚文,GPU上的AES实现与分析,硕士毕业论文,2015.01.
[3]K.Iwai, T.Kurokawa, N.Nishikawa. AES encryption implementation on CUDA GPU and its analysis[C]//Proceedings of the 2010 First International Conference on Networking and Computing. Washington DC: IEEE Computer Society, 2010:209-214.