论文部分内容阅读
针对当前的数据防泄漏方案主要依赖在外传数据中进行关键词通用搜索,导致数据流控制不够精细、虚警率较高的问题。首先设计了一种基于白名单的数据防泄漏(DLP)架构,在此基础上,提出了一种基于文件指纹和Bloom滤波器的数据泄露检测算法。该算法通过使用动态规划来计算最优检测位置,最大限度地降低了内存开销,并支持高速部署。仿真实验结果表明,所提算法可以用较低的代价,实现大量数据的在线指纹检测。例如,对1 TB的文件,该方案只需340 MB内存就可实现1000字节的最差检测延时期望(泄露的长度)。