论文部分内容阅读
文章介绍了搜索引擎网页快照系统的实现以及在安全性能方面的研究。当前的多数搜索引擎网站提供的网页快照,能够使用户更加快速和方便地访问较早时期的网页,但它们并没有对其中的网页安全进行判断。文章中的网页快照系统在实现网页快照的同时,通过建立网页脚本语言学习解释器,运用机器学习技术、词法分析技术等对网页上可能存在的不安全代码进行判断和去除,从而保证提供给用户的是尽量安全的网页快照。