论文部分内容阅读
1引言世界上有很多机构或组织都在收集和保存网页信息,但收集和保存网络上的页面临许多问题或挑战。首当其冲是技术上的困难,由于网络的规模庞大及网络多样性等特点,没有任何一个组织能独立完成对整个网络上网页的收集和保存。此外,国际上没有专门的组织对网页收集和保存标准或者策略进行规范和指导,导致收集的网页的数量和保存情况千差万别。