论文部分内容阅读
近十年来,随着馆藏档案数字化工作快速推进,以及数字档案馆建设逐渐铺开,综合档案馆的数据量早已从GB级达到TB级,相信未来的区域档案数据中心,数据量增到PB级也指日可待。但是档案部门在硬件设备和管理软件上,不可能像以数据为核心的专业部门,能够不断增加投入,不吝成本提升性能。因此把不依赖于高配置设备的生态系统—Hadoop框架.