论文部分内容阅读
针对大数据时代下企业文件的存储和检索难题,使用基于DHFS分布式文件系统实现企业内部文件的海量存储,采用ElasticSearch分布式索引技术对资源进行分布式索引和检索,构建一个高效的、分布式的企业文件检索框架。测试显示,在海量数据情况下,基于HDFS的文件系统检索时间约为传统Oracle数据库的1/20,并带有缓存功能。