论文部分内容阅读
随着电子资源在高校图书馆中的普及,复杂多样的电子资源数据给访问跟踪和数据挖掘带来了日益严峻的挑战。为了从海量的电子资源访问数据中更快和更好地进行行为分析和数据挖掘,基于复旦光华的ERU系统和其在复旦大学图书馆的历年运行结果,重点阐述了在海量数据采集分析中的各个优化步骤和手段,特别是原始数据清洗或过滤和数据库优化。通过介绍的优化方案,复旦大学现场实现了高性价比的采集分析方案。该方法不但可以应用在图书馆中电子资源,而且对其他的海量数据处理有着较好的借鉴性。