论文部分内容阅读
为了探讨如何存储和管理大量的文本信息并提供方便的查询,建立了一个支持数字图书馆的并行文本数据管理原型系统,给出了PDoc系统的功能和总体框架.PDoc的功能包括文本数据采集、格式标准化、信息提取、自动分类、数据加载、数据分布、查询等.系统既提供了管理员维护界面,又针对不同用户提供了多个基于internet的查询界面,使系统管理员和普通用户都能方便地通过界面实现各种查询和维护操作.