论文部分内容阅读
本文介绍了一种分布式情报检索系统的设计与实现。系统采用关键词+VSM模型的方法组建检索模型,并采用无词典高频字串提取算法突显类型特征。系统使用调度分发的方式统一控制各检索服务器,实现分布式处理,系统处理能力可按选报服务器数量线性扩展。系统能自动识别处理中、英文两个语种和txt、html、eml、pdf等格式的文本。