论文部分内容阅读
数字图书馆馆藏资源服务粒度过大、集成度不高的主要原因在于馆藏资源知识组织的粒度过粗。为解决这一问题,本文提出一种数字图书馆馆藏资源多粒度层级主题分割方法。该方法基于最优分割,采取自上而下逐步二分的策略,首先将待分割文本包含的所有语句视为一个类,而后对该类进行逐级二分,直到识别出所有的主题为止,最终生成一棵文档分割树。该树结构的突出优势是可以实现馆藏资源的多粒度层级组织,进而提供多粒度集成知识服务。