论文部分内容阅读
报纸文献主题标引、分类标引和命名实体抽取是其内容深加工的主要形式,基于知识库的自动 标引是报纸文献标引自动化的一种实现方式。本文在报纸文献自动标引研究现状基础上提炼出报纸文献自动 标引一般流程,提出知识库建设是其实现自动标引的前提。结合报纸文献标引的特点,提出报纸文献标引用 知识库应由主题标引库、分类知识库和实体标引库三部分多个词表组成,具有多词表融合、规模大、可扩充、 简单易行等特点。同时,就知识库构建中的主题规范表、分类主题对照表和命名实体抽取规则库建设等关键 技术进行阐述。