论文部分内容阅读
避开汉语分词中的技术特点,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略,也是最为可行的方法.本文以新华社新闻稿中的题名和导语为对象,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术.并成功设计了新闻信息自动标引的实验系统,取得了较好的效果.