论文部分内容阅读
专利自动分类是一个大规模、多层次结构的复杂文本分类问题。其中特征权重计算是一个关键环节,关系到专利的文本表示能否体现出主题信息的问题。本文通过分析专利(标题和摘要)的特点,提出了一种基于主题的特征权重计算新方法。该方法通过考察特征与主题的相关性来确定权重,使专利的文本表示更趋近于文章的主题。实验结果表明,该方法优于一般的权重计算方法,取得了较好的效果。