论文部分内容阅读
为了准确稳定地对专利主题进行标引,本文提出了一种基于概率潜在语义分析的专利主题标引方法。首先建立由共同主题和特定主题所联合起来的混合模型;然后通过这两类主题相关性推断出训练集和测试集特定主题的映射关系;最后选择相似度最高的主题作为专利的主题完成标引。实验结果表明,该方法能较为准确、稳定地对未标记专利进行主题标引。本文尝试将概率潜在语义分析运用到专利文本的标引中,既是对专利标引自动化的一种积极尝试,也为深层次挖掘专利信息情报技术提供了一种新的思路。