论文部分内容阅读
在文本聚类/分类处理中,一个重要步骤就是寻找文本的合理表示。在被广泛采用的向量空间模型中,一个文本被表示成一个向量,向量的各维是特征项,而向量空间模型的核心问题就是如何进行特征的抽取和选择。在特征的权重计算中,存在一种对偶性现象。利用迭代的方法来处理和利用这种对偶性,获得了文本的隐含概念。实验结果表明,采用概念空间代替原始词空间来表示文本,能够得到更好的聚类结果。