论文部分内容阅读
在本文中,我们尝试将HNC领域作为文本特征,结合现有的分类技术,探索一条文本分类的新方法。本文对这一方法作了详细说明,并给出了试验数据及数据分析。通过试验,我们发现,单纯基于领域特征分类方法在分类精度上不如基于词特征的方法,基于词和领域的混合特征则在效果上略有提高;在分类速度和特征压缩比方面,基于领域特征的算法远远高于其他算法。