论文部分内容阅读
提出了一种基于序列的文本自动分类算法,该算法利用了文本中两个层次的语义相关性:句子(子模式)之间的相关性和句子内代表特定含义的关键词(概念节点)之间的相关性,这样就实现了对关键词的动态加权,对于不含有关键词的子模式,采用Markov模型来对其信号幅度进行估计,从而生成一个待分类文本的特征序列,在中文本分类实验中,可以达到83%的BEP值,此外,该算法在实际系统中容易实现。