论文部分内容阅读
术语具有特定的领域特征,即在专门的领域里大量出现,而在通用领域内出现的机率较小.基于此特性,本文提出了基于信息增益的术语抽取算法.将术语抽取的过程看成是文本分类的特征选取过程.通过对比专业领域与通用领域的文档,抽取出两类文档中信息增益较大的特征词作为术语.实验表明,该方法取得了令人满意的结果.