论文部分内容阅读
将潜在语义索引(LSI)应用于垃圾邮件过滤领域,并将其与向量空间模型(VSM)和经典的邮件过滤器SpamAssassin系统进行比较.另外,对基于词提取技术的邮件文本特征集合和SpamAssassin系统提取的邮件“元特征”集合进行了对比.实验结果表明,LSI与VSM均取得了较SpamAssassin系统更优的分类效果.