论文部分内容阅读
随着电子时代的发展,人与人之间的通信越来越便捷。邮件是如今社交中非常重要的交流工具,然而邮件在给人带来有效交流信息的同时,也会给人带来大量的垃圾信息。本文针对对垃圾邮件的辨别,提出一种基于自然语言处理技术的邮件检测系统方案。首先利用TF-IDF特征提取技术、PCA降维技术获得训练样本中最能够识别垃圾邮件的特征,然后使用朴素贝叶斯分类算法对邮件进行检测。