论文部分内容阅读
针对个性化邮件过滤中接收的邮件没有规律、正常邮件和垃圾邮件存在严重类偏移等问题,提出一种改进的k最近邻(k-nearest neighbor algorithm,KNN)个性化邮件过滤方法。该方法主要是通过建立兴趣度模型(对兴趣度计算的改进,剔除用户习惯对建立兴趣度模型带来的影响)不断改变训练集,使得训练集中的文本始终代表用户最近的兴趣。然后通过对接收邮件的无规律和类偏移问题的研究,提出一种改进的KNN算法,该算法主要是对文本在聚类中的价值重新评定,使其对邮件文本进行了较好的分类。经实际验证,改进后