论文部分内容阅读
在文本信息处理领域,随着信息网络化的发展使得获取海量的文本训练集不再困难。但在合理利用这些文本训练集进行数据挖掘的同时,必然遭遇到隐私保护方面的诸多问题,特别是针对涉及用户隐私的文本数据所进行的挖掘。针对垃圾邮件过滤中隐私保护问题进行了研究,在给出了基于隐私保护的自适应垃圾邮件过滤模型的基础上,讨论了一种基于简单散列变化的隐私数据保护方法,并给出了一种改进的数据部分属性隐藏的隐私数据保护方法。分析和实验结果表明,改进方法能够有效地解决在线自适应垃圾邮件过滤中隐私保护的问题。