论文部分内容阅读
模式分类过程涉及到对原始训练样本的学习,容易导致用户隐私的泄露。为了避免模式分类过程中的隐私泄露,同时又不影响模式分类算法的性能,提出一种基于主成分分析(PCA)的模式分类隐私保护算法。该算法利用PCA提取原始训练数据的主成分。并将原始训练样本集合转化为主成分的新样本集合,然后利用新样本集合进行分类学习。选用Adult数据集和KDDCUP99数据集进行仿真实验。并采用正确率和召回率进行性能评价,结果表明,该隐私保护算法通过PCA提取原始数据特征属性的主成分,可避免原始属性的泄露,同时PCA在一定程度上可实