论文部分内容阅读
海量数据在采集和传输过程中由于多种原因会不可避免地造成数据矩阵元素的缺失,对获得的残缺矩阵进行直接分析可能会出现错误的结果,因此在数据分析之前需要对残缺矩阵进行修复。常用的贝叶斯修复方法假设属性间完全相关,朴素贝叶斯方法则假设各属性相互独立,因此在处理属性间关系并不完全相关或完全独立时往往无能为力。基于贝叶斯理论,提出了一种改进的矩阵修复方法,采用关联度系数来衡量数据之间关联性,综合考虑了数据中部分属性存在关联关系而部分属性又相互独立的复杂情况。实验结果表明该方法能有效提高残缺矩阵修复的正确率,且对