论文部分内容阅读
高速公路智能交通数据记录量大且易产生冗余数据,使交通数据质量降低,不利于对交通数据分析和进一步应用。由于SNM算法过于依赖关键字的选取,计算的时间复杂度高,易造成计算的浪费导致对冗余数据检测效果不佳;而Simhash算法存在关键词对应的权重选取困难问题。因此,提出了基于灰狼算法改进的Simhash算法,对关键词对应的权重选择进行优化。使用SNM算法、Simhash算法以及改进后的Simhash算法对高速公路智能交通冗余数据样本集进行仿真实验。分析结果表明改进后的Simhash算法检测高速公路交通冗余数据记