论文部分内容阅读
针对互联网地理信息涉密与安全问题,提出一种以Spark技术框架为基础的敏感地理信息检测算法,该算法与现有的检测算法相比,由于Spark算法不仅考虑了特征词与敏感词之间的直接匹配度,而且还考虑了两者之间的相似性敏感信息以及特征词在文本中的位置属性和权值情况等对种情况,使其具有更高的准确率、召回率以及F度量值,经并行化处理后,其运行效率明显高于单机模式,同时不影响其检测精度,可大大提升数据信息的处理速度和效率,值得在地理信息安全领域推广运用。