论文部分内容阅读
互联网敏感信息的识别过滤对促进互联网健康发展有重要意义。为逃避计算机的识别,敏感信息往往以变形形式出现,使得敏感信息的识别变得困难。针对这一问题,本文提出了一种多模式模糊匹配的敏感规则过滤算法。通过对用户自定义的关键词进行拆分,并利用拼音编码为关键词建立索引表,实现同音变形的匹配。同时,通过引入逻辑表达式作为过滤规则,增强了表达描述敏感信息的能力。实验证明,算法有良好的识别效果和运行效率。