论文部分内容阅读
电子政务网站是政府信息发布、政务公开、政民互动的重要平台,关乎政府的形象工程。为避免错别字或敏感词在政务平台出现,提升自动检测的效率,研发了一款基于DFA算法的政务云敏感词汇监测系统,实时扫描指定网站或新媒体的内容,对其含有错别字和敏感词的网页进行屏蔽及记录。系统首先构建敏感词及问题词库,并应用效率较高的DFA算法进行词汇检索,该算法相较于以往采用正则表达式的词库检索算法,具有更好的性能。系统经过测试,能达到预期效果。