适用于PDF文本内容的高效模式匹配算法

来源 :通信技术 | 被引量 : 0次 | 上传用户:kuakua01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高效、准确地对PDF文档文本内容中的敏感信息脱敏,成功的关键在于敏感词的有效匹配。因此,对经典单模式匹配BM算法、QS算法进行研究分析,结合PDF文本内容编码的规则,提出了一种适用于PDF文档的模式匹配算法。该算法利用BM算法的坏字符表的计算规则、QS算法的下一字符思想,结合已匹配的信息及PDF编码规则,使其最大跳跃距离为m+4,减少了匹配次数,提高了匹配效率。分析验证表明,该算法匹配效率相对于BM算法、QS算法有一定提高。
其他文献
目的:探讨分析对高血压患者进行循证护理的临床效果。方法:选取近年来我院收治的140例高血压患者作为研究对象,采用随机数表法将其分为对照组(70例)和观察组(70例),为对照组患者进行
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
采用自主研制的改良二硫代氨基甲酸盐(DTC)类重金属捕集剂(ZTI重捕剂),考察单独投加、混凝/氧化/吸附强化、混凝助凝强化条件下ZTI重捕剂对烧结脱硫废水中除铊(Tl)的小试和混
G847.19羽毛球教学中的步法移动技术=Step moving techni-ques in badminton teaching[刊,中,B]/冯秋明(五邑大学体育部)∥体育成人教育学刊.-2003,19(4).-90-91 参2(SJ)羽毛
提出了一种基于图像信息隐藏的密文隐蔽通信技术。兼顾携密载体的透明性和鲁棒性,设计了基于SVD的特征量差值移位的隐藏算法。将SVD最大奇异值作为特征量,根据其差值和阈值的关系,在通信发送端和接收端实现密文的嵌入和盲提取。实验结果表明:该技术可实现大容量密文的传输,且携密图像载体的视觉质量良好,对JPEG压缩和噪声攻击等具有较好的性能,为基于计算机网络及多种通信系统的隐蔽通信提供了实现途径。
长三角区域一体化发展上升为国家战略,这是新形势下上海、浙江、江苏及安徽面临的新发展机遇。推进长三角更高质量一体化发展,在党建、经济、文化、生态与社会五个方面还存在
本文首先对水环境监测中的水污染进行分类,探讨了水污染监测分析的一些方法。指出水环境监测的目的是及时,准确,全面地反映水环境质量现状和发展趋势,为污染防治提供科学依据,并通
近年来,随着国家经济的高速发展,消费电子行业、日化行业、新能源行业等都得到了快速发展,不干胶标签材料作为这些行业产品的辅助原材料,其行业规模也不断壮大,行业前景值得
目的探讨经内镜逆行胰胆管造影联合腹腔镜术治疗胆总管结石伴胆囊结石的效果及安全性,并检测血总胆红素(TBIL)、尿胰蛋白酶原-2及C反应蛋白(CRP)水平变化。方法选择该院2016-10~2