一种面向中文的快速字串多模式匹配算法

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:coolzhaonan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对中文字串匹配问题,提出一种快速多模式匹配算法.算法采用新型组合状态自动机,将2个状态组合起来匹配一个双字节字符,从而解决了双字节字符构建完全Hash表时带来的存储空间膨胀问题;同时考虑到待匹配模式串中的字符在大字符集中呈稀疏分布的特点,尝试将单模式QS匹配算法的思想与DFSA算法进行结合,应用于多模式匹配中.实验结果显示,本算法明显优于DFSA算法,平均所花费时间仅为DFSA算法的45.2%.
其他文献
制造企业从大规模化转向了小型化,其中定单的处理是少量的并且时刻发生变化.这种趋势导致虚拟车间的出现,虚拟车间包括一些分布在车间中的加工中心.阐述了一些基本的概念和方法,用
构架了一种基于声表面波延迟线式的无线标签识别系统.该系统以不同的无源编码标签代表不同的对象,通过对标签的传感以达到目标识别的目的.介绍了标签传感器和系统的信号处理方
对Lipschitz非线性系统观测器存在性的判定进行了讨论.提出了一种观测器存在性的迭代判定方法,当出现无限迭代的情形时,其判定又转化为对一列单调不减之数列的收敛性的判定.该
阐述了敏捷制造模式下,模具行业如何利用Internet/Intranet技术和多Agent技术高效的控制和管理产品信息,并给出了敏捷化产品信息控制与管理系统的结构和功能,进而分析了其中
提出了一个基于案例的模型,实现工作流系统的执行动态性和自适应性.工作流接口、定义和案例3个概念的分离实现了动态性.工作流目标以及工作流过程的绑定成为一个动态的可随时
将高阶累积量对具有高斯分布特性的(白色或有色)随机噪声的强烈抑制特性,用于辨识开环条件下的干扰,一些文献中提出了基于高阶累积量的改进均方辨识准则(MSE).针对三阶累积量的
提出了基于部分元等效电路(PEEC)方法求解印制板电路电磁兼容问题的新方法.即将印制板电路的辐射问题分为两步:(1)用部分元等效电路的方法确定印制板导体上的场源(电流)分布;
组建动态联盟可以极大地提高成员企业对市场的快速适应能力.从销售代理的角度,采用敏捷制造思想,研究了供应链的最小成本制造规划问题.给出了综合考虑产品制造、储存、延期交货
给出利用下限定理计算扭转极限状态下船体剖面上塑性剪流分布的方法,以及相应的线性规划问题.根据扭转极限状态下剖面剪应力的分布可计算剖面的极限转矩.对3艘不同尺度的大开
用遗传算法来选择具有高功耗的输入模型,对电路进行仿真,实现组合电路的最大功耗估算,同时给出了基于统计的逻辑模拟最大功耗估计方法.基于ISCAS85基准电路的仿真表明,该方法在大