论文部分内容阅读
由于正则表达式(RE)被广泛用于信息抽取、模式学习和生物序列分析等领域,因此开发能够从正样例集学习RE的算法很有实际意义.为克服现有RE学习算法在所学RE类型、样例数目和样例类型等方面存在的限制,基于最优树联配原理提出了一种基于树结构的RE学习算法.该算法的特点包括:采用自适应方法自动选择最优代价阈值;对所学RE类型、样例数目和样例类型等限制很少,因此适合于绝大多数RE应用.实验表明,该算法在所学结果 RE的实用性方面优于现有RE学习算法.