论文部分内容阅读
搜索引擎中的HTML文档处理器和查询分析器都需要对特定格式的文本做词法分析和语法分析,以便构建出相应的数据结构。如果手工来编写这些分析程序,不仅编写代码工作量大,而且增加了测试的负担。本文研究了JavaCC的使用步骤和特点,并使用JavaCC构建了一个HTML文档处理器和一个查询分析器。实践表明,使用JavaCC能够大大缩短开发文本分析程序周期。