论文部分内容阅读
本文详细描述了中文智能搜索引擎中汉语自动分词模块的设计方案与实现方法。 本文从目前发展迅速的搜索引擎技术的综述出发,结合中文智能搜索引擎技术的发展现状以及具体应用情况出发,根据项目要达到的目标逐步引出课题中心——汉语自动分词模块的设计与实现。然后从理论上分析和比较了目前的各种汉语自动分词方法,对各种分词方法的技术特点进行了阐述,对自动分词发展现状和趋势作了概括性的总结。根据课题应用具体现状,阐述了适合于本课题的分词方法和分词模块预期达到的性能指标。最后详细描述了汉语自动分词模块的具体设计,包括总体设计以及各模块设计等,同时给出了一些关键性的例程说明和程序设计的关键点总结。 本文所包含的内容完全是面向应用的,具体的技术选择与整体的设计思想完全根据实际的应用需求而定,采用的都是比较成熟的技术,实现了理论联系实际。另外,本文所描述的汉语自动分词模块已可以在基于命令行的情况下,进行分词处理。