论文部分内容阅读
基于词典的中文分词技术,构建一个时空性能良好的词典机制是很重要,因此在这篇论文中,设计并实现了一种改进的中文分词词典机制,通过引进位图这种数据结构来标识二字词是否存在于词典当中。分析时间复杂度跟空间复杂度后:时间复杂度跟文献中一致,空间复杂度降低了。并且使用最大正向匹配算法与其它文献的词典机制进行对比,分析对比实验数据后表明:该词典机制时间消耗保持不变,内存使用量降低。