论文部分内容阅读
摘 要:对信息检索系统中常用的两种分词方法,即词表分词法和二元分词法,进行了分析比较。针对二元分词的分词结果冗余度大的问题,提出了改进方法,即经过预处理的二元分词方法。
关键词:词表分词;二元分词;预处理;冗余度
关键词:词表分词;二元分词;预处理;冗余度