论文部分内容阅读
本文首先分析传统分词方式在信息检索应用中所造成的查准率、查全率及检索速度的问题。为同时解决上述问题,笔者构造了基于字词混合分词的置信分词模式,分词项需要包含词、位置及置信度这三个指标。此外,本文还描述了一种具体的RMM置信分词方法,进一步阐释置信分词模式。通过实验,简单验证了置信分词模式的有效性。笔者相信,置信分词模式不仅能应用于信息检索应用,也可推广到其他中文处理应用。