论文部分内容阅读
索引策略是中文信息检索系统中重要的研究内容之一。对基于字、词和二元文法的索引策略进行研究,分析各自的特点,进行性能对比,在此基础上提出将词的索引策略与二元文法索引策略进行线性融合。应用2-泊松模型的BM25公式在TREC公开数据集上进行测试。实验表明,融合后的索引策略在主要性能评测参数平均精确率、R-精确率参数上相对较优。