论文部分内容阅读
提出了一种基于文档内位置关系的伪相关反馈框架LRoc(location-based Rocchio framework).该框架采用不同的核函数对候选词项在反馈文档中的位置进行建模,得到候选扩展词的位置重要度,并将其应用到经典的Rocchio模型中.该方法在选择和评估候选扩展词时,不仅考虑了词频,也考虑了词项位置的影响,有助于获取与查询更可能相关的扩展词.最后,在5种TREC数据集的实验结果表明:基于LRoc框架提出的3种模型(LRoc1、LRoc2和LRoc3)对比基线模型在MAP和P@20指标上具有显著提升.