论文部分内容阅读
2005年863评测任务是在CWT100G这个90G的数据桑上检索相关网页。评测给出了50个包含title、dese、narr的主题,要求根据这些主题自动和人工生成查询。ICST在这次评测中使用了倒排索引技术蛤数据桑建索引,通过给多个查询调整权重和多个文档查询域调整权重的方法,综合给出网页的得分。2005年的评测结果显示,排在最前的一些网页大部分是相关网页,前10个结果的准确率超过了50%。召回率也达到了30%以上。评测结果也表明,手工选词生成查询的结果要优于自动生成的查询。