论文部分内容阅读
绝大部分现有信息检索(Information Retrieval,简称IR)模型是可计算定量模型。这些模型提升IR效率的主要手段是定量化信息对象间的联系(主要是语法关联)并加以利用。这是典型的实验性IR研究方法,即实验、分析、假设、理论化、再实验。实验性IR方法,如查准率/查全率、TREC实验等,能定量反映IR系统的性能,却不能明确解释系统为何会对特定问题作出/不作出预期反映,即不能评价IR模型的功能特性。研究者可以通过实验性IR方法提升一定程度的IR效率,却无法引发IR系统的功能飞跃。
有鉴于此,近年来一些学者提出使用理论性IR方法,如基于逻辑的归纳评价法,深入揭示信息对象间的语法/语义联系,帮助分析IR系统的功能特性,找出可能的功能缺陷或可改进之处,并在可能情况下,对系统作出相应修正。
本文正是这样一种理论性IR方法的尝试,我们将其称为Situation IR方法。
信息检索可被看作确定文献和用户查询间关涉(aboutness)关系的过程。()Situation IR方法运用情境理论形式化关涉属性,在“情境关涉”基础上运用逻辑方法分析IR模型的功能特性,指出某些关涉属性对IR模型性能和功能特性的影响。由于IR模型的关涉关系各不相同,即不同IR模型支持不同关涉属性集。因此,不同IR模型功能上的优缺点可以从它们具备的关涉属性集入手,进行定性比较和分析。为达到这一目的,整个逻辑分析的基础--关涉--必须能容纳不同IR模型的关涉属性。已有类似研究中,逻辑框架对关涉形式化的影响较大,甚至会形成一些只对特定框架可靠的关涉属性。对此,我们采用情境理论形式化关涉,由于现代IR本质上是复杂检索情境下的信息流约束行为,而情境理论擅长于情境和信息流处理,因此本文相信同其它逻辑理论相比,运用情境理论构建的关涉属性分析框架能最大程度的削弱上述问题。
本文以古典IR模型为对象,运用Situation IR方法进行了功能分析,发现通过分析IR模型关涉属性,可以有效揭示模型的功能特性,并可指引IR模型性能提升(如,使模型满足/不满足某关涉属性即可预期IR性能的变化)。
我们注意到,虽然Situation IR方法是一种定性IR分析/评估方法,但却可用于建模某些IR任务,在文中以超媒体检索系统为例作了相应说明。
本文相信Situation IR方法为信息检索研究提供了一种重要的研究思路,能促进更有效IR系统的产生。