论文部分内容阅读
科学数据已经成为科学研究的战略性资源。从海量科学数据资源中发现所需数据成为研究人员的迫切需求。由此,理解科学数据相关性判断的认知本质,为科学数据的高效发现、质量判断、以及治理提供理论基础,成为信息科学领域相关性研究的新课题。用户相关性研究力图理解用户检索信息行为的认知机制进而实现行为的解释和预测。学者们已经先后开展了多种信息类型的相关性标准研究,认为相关性标准与信息类型具有关联性。因此,科学数据作为新型信息类型,相关性标准集合、内涵以及对判断的影响会发生怎样的变化是一个需要回答的问题。研究基于刺激反应理论和透镜模型理论提出了科学数据相关性判断认知模型,抽样选取了86名科学数据研究生,综合运用眼动仪记录、访谈和问卷等构成的三角测量方法观察和记录了具有真实信息需求的科学数据检索者的相关性判断过程,并运用内容分析法和层次分析法等方法创新性地探索了科学数据用户相关性判断的线索、标准及使用特征。首先,研究首次提出了9个科学数据相关性标准,分别为:主题性、可获得性、质量、规范性、权威性、全面性、便利性、可用性、时效性。其中主题性、可获得性、时效性、权威性、质量、便利性和可用性是跨越不同信息载体而存在的共性标准;全面性和规范性是与科学数据自身特质相关的独特标准。且科学数据相关性标准具有层级性,9个相关性标准可分为5大类。第二,研究首次明确区分了科学数据信息特征、线索、相关性标准并分析了三者的对应关系。信息特征是客观存在于外界环境的数据的外在表现。判断者对信息特征进行感知的信息是判断中的线索。大脑感知线索触发用户认知中的工具性概念是判断的标准。第三,相关性标准的认知处理过程呈现出两个特点:一重刺激,多重反应;多重刺激,一重反应。主题性认知处理过程既需要常规数据信息特征如题目、摘要,又需要综合专业知识,最为复杂。其余相关性标准的调用基本不依赖专业知识。第四,研究探索了用户长时记忆中相关性标准的使用特征,相关性标准的使用符合长尾定律和最小省力原则。整个判断过程符合锚定与调整策略,主题性为相关性判断中的锚,其余标准都是在这个“锚”定后的后续调整。最终的判断结果是相关性标准线性累加的结果。最后,综合信息特征、线索、用户相关性标准特点及其内在关系,提出了科学数据相关性判断模型。本文创新性——研究首先在用户相关性理论方面有所创新,基于刺激反应理论和透镜理论,提出了科学数据用户相关性判断的理论模型,较为完整地描述了科学数据相关性判断全过程,丰富了用户相关性判断的理论。其次,研究综合考虑了相关性判断过程中各变量的性质及相互关系,首次将眼动观测与访谈、问卷等方法集成为三角测量法,实现了方法的创新。下一步,将进一步拓展用户和情境类型,丰富现有的科学数据相关性判断理论模型,提升模型的描述和解释能力。