基于关键词共现的国内用户研究主题探讨

来源 :知识管理论坛 | 被引量 : 0次 | 上传用户:qidezhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】以2002-2011年我国图情领域关于用户研究的文献为对象,从关键词共现分析、聚类分析、社会网络分析等几个方面对文献中的高频关键词进行定量研究,并将其归类为六大主题。
  【关键词】用户 共词分析 社会网络分析 主题归类 核心主题
  引言
  随着信息化和网络化时代的来临,人们的信息交流日益频繁,信息用户日渐庞大。对用户进行研究已成为我国图情领域研究的前沿和热点,其研究成果可以为信息服务机构开展以用户为中心的服务提供依据。在这一趋势的引领下,图情界同仁迫切希望了解近10年来关于用户研究的热点领域和动态信息,为未来完善用户研究提供有用的借鉴。因此,笔者采用共词分析法和社会网络分析法对2002-2011年我国图情领域关于用户研究文献中的高频关键词进行分析,以揭示用户研究的主题,把握其发展趋势。
  共词分析法主要是利用文献集中关键词对共同出现的情况来确定该文献集所代表学科中各主题之间的关系。一般做法是统计一组文献的关键词两两之间在同一篇文献中出现的频率,便可形成一个由这些词对关联所组成的共词网络。利用聚类、因子分析等多元统计分析方法对共词网络进行分析,进而展现该学科的研究结构[1]。
  社会网络分析法原本是社会学用于研究社会成员之间关系的一种定量方法,后来被引入到了图情领域的相关研究。它在关键词分析中应用的主要原理是将关键词作为网络的节点,关键词之间的共现关系则构成节点之间的连线,构建社会网络关系图谱,然后应用中心度、小世界效应等方法进行分析,进而发掘出关键词之间的关系 [2]。
  2.1 数据来源
  为了尽可能保证查全率,笔者以“用户”、“信息用户”为题名和关键词,对中国知网和维普网收录的19种图情领域核心期刊进行检索。共得到2002-2011年发表的论文2 632篇,剔除非学术论文、重复等无效部分后,最终有效篇数为2 115篇。
  19种核心期刊分别是:《情报学报》、《图书情报工作》、《国家图书馆学刊》、《图书与情报》、《图书馆学研究》、《图书馆工作与研究》、《图书馆理论与实践》、《情报杂志》、《情报科学》、《图书馆杂志》、《图书馆建设》、《图书馆论坛》、《图书馆》、《图书情报知识》、《情报理论与实践》、《中国图书馆学报》、《大学图书馆学报》、《情报资料工作》、《现代图书情报技术》。除了《情报学报》上发表的文献来自于维普网外,其他均来自于中国知网。
  2.2 数据预处理
  由于关键词是论文作者自行选择的自然语言,因此会存在一些不规范、不统一的现象。为了让研究结果更加准确,笔者采用归并、吸收和丢弃三种方法对关键词进行逐一的人工处理。
  归并法是指对同一内容用不同词语来表达或者同一词语用不同语种来表示的情况,归并为统一的词语。如用户、读者和信息需求者等,归并为用户; Lib2.0、Library2.0和图书馆2.0,归并为图书馆2.0。
  吸收法是指针对同一研究内容,但却采用上下位关系来表示的关键词,如用户、图书馆用户和信息用户,采用上位类代替下位类的方式进行吸收,即采用用户来表示。有些词需要采用下位类吸收上位类的方式,如模型和用户模型,这需要结合文献的具体内容而定。
  丢弃法是指针对一些与用户研究无关或者太宽泛的关键词,如学校机构的名称(中央财经大学)、趋势、google工具栏、21世纪等,将这些关键词丢弃而不纳入统计分析范畴。同时,由于本文研究的文章都是来源于图情领域,这些文章包含“图书馆”这个关键词的频率较高,为了使得研究结果更加准确和客观,把这个关键词也剔除。
  按照上述方式,采用自编的C语言程序进行统计,共得到关键词3 256个。结合齐普夫第二定律以及关键词频次变化曲线,选取频次大于20的34个高频关键词,如表1所示:
  2.3 构建共词矩阵
  为反映关键词之间的关系,笔者统计高频关键词两两共现的情况,构建出34×34的共词矩阵(见表2)。由于关键词共现的频次直接受到各自词频大小的影响,因此原始共词矩阵难以反映关键词之间真正的依赖程度。为了消除这种现象,笔者采取常用的Ochiia系数对关键词对进行了包容化处理,将原始共词矩阵转换为相似矩阵。Ochiia系数计算公式为: ,其中 表示关键词 和 共现的频次, 分别表示关键词 和 的频次。
  由于构建的相似矩阵为0值过多的稀疏矩阵,为方便后续处理,用1与全部相似矩阵中的数据相减,得到表示关键词对的相异矩阵(表3),作为后面分析的矩阵变量。相异矩阵中的值越大表示两个关键词对联系越不紧密,值越小表明联系越紧密。
  2.4 研究方法
  因子分析法。该方法的目的是用少数几个因子去描述众多指标或因素之间的联系,其基本原理是把比较密切的几个变量归在同一类中,每一类变量就成为一个公共因子,然后以较少的几个公共因子反映原资料的大部分信息。运用这种方法,可以确定本论文研究的高频关键词的类数,为聚类分析中类数的确定提供依据[3]。
  聚类。该方法是直接比较各事物之间的性质,将性质较相近的聚为一类,将性质差别较大的归入不同类的分析方法。运用此方法,可以将高频关键词按照距离的远近聚集成不同的类别,使类内属性相似性最大, 类间属性相似性最小[4]。
  多维尺度分析。该方法是通过低维空间(通常是二维空间)展示多个研究对象之间的联系,利用平面距离来反映研究对象之间的相似程度。通过高频关键词的多维尺度分析结果,可以直观形象地展现关键词之间的相近程度[5]。
  社会网络关系图谱。该方法能够直观地揭示各个元素之间的紧密程度和所处地位。通过构建高频关键词的图谱,可以分析出高频关键词在整个网络中所处的地位 [6]。
  3.1 总体趋势
  论文的数量能够直接反映图情领域对用户研究的关注度,2002-2011这10年间共有2 115篇相关论文,年均211.5篇。刊文量从2002年的98篇增长到了2011年的309篇,增长了近3.15倍,年均增长率达到12.2%。上述数据表明,近10年来我国学者对于用户的研究越来越关注和重视。正如普赖斯文献指数增长规律所反映的现象,图情领域关于用户的研究正处于发展阶段,会引起许多不同学者进行思想交流,不同学科内容的相互渗透、交叉,推动了用户研究的蓬勃发展。   同时,笔者对关键词进行规范化处理之后,共整理出频次大于20的34个高频关键词。其中信息服务、用户需求、数字图书馆、高校图书馆、个性化服务这5个关键词的频次都大于100,说明在网络越来越发达的今天,图书馆等信息服务机构更加关注用户的个性化需求,根据不同用户的需求特征,有针对性地提供信息服务。
  为了更加清楚、形象地展现近10年我国图情领域关于用户研究的主题和核心领域,笔者对得到的高频关键词进行共词和社会网络分析,并绘制相应的关系图。
  3.2 主题归类
  3.2.1 主题类数的确定
  利用SPSS17.0 进行因子分析, 结果见表4。按照提取因子的方差累积百分比要超过60 %的原则, 从关键词矩阵中提取符合条件的因子个数为6。这6个因子的方差累积贡献率达到63.503%,即能够解释全部信息的63.503%。由此可以确定用户研究的主题类数为6类。
  3.2.2 归类结果
  根据因子分析的结果,将关键词采用系统聚类的方法聚为六大主题(见表5),分别是新形势下高校图书馆用户教育研究、网络环境下图书馆用户需求研究、数字图书馆用户个性化服务研究、网络模式下用户服务满意度研究、网络信息资源的用户体验研究、信息组织中的用户参与研究。为了更加直观形象地展示归类主题结果,笔者采用多维尺度分析法构建了主题图谱(见图1)。
  新形势下高校图书馆用户教育研究。由于高校图书馆是高校的文献信息中心,是教师、科研人员、学生查找资料的主要场所。因此,国内外对于高校图书馆的用户教育研究历来都很重视,将之贯穿于图书馆各个工作环节中。随着Web 2.0和图书馆2.0的发展,高校图书馆在文献载体、信息构建、服务手段等诸多方面都发生了巨大的变化。如何将Web 2.0和图书馆2.0的一些元素应用于用户教育,提高用户信息检索能力以及有效利用信息的能力,已成为高校图书馆一项十分紧迫而重要的任务[8]。
  网络环境下图书馆用户需求研究。随着网络的不断发展,用户对信息的需求也处于不断变化中。用户不再满足于简单地获取文献信息,而是希望利用快捷、丰富的网络资源全方位获取各种相关的信息。图书馆传统的服务模式已经跟不上网络环境下用户的需求,用户流失现象日益严重。在这种形势下,学者对网络环境下用户需求的特点进行了大量的研究,以期图书馆等信息服务机构创建与之相适应的服务方式,为用户提供综合化的信息服务[9]。
  数字图书馆用户个性化服务研究。数字图书馆是随着网络技术的成熟而蓬勃发展起来的,用户通过检索就能够获取所需信息。由于需要用户的参与,因此这种信息获取往往是被动的,获得的信息质量不尽如人意。在这样的情况下,个性化服务应运而生,并已经成为数字图书馆信息服务研究的主要问题。围绕这个问题,学者对用户信息行为、信息偏好、用户模型、用户咨询、搜索引擎等方面进行了大量的研究,以便系统、全面地获取用户兴趣特点,主动推送其所关注的信息资源。
  网络模式下用户服务满意度研究。网络环境下图书馆的用户满意度是从用户角度出发,即用户在获取网络信息资源时是否达到或者超过预期满足程度的一种心理状态。学者对用户满意度研究有利于优化网络检索系统,提高查全率和查准率,提升信息的服务质量。
  网络信息资源的用户体验研究。对图书馆等信息服务机构而言,用户体验是指用户在使用信息产品过程中所获得的心理感受。根据用户体验结果可以有效地进行网络信息资源整合、基本术语规范以及创新服务模式等。用户体验对于图书馆等信息服务机构来说是一种全新的观念,近年来对其关注度不断加大。但是相对其他主题来说,用户体验研究的内容宽泛而且没有一个相对统一的标准,导致该领域的研究深度有限。
  信息组织中的用户参与研究。信息组织是信息资源开发利用的关键环节,由于当前以博客、微博、社交网络等为代表的微内容不断兴起,用户越来越多地参与到信息组织中来。用户参与图书馆信息组织一方面有益于改善图书馆信息资源组织与服务,同时也给图书馆信息组织带来了挑战。因此,图书馆将来必须变革传统的信息组织模式,创新信息组织模式与方法[10]。
  3.3 核心主题
  3.3.1 核心主题的确定
  在确定了近10年来关于用户研究的主题后,接下来笔者将进一步分析这6类主题的联系程度及所处地位。为此,笔者借鉴社会网络分析方法,绘制主题的社会网络关系图谱(见图2)。图谱中节点的大小代表在整个网络中的地位,节点越大越接近中心地位,属于核心主题。据此可以看出“数字图书馆用户个性化服务研究”和“网络环境下图书馆用户需求研究”是整个主题网络中的核心节点,其中前者与所有的主题都有联系,核心地位更突出。这表明在互联网的冲击下,传统图书馆在向数字图书馆迈进的过程中,更加注重以用户需求为导向的个性化服务模式的运用。
  3.3.2 核心主题的分析
  社会网络关系图谱中两节点间的连线情况反映两个节点的联系强度,如果存在连线,代表两个节点有联系;连线越粗,表示两者关系越紧密。根据这个原理,笔者对核心主题——“数字图书馆用户个性化服务研究”所囊括的高频关键词进行图谱分析(见图3)。从图中可以看出,个性化服务与数字图书馆、用户模型、搜索引擎以及知识服务联系紧密。可见在数字图书馆背景下,用户模型的建立、搜索引擎的优化以及原始资料的知识抽取对个性化服务的开展至关重要。同时,数字图书馆与用户研究、用户服务联系紧密,表明数字图书馆与传统图书馆相比,更加注重以用户为中心的服务理念。
  结论
  笔者利用共词和社会网络分析技术,对2002-2011年我国图情领域以用户研究为主题的论文进行了研究。结果表明,学者对用户研究的主题主要集中在六个方面。其中,数字图书馆用户个性化服务研究和网络环境下图书馆用户需求是目前关注的重点领域。现有的用户研究主题都与互联网技术密切相关,这表明将网络技术引入到对图情领域用户的信息服务已成为这一学科的未来发展趋势。
  [参考文献]
  [1] 钟伟金,李佳.共词分析法研究(一)——共词分析的过程与方式[J].情报杂志,2008,27(5):70-72.
  [2] 朱庆华,李亮.社会网络分析法及其在情报学的应用[J].2008(2):179-183.
  [3] Dhanarai C,Lyles M A.Managing tacit and explicit knowledge transfer in IJVs:The role of relational embedded mess and the impact on performance[J].Journal of International Business Studies,2004,35(3):428-442.
  [4] 韩永青,黄科舫.基于聚类技术的政务信息资源整合研究[J].图书情报工作,2010,54(8):11-15.
  [5] 韩璐,谢俊奇.基于多维尺度分析的土地科学决策支持系统研究现状分析[J].中国土地科学, 2009,23(7):37-42.
  [6] 刘军.整体网分析讲义:UCINET软件使用指南[M].上海:格致出版社,2009.
  [7] 林聚任.社会网络分析:理论、方法与应用[M].北京:北京师范大学出版社,2009.
  [8] 由敬春.网络环境下高校图书馆的用户需求特点与服务模式[J].现代情报,2008(12):78-83.
  [9] 邓小昭,阮建海,李健,等.网络用户信息行为研究[M].北京:科学出版社,2010.
  [10] 司莉,邢文明.Web 2.0环境下用户参与的图书馆信息组织模式及其影响研究[J].图书馆论坛,2011,31(6):199-206.
其他文献
假如你有机会到亚里桑那州的凤凰城去,你问问那里的市民,谁是这个城市最有名的夫妻?他们一定会说:贾森·基德和乔玛娜·基德是鄙城最为人知的夫妻,也是最恩爱的一对夫妻。告诉你,他
工作这么多年了,参加的培训学习不计其数,但十之八九都是业务方面的。关于精神,关于信仰方面的培训教育感受最深的还是参加在井冈山的培训。  这次培训,我们怀着崇敬的心情,先后参观茨坪毛泽东旧居、大井红军领袖故居、毛泽东八角楼旧居。这些领袖生活和工作的地方,条件异常艰苦,让我们身临其境地感受到了当年革命领袖、红军战士和井冈山人民在敌人包围封锁的情况下所进行的斗争的艰苦性,更领略了毛泽东创新性地确立了党指
根据铁路软岩隧道施工的要求 ,设计了一种肱尺分动式工作机构。讨论了该机构在工作时的优缺点 ,分析了其工作特性 According to the requirements of railway soft rock tun
大气污染 城市的主要交通干线和路口,汽车尾气排出的一氧化碳、碳氢化合物和氮氧化物等气体浓度常年超过国家标准。 噪声污染 汽车行驶过程中发动机、喇叭、制动、排气等系
本文简要介绍了莘奉金高速公路机电工程的概况,对机电工程监理的重点、方法等问题进行了有益的探讨,重点总结了机电工程监理的一些经验,并提出了一些针对性的监理对策,为今后
本文探讨随书光盘馆际共建共享合作机制与技术平台,让随书光盘可以在互联网上无障碍地被访问,发挥其最大的文献价值。通过共建共享减少图书馆工作人员的重复工作,节省器的存
半个月前,家住哈尔滨康安路的独居老人孟大娘焦急地拨通了李庆长的手机,她家的电闸发生故障。“冬季严寒停电,会给老人带来很多不便,甚至是危险。我们接到电话后,马上登门服
英语学习,课堂是主战场,作业(包括课内作业和课外作业)是后勤和保障,是教学的延伸和补充,是对所学知识的复习与巩固,是教师用来检查教学效果、指导学生学习的教学手段之一。
五缘文化具有多学科综合交叉的理论品质,与政治学、经济学、社会学、宗教学、人类学、民俗学、历史学、民族学、伦理学等诸多学科,发生关联并从中汲取理论素养。同时,五缘文
中国共产党作为我国的执政党,之所以得到了广大人民群众的支持与中国共产党处理干群关系的态度和方式具有直接关系,中国共产党重视人民群众的感受,在制定任何决策时都优先考