图书馆定量分析中的专家权重问题研究

来源 :现代情报 | 被引量 : 0次 | 上传用户:JK0803_zouzhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  〔摘 要〕本文针对近年来图书馆定量研究中的专家权重确定问题,将专家权重划分为先验权重和后验权重,并通过实证研究获得较客观专家综合权重,使图书馆定量化决策分析更加科学合理。
  〔关键词〕专家权重;后验权重;聚类分析;定量分析;图书馆
  〔中图分类号〕G255 〔文献标识码〕A 〔文章编号〕1008-0821(2009)09-0133-04
  
  Research on the Expert Weight of Library Quantitative AnalysisZhang Jian Jian Xiaolei
  (Library,Dalian University of Technology,Dalian 116024,China)
  〔Abstract〕The expert weight is divided into two parts as prior weight and posteriori weight when much quantitative analysis is used to evaluate library.Empirical study is made to get a more objective comprehensive expert weight to make the library quantitative analysis more scientific and reasonable.
  〔Key words〕expert weight;posteriori weight;cluster analysis;quantitative analysis;library
  
  随着信息技术及情报理论的发展,越来越多的研究人员开始注重图书馆问题的定量研究。关于图书馆定量研究的文献,近年来开始出现一些基于数学方法的相关理论和实证研究。研究人员采用层次分析法(AHP)、模糊理论、灰色理论等对图书馆的各项决策目标进行量化分析。采用这些数学方法的原因在于,图书馆决策研究属于社会科学领域的研究内容,影响图书馆决策目标的因素不仅包含定量因素,还往往包含大量的定性因素,这些定性因素是由人的主观判断来决定的。而且往往一个决策目标的实现包含多个因素,多个可选方案。这些数学方法可以较为合理的将定性问题定量化,从而将图书馆的决策目标和可选方案量化成为一个可以进行比较和衡量的具体数值或者向量,解决以往单纯靠决策者主观的感觉来进行判断和决策的困难。
  无论采用AHP方法,还是模糊理论和灰色理论,研究者首先都需要确定影响决策目标的指标体系,然后,因为各指标对决策目标的影响程度不同,需要确定各指标的权值,并最终将定性指标通过各种方法定量化。而各个指标的权值及定性指标的定量化,往往需要通过多个专家的判断来确定。
  由于专家个人的经历、经验、文化背景及个人的需求、偏好均不尽相同,因此,每个专家的判断结果的可信度也应有所不同。也就是说,无论是通过专家判断来确定指标体系的权重,还是通过专家判断来将定性指标定星化,各个专家的判断结果对研究者而言,不应该是一视同仁的,这就是本文要讨论的“专家权重”问题。
  专家权重直接影响各指标最终权重。只有将专家权重赋予较为合理的取值,才能获得最终决策目标较为科学合理的量化结果。很多研究人员为简化计算过程,默认所有专家的判断的可信度是相同的,或直接由决策者给定各个专家的权重,人为主观因素过强而忽略了专家判断的客观性。为了使靠主观判断的权重相对客观,使专家权重及各因素最终权重更加科学合理,笔者以实例探讨了对专家权重确定的一些看法,以期和同行交流。
  
  1 专家权重的组成
  
  本文在专家权重的确定方面,提出按照专家综合权重(γk),即后验权重(λk)和先验权重(βk)的凸组合来计算最终各因素的权向量。
  1.1 专家先验权重
  专家先验权重即依据专家的知识、经验、对问题的熟程度等来确定的专家权重,这部分权重是可以在专家对决策目标进行判断前获得的。对于小样本的专家判断结果,可以采用决策者主观赋权方法来简单获得专家先验权重,而对于大样本,特别是多层次专家的判断结果,专家先验权重的获取则应综合考虑。
  图书馆决策目标评判的专家选取,一般有两种方式。方式一,直接选取图书馆资深的相关专家进行判断。其优点是,图书馆专家对决策目标较为熟,并且能够代表一定的读者意见。而且,直接选取图书馆专家,对决策目标的评价和判断易于实现。缺点是,首先专家数量有限,每个专家判断对于决策目标的结果影响过大,一旦某个判断偏离,对结果的客观性则会有较大的影响;其次,图书馆专家毕竟无法代替多数读者的意见。因此,最优的选择是方式二,选择分层次大样本的专家群体进行判断,其优点是覆盖面广,判断结果相对客观可靠;其缺点是样本量大造成的计算困难,但是这个缺点可以通过程序或相关的软件得到解决。
  对于分层次大样本专家群体,一般研究者会按照身份选择图书馆员、教师、研究生、本科生4个层次,每个层次多名专家。但是实际上,每个专家的主观的可信度并不是和他的身份层次相一致的,因此,不能简单的将每个身份层次的专家赋予相同的先验权重。影响专家先验权重的主要因素包括:专家对决策目标的熟悉程度、专家是否接触过国内外其他更先进图书馆的相关决策目标;专家所在学校的级别;专家的身份;专家的年龄等等。
  假设S个专家,影响专家判断有n个因素。对于因素i,每个专家的各个因素的分值为ai,各个因素的权重为wi,则专家的最终得分:
  Ak=∑ni=1wiai k=1,2,……S;i=1,2,……,n
  专家的最终得分A与专家的先验权重β成正比,得分越高的专家,其判断的可信程度越高,其权重应该越高。即βk=αAk(α为比例系数)
  由∑ki=1βk=1得到:
  专家先验权重βk=aAk=Ak∑sk=1Ak=∑ni=1wiai∑sk=1∑ni=1wiai
  k=1,2,……S;i=1,2,……,n
  即,专家的先验权重等于专家最终得分和所有专家得分之和的比。每个影响因素的权重,可以由决策者根据经验判断,或者根据专家问卷调查方式获得。
  2009年9月第29卷第9期现?代?情?报Journal of Modern InformationSep.,2009Vol.29 No.92009年9月第29卷第9期图书馆定量分析中的专家权重问题研究Sep.,2009Vol.29 No.91.2 专家后验权重
  在实际评价时,专家所作出的评价结果的可信度并不一定与他的先验权重相一致。因此为了全面反映专家在决策过程中的权重,还必须确定专家判断结果所反映的客观可信度,这种可信度由评价结果及其相互关系所决定,是通过专家对目标的评价结果来获得的,称之为后验权重[1]。
  本文按照简单多数原则,根据专家群体判断的一致性确认专家的后验权重。依据简单多数原则,专家个体与专家群体对决策目标认识上的一致性程度高,就应认为该专家的评价水平高,具有高可信度,或者认为其意见代表大多数人的意见,应该赋予较高的权重;反之,则认为该专家评价水平低,具有低可信度,或者认为其意见与大多数人的意见相背离,应该赋予较小的权重。虽然相反的情况确定存在,但本文按照此准则作分析研究。系统聚类方法较好的遵循了专家群体判断的简单多数原则,把各个专家个体的最终排序向量看作待识别的样品,通过对其进行系统聚类分析,将排序向量相似的专家看做一类,认为其代表了大多数人的意见;而排序向量和大多数人背离的专家,认为其意见不具备代表性。根据聚类结果判别其客观可信度,给专家赋权,即后验权重赋权。
  1.2.1 系统聚类方法
  系统聚类是将一批样品或变量按照其在性质上的亲疏程度进行分类,描述其亲疏程度通常采用距离或相似系统。其基本思想是,先将n个样品各自看成一类,然后规定样品间的距离或相似程度,选择距离最小或最相似的一对并成一个新类;计算新类和其他类的距离,再将距离最近的两类合并;这样每次减少一类,直至所有样品都成一类,或到达一定的阀值为止。这样方法体现了简单多数的原则。
  系统聚类的主要过程为:
  (1)将被评价的n个样本x1,x2,…xn看成n个类,此时类间距离与样本之间的距离相等。将D(0)记为初始距离矩阵。
  (2)按照被评价对象的评价指标体系的特征,选择适当的“距离”作为不相似性度量,并找出相应的类间距离Dpq。
  (3)将与Dpq对应的类合并为一类,即选择D(0)中与Dpq对应的Gp与Gq合并为新类Gr,即Gr=Gp∪Gq。求出新类与其余类之间的距离Drk,用Drk代替D(0)中p,q行和p,q列,得到距离对称矩阵D(1)。以次类推,求解D(w),并合并相应的类。
  (4)重复步骤(3),直至所有类归为一类。或者,对于给定的聚类阀值T,当DrkT时,聚类结束。
  (5)画出按相似性或相近程度联结的谱系图。
  (6)按综合评价的精度要求,选择阀值,确定聚类结果并给出综合评价的结论[2]。
  1.2.2 专家后验权重的确定
  设评价对象为n个,参加评价的专家s个,第k个专家在某一准则层下,给出的判断矩阵为A(k),由判断矩阵A(k)求出的个体排序向量为:
  U(k)=(u(k)1,u(k)2,…u(k)n) (k=1,2,…s)
  个体排序向量U(k)和U(l)之间的相似性测度采用夹角余弦定义:
  c(k,l)=∑ni=1u(k)iu(l)i∑ni=1u(k)i2∑ni=1u(l)i212
  根据相似系统可判断两个个体排序向量的相似程度:c(k,l)越接近于1,说明第k个专家与第l个专家的个体排序向量越相似。
  通过对个体排序向量的聚类分析,将个体排序向量划分为不同的类别。假设将s个个体排序向量聚集成t个类别(ts),第p个类(pt)包含个体排序向量为φp个(φp称为类别Ωp的类容量)。假设第k个个体排序向量属于第p类Ωp,类别Ωp中包含的个体排序向量个数φp与个体排序向量总数s的比值,称为个体排序向量U(k)的置信因子,用αk表示:αk=φp/s。
  同一类别中的个体排序向量具有相同的置信因子,即同一类中的个体排序向量所表达的评价信息可以认为是相似的,而属于不同类别的个体排序向量所表达的评价信息可以认为不相似。类容易较大的类中个体排序向量所表达的评价信息符合较多评价者的意见,对应的专家应赋以较大的权重,类容量较小的类中的个体排序向量所对应的专家应赋以较小的权重。即专家k的后验权重λk与个体排序向量Uk的置信因子αk成正比[3]。
  λk=aαk=αk∑sj=1αk(α为比例系数)∑sk=1λk=1
  属于同一类的个体排序向量有相同的置信因子,因此
  ∑sj=1αj=∑tq=1φqαq=∑tq=1φ2q/s
  最终求得专家k的后验权重λk=φp∑tq=1φ2q(φp为个体排序向量U(k)所在Ωp类容量)
  1.3 专家综合权重
  若S个专家的后验权重记为λi,先验权重记为βi,则专家i的综合权重为先验权重和后验权重的凸组后:
  γi=μλi+(1-μ)βi,i=1,2,……,S[4]
  其中,0μ1反映出决策者对先验权重和后验权重的偏好程度,μ越大,表示决策者越重视专家的后验权重。特别地,若μ=1,则只考虑后验权重;若μ=0,则只考虑先验权重。μ的取值可以由决策者控制,较为灵活。这里取μ=0.5,即决策者认为专家的先验权重和专家群体一致性水平同样重要。μ的取值可以由决策者控制,较为灵活。
  需要注意的是,在按照本文所述的方法进行专家权重的确定之前,首先需要确定哪些专家的判断是有效的,即先要对专家进行筛选。特别是对于大样本多层次的专家判断,先验权重等于0或低于某个值的专家的判断结果,一般不作为有效样本进行处理。其原因在于,先验权重过低,代表专家本身的知识经验或对决策目标的了解程度极低。因此我们有理由认为,其难以提供较为客观的判断。为避免这部分无效判断扰乱整个判断结果的客观性,因此,我们将这部分判断作为无效判断进行忽略,将剩余的有效专家判断作为有效样本,按照本文所述的方法进行专家权重的确定,以保证最终决策目标的合理化分析。其中先验权重的最低值的确定,由决策者或决策专家群确定。
  
  2 实例研究
  
  假设图书馆关于某决策目标构建了多层次、多因素的综合评价体系,并聘请6位图书馆专家对各因素重要性进行判断,分别获得各个专家的判断向量。
  专家先验权重采用决策者直接赋权的方法,由决策者根据评时工作中的经验判断,赋予专家A先验权重0.14,专家B先验权重0.18,专家C先验权重0.2,专家D先验权重0.14,专家E先验权重0.16,专家F先验权重0.18。
  后验权重采用聚类分析软件SPSS计算,6位专家的排序向量数据输入如图1所示。距离采用夹角余弦,聚类方法采用类间平均联结法。最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,类间平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,且使两个类间的距离为平均距离最小,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好。图1 SPSS聚类分析数据输入页面
   系统聚类结果如下:
  表1 聚类进度表
  步 骤个案合并类 1类 2相似系数新聚类首次出现的步骤类 1类 2新聚类下次
  出现的步骤1250.9960022230.9941043140.9900044120.9893255160.985402
  图2 聚类树状图
  从系统聚类结果可以看出,阀值取0.994时,样品聚为4类。
  第一类有3位专家,包括专家B,专家C,专家E。(φ1=3)
  第二类有1位专家,包括专家A。(φ2=1)
  第三类有1位专家,包括专家D。(φ3=1)
  第四类有1位专家,包括专家F。(φ4=1)
  根据上述公式分别计算各专家后验权重λi如表2所示。表2 专家后验权重赋值表
  专 家后验权重专 家后验权重专家Aλ1=1/12专家Dλ4=1/12专家Bλ2=1/4专家Eλ5=1/4专家Cλ3=1/4专家Fλ6=1/12
  这里取μ=0.5,即决策者认为专家的先验权重和专家群体一致性水平同样重要。则根据上述公式计算专家综合权重γi如表3所示。表3 专家综合权重赋值表
  专 家综合权重专 家综合权重专家Aγ1=0.111667专家Dγ4=0.111667 专家Bγ2=0.215? 专家Eγ5=0.205? 专家Cγ3=0.225? 专家Fγ6=0.1316673 结 论
  本文将专家权重分为先验权重和后验权重,既考虑了专家的主观可信度,又考虑了专家判断结果所表现出来的客观可信度,从而使专家权重确定更具客观性。专家权重相对的客观和合理,不仅影响评价体系中各因素的最终权重的确定;也影响定性因素最终定量化数值的修正。通过本文的方法获得相对客观合理的专家权重,为图书馆后续采用数学方法进行定量研究以及决策者的客观判断奠定基础。
  
  参考文献
  [1]周宇峰,魏法杰.基于模糊判断矩阵信息确定专家权重的方法[J].中国管理科学,2006,14(3):71-75.
  [2]叶义成,柯丽华,黄德育.系统综合评价技术及其应用[J].北京:冶金工业出版社,2006:76.
  [3]郭文明,相景丽,肖凯生.群组AHP权重系数的确定[J].华北工学院学报,2000,21(2):111-112.
  [4]宋光兴,邹平.多属性群决策中决策者权重的确定方法[J].系统工程,2001,19(4):84-89.
其他文献
为了研究饱和黄土强度的影响因素,以原状饱和黄土为研究对象,应用TSZ30-2型台式三轴仪,进行了不同剪切速率及围压下的固结不排水三轴试验(CU)研究,试验结果表明剪切速率对饱
可控串联补偿技术不仅可以提高输电线路的输送容量、改善电网的潮流分布、增强系统的暂态稳定性,而且还可以抑制低频功率振荡和次同步谐振等。该研究对TCSC的基本结构及运行
【摘要】 《企业会计准则应用指南》中取消了“待摊费用”科目,给支付跨年度费用的处理带来了新问题。笔者认为应当以权责发生制为基础,根据配比原则的要求,对此类会计业务进行处理。  【关键词】 跨年度费用;会计处理;长期待摊费用    财政部于2006年10月30日颁布的《企业会计准则——应用指南》中,取消了“待摊费用”会计科目,将原属于“待摊费用”科目核算的“本期支付,在本期和以后各期负担的分摊期限在
2006年2月13日出台的新会计准则将金融资产分为以公允价值计量且其变动计入当期损益的金融资产、持有至到期投资、贷款和应收款项、可供出售金融资产四大类,不同类别的金融资
为了提高变压器油中溶解气体的分析诊断准确度,结合模糊理论和克隆选择算法,对传统的IEC三比值法的数据边界和编码进行了模糊处理,并通过模糊推理得到故障诊断结果。通过现场
【摘 要】 本文通过对我国知识经济时代人力资源会计现状的分析,提出知识经济时代需要人力资源会计的观点,同时客观分析了知识经济时代人力资源会计面临的问题并提出解决办法。  【关键词】 知识经济时代; 人力资源会计; 问题; 探讨    一、知识经济时代需要人力资源会计    “如果为使一个员工具备完成某项工作所需要的技能而对他投入一定的时间和金钱,那么就可以把他比作一台买进的机器,为了获得技能而花费
IPv6协议已被公认为下一代互联网的核心协议。IPv4到IPv6的渐进式的演化过程中,必然会出现一个IPv4、IPv6双协议长期共存的过渡时期。如何使得已支持IPv4的设备和应用程序向IP
为了满足高校扩招扩建的需要,很多学校选择向银行贷款的方式来解决资金短缺的问题本文对高校建设、贷款规模与财务风险现状进行了分析,提出了规避贷款风险的有效措施.
〔摘 要〕文章提出图书馆将科技查新与学科馆员工作相结合的初步构想,结合本馆工作实践分析该构想的客观优势,并对其可行性进行探讨。  〔关键词〕图书馆;科技查新;学科馆员  〔中图分类号〕G252.6 〔文献标识码〕C 〔文章编号〕1008-0821(2009)02-0150-03    Combination of Sci-tech Novelty Retrieval and Subject Lib
能源是国民经济的基础产业和战略性资源,是保障和促进经济增长与社会发展的重要物质基础,随着经济的高速发展,我国对能源的需求总量呈现出稳定增长的发展趋势。从我国能源市