论文部分内容阅读
摘要:本文分析了文献主题标引存在的问题及产生的原因,最后谈及把握主题标引深度所具备的条件。
关键词:主题标引 标引深度
中图分类号:G254 文献标识码;A 文童编号:1674-098X(2012)02(b)-0233-02
引言
主题标引作为机读书目数据的重要检索途径,其标引是否准确、规范,对书目数据库的检索、利用和质量具有重要影响。我们在标引工作中时常发现有关主题标引不全面,对文献所揭示的内容不够准确以及漏标文献的隐含主题的问题。因此,文献标引就要把握好一个度。
所谓标引深度:简单说是指一篇文献所赋予的全部检索标识的数量。在用词准确的基础上,标引深度就是标引文献平均所用主题词的数量,对文献的查垒率和查准率是很有影响的。那么标引一篇文献究竟用多少个主题词才算合适呢?我国国家标准局GB/T3860-1 995《文献叙词标引规则》规定标引一篇文献所用叙词数量为“手检系统平均标引用词2~5个,机检系统平均用词4-10个”。因此,标引人员要把握好标引用词数量:首先应视文献具体内容而定,一般来说,文献研究的对象和论述的问题,文献中有参考价值和检索意义的内容都是主题标引的具体对象;其次应考虑检索系统功能;另外还有考虑到文献类型、标引语言类型、服务对象等因素最终确定标引用词数量。用词过多或过少都会影响文献的查全率和查准率。
文献标引的深度是相对于浅标引和过度标引而言的,笔者在从事这项工作中发现:文献主题中存在很多浅标引和过度标引,下面将从这两方面示例和产生的原因一一表述。
1浅标引
浅标引是指文献中提炼和分析出来的主题少于文献提供的主题,没有把符合检索要求的所有主题提炼出来而造成漏标、漏检,影响文献的查垒率。也就是用词过少导致的浅标引。其表现:
(1)只看文献题名,不做内容分析:研究表明:80%~90%题名能准确或基本反映文献的整体内容或主要内容,尤其是自然科学的题名与内容相符率很高。但是,这并不意味着仅凭题名就可以进行主题分析。
示例一:《欧元大崩溃:主权债务危机引发的欧洲经济大衰退》一书,其内容是对希腊债务危机事件进行了深度分析,并沉淀了控制事件背后的幕后操作者,把欧元的生存危机真实的展现出来。如果只给出:6060#@a欧元@x研究,这样的主题标引就犯了只看文献题名,不做内容分析的错误。应把6060#@a经济危机@x研究@y欧洲也应标引出来。
示例二:《家庭应急必备》一书,本书分家庭安全与自救、生病受伤与自救、公共场所突发事件的个人应对、自然灾害的避险与自救、出行安全与自救五编介绍了家庭应急必备知识。其内容立足于应对多种突发事件和自然灾害,以家庭自救为主。有的标引员只标引出:6060#@a应急@x基本知识,显然只在文献题名上做文章,并没有全面揭示内容本质。应标引为:6060#@a自救互救@x基本知识;6060#@a灾害防治@x基本知识。
示例三:《我的五官体验书》包括嗅觉、味觉、视觉、听觉、触觉的秘密,这是一套专为低龄儿童设计的科普图画书。该系列通过引导孩子对人体进行细致人微的观察,让他们了解人们是如何依靠自己的五官来认识周围世界的。有的编目员给出了6060#@a常识课@x学前教育@教学参考资料,这是再版编目的主题词。显然没有反映出嗅觉、味觉、视觉、听觉、触觉的主标题内容,本书的适用范围和读者对象作为限定主标题也没有反映出来。因此本文献无论从查全率和查准率两方面都无从检索。正确标引形式为:6060#@嗅觉@儿童读物:6060#@a味觉@儿童读物等等。
(2)只做文献整体标引,漏标局部主题:有的标引人员不管文献内容是否复杂,只对文献做整体标引,而不注意局部的主题揭示。
示例四:《冷云传奇》一书,以长篇传记小说形式讲述抗日女豪杰冷云的传奇人生。300#@a红色少年读本抗战铁血关东魂。本文献为少儿读物。
从掌握这些信息中了解,本文献应标引为:6060#@a儿童文学@x传记小说@x中国@z现代~6060#@a儿童文学@x长篇小说@x中国@z现代,6060#@a烈士@x生平事迹@j少年读物,6060#@a女性@x生平事迹@j少年读物,这样读者可以从不同角度检索该文献,满足读者检索途径。
示例五:《中国社会生活从书》一书,分旅游篇、科考篇、饮食篇等分册,比如舞蹈篇应标引为:6060#@a社会生活@y中国@j丛书和6060#@a舞蹈史@y中国@j丛书,这样才能做到完整的标引文献。从而使文献用户在大量的文献中准确、快速、全面的查到相关特定文献,满足读者阅读需求。
(3)只标引显性主题,漏标隐性主题:显性主题是显而易见的主题,而隐性主题指在文献中没有直接加以描述,而是隐含在不同字面形式中的主题。由于隐性主题具有隐含性、相对性和模糊性等特征,往往难以分析确定,需要通过深入了解文献的主题内容才能挖掘出来。笔者在从事这项工作中发现很多医学类文献都存在漏标隐性主题。
示例六:《实用临床新药手册》,该书收编了近年来用于临床的进口、国产新药700多种,并详细介绍了每种新药的药理作用,体内过程、用途、用法与剂量及不良反应和注意事项等。如只标引为:6060#@a药物@j临床应用,那么则漏标了其重要的隐含主题:6060#@a药物@x副作用。我们在作书过程中发现这类文献的标引国图数据存在很多,应加以更新。
示例七:《职工文化体育工作与工会活动礼仪》,本书分为七章介绍了职工文化工作的基本知识、职工文化活动的组织策划、工会应用文写作、职工体育工作、职工体育运动竞赛的组织与方法、工会日常活动礼仪、工会在节日举办活动的组织策划等内容。在主题分析时,标引人员只是根据题名来标引主题,而未注意到书中所涉及的群众体育的方面的内容。主题只给了6060#@工会工作@Y中国,比较全面的标引还应再给出6060@职工@x群众体育@Y中国。
2过度标引
过度标引:指从文献中分析和提炼的主题概念多于应提炼的主题概念,把文献中有些没有参考价值或不符合检索系统要求的主题概念提炼出来,造成重复标引或过度标引,提炼错误、题文不符,容易造成误检,影响文献查准率和查全率。
示例八:《明末清初达赖喇嘛系统与蒙古诸部互动关系研究》一书,本书是一本跨学科、多领域的课题,涉及历史学、民族学、宗教学、文献学、社会学等学科的许多知识。在做主题分析时,往往错标为蒙古族、民族历史、民族问题研究、西北地区、明清时代。把“民族历史、民族问题研究”提炼出来,显然属于过度。而本书主要讲述了达赖喇嘛与蒙古各部落的关系。正确标引为:6060#@a达赖喇嘛@x关系@x蒙古族@x 部落@x研究@y西北地区@z明清时代。
示例九:《安利销售模式》一书,作者认为安利的模式在一定程度上代表了国内营销变革与国际接轨的趋势,但它却因介乎直销与传销韵边缘而备受争议。显然本书讲述了安利公司的销售经验。如果标引为:60102#@a安利公司@x销售@x经验@y美国就属于重复过度标引。因为“安利公司”这个主题词已经注明是美国公司,创建于1959年。正确标引应去掉“美国”。
示例十:《走向21世纪的亚太经济》文献重点研究了亚太地区经浇发展潜力的趋势,在比较研究中提到了欧共体和北美自由贸易区的一些统计数据,所以应标引为:6060#@a经济发展@y亚太地区,若把“欧共体、北美自由贸易区”也提炼出来就属于过度提炼,因为没有检索价值。
鉴于以上示例,我认为标引并非越深越好,标引深,检索途径多,检索率商,但过潦,检索误差大,检准率降低。那/厶产生上述两方面原因是什么?笔者认为,原因有三:
(1)文献主题标引工作是受标引人员技术水平、知识背景和专业素质制约。标引员对文献内容了解不充分,不能深入分析文献的研究对象、研究方法,习惯从文献题名推测主题内容,习惯使用CIP数据。就拿国图每天高额的工作量来说,同样会使标引员犯这个错误。为了抢时间,赶速度完成工作定额,不注意在内容概念上分析投入,往往照抄CIP主题。
(2)把好标引审校关是至关重要的。因为标引者之间的文化水平、专业水平及知识面或多或少都存有差异,主题标引水平也会参差不齐,这就需要审校人员本着认真负责的态度把好质量关,统一标引深度。标引员也要通过自检、互检形式,对标引结果进行审查,以求高质量的标引结果。
(3)应根据国图特点、文献入藏情况,对主题标引方式、标引深度,主题分析要求等做出具体规定,以便标引人员有章可循。
3结语
笔者从事这项工作以来深深体会到主题标引就像国医大师开处方,不经过长期的实践积累不能轻易就给出一篇文献的主题词,书做的越多,考虑问题角度和内涵越广。尤其是专业性强、跨学科、多领域的文献要慎之又慎。因此,我认为标引一篇文献,要掌握这个度要具备三个条件;一是文献已具备论述了某方面具体内容-二是有一定的参考价值;三是具有检索意义。
参考文献
[1]孙凤梅,曹高芳,李艳芝.主题标引在文献检索中的作用及提高标引质量的对策[J].图书馆论坛,2004,lO,24(5):148~149。
[2]杨洁.主题标引常见问题分析[J],科技情报开发与经济,2005,15(21).
[3]林娜.浅析中文文献主题标引准确性[J].重庆图情研究,2006(3)7:43
[4]杨建,王平南,张宇清.文献主题标引分析与解决方法[J].现代情报,2005,5(5):124~125.
[5]邱翠云.文献主题标引适度性探析[J].管理研究:81.
关键词:主题标引 标引深度
中图分类号:G254 文献标识码;A 文童编号:1674-098X(2012)02(b)-0233-02
引言
主题标引作为机读书目数据的重要检索途径,其标引是否准确、规范,对书目数据库的检索、利用和质量具有重要影响。我们在标引工作中时常发现有关主题标引不全面,对文献所揭示的内容不够准确以及漏标文献的隐含主题的问题。因此,文献标引就要把握好一个度。
所谓标引深度:简单说是指一篇文献所赋予的全部检索标识的数量。在用词准确的基础上,标引深度就是标引文献平均所用主题词的数量,对文献的查垒率和查准率是很有影响的。那么标引一篇文献究竟用多少个主题词才算合适呢?我国国家标准局GB/T3860-1 995《文献叙词标引规则》规定标引一篇文献所用叙词数量为“手检系统平均标引用词2~5个,机检系统平均用词4-10个”。因此,标引人员要把握好标引用词数量:首先应视文献具体内容而定,一般来说,文献研究的对象和论述的问题,文献中有参考价值和检索意义的内容都是主题标引的具体对象;其次应考虑检索系统功能;另外还有考虑到文献类型、标引语言类型、服务对象等因素最终确定标引用词数量。用词过多或过少都会影响文献的查全率和查准率。
文献标引的深度是相对于浅标引和过度标引而言的,笔者在从事这项工作中发现:文献主题中存在很多浅标引和过度标引,下面将从这两方面示例和产生的原因一一表述。
1浅标引
浅标引是指文献中提炼和分析出来的主题少于文献提供的主题,没有把符合检索要求的所有主题提炼出来而造成漏标、漏检,影响文献的查垒率。也就是用词过少导致的浅标引。其表现:
(1)只看文献题名,不做内容分析:研究表明:80%~90%题名能准确或基本反映文献的整体内容或主要内容,尤其是自然科学的题名与内容相符率很高。但是,这并不意味着仅凭题名就可以进行主题分析。
示例一:《欧元大崩溃:主权债务危机引发的欧洲经济大衰退》一书,其内容是对希腊债务危机事件进行了深度分析,并沉淀了控制事件背后的幕后操作者,把欧元的生存危机真实的展现出来。如果只给出:6060#@a欧元@x研究,这样的主题标引就犯了只看文献题名,不做内容分析的错误。应把6060#@a经济危机@x研究@y欧洲也应标引出来。
示例二:《家庭应急必备》一书,本书分家庭安全与自救、生病受伤与自救、公共场所突发事件的个人应对、自然灾害的避险与自救、出行安全与自救五编介绍了家庭应急必备知识。其内容立足于应对多种突发事件和自然灾害,以家庭自救为主。有的标引员只标引出:6060#@a应急@x基本知识,显然只在文献题名上做文章,并没有全面揭示内容本质。应标引为:6060#@a自救互救@x基本知识;6060#@a灾害防治@x基本知识。
示例三:《我的五官体验书》包括嗅觉、味觉、视觉、听觉、触觉的秘密,这是一套专为低龄儿童设计的科普图画书。该系列通过引导孩子对人体进行细致人微的观察,让他们了解人们是如何依靠自己的五官来认识周围世界的。有的编目员给出了6060#@a常识课@x学前教育@教学参考资料,这是再版编目的主题词。显然没有反映出嗅觉、味觉、视觉、听觉、触觉的主标题内容,本书的适用范围和读者对象作为限定主标题也没有反映出来。因此本文献无论从查全率和查准率两方面都无从检索。正确标引形式为:6060#@嗅觉@儿童读物:6060#@a味觉@儿童读物等等。
(2)只做文献整体标引,漏标局部主题:有的标引人员不管文献内容是否复杂,只对文献做整体标引,而不注意局部的主题揭示。
示例四:《冷云传奇》一书,以长篇传记小说形式讲述抗日女豪杰冷云的传奇人生。300#@a红色少年读本抗战铁血关东魂。本文献为少儿读物。
从掌握这些信息中了解,本文献应标引为:6060#@a儿童文学@x传记小说@x中国@z现代~6060#@a儿童文学@x长篇小说@x中国@z现代,6060#@a烈士@x生平事迹@j少年读物,6060#@a女性@x生平事迹@j少年读物,这样读者可以从不同角度检索该文献,满足读者检索途径。
示例五:《中国社会生活从书》一书,分旅游篇、科考篇、饮食篇等分册,比如舞蹈篇应标引为:6060#@a社会生活@y中国@j丛书和6060#@a舞蹈史@y中国@j丛书,这样才能做到完整的标引文献。从而使文献用户在大量的文献中准确、快速、全面的查到相关特定文献,满足读者阅读需求。
(3)只标引显性主题,漏标隐性主题:显性主题是显而易见的主题,而隐性主题指在文献中没有直接加以描述,而是隐含在不同字面形式中的主题。由于隐性主题具有隐含性、相对性和模糊性等特征,往往难以分析确定,需要通过深入了解文献的主题内容才能挖掘出来。笔者在从事这项工作中发现很多医学类文献都存在漏标隐性主题。
示例六:《实用临床新药手册》,该书收编了近年来用于临床的进口、国产新药700多种,并详细介绍了每种新药的药理作用,体内过程、用途、用法与剂量及不良反应和注意事项等。如只标引为:6060#@a药物@j临床应用,那么则漏标了其重要的隐含主题:6060#@a药物@x副作用。我们在作书过程中发现这类文献的标引国图数据存在很多,应加以更新。
示例七:《职工文化体育工作与工会活动礼仪》,本书分为七章介绍了职工文化工作的基本知识、职工文化活动的组织策划、工会应用文写作、职工体育工作、职工体育运动竞赛的组织与方法、工会日常活动礼仪、工会在节日举办活动的组织策划等内容。在主题分析时,标引人员只是根据题名来标引主题,而未注意到书中所涉及的群众体育的方面的内容。主题只给了6060#@工会工作@Y中国,比较全面的标引还应再给出6060@职工@x群众体育@Y中国。
2过度标引
过度标引:指从文献中分析和提炼的主题概念多于应提炼的主题概念,把文献中有些没有参考价值或不符合检索系统要求的主题概念提炼出来,造成重复标引或过度标引,提炼错误、题文不符,容易造成误检,影响文献查准率和查全率。
示例八:《明末清初达赖喇嘛系统与蒙古诸部互动关系研究》一书,本书是一本跨学科、多领域的课题,涉及历史学、民族学、宗教学、文献学、社会学等学科的许多知识。在做主题分析时,往往错标为蒙古族、民族历史、民族问题研究、西北地区、明清时代。把“民族历史、民族问题研究”提炼出来,显然属于过度。而本书主要讲述了达赖喇嘛与蒙古各部落的关系。正确标引为:6060#@a达赖喇嘛@x关系@x蒙古族@x 部落@x研究@y西北地区@z明清时代。
示例九:《安利销售模式》一书,作者认为安利的模式在一定程度上代表了国内营销变革与国际接轨的趋势,但它却因介乎直销与传销韵边缘而备受争议。显然本书讲述了安利公司的销售经验。如果标引为:60102#@a安利公司@x销售@x经验@y美国就属于重复过度标引。因为“安利公司”这个主题词已经注明是美国公司,创建于1959年。正确标引应去掉“美国”。
示例十:《走向21世纪的亚太经济》文献重点研究了亚太地区经浇发展潜力的趋势,在比较研究中提到了欧共体和北美自由贸易区的一些统计数据,所以应标引为:6060#@a经济发展@y亚太地区,若把“欧共体、北美自由贸易区”也提炼出来就属于过度提炼,因为没有检索价值。
鉴于以上示例,我认为标引并非越深越好,标引深,检索途径多,检索率商,但过潦,检索误差大,检准率降低。那/厶产生上述两方面原因是什么?笔者认为,原因有三:
(1)文献主题标引工作是受标引人员技术水平、知识背景和专业素质制约。标引员对文献内容了解不充分,不能深入分析文献的研究对象、研究方法,习惯从文献题名推测主题内容,习惯使用CIP数据。就拿国图每天高额的工作量来说,同样会使标引员犯这个错误。为了抢时间,赶速度完成工作定额,不注意在内容概念上分析投入,往往照抄CIP主题。
(2)把好标引审校关是至关重要的。因为标引者之间的文化水平、专业水平及知识面或多或少都存有差异,主题标引水平也会参差不齐,这就需要审校人员本着认真负责的态度把好质量关,统一标引深度。标引员也要通过自检、互检形式,对标引结果进行审查,以求高质量的标引结果。
(3)应根据国图特点、文献入藏情况,对主题标引方式、标引深度,主题分析要求等做出具体规定,以便标引人员有章可循。
3结语
笔者从事这项工作以来深深体会到主题标引就像国医大师开处方,不经过长期的实践积累不能轻易就给出一篇文献的主题词,书做的越多,考虑问题角度和内涵越广。尤其是专业性强、跨学科、多领域的文献要慎之又慎。因此,我认为标引一篇文献,要掌握这个度要具备三个条件;一是文献已具备论述了某方面具体内容-二是有一定的参考价值;三是具有检索意义。
参考文献
[1]孙凤梅,曹高芳,李艳芝.主题标引在文献检索中的作用及提高标引质量的对策[J].图书馆论坛,2004,lO,24(5):148~149。
[2]杨洁.主题标引常见问题分析[J],科技情报开发与经济,2005,15(21).
[3]林娜.浅析中文文献主题标引准确性[J].重庆图情研究,2006(3)7:43
[4]杨建,王平南,张宇清.文献主题标引分析与解决方法[J].现代情报,2005,5(5):124~125.
[5]邱翠云.文献主题标引适度性探析[J].管理研究:81.