论文部分内容阅读
查重是图书分类的先决条件,是图书馆编目工作中一个非常重要的环节,查重的质量直接影响到分类标引的质量,进而影响到整个机读目录数据库的质量,最终影响文献的开发和利用。在进入信息化时代的今天,随着计算机技术、网络技术的普及与发展,推动了图书馆自动化水平的提高,使图书编目利用网络进行已成为现实。在编目过程中,文献查重不仅仅只是传统意义上的查找馆藏重复记录,而是包括查找可以利用的外部数据库资源,分编工作的重点由此转向以数据查找和数据审校工作为主。根据这一特性,如何有效地利用计算机网络的优势,寻求科学合理的分类查重方法与技巧,来提高分类的准确性,减少重复劳动,提高编目效率,确保图书馆藏书建设质量,最终为读者检索图书提供科学依据,具有现实的指导作用和实践意义.
一、ISBN查重
ISBN号是国际标准书号的简称,它具有唯一性和标准性。用ISBN号查重较题名查重或责任者查重简单易行,省时省力,可操作性强,是计算机编目中被广泛采用的一条重要检索途径。其方法是通过条码识别仪一扫文献封面后页上的ISBN条形码,就能很快查到所需要的图书数据(仅出现一条记录),这种方法的优点是快而准,缺点是有时找不到与之相联系的图书作参考。使用ISBN号查重,由于出版商对“在中国注册的出版社所出版的每一种图书”的内涵和外延没有明确的界定,各家出版社都按自己的理解和需求来使用ISBN号,造成了ISBN号的复杂性。
二、题名查重
1、全名称检索法。将某种图书的正题名全部准确地输入计算机,查找本馆是否收藏,我们把它叫做全名称检索法。这一方法优点是查准率高,具有针对性,缺点是输入汉字多,耗时。下列情况还可能造成漏检或误检:
第一,不规范的题名文字,模棱两可、容易引起歧义的题名。如电子工业出版社2002年6月出版的《全国计算机等级考试用书》为一套丛书,首批推出12种,也有的著录为《新大纲全国计算机等级考试用书》,因为“新大纲”3个字以不同颜色、不同字体排在题名前上方,这3个字是否可作为题名部分,不同的编目员观点不一,从CALIS下载的数据中就能证明这一点,有的在丛书名前冠以“新大纲”,有的则不取此3个字,这时就体现出了查重工作的严谨性。对于有歧义的题名,仅取一种意见是不够的,应充分考虑各种可能性,有可能被理解成几种意义,就要用几种意义去查重,以保证整套丛书集中与分散的统一。
第二,著录不规范。著录员对于题名中的一些符号、字母、数字或空格等信息理解不一致。
第三,题名过于简单。如《线性代数》《有机化学》《高等数学》《国际法》等,需要比较的记录太多,难于辨别,容易被同书名、不同内容的书籍所误导,导致误检和分类错误,这种情况需用责任者或ISBN号组配查重。
2、模糊检索法。将题名前方一致的信息输入计算机,查找本馆的收藏情况,我们把它叫做模糊检索法。对于第一种精确查重而出现的漏检情况,可采用这种方法。例如《小说月报第4届百花奖获奖作品》,在计算机中输入“小说月报”,通过这种模糊检索,可将本馆内数据库中收藏的不同届次的图书予以集中。这种检索方法检索出来的大量命中记录,对分类标引具有很好的参考作用,便于将同类型图书集中标引。
3、截词检索。用截词和包含关系的题名输入计算机,查找馆藏信息,我们把它叫做截词检索。这种方法是用文献题名所包含的名词和词组进行查找。对题名中带有“年代或时间特征”的图书,查重时应去掉年份,用含有(包含关系)进行查重,便于将此类图书集中标引。
三、责任者查重
用责任者标目检索文献,其查准率达74.7%,责任者查重可当做判别记录异同的重要依据。这种方法是在题名不确定或是题名过简过繁时采用,也常用于查找外国文学作品上。这是因为同一部外国文学作品往往因译者不同而产生不同的题名,如:《哈克贝里•费恩历险记》,又称《玩童历险记》;《巴黎圣母院》有的译为《钟楼怪人》,有的译为《钟楼驼侠》。上述情况,若还以题名和ISBN号查重,就很容易把它们作为不同种书处理,导致一书两入,此类型应以责任者查重为佳,这样才能将同种书的不同翻译题名、不同版本作集中处理,从而达到查重的目的。需要注意的是用责任者查重也有一定的局限性,应视具体情况具体分析。如责任者重名情况较多,系统会出现大量的命中记录,使逐条查找反而较麻烦,这时宜选择其他检索点。同一著作的不同译本或不同版本,所翻译出的责任者不同,如《卡希人像摄影选集》,尤索福•卡希著,有的译为“尤索福•卡什”著,若仅用责任者进行查重,容易漏检,需用题名组配查重。另一种情况是由于名称著录不规范,如“卡内基”与“卡耐基”,卡耐基为规范名称,但有的出版物著为卡内基,如果编目员疏忽没有加以规范就会漏检,因此,应用规范和不规范名称两种方式查重,并结合其他查重途径,以确保查重的准确性。
四、结语
图书分类查重可供选择检索的途径很多,俗话说得好,“条条道路通罗马”,但关键是选择何种捷径省时、省力、效率最高。上述谈到的ISBN号查重、题名查重、责任者查重,3种检索方法是最常见并且是较适用的方法,笔者在多年分编工作实践中,选择上述3种检索方式,并灵活加以应用,对提高工作效率,保证查重的准确性起到了很好的作用。但这里需要说明的是,任何事物的选择,都不是绝对的。分类查重工作始终应遵循:根据具体情况进行多检索点查重,是复本的要避免重复记录,是同种书或同类书的要加以集中,这样才能减少重复数据,保证标引和著录的一致性,从而提高书目数据库的质量,为图书馆其他工作打下良好的基础。
一、ISBN查重
ISBN号是国际标准书号的简称,它具有唯一性和标准性。用ISBN号查重较题名查重或责任者查重简单易行,省时省力,可操作性强,是计算机编目中被广泛采用的一条重要检索途径。其方法是通过条码识别仪一扫文献封面后页上的ISBN条形码,就能很快查到所需要的图书数据(仅出现一条记录),这种方法的优点是快而准,缺点是有时找不到与之相联系的图书作参考。使用ISBN号查重,由于出版商对“在中国注册的出版社所出版的每一种图书”的内涵和外延没有明确的界定,各家出版社都按自己的理解和需求来使用ISBN号,造成了ISBN号的复杂性。
二、题名查重
1、全名称检索法。将某种图书的正题名全部准确地输入计算机,查找本馆是否收藏,我们把它叫做全名称检索法。这一方法优点是查准率高,具有针对性,缺点是输入汉字多,耗时。下列情况还可能造成漏检或误检:
第一,不规范的题名文字,模棱两可、容易引起歧义的题名。如电子工业出版社2002年6月出版的《全国计算机等级考试用书》为一套丛书,首批推出12种,也有的著录为《新大纲全国计算机等级考试用书》,因为“新大纲”3个字以不同颜色、不同字体排在题名前上方,这3个字是否可作为题名部分,不同的编目员观点不一,从CALIS下载的数据中就能证明这一点,有的在丛书名前冠以“新大纲”,有的则不取此3个字,这时就体现出了查重工作的严谨性。对于有歧义的题名,仅取一种意见是不够的,应充分考虑各种可能性,有可能被理解成几种意义,就要用几种意义去查重,以保证整套丛书集中与分散的统一。
第二,著录不规范。著录员对于题名中的一些符号、字母、数字或空格等信息理解不一致。
第三,题名过于简单。如《线性代数》《有机化学》《高等数学》《国际法》等,需要比较的记录太多,难于辨别,容易被同书名、不同内容的书籍所误导,导致误检和分类错误,这种情况需用责任者或ISBN号组配查重。
2、模糊检索法。将题名前方一致的信息输入计算机,查找本馆的收藏情况,我们把它叫做模糊检索法。对于第一种精确查重而出现的漏检情况,可采用这种方法。例如《小说月报第4届百花奖获奖作品》,在计算机中输入“小说月报”,通过这种模糊检索,可将本馆内数据库中收藏的不同届次的图书予以集中。这种检索方法检索出来的大量命中记录,对分类标引具有很好的参考作用,便于将同类型图书集中标引。
3、截词检索。用截词和包含关系的题名输入计算机,查找馆藏信息,我们把它叫做截词检索。这种方法是用文献题名所包含的名词和词组进行查找。对题名中带有“年代或时间特征”的图书,查重时应去掉年份,用含有(包含关系)进行查重,便于将此类图书集中标引。
三、责任者查重
用责任者标目检索文献,其查准率达74.7%,责任者查重可当做判别记录异同的重要依据。这种方法是在题名不确定或是题名过简过繁时采用,也常用于查找外国文学作品上。这是因为同一部外国文学作品往往因译者不同而产生不同的题名,如:《哈克贝里•费恩历险记》,又称《玩童历险记》;《巴黎圣母院》有的译为《钟楼怪人》,有的译为《钟楼驼侠》。上述情况,若还以题名和ISBN号查重,就很容易把它们作为不同种书处理,导致一书两入,此类型应以责任者查重为佳,这样才能将同种书的不同翻译题名、不同版本作集中处理,从而达到查重的目的。需要注意的是用责任者查重也有一定的局限性,应视具体情况具体分析。如责任者重名情况较多,系统会出现大量的命中记录,使逐条查找反而较麻烦,这时宜选择其他检索点。同一著作的不同译本或不同版本,所翻译出的责任者不同,如《卡希人像摄影选集》,尤索福•卡希著,有的译为“尤索福•卡什”著,若仅用责任者进行查重,容易漏检,需用题名组配查重。另一种情况是由于名称著录不规范,如“卡内基”与“卡耐基”,卡耐基为规范名称,但有的出版物著为卡内基,如果编目员疏忽没有加以规范就会漏检,因此,应用规范和不规范名称两种方式查重,并结合其他查重途径,以确保查重的准确性。
四、结语
图书分类查重可供选择检索的途径很多,俗话说得好,“条条道路通罗马”,但关键是选择何种捷径省时、省力、效率最高。上述谈到的ISBN号查重、题名查重、责任者查重,3种检索方法是最常见并且是较适用的方法,笔者在多年分编工作实践中,选择上述3种检索方式,并灵活加以应用,对提高工作效率,保证查重的准确性起到了很好的作用。但这里需要说明的是,任何事物的选择,都不是绝对的。分类查重工作始终应遵循:根据具体情况进行多检索点查重,是复本的要避免重复记录,是同种书或同类书的要加以集中,这样才能减少重复数据,保证标引和著录的一致性,从而提高书目数据库的质量,为图书馆其他工作打下良好的基础。