论日文图书自建数据库的书目质量控制

来源 :科学与财富 | 被引量 : 0次 | 上传用户:pldpl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文以本馆日文数据数据库建设的经验和问题为基础,从馆藏整理、运行环境、操作规范等方面论述了日文自建书目数据库的质量控制。
  关键词:回溯建库;质量控制;日文图书
  目前我国图书馆的中、西文图书书目数据库的建设已经基本完成,并日趋成熟,形成了全国性和地区性的联合目录数据库。而日文图书由于在各馆馆藏中所占的比例小,馆员日文编目能力较弱,计算机软、硬件条件限制等因素,日文图书书目数据库的建设仍然处于起步阶段。虽然CALIS联合编目中心已经建立了以日本国立情报学研究所综合书目数据库为数据源的日文联合编目数据库,但是由于多种原因,仍有许多馆不能利用CALIS联合编目数据库,需要进行以原始编目为基础的回溯建库工作,这样,日文图书自建数据库书目质量的控制问题就成为建库的核心问题。
  近年我馆进行了日文图书的回溯建库工作,总结建库工作中的经验和问题,笔者想以建库工作流程为思路,主要从馆藏整理、运行环境、操作规范等方面谈一下自建日文数据库的书目质量控制。
  1 馆藏的清点与整理
  馆藏清点与整理是数据录入的前提,也是书目质量控制重要环节。馆藏图书是书目数据库的物质基础,书目数据库是館藏图书的数据反映。只有将馆藏图书理清、理顺,以其为依据的书目数据库的建设才能有序进行,所形成的书目数据质量才能得到保证,以此为依托的馆藏数据统计、检索查重等图书馆业务工作和读者检索、图书流通等读者工作才能得到有效保证。
  馆藏数据清点与整理主要包括以下三个方面的内容:
  1.1 书卡核对
  书卡核对的依据应该是公务目录中的分类目录。图书馆藏书经过多年的流通,肯定会有一定的流失,而由于诸多原因,这些流失的图书没有被详细记录,没有在公务目录上全部反映的情况一定存在;另一方面,由于人员的更替,图书馆公务目录在长期积累的过程中在著录项目、著录规范等方面存在许多问题和纰漏。
  书卡核对主要做以下工作:①以公务分类目录为依据核对图书顺序,对乱架的图书进行整序。②核对图书存在情况。对于没有相对应图书的登录号,如经查证后确实没有图书,在卡片上注明“无书”字样,对该登录号做注销处理;对有书无卡的情况,应补充卡片数据。③核对分类号、书次号是书卡核对的重点。图书馆在长期编目过程中,由于分类法的更换、修订、分编人员变化以及同一人员在不同时期对分类法的理解不同、查重不准确等等诸多因素,会产生分类错误或分类不一致;同时由于图书集中与分散著录的标准在执行时的不一致,致使多卷书、丛书的分类号和书次号取号原则不一致,;图书版本、印次的不同所产生的书次号混淆现象也很常见。而以上这些问题表如果不进行修改,在下一步的计算机数据录入时会出现索书号重复、同书异号等现象。这就需要图书馆制定建库分类标准、集中著录与分散著录标准、同类书区标准,并在书卡核对环节按照标准更正和修改与标准不符的分类号和书次号,为数据录入打好基础。
  1.2 藏书剔除
  在书卡核对过程中,对复本过多和破损严重的文献进行剔除,并在卡片上做标注。
  1.3 注销登记
  依据卡片标注,对在查明无书和剔除的藏书进行图书和/或财产帐的注销。
  2 条形码和磁条的加工
  在完成馆藏整理后就可以进行图书条码和磁条的加工。条形码是图书馆财产的反映,条形码数量应根据注销后的财产帐的统计数据,条形码的语种号应根据本馆对各语种的管理方法给定。
  3 图书分类
  对于自建数据库来说,本步骤是个可选过程。每个图书馆的日文图书都采用一种分类法,如中国人民大学图书馆分类法、中国科学院图书分类法或中图法,有的图书馆在不同时期使用了不同的分类法。如果从资源共享的角度考虑,在建库时,应对图书进行中图法分类,增加中国图书馆图书分类号;如果只是想建成本馆数据库,在局域网进行运行,本步骤可以省略。
  3.1 图书分类
  图书的分类遵循《中国图书馆分类法》最新版相关规定。
  3.2 图书书次号的选取。
  日文图书书次号的选取应遵循以下原则:①西文姓名直接取姓、名首字母;习惯以名称呼的西方作者,则依次取两位首字母;西文团体依次取前两词首字母(不含首冠词)。②佚名作品(无原作者,不包括译者等)根据题名前两个汉字取;西文佚名作品取前两词首字母(不含首冠词)。③如果重号再加大写字母区分,同一著者的书尽量取号接近:④同一作者同一种书,如为不同版次,用括号加版次区分,如ABA(3);否则加短横数字区分(从2往后取),如ABA-2。
  4 运行环境
  4.1 MARC格式
  关于日文图书的计算机编目系统,除了日本的JAPAN/MARC系统以外,有美国的RLG于1983年开发的处理中、日、朝文资料的CJK系统和加拿大公用书组织Utlas自1986年以来开发的以日本标准格式JAPAN/MARC为基础的日文资料联机编目系统。在我国,有关日文编目系统方面的报道尚未见到。
  依据中国农业大学图书馆李晨英、韩明杰以该馆实践经验为基础的《套用CNMARC机编中文图书的可行行分析》中对CNMARC字段和JAPAN/MARC的比较(如图)可以看出,JAPAN/MARC中关于ISBN(M)所要求的著录规则在CNMARC中都可以得到体现。
  经过CALIS联合目录编目中心近几年的实践也证明,采用CNMARC格式可以实现中文平台的检索和流通。所以可以采用CNMARC格式进行日文图书的回溯建库。(见表1)
  4.2 文字处理系统
  Microsoft IME 2000的出现解决了日文输入法的问题。它提供了在中文Windows 2000/xp环境下的日文罗马输入法,支持中文Word、Excel、WPS、Outlook记事本等常见编辑器内的日文整句自动切入(包括常见变化处理),通过输入法的切换,一个文件里可以同时出现中、日、英文字,不会出现乱码,在书写器中有平假名、片假名、全角、半角等选项,为难字、生字的输入提供方便。   4.3 系统软件
  我馆使用PFT大连伯菲特文献集成管理系统中文图书编目系统。
  5 操作规范
  在数据录入前要根据日文图书编目特点,依据ISBD标准,编写出日文图书编目著录原则、名称规范(标引)原则和主题标引原则,同时编制MARC必备字段及其使用说明。
  日文图书著录总则:
  如前所述,日文图书的著录采用CNMARC格式,那么著录规则也应以中文著录规则为准,在涉及到日文的特殊地方作区别规定。
  5.1 适用范围
  细则适用于正文为日本语,或以日本语为主的印刷型日文图书。日本或中国出版的面向具有中文能力读者的中文学习材料和中国出版的日本语文献重印本,以日文图书著录。
  5.2 著录文字和数字
  题名与责任说明项、出版发行项、丛编项均按文献本身所用文字如实著录;载体形态项、附注项、文献标准编号与获得方式项用日文著录(日文固有汉字及片假名、平假名)。
  5.3 字符录入原则
  基本套用中文数据录入原则;遇到计算机系统难以显示的文字、图形及符号等用“◆U◆”表示。
  5.4 详简级次
  图书馆可参照本馆中文著录详简级次和机读目录的有关规定,确定每个记录中字段与子字段的必备性。
  5.5 集中著录与分散著录
  ●单行本文献,一般分散著录。
  ●丛书一般采取分散著录。
  ●多卷集
  具有共同题名,但单个物理单位没有具有独立意义的题名,只有卷册区别,采用集中著录。下层的各卷册不作分析著录。
  多卷册虽有分卷题名,但没有独立意义,并且有总责任者时,一般应集中著录。
  多卷册图书虽然有分卷册,但没有独立意义,各分卷册有独立的ISBN及各自的责任者时,最好采用分散著录。
  具有共同题名,且各个物理单位都又相对独立的分卷题名、作者等区别于其他卷册的书目信息时,一般以卷册为单位分散著录。
  具有共同题名的一套书中,当若干个卷册具有相同的、具有區别于其他卷册的题名时,这几个卷册采取集中著录。
  文学作品中的全集类文献,要根据题名页的正题名情况判断是分散著录还是集中著录。
  6 日文图书著录细则
  以下以MARC记录为顺序,谈以下日文图书著录中特殊需要注意的地方。
  6.1 000记录头标区
  5字符位 记录状态代码:回溯建库的代码选用“n”;
  6字符位 记录类型代码:选用“a”表示印刷型文字资料;
  7字符位 书目级别代码:单册图书、集中著录的多卷书用“m”;分散著录丛书的单册用“m”;集中著录的丛书用“s”;
  8字符位 层次等级代码:无等级关系的单册图书、集中著录的多卷书选用“0”。
  6.2 010国际标准书号
  ●“$b 限定信息”是对ISBN范围的说明,通常是ISBN与整套文献或特定卷册的关系说明;本字段还可以记录说明文献装订形式的信息,如“並装版”、“合装版”、“改装版”等。
  ●“$d价格”子字段中货币符号统一使用“円”;若文献已经注明是“非卖品”,且无价格,则在本子字段注明;当同一图书同时存在“売品”和“非売品”2种销售方式时,不论ISBN号是否相同,都以“売品”为著录对象;图书单册著录,但价格是全套价格时,需在价格后的圆括号内著录“全套”或“X册”字样。
  6.3 100一般数据处理
  ●8-16字符位与中文普通图书的填写方法相同。注意授权影印版日文图书的代码应选择“e”。
  ●17-19字符位注意a不能与b、c、d、e组配,常用代码“kna”。
  ●21字符位,通常情况下用“0”。
  ●22-24字符位,选用“jpn”。
  ●25字符位,通常情况下选未使用音译方案,代码为“y”。
  ●26-29字符位,选用GBK字符集代码为“0121”。
  ●30-33字符位,通常情况下不需要补充字符集,用“####”。
  ●34-35字符位,表明正题名使用文字,选用代码“da”。
  6.4 101 文献语种代码
  本字段代码的填写“jpn”。
  6.5 102出版国别
  日文文献没有出版地区代码,只有出版国别代码,为“JP”。
  6.6 105 编目数据字段:专著性文字资料
  大多数数据元素的选取与中文普通图书相同,只在0-3字符位图表代码的描述中,注意以下两个问题:
  ●描述图的类型时,日文文献只采用“図”、“地図”、“肖像”三种表达形式。
  ●自然科学文献中的示意图,应用代码“a”,并在215$c子字段中著录“図”。
  6.7 200 题名与责任说明项
  6.7.1 正题名按照规定信息源所载题名如实著录,但由于在排版的特殊性,应特别注意以下几点:
  ●正题名上含有对某一词的日语注音时,要直接著录在该词后的圆括号中。
  例:200 1#$a青い思想(こころ)$Aアオイ ココロ
  ●题名前冠有出版社时,依原题照录,并在517字段提供除去出版社名称的题名检索点。
  例: 角川 漢和中词典
  200 1#$a角川漢和中词典
  517 1#$a漢和中词典
  ●题名前冠有年代、时代时,依原题著录。
  例: 明治以降本帮主要経済統計
  200 1#$a明治以降本帮主要経済統計
  ●题名前文字对书中内容起限定作用时,依原题照录。   例 学校 図書館の整理
  200 1#$a学校図書館の整理
  ●表示内容程度的文字依据原题照录。
  例: 初级フランス語
  200 1#$初级フランス語
  ●题名前冠有说明图书特色、性质的文字,如讲座、年谱、年表、图解、口述、体系、最新、新编、概说、总说、参考、评传、应用、实用等冠词时,依照原题照录,并在517字段提供去掉冠词的题名检索点。
  例: 改正健康保险法解说
  200 1#$a改正健康保险法解说
  517 1#$a健康保险法解说
  ●责任者已是题名的组成部分时,如著作集、专题汇编等题名前冠有责任者名称时依原题照录。
  6.7.2 责任说明
  ●责任者超过三个,只著录第一个,后加[ほか]表示。
  ●若文献题名页上的责任者有“监修”、又有“编”者时,“编”者作为第一责任说明,“监修”为第二责任说明;若文献题名页上只有“监修”,则著录“监修”。
  例: コンサイス外国人名事典
  200 1#$aコンサイス外国人名事典$三省堂編修所編$相田重夫[ほか]監修
  ●题名前冠有小字责任者时,不应视责任者为题名的组成部分,应将其著录在相应的责任说明字段。
  例: ストテン有機機器入門/小松芳郎訳
  200 1#$a有機機器入門$fストテン著$f小松芳郎訳
  6.7.3 205版本项
  ●除第一版外,各个版次以及与版本有关的说明信息均著录在$a子字段,版次一律用阿拉伯数字表示。著录时用“第x版”形式。
  例: 205 ##$a第二版
  205 ##$a改訂増補版
  ●题名前冠有表示版本内容、版本种类的信息,应著录在版本项。
  例: 縮約 国史大系
  200 1#$a国史大系
  205 ##$a縮約
  6.7.4 出版发行项
  ●著錄影印本和其他复制本时,本项应著录复制本的出版地、出版者及出版日期。原版的出版信息著录在附注项。
  例:200 1#$a新明解国语词典
  205 ##$a復刻本
  210 ##$a北京$c世界图书出版公司北京公司$d1999
  300 ##$a復刻原本:東京:三省堂,1997.11
  ●版发行年一律用阿拉伯数字著录,著录到月。如出版年非公元年,一律改为公元年著录。
  ●版本为私家版时,出版者著录个人名。
  例: 210 1#$a音羽街(爱知县)$c山口卓郎$d1978
  ●多卷书出版年各不相同时,如集中著录,100出版类型代码用“g”。
  6.7.5 载体形态项
  ●图书同时有図、彩図、地図、肖像、摹真等特征时,只著录“図,地図,肖像”,中间用逗号标识;表格不著录。
  ●附件的数量用阿拉伯数字,单位可用“p、枚、册”表示。
  6.7.6 丛编项
  日文丛编的卷册标识比较复杂,著录时一律照录,不可随意更改位阿拉伯数字编号。
  6.7.7 4xx 连接款目块
  日文著录中一般常用的连接字段有410、423、454,其他连接字段可根据编目文献的具体情况选择使用。
  6.7.8 6xx和7xx著录信息块的机读目录格式的使用说明与中文普通图书基本相同;关于标目的选取可参照《国立国会图书馆件名标目表》、《现代日本名人录》、《广辞苑》、《日本人物辞典》;分类法的使用参照各分类体系。
  6.7.9 馆藏项
  建立书目数据库前,图书馆财产帐的管理如果是按语种分别做财产登记,那么,不同语种的图书就会有许多相同的登录号,在建立计算机数据库时,如果对登录号不进行区分,容易在中央数据库产生重复登录号,在以登录号做检索点进行数据检索时则检索不到该数据。
  我馆用登录号前加语种英文字母首字母的方法解决了不同语种登录号的重复问题,方便了数据的检索,提高了数据库的书目质量。
  7 数据录入
  鉴于建库工作量大,需要工作时间长,熟悉编目的工作人员少的情况,数据的录入可以分两步来做。
  第一步进行卡片数据录入。先对普通工作人员或懂日文的勤工俭学人员进行MARC格式和著录规则的培训,然后根据核对过的公务分类目录的卡片顺序,按批号进行数据录入。
  第二步实物数据录入。由本馆编目人员根据批号调出卡片数据,依据图书实体进行数据核对、主题词录入,条形码扫描。
  结束语
  日文书目数据库的建设,既有回溯书目数据库建设的普遍特点,也有日文书目数据的特殊性。所以在日文书目数据库的建设过程中,可以借鉴中、西文书目数据库的建设和管理方法,对数据库进行统筹管理;同时要抓住日文建库的重点,克服难点,制定有针对性的条例和实施办法,将书目质量控制贯穿于数据库建设的各个阶段。
  参考文献
  [1]李晨英,韩明杰.现代图书情报技术,1996(2):47-50
  [2]张艳.图书馆回溯书目数据库建设,2003(12):107-110
  [3]谢琴芳.CALIS联机合作编目手册(上册).北京:北京大学出版社,2000
  [4]CALIS联合目录日文文献著录细则.http://www.calis.edu.cn
  作者简介:许爱萍(1968-),女,硕士,副研究馆员,发表论文10篇。
其他文献
摘 要:餐饮外卖这一服务行业拥有较为悠久的历史,但过去发展一直较为缓慢。如今,借着互联网这一有利平台,餐饮外卖得到了蓬勃发展,但同时也带来了诸如监管、卫生等方面的问题。本文分析了餐饮外卖的历史发展和行业现状,结合在某大学的调研,指出了现阶段餐饮外卖行业存在的一些问题,并对未来这一行业的发展提出了建议。  关键词:餐饮外卖;配送员;外卖网站;监管  1 餐饮外卖的历史描述  关于我国外卖的历史,最早
会议
摘 要:信息技术在各行各业的普及和发展,为当代社会发展与精神带来了巨大贡献,在此背景下,人事档案管理也逐渐步入信息化建设阶段。人事档案信息化建设是人事档案工作发展到一定阶段的必然,符合社会发展规律,因此相关工作人员应该秉持积极的态度,客观看到目前人事档案信息化建设中存在的诸多问题,并能够不断完善和创新人事档案信息化建设的相关制度与措施,全面推动其发展。  关键词:人事档案信息化;建设;发展  引言
摘 要:结合实际,重点探讨了如何完善非法证据排除的救济制度。  关键词:非法证据排除;制度;完善  1 对拒绝受理的处理可进行复议  当事人在一审中提出非法证据排除的申请,法院经过初步审查后认为不符合启动非法证据排除程序的情形,对当事人的请求进行了拒绝,依照法律的规定,当事人有权提出上诉,笔者认为,采用这样的方式实际上是在案件的实体裁判作出之后才对程序性事项进行审理,如果二审认为一审法院拒绝受理非