网络词典出版中的伦理问题研究

来源 :编辑之友 | 被引量 : 0次 | 上传用户:sleon001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  网络不仅改变了辞书出版的流程和形态,而且给辞书出版带来前所未有的伦理挑战。文章首先概述三类网络词典(信息提取类、维基架构类和网站集合类)的出版技术基础,然后分析网络技术对词典出版的影响,最后指出唯技术论不可避免地导致真善美在网络词典出版中的边缘化。
  网络词典 出版伦理 技术 真善美
  张雅,南京信息工程大学语言文化学院讲师;卢华国,南京信息工程大学语言文化学院副教授;陈志杰,南京信息工程大学语言文化学院,教授,硕士生导师,博士后。
  2013年国家社会科学一般项目“翻译伦理学研究”(13BYY021)、2010南京大学人文社会科学“985工程”三期改革型项目“当代西方语言学前沿理论研究及应用探索”(NJU985JD05)和2013年南京信息工程大学教学改革研究课题“基于EAP理论的理工类高校大学英语后续课程研究”(13JY030)成果之一。本研究还受到2012年度江苏政府留学奖学金项目的资助。
  出版是传播科学文化、信息和进行思想交流的一种社会活动,同任何一项社会活动一样,需法律、法规的支持与约束,需接受有关政府行政部门的支持与指导,更需出版行业的职业道德及其从业人员的自律。[1]法律代表的是底限要求,道德则代表一种更高要求,任何出版行为都同时受到法律和伦理道德的双重约束,都须做到既合法又合理。作为一种重要的学术出版类型,辞书出版亦不例外。
  一、辞书出版的伦理维度
  辞书编纂离不开对前人成果的借鉴。一方面,辞书是一种信息密集型文本。为节约空间,辞书正文中仅限于用户需要的信息。除在附录中列出所参考的蓝本词典外,辞书无法像其他学术出版物那样在正文中明确标注引用或借鉴的来源。另一方面,辞书编纂以语言文化为处理对象。鉴于语言文化的传承性,辞书编纂者往往受制于各种规约,能够发挥的空间非常有限。如除新词新义外,编者撰写释义时,往往要遵循既有的规范,不可能另起炉灶,创造出一个与前人完全不同的释义。因此,与其他学术出版物相比,辞书产品的创新性往往不够明显。辞书特殊的编纂方式和信息布局模糊了出版中的借用和剽窃,给唯利是图者以可乘之机。近年来,辞书侵权案件频发,凸显了辞书出版中存在的法律问题,引起了人们的高度重视。
  辞书出版是一种社会活动,不仅追求利益,且还肩负着一定的文化使命,受到出版伦理的制约。出版伦理包括出版的道德观念与价值取向,在具体的出版行为中表现为特定的出版理念。所谓出版理念指通过对出版活动目的性的理性认识和思考所形成的关于出版价值的根本性判断,一般来说,包括对人类文化求真、求善、求美的目标追求。[2]辞书也应该秉承正确的理念,在具体的出版过程中实现对真善美的追求。具体讲来,这里的“真”,指辞书在内容方面须正确无误且合乎规范。如词典提供的语言文化信息必须正确,这样用户查阅词典时才不至于误解或误用这个词。这里的“善”,指辞书须有正确的导向,与主流价值观保持一致。如词典在释义时不能传达一些带有明显种族偏见的内容,而应尽可能使用一种中性的语言。这里的“美”,指辞书应把形式和功能统一起来,以用户可把握的方式组织辞书信息,从而帮助其方便快捷地查到自己需要的信息。真、善、美集中体现了辞书出版活动的价值追求,它们之间是层层递进的关系,共同构成了辞书出版的伦理规范。
  辞书出版中的侵权总是与经济收益挂钩,利益受损方为维护自身权益主观上愿意对这样的行为进行追责。从客观角度看,侵权是一种违法行为,以法律为依据批判和追究这种行为具有较高的可操作性。由于上述两方面的因素,辞书界对出版中的法律问题倾入了较多的关注。与法律相比,伦理对行为的调节,以价值性为要点,它赋予规则以价值的内涵,所以伦理是所谓的应当(should,ought)规范,由美德主观能动地完成。[3]换言之,辞书出版伦理是一种柔性的约束,往往通过主体在道德压力下唤起羞耻感和罪恶感而起间接作用。因此,无论从主观还是客观上讲,国内辞书界对辞书出版中伦理问题的关注都缺少足够的动因。
  辞书出版中的法律问题主要涉及辞书的商品属性,辞书出版中的伦理问题则与辞书的工具属性密切相关。前者面向出版商和编者,影响的主要是其经济利益;后者面向用户群体,不仅改变其知识结构,且往往能够从意识形态上对他们产生潜移默化的影响。网络词典是电子词典的一种,借助电脑、手机等终端设备向用户提供数据服务,使用起来既方便又快捷,因而深受用户(尤其是年轻用户)的欢迎,拥有比传统纸质词典更广泛的用户群体。鉴于网络词典的影响面更广,对这类词典出版中的伦理问题进行研究是非常有必要的。
  与传统出版相比,网络出版拓展了出版物的概念,扩充了出版主体,实现了多元化出版,且可以实现出版信息交流的交互化。因此,必将对传统出版伦理产生巨大的影响。[4]就传统辞书而言,编纂和出版是两个不同的过程,即专家搜集数据,在辞书文本中以条目的形式予以编排呈现,然后把所有的条目集中在一起并按照特定的方式汇编形成辞书,最后以书稿的形式交由出版社排版、印刷和出售。在网络环境中,辞书的出版可化整为零,即编者每编完一个词条就可在网上公布。辞书的编纂和出版之间的先后关系变成了一个持续交替的关系,呈现出一体化的趋势。网络辞书出版的新特点给辞书出版伦理研究带来了全新的研究课题。
  二、网络词典出版的三种类型
  网络词典又称在线词典,指构建在网络平台上,通过使用某种计算机网络语言将机器可读的词典文本转换为可在网络中检索的辞书,并向用户提供实时查询服务的数字化参考工具。[5]从词典内容的来源看,网络词典还可分为有版权和无版权两类。有版权网络词典以受到版权保护的辞书为内容依托,把这些辞书进行数字化处理后在网络上向用户开放;无版权词典要么通过技术手段对网页进行抓取或收集获取词典数据,要么由热心网友依托维基平台撰写词条并汇集而成。
  1. 信息提取类
  随着 Web信息采集技术和自然语言处理技术的迅速发展,从拥有海量资源的网络上获取有效数据和知识以便更好地服务于基础和应用研究已成趋势。在搜索引擎和数据挖掘技术的推动下,基于网络的双语素材获取技术日益受到关注。[6]据相关研究看,目前从网络中提取的双语素材主要有双语词对和句对两种。数据抓取的来源有双语对照网页和普通网页两类。顾名思义,双语对照网页本身即是双语对照,所以从中配对并提取双语素材相对简单。从学术论文的中英文摘要或关键词中提取双语词对或句对就属于这一种情况。从普通网页中配对并提取双语素材(主要是词对)则复杂得多。如从学术论文中提取散落在其中的词对(比如,论文作者首次引入新术语时,往往会同时给出外文术语),技术人员需判断目标词之间的距离以及它们之间是否构成双语对应关系等等,而这对二语或外语学习者而言也并非易事。为免去用户查找、选择的烦恼,技术人员以搜索引擎为依托开发出了一种新型的“信息提取类词典”。具体讲,就是通过搜索引擎获取海量网页数据,然后借助自然语言处理中的数据挖掘技术对其进行分析,从中提取所需要的信息并自动生成一个庞大的、可自动及时更新的动态词典资源库。   2. 维基架构类
  网络技术日新月异,在其自身不断发展的同时,也一直影响甚至可能制约着网络辞书的发展模式。在前“维基时代”,受制于传统网站集中发布模式,普通用户只能浏览信息而不能随意发布信息,所以处在一种被动接受的地位,或者说只是传统意义上的“用户”。而进入“维基时代”之后,维基技术的创生颠覆了这种信息传播的传统模式。作为一种崭新的信息发布方式,维基技术使任何人都可对自己在互联网上看到的页面进行编辑,且编辑结果在网络上同时向其他用户公开,并允许被再次编辑和修改,从而实现网页的可擦写功能。维基架构类词典正是基于以维基技术为核心的合作软件构建的网络新词典。这类词典堪称辞书进入“维基时代”的重要标志。维基架构类词典对用户没有任何门槛限制,用户不仅可免费使用这类资源,更重要的是可参与编写。这类词典通常不设专职的编辑队伍,一般采用所见即所得的编辑模式,页面操作非常简单,用户只要会点鼠标、会打字就可参与词典的编写工作。这类词典的高度开放性为热心网友搭建了一个展示技能和知识的平台,使用户能够自己动手,体验分享知识的乐趣。由于理论上拥有无限的编辑人员队伍,该类词典在容量增长和内容更新方面是传统词典所不可比拟的。[7]
  3. 网站集合类
  一方面,传统词典受到信息容量的限制,须在广度和深度之间做出取舍;另一方面,与日新月异的语言变化相比,词典自出版之日就已显滞后,无法满足用户在新词新义方面的需求。[8]这意味着用户有时需查阅多本词典才能找到自己需要的答案。然而,来回翻阅多本大部头纸质词典是一件费时费力的事情。网站集合类词典的出现为解决这个问题提供了一种思路。与信息提取类词典一样,该类词典以搜索引擎为技术实现前提,但是与前者相比,其词典内容来自可单独使用的网络词典资源。网站集合类词典只是把这些分散在不同网页的在线资源汇集在一起,旨在为用户提供一站式的查询服务。根据词典信息的呈现方式,网站集合类词典可以大致分为两个小类:词典名称类和词条全文类。当在第一类词典的输入框中键入某个词项进行检索后,词典呈现给用户的是一长串具体的词典名词,每个词典名称对应着一个超链接,用户选择点击超链接后进入相应的词典界面,阅读相关的词条内容。与词典名称类网络词典不同,词条全文类网络词典直接把多个词典的词条内容在屏幕上同时呈现给用户,用户可像浏览网页一样直接阅读所有搜索到的词条内容。
  信息提取类词典依靠数据挖掘技术从网页上获取词典数据,维基架构类词典在Web2.0环境中借助wiki技术为网民搭建了一个参与辞书编纂和出版的平台,网站集合类词典则直接借助搜索引擎把分散在网络上的词典资源汇集在一起。这三类词典虽然在内容来源上各有不同,但现代技术在其编纂和出版中都发挥了举足轻重的作用。网络技术的深度介入以及传统编纂和出版主体的缺席使得这三类词典在出版伦理方面表现出了不同于传统词典的特征。
  三、网络新词典出版中的伦理失范
  网络不仅改变了词典的存在形态,且革新了词典的出版方式。如牛津大学出版社宣称,从第4版开始,《牛津英语词典》的印刷版将宣告终结,全部改为网络版;据法新社报道,拥有244年出版历史的《大英百科全书》也宣布将停止印刷版,实现全部数字化,其中网络出版是一个重要的发行方式;学习型词典新秀《麦克米伦高级英语词典》在官网上宣称在售完词典的纸质版之后也将只推出网络版等等。有人甚至宣称互联网时代再也无需那种由专家编纂、机构出版的词典了。网络新词典通常被视为专家型词典的替代品。如果说在传统词典的出版中存在伦理失范的情况,那么在标榜自由、开放和免费的虚拟世界中,由于难以实施有效的审核和过滤机制,网络词典出版中的伦理问题更加突出。
  在信息提取类词典中,有道词典有着广泛的影响力。尼尔森网联研究在调查金山、谷歌等7个品牌之后,发现有道词典的覆盖率达到58%,位居7个被调查品牌之首;平均每周被使用12次,累计达36分钟,均明显高于同类其他网络词典。原因之一就在于有道词典提供的信息内容丰富,涵盖了“网络释义”“双语例句”“专业释义”“短语”“权威例句”“原声例句”多个类别。然而,由于主要依靠计算机技术且缺少语言专家的专业判断和审慎筛选,这几类信息都不同程度地存在问题。如许多专业释义实质上只是普通释义,根本谈不上专业性;短语包含了大量的偶然性组合,不能被视为语言学意义上的短语;权威例句和原声例句的典型性不足,难以真正起到示范的作用。有道词典提供给用户的“网络释义”和“双语例句”有时则存在严重的错误。如在网络释义中,有道词典为流行语“忽悠”提供了4个对应词:hooyoo、flicker、poof和E。其中,排在第一位的是hooyoo,系从350网页提取而来。追踪这些网页后,笔者发现hooyoo多被用作网站的名字,与“忽悠”的“欺骗”意义没有任何关系。排在第二位的flicker仅与“忽悠”的陈旧义项(飘忽不定)有关,排在第三、第四的poof和E则让人不知所云。有道词典提供了如下两个例句:1. Abundance doesn’t mean redundance. The hound found a profound book on the roundabout.(充裕并不意味多余。猎犬在旋转木马上找到一本深奥的书)2. My stockbroker have advise against buy those share. (我的股票经纪人告诫我不要购买那些股票)在这两个例句中,第一个句子让人觉着滑稽可笑,追踪来源网站后发现,作者写出这样的句子不过是为加深读者印象,从而达到巩固记忆考研词汇的目的。第二个句子不符合最基本的语法规则,明显是机器翻译的结果。显然,这样的句子连正确性都无从保证,不符合辅助二语或外语学习的功能需求,更无法实现传统双语词典例句应有的功能。
  在维基架构类词典中,维基词典当属最典型的代表。由于维基词典内容几乎每天都在更新添加,要统计其词条数目是一件不容易的事情。维基词典官网显示,截至2014年4月30日,维基词典英文版共有3 742 854个词条。维基词典虽收词量大且词条内容丰富,但也存在比较明显的问题。高永伟曾从宏观和微观层面对维基百科存在的问题进行了细致探讨,认为其中的主要问题体现为立目随意、例证不典型、释义不准确等方面。[9]即使这些问题中的大部分属于非专业网友的无心之失,也不代表我们可以忽略某些有意而为之的“错误”。在维基词典中我们不难发现某些带有个人或群体意识痕迹的信息内容。如维基词典为Taiwan这样一个政治上较为敏感的词提供了一个主流词典均未收录的义项:Common name for a country in East Asia. Official name: Republic of China. Its defacto capital is Taipei(东亚某国,官方名称为“中华民国”,台北是其实质上的首都)。在这里,中国的台湾省被定义为一个独立的“国家”,词条撰写者的政治立场也就不言自明了。维基架构类词典中的另一个典型是都市词典(Urban Dictionary)。当媒体近日都在津津乐道都市词典收录了网络用语“no zuo no die(不作死就不会死)”时,同样不能忘记撰写者的意识形态对词条内容所产生的影响,如在都市词典中,male(男性)被定义为“Generally good people. But there are some examples of true assholes who do think that women are inferior to them(一般是好人,但也有一些十足的混蛋认为女人低一等)”。该释义因为赞成者人数(2214)超过反对者人数(885)而被收入词典。表面上,这是少数服从多数的民主理念在虚拟世界中的体现,而实质上却反映了现实社会中女权主义者对女性不平等地位的愤慨和对男性的不满。   OneLook Dictionary创建于1996年,在网站集合类词典中可谓是历史悠久,索引的网络词典达到了1061部。试以book为例说明OneLook Dictionary的信息呈现特点。在检索栏输入单词book之后,词典返回的检索结果中列出了100部词典,用户点击与具体词典对应的超链接后,离开词典列表,进入相应的词条页面,阅读该词典中的book的释义。如果用户发现查询一本词典不能满足自己的需要,可退回到词典列表页面后再次重复同样的步骤以进入其他词典的词条界面。由于过度依赖超链接,用户在需要对不同词典的释义进行比较时,只能在词典列表和词条页面间反复跳转,加剧了信息的碎片化,使用起来相当不便。The Free Dictionary是网站集合类词典中的另一个典型。官网上明确标出迄今为止已为6 507 050 523位用户提供过查询服务,足见其影响力之大。The Free Dictionary把索引的词典分为词典/近义词词库、医学词典、法律词典、缩略语、习语和百科全书(包括维基百科)5个类别。该词典与OneLook Dictionary最明显的不同之处在于它直接把词条内容作为检索结果呈现给词典用户。用户可依次阅读所有词典中的book词条,免去了来回切换之苦。然而,每一本词典中罗列出的book义项都在30个左右,阅读全部词条并非易事。词典只是在低层次上把词条拼凑在一起,彼此之间缺乏有效的整合,内容重复比较严重,造成了信息过载,虽做到了“多而杂”,却难言“精和美”。网站集合类词典为用户提供的服务与传统纸质词典相比并无质的提高。词典学家Lew对这类词典提出了如下的批评,“链接和嵌套是互联网的核心要素,但在集合类词典中却走了极端,其结果是数个网络词典的内容被粘贴和拼接在一起,形成的新词条长得不可思议”。[10]
  在信息提取类词典中,技术完全主导了词典的出版。值得注意的是,无论信息提取技术所依赖的算法如何先进,对语言信息的提取精准度总是受到限制。从上文对有道词典相关内容的分析中亦可清楚地看到这一点。词典一向被用户奉为语言运用的圭臬。如果词典无法反映语言现实,存在严重的“失真”现象,连最起码的正确度都无法得到保障,也就失去了作为工具书存在的价值和前提。在维基架构类词典中,高度的开放和自由也带来了无序和混乱。普通网民在编纂词条时,不仅在内容方面难以保障正确性,且还会有意或无意地携带“私货”,把词典变成了个人好恶的秀场。在对某个词条的内容产生分歧时,网民可通过投票表决来解决争议,但让不具有专业背景的网民解决严肃的学术问题,只会把个人的好恶变成群体的偏见。如在都市词典中,虽对male的定义颇有人身攻击的意味,但这个词条依然因赞成者占多数而被词典纳入。义工式的词典编纂和出版行为并非总是向善之举。作为词典资源的搬运工,网站集合类词典的创建者只能借用这些资源,却无权对其从内容编排上进行有效的整合。其结果是这类词典要么滥用超链接,加剧了信息的碎片化,要么把搜索到的词条简单地拼凑在一起,造成信息的大量冗余。“词典美是功能美和形式美的统一”,[11]在此意义上,网站集合类词典的功能和形式之间难言和谐之美。
  结 语
  毋庸置疑,技术在现代辞书出版中发挥了重要作用。然而,在享受技术所带来的便利的同时,人们往往忽略了技术背后孕育的伦理危机。就网络词典出版而言,一方面,网络出版的碎片化和即时性加大了对词典出版监管的难度;另一方面,网络出版的去中心化解构了编者在传统词典出版中的权威地位。技术在网络词典出版中因而被赋予至高无上的地位,成为网络词典赖以存在的基础。换言之,没有网页抓取技术、维基技术、搜索引擎等技术要素,上述三类词典也将不复存在。技术地位在网络词典出版中的过度彰显不可避免地导致了真善美的边缘化,也为辞书出版伦理带来新的挑战。
  参考文献:
  [1] 孙宝寅. 金兼斌. 繁荣出版与出版伦理建设[J].出版与科技 1998(1):7-8,17.
  [2] 赵东晓. 网络出版及其影响[M]. 北京:中国人民大学出版社,2008:191.
  [3] 刘华. 法律与伦理的关系新论[J]. 政治与法律,2005(1):3-7.
  [4] 黎伟华. 网络出版对传统出版伦理的影响[J]. 科技与出版,2009(3):55-56.
  [5] 魏向清,耿云冬,王东波. 中国辞书发展状况报告(1978-2008)[M]. 北京:商务印书馆,2014:223.
  [6] 王东波,苏新宁. 英汉双语句子级平行语料库自动构建[J]. 现代图书情报技术,2009(12):47-51.
  [7] 卢华国. 试论现代辞书学发展的“维基范式”[J]. 外语研究,2011(3):70-73.
  [8] 王正,孙东云. 论双语词典的修订[J]. 中国图书评论,2009(8):53-59.
  [9] 高永伟. 网络时代的英汉词典修订[J]. 辞书研究,2010(1):74-75.
  [10] Lew R. Online Dictionaries of English [C] in Fuertes-Olivera,P.A.,& Bergenholtz,H.(Eds.). E-Lexicography:The Internet,Digital Initiatives and Lexicography.Bloomsbury Publishing.2011:230-250
  [11] 丁骏. 词典可以很美——词典中的美学思考[J]. 复旦外国语言文学论丛,2006(05秋季号):206-212.
其他文献
21世纪是信息化的时代,信息素养成为促进教师专业发展的催化剂。作为“准教师”的高校师范生是未来中小学教师的主力军,针对当前高等院校师范生信息素养的现状及存在的问题,阐述
新的教学模式以现代信息技术为支撑,特别是网络技术,使英语教学朝着个性化学习、不受时间和地点限制的学习、主动式学习方向发展。通过使用Hot Potatoes制作英语听力选择题和
参加过演讲活动的青年朋友都知道,很难有一个演讲者,能让全场的听众都聚精会神地听他的演讲,尤其是在演讲比赛中,大家都在讲着同一个话题,听着听着就会让人不耐烦起来。那么,怎样才
创始于2006年的中国作家富豪榜正逐渐演变为一个时尚品牌。虽然对榜单的意义聚讼纷纭,但从中仍可得出一些值得关注的特点:少年儿童成长为核心受众,文化产业催生类型化生产,网络创
【摘要】 外语学术出版物指有关外语语言学、外国文学、外语教学、翻译理论与实践以及跨文化研究等学科的各类图书。这类图书发行量小、受众面窄,但对于引领外语学科建设具有十分重要的意义。文章列举我国目前外语学术图书开发中存在的问题,分析外语学术图书开发的新动向,并就外语学术图书新的开发模式进行探讨。  【关键词】外语 学术图书 问题 动向 新模式  【作者信息】许进兴,上海外语教育出版社副编审。  外语学
在电子信息类专业中为提高程序设计类课程的教学质量,提出了一种以计算机仿真技术为平台的教学方法,并对基础类和中高级类程序设计课程的仿真教学方法进行了讨论,介绍了曾使用和
随着网络通信技术的发展、学生特点的变化及精品课程建设的深入,目前的网络教育教学平台已不能满足教学需要。通过分析网络技术、学生特点和精品课程评审要求的变化,提出了新一
利用大口径柱测试己内酰胺生产中己内酰胺含量。通过对各种萃取剂及各种柱型的筛选,确定了最佳的分析条件:以甲苯作萃取剂,以SE-54作为分析柱,不分流进样,外标法峰面积定量.并考察
随着社会的发展,基础教育越来越受到人们的重视,学校和社会对当代教师提出了更高的要求,教师必须提高自己的素质来面对激烈的竞争,师范类院校担负着培养未来教师的重任。以教