标准之争与万码归一

来源 :西藏人文地理 | 被引量 : 0次 | 上传用户:gankai0319
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  微软、苹果和Linux等世界主流操作系统,相继实现基于国际标准的藏文支持功能,实际上是为最大层面的藏文使用者打开了真正的应用之门。
  ——扎西次仁(中国藏学研究中心资深信息技术专家,微软Vista藏文版研发组技术顾问)
  
  1995年起即从事藏文编码国际标准研发的尼玛扎西,如今是西藏大学网络信息中心主任,也是藏大藏文信息化相关研究领域的学科带头人。1997年7月,他所属的研发团队编制的藏文编码体系国家标准和藏文编码字符集等,就已通过了国际标准化组织认证而成为国际标准,并于1998年1月1日在全国实施。“从那一天起,藏文就成为我国少数民族文字中,第一个正式进入国际标准编码体系结构的文字。”尼玛扎西强调说:这是藏文获取接轨信息化高速大道通行证的标志。
  
  然而,尼玛扎西话锋一转又说道:这一习惯上被称为小字符集的国家及国际标准,在其后的几年里却并未得到广泛应用,之前以各种标准进行研发的态势仍在继续。所以,2006年10月,国家又颁布了新的标准《信息技术-藏文编码字符集-扩充集A》,也就是通常所说的“大字符集”。
  导致从小字符集转向大字符集的原因通常是这样解释的:由于藏文本身书写特点和我国技术水平的现状,该标准(指1997年的小字符集)难以在我国的藏文信息处理系统上实现,这严重迟滞了我国的藏文信息化建设。为此要制定藏文编码字符集的扩充集标准。
  作为过程亲历人,尼玛扎西承认技术水平确实是根本的促变原因,为此他举了一简单的例子:作为拼音文字的藏文并不像英文那样,可以以“字母、间隔符号等元素”作简单横向组合,藏文中还存在大量的字母与各种符号间的纵向组合方式。比如,从已知藏文尤其是古藏文中的梵音转写字等的统计可知,有多达7重叠加组合成的藏字,而当时的输入法对那种超出4重叠加的藏字(其实不只是藏字,凡是在结构上显现叠加特征的文字都存在这种问题)就无法录入,更说不上显示、打印和数据交换了。在这种情况下, “因挪用了部分公共编码空间段”而字符存量较大的大字符集,确实好运用一些。
  但孰优孰劣并不能总局限在当时的技术背景下来权衡。随着技术的不断提升,坚持以小字符集编码标准的研究之路已愈显宽广。同样供职西藏大学的学者高定国,就一直坚持以小字符集编码标准进行藏文信息化基础开发。
  他告诉记者,随着新一代能实现多达50重叠加文字造字的程序出现,小字符集在属于自己的编码空间段里,已经腾挪出比大字符集大得多的空间。这主要体现在三个方面,一是基于小字符集而来的藏字都是编码之间的自由组合,像一个孙悟空却拥有72神变,可随组随用。而大字符集是机械地收录生僻字,然后把它们做成固定的编码,并给一一安排位置以供调用。这就好比把孙悟空生掰成72个,不能收放自如了。二是编码空间段是划定还是挪用的问题。大字符集被挪用的空间总是要还的。三是信息化的标准无疑是越国际越通行。将之前国家和国际标准合二为一的局面分拆开来,只能是暂时的。
  作为技术顾问深度参与过Vista实现藏文支持研究的中国藏学研究中心信息专家扎西次仁,如今仍和微软保持密切联系,通过电子邮件处理来自微软有关藏文操作系统BUG检测和调试等请求,是他的日常工作之一。他告诉记者说:“随着第一款全面支持藏文的主流操作系统“Windows Vista”于2007年1月30日的全球发布,一直存在于我国藏文信息化领域的“大小(字符集)之争”就实质性结束了。”其实在他心中,这个结束的日子其实还应该提前,当2000年微软和Adobe公司共同研发出OpenType字体格式及其造字技术后,有关小字符集标准无法运用的技术瓶颈(即利用国际编码实现藏文动态叠加造字技术)就已经告破。所以,现在再探讨“大小之别”的原因毫无意义。扎西次仁认为:藏文信息化的真实历程是,以前有标准而无主流操作系统支持,现在有操作系统支持而缺应用软件开发。对于搞藏文信息化的我们来说,该着手什么再清楚不过了。为此扎西次仁向记者介绍了他目前正在进行的工作。
  标准不一至少为国内外带来了几十种藏文编码,这种“万码奔腾”互不兼容的局面,让大量已经电子化的藏文文档资料难以互通。但如今,一款名为“通用藏文字体转换软件”的超级工具,却能在16种主要藏文编码文字间实现自由转换。目前,这款由扎西次仁独立研发的软件,正在实现网页运行功能,不久即会在网络上免费发布使用。
  万码归一之后又面临字体不够的困境。扎西次仁介绍说:藏文有多达20多种的字体,但目前基于国际编码标准的藏文字体只有微软的藏文正楷一种,苹果公司最新操作系统最近也实现了藏文支持,字体和微软一样,也是藏文正楷,但做得要平滑漂亮一些。扎西次仁课题组目前正在研发的字体有四种,都是精选历史上比较受欢迎的藏文名家字体。包括朱擦体、白楚体和丘乙体,还有乌金体,即通常所说的楷体。只有基于国际编码标准字符集,用OpenType字体技术才能设计出前三种字体。这就是为什么到今天在计算机中还见不到其他藏文字体的原因。这项字体研发工作计划将于今年8月完工后免费推出。当然,他们也希望这些字体最终能被微软等大操作系统采用,从而被更多的藏文电脑使用者使用。
其他文献
目的 观察缺氧对培养的牛视网膜色素上皮 (retinal pigment epithelium,RPE)细胞增生和凋亡基因 bcl- 2表达的影响。 方法 用四甲基偶氮唑蓝 [3- (4,5 - dimethylthiazole