论文部分内容阅读
每天,我们都在使用汉字,用各种输入法把汉字装进电脑、浏览网络上用汉字表达的各种信息、用手机收发着一条条中文短信……无论是打字、排版、设计、制作,还是上网、通讯、娱乐、消费,汉字无处不在。那么,你是否知道,汉字是如何批上电子外衣的?
字库——汉字大本营
如果你很早就开始接触电脑,也许感叹过全英文界面的不便。不久,硬件字库(汉卡)技术让汉字进入电脑,再后来,微软推出了Windows 95操作系统,安装了Windows 95操作系统的电脑在汉字显示时就不再需要汉卡,而由汉字字库取而代之了。
字库就好比储存在电脑、手机里的文字仓库,从仓库中找到对应的汉字就可以显示出来。但汉字数目巨大,如果全部制作出来,将异常庞大。还好常用的汉字只有数千字,国家选取了汉字里的常用字制作了国家标准和相应的字库。字库的开发需要组织巨大的人力物力,一套精美的汉字字库从设计到最后成型,需要2~3年的时间,并且价格昂贵。
小提示
为了防止不同字库间的差异化,国家授权专门从事汉字字库字模及其周边开发的企业进行研发,最后形成的点阵汉字标准归国家所有并强制执行,而具体的字库字形内容归企业所有。
字体——汉字美化剂
不同的字体与源远流长的书法有着紧密的联系。电子汉字诞生前,首先由专业字体设计师在纸上固定大小的格子内,书写出统一风格的汉字字形设计稿。然后扫描成高精度点阵字库,给出其字库编码,接着将刚才扫描到的点阵字体矢量化,最后再经过人工修字等步骤。
具体怎么修?怎样变得更好看?这就需要了解“字体”了。
1.点阵字体(位图字体)
这种字体在有限的点格上,通过填写黑白两色来表现符号笔画结构。使用时直接读取并显示,所以显示效率高,效果清晰,占用内存少。但是放大时会出现明显的锯齿,如果要在别的分辨率下显示需要另外制作字体,导致字体制作量增大。点阵字体常用的代表字型是BDF、PCF。我们通常在计算机屏幕上看到的中文字体、手机、PDA、MP3播放器或机场、商场的广告版上的字体基本上都是点阵字体。
2.矢量字体(可缩放字体)
这种字体通过公式和参数描述的数学曲线来表现符号轮廓,可无限放大,做倾斜等变化,但边缘依然保持光滑,适合于高清晰度打印,但计算比点阵字体更耗时。点阵字体和矢量字体的关系类似于wav和midi的关系。
3.TrueType字体
TrueType(ttf)是矢量字体的常用代表字型,是 Apple和Microsoft为了对抗Adobe的PostScript所共同制定的开放标准,并且由系统直接提供支持,不需外挂其他管理程序。TrueType中文字体按照国家标准有宋体、楷体、仿宋体、黑体,还有很多其他美术体、书法体等。为了适应英文字体的显示方式,还使用了粗斜体。
如此重要的字体当然需要强大的技术支持,其实主要有两大核心支撑。
(1)让字体平滑的anti-alias(AA)技术:这是针对矢量字体的技术,会让字体边缘看起来圆滑、无锯齿。它将字型先在幕后以数倍的大小来绘制,然后再缩成想要的大小,未能占满一格像素的格子就用灰色填补。所以对于大字体,相应的笔画变粗,字体边缘的灰阶相对整体变少,效果很好;小字体时英文等笔画较少的字符文字会好看些,而对于部分中文矢量字体就会因边缘灰度过多而看起来模糊发虚。
(2)微调字体的hinting技术:这是用来优化小字体显示的方法,可以在颜色、间距、高低、匀称等方面达到很好的效果。由于显示器的种类不同,同种显示器的点距不同,分辨率也不尽相同,所以矢量字体的缩放就需要考虑更多的问题,如果控制得不好就会让小字体破碎变形。hinting嵌入字体内部,人工详细指定了如何在字体缩放、变形后的显示方法,字体渲染引擎(指X的Xft\\ freetype\\ fontconfig 系统)就根据这些指示使小字看起来更美观。hinting 是非常费时费力的工作,不是所有的字体都有,更不是所有的字体都做得好。Truetype字体很多,但是有良好hinting的不多,劣质的hinting反而会让字变得更糟糕。
说了这么多,那么中文字体到底用什么方法解决呢?解决方法有三种:一是使用上面提到的点阵字,二是加粗、加黑、加深字型,让它占据更多的像素,而不是用灰色的点填充边缘,三是使用 hinting 技术。中文字体众多而复杂,针对每个字体进行微调将非常耗时,所以第三种方法不太现实,只能使用点阵字体、内嵌点阵的矢量字体(此时需关闭anti-alias),或者加粗加黑的矢量字体(此时需打开anti-alias),来达到满意的显示效果。
小提示
真正的汉字字库的诞生,要经过长时间艰苦的劳动,步骤有:
绘制字稿、把字稿进行扫描输入进电脑、数字化拟合、修字(字形的修边、平移、复制、缩放、翻转、增删笔划等)、质检、整合成库、测试、商品化等,就“新鲜出炉”了。
TrueType——造字初体验
平时我们难免会碰到一些无法输入的怪字,电脑字库中没有怎么办?刚才了解了造字的原理,我们就趁热利用Windows的TrueType造字程序体验一下吧。
1.造字
进入“开始→所有程序→附件→TrueType造字程序”,双击对话框中的方格选定代码,双击AAB0行的第二格选定代码AAB1后进入编辑窗口开始造字(可从菜单栏的“编辑/选择代码”改选其他代码)。
(1)直接绘制法:利用窗口左侧工具栏中的工具,单击选择工具栏中的直线、矩形或画笔等工具,直接在编辑区按拖动绘出字形即可。这个操作简单,但需要足够的耐力,要“画”出一个优美的字比较困难。
(2)组合法:从几个字中各取出一部分来组合成字,这样较能保持字体风格。以制作“侻”字为例。点击菜单栏的“编辑→复制字符…”,打开复制字符对话框,点击“字体”按钮,选择“宋体”。在“形状”输入框中输入“伟”字,确定,可以看到“伟”字出现在编辑区。使用矩形选项工具选中多余部分按Delete键删除,只留下“亻”。点击菜单栏的“窗口→参照…”,打开如图参照对话框,同样设定为宋体,在“形状”输入框中输入“说”字,确定后会多出一个参照区,点击工具栏中的任意形状选择工具,选定 “兑”拖动到编辑区,用尺寸柄调整适当大小与“亻”组成“侻”字。点“编辑→保存字符”,“侻”字就造好了。
(3)复制法:直接在画图程序或其他图形处理软件中绘制好需要的字,选中复制到造字程序的编辑窗口粘贴即可。以画图程序为例:用“A”文字工具输入“伟”“说”二字,字号大一些,使用橡皮工具擦除多余部分,用“选定”工具(要选中透明化处理)把剩下的“亻”“兑”两部分拖到一起组成“侻”字,用“选定”工具选中“侻”复制,进入造字程序编辑窗口按“Ctrl+V”粘贴。这个方法最好用,可以同时做好几个字,甚至可以把你喜欢的图形或自己的相片做成字,当然只能是单色图(注意绘制时字图的像素要控制在64×64以内,且背景色一定要纯白色)。
2.应用
按以上方法保存的字体默认在所有的字体中通用,不管选择什么字体都只会显示我们做的宋体字。如果想让造的字也会随实际选择的字体类型而改变字体,必须为每一种字体造一个字。在造字前先点击“文件→字体链接”,选择“与所选择的字体链接”,选中相应链接字体后确定,输入链接文件名保存即可。
小提示
切记字体链接文件一定要保存在非系统分区,如F:\造字\目录下。同一个字的不同字体字符代码必须相同,即该字符在宋体中的代码为AAB1那么它在楷体中的代码也必须是AAB1。
自由字库——打破垄断坚冰
手机、终端设备、显示仪器、仪表等一切电子汉字显示打印产品和设备都需要汉字字体,在国家强制标准的推动之下,只要使用中文电子汉字都必须向这些把握汉字字体的公司付费,同时也造成不同字体之间显示的差异。
购买一整套汉字字体的费用巨大,而不同公司的字库大小和汉字个数的不同造成了中文电子汉字显示方面的麻烦。所以香港、台湾地区提供了相应的满足汉字标准要求的字体,放在网上供个人免费使用。去年底东京大学的坂村健教授等人,将目前收录字数最多的汉字字体集对软件开发公司无偿公开。大陆至今没有一个好用的开源字库,微软公司使用的中文字体也都是从国内的商业公司手中买来的。
由于没有公司愿意公开其私有字形字库免费给消费者使用(特别是在GNU/Linux领域),怀着让每一个中文电脑用户受益的梦想,“文泉驿”应运而生(http://wqy.sourceforge.net/cgi-bin/index.cgi)
这是一群致力于在计算机世界中推广汉字,丰富电子汉字资源的志愿者组成的非赢利性组织,他们要开发一套完整的、美观的、基于自由软件原则的汉字字库,将包含各个大小的点阵汉字以及标准宋体、细宋体、报宋体、黑体的可以无限放缩的矢量汉字、隶书、行书等矢量艺术字体,使得所有人无论在世界上任何一个角落,无论在什么不同的系统下都可以免费地获得电子汉字资源,无障碍地通过汉字进行交流。
由于汉字笔画相对复杂,“文泉驿”制作的汉字点阵都是小字体,这些字体都需要人工对点阵排布进行优化,既保证汉字结构的美观性,又保证其易读性。而这些优化目前还没有有效的算法来自动实现。
现在每天来自不同IP的浏览者大概有3000多个,每天平均点击数为8000多个。对于发送的点阵或者矢量字体,最后的质量审核、软件测试、文档和发布管理工作主要由少数的核心会员来负责。
去年5月,文泉驿推出了点阵宋体(文泉半两)0.5版,8月又推出改进的0.6版本。经过多半年的优化,今年3月发布了0.7(代号北斗)的beta版。经过上万点阵的优化、对每个字体无数细致的推敲和斟酌而产生,实现了从“能用”到“好用”的飞跃。
其实,只要每个愿意为之付出努力的公众抽出一天哪怕几分钟的时间描出一个字,将极大地缩短开源中文字体的最终面世时间,我们期望汉字无障碍自由使用的一天早日到来。
小提示
何处可以找到适用GNU/Linux的字型?http://wiki.debian.org.hk/w/Where_ can_ I_ find_ fonts_ for_ GNU/Linux
字库——汉字大本营
如果你很早就开始接触电脑,也许感叹过全英文界面的不便。不久,硬件字库(汉卡)技术让汉字进入电脑,再后来,微软推出了Windows 95操作系统,安装了Windows 95操作系统的电脑在汉字显示时就不再需要汉卡,而由汉字字库取而代之了。
字库就好比储存在电脑、手机里的文字仓库,从仓库中找到对应的汉字就可以显示出来。但汉字数目巨大,如果全部制作出来,将异常庞大。还好常用的汉字只有数千字,国家选取了汉字里的常用字制作了国家标准和相应的字库。字库的开发需要组织巨大的人力物力,一套精美的汉字字库从设计到最后成型,需要2~3年的时间,并且价格昂贵。
小提示
为了防止不同字库间的差异化,国家授权专门从事汉字字库字模及其周边开发的企业进行研发,最后形成的点阵汉字标准归国家所有并强制执行,而具体的字库字形内容归企业所有。
字体——汉字美化剂
不同的字体与源远流长的书法有着紧密的联系。电子汉字诞生前,首先由专业字体设计师在纸上固定大小的格子内,书写出统一风格的汉字字形设计稿。然后扫描成高精度点阵字库,给出其字库编码,接着将刚才扫描到的点阵字体矢量化,最后再经过人工修字等步骤。
具体怎么修?怎样变得更好看?这就需要了解“字体”了。
1.点阵字体(位图字体)
这种字体在有限的点格上,通过填写黑白两色来表现符号笔画结构。使用时直接读取并显示,所以显示效率高,效果清晰,占用内存少。但是放大时会出现明显的锯齿,如果要在别的分辨率下显示需要另外制作字体,导致字体制作量增大。点阵字体常用的代表字型是BDF、PCF。我们通常在计算机屏幕上看到的中文字体、手机、PDA、MP3播放器或机场、商场的广告版上的字体基本上都是点阵字体。
2.矢量字体(可缩放字体)
这种字体通过公式和参数描述的数学曲线来表现符号轮廓,可无限放大,做倾斜等变化,但边缘依然保持光滑,适合于高清晰度打印,但计算比点阵字体更耗时。点阵字体和矢量字体的关系类似于wav和midi的关系。
3.TrueType字体
TrueType(ttf)是矢量字体的常用代表字型,是 Apple和Microsoft为了对抗Adobe的PostScript所共同制定的开放标准,并且由系统直接提供支持,不需外挂其他管理程序。TrueType中文字体按照国家标准有宋体、楷体、仿宋体、黑体,还有很多其他美术体、书法体等。为了适应英文字体的显示方式,还使用了粗斜体。
如此重要的字体当然需要强大的技术支持,其实主要有两大核心支撑。
(1)让字体平滑的anti-alias(AA)技术:这是针对矢量字体的技术,会让字体边缘看起来圆滑、无锯齿。它将字型先在幕后以数倍的大小来绘制,然后再缩成想要的大小,未能占满一格像素的格子就用灰色填补。所以对于大字体,相应的笔画变粗,字体边缘的灰阶相对整体变少,效果很好;小字体时英文等笔画较少的字符文字会好看些,而对于部分中文矢量字体就会因边缘灰度过多而看起来模糊发虚。
(2)微调字体的hinting技术:这是用来优化小字体显示的方法,可以在颜色、间距、高低、匀称等方面达到很好的效果。由于显示器的种类不同,同种显示器的点距不同,分辨率也不尽相同,所以矢量字体的缩放就需要考虑更多的问题,如果控制得不好就会让小字体破碎变形。hinting嵌入字体内部,人工详细指定了如何在字体缩放、变形后的显示方法,字体渲染引擎(指X的Xft\\ freetype\\ fontconfig 系统)就根据这些指示使小字看起来更美观。hinting 是非常费时费力的工作,不是所有的字体都有,更不是所有的字体都做得好。Truetype字体很多,但是有良好hinting的不多,劣质的hinting反而会让字变得更糟糕。
说了这么多,那么中文字体到底用什么方法解决呢?解决方法有三种:一是使用上面提到的点阵字,二是加粗、加黑、加深字型,让它占据更多的像素,而不是用灰色的点填充边缘,三是使用 hinting 技术。中文字体众多而复杂,针对每个字体进行微调将非常耗时,所以第三种方法不太现实,只能使用点阵字体、内嵌点阵的矢量字体(此时需关闭anti-alias),或者加粗加黑的矢量字体(此时需打开anti-alias),来达到满意的显示效果。
小提示
真正的汉字字库的诞生,要经过长时间艰苦的劳动,步骤有:
绘制字稿、把字稿进行扫描输入进电脑、数字化拟合、修字(字形的修边、平移、复制、缩放、翻转、增删笔划等)、质检、整合成库、测试、商品化等,就“新鲜出炉”了。
TrueType——造字初体验
平时我们难免会碰到一些无法输入的怪字,电脑字库中没有怎么办?刚才了解了造字的原理,我们就趁热利用Windows的TrueType造字程序体验一下吧。
1.造字
进入“开始→所有程序→附件→TrueType造字程序”,双击对话框中的方格选定代码,双击AAB0行的第二格选定代码AAB1后进入编辑窗口开始造字(可从菜单栏的“编辑/选择代码”改选其他代码)。
(1)直接绘制法:利用窗口左侧工具栏中的工具,单击选择工具栏中的直线、矩形或画笔等工具,直接在编辑区按拖动绘出字形即可。这个操作简单,但需要足够的耐力,要“画”出一个优美的字比较困难。
(2)组合法:从几个字中各取出一部分来组合成字,这样较能保持字体风格。以制作“侻”字为例。点击菜单栏的“编辑→复制字符…”,打开复制字符对话框,点击“字体”按钮,选择“宋体”。在“形状”输入框中输入“伟”字,确定,可以看到“伟”字出现在编辑区。使用矩形选项工具选中多余部分按Delete键删除,只留下“亻”。点击菜单栏的“窗口→参照…”,打开如图参照对话框,同样设定为宋体,在“形状”输入框中输入“说”字,确定后会多出一个参照区,点击工具栏中的任意形状选择工具,选定 “兑”拖动到编辑区,用尺寸柄调整适当大小与“亻”组成“侻”字。点“编辑→保存字符”,“侻”字就造好了。
(3)复制法:直接在画图程序或其他图形处理软件中绘制好需要的字,选中复制到造字程序的编辑窗口粘贴即可。以画图程序为例:用“A”文字工具输入“伟”“说”二字,字号大一些,使用橡皮工具擦除多余部分,用“选定”工具(要选中透明化处理)把剩下的“亻”“兑”两部分拖到一起组成“侻”字,用“选定”工具选中“侻”复制,进入造字程序编辑窗口按“Ctrl+V”粘贴。这个方法最好用,可以同时做好几个字,甚至可以把你喜欢的图形或自己的相片做成字,当然只能是单色图(注意绘制时字图的像素要控制在64×64以内,且背景色一定要纯白色)。
2.应用
按以上方法保存的字体默认在所有的字体中通用,不管选择什么字体都只会显示我们做的宋体字。如果想让造的字也会随实际选择的字体类型而改变字体,必须为每一种字体造一个字。在造字前先点击“文件→字体链接”,选择“与所选择的字体链接”,选中相应链接字体后确定,输入链接文件名保存即可。
小提示
切记字体链接文件一定要保存在非系统分区,如F:\造字\目录下。同一个字的不同字体字符代码必须相同,即该字符在宋体中的代码为AAB1那么它在楷体中的代码也必须是AAB1。
自由字库——打破垄断坚冰
手机、终端设备、显示仪器、仪表等一切电子汉字显示打印产品和设备都需要汉字字体,在国家强制标准的推动之下,只要使用中文电子汉字都必须向这些把握汉字字体的公司付费,同时也造成不同字体之间显示的差异。
购买一整套汉字字体的费用巨大,而不同公司的字库大小和汉字个数的不同造成了中文电子汉字显示方面的麻烦。所以香港、台湾地区提供了相应的满足汉字标准要求的字体,放在网上供个人免费使用。去年底东京大学的坂村健教授等人,将目前收录字数最多的汉字字体集对软件开发公司无偿公开。大陆至今没有一个好用的开源字库,微软公司使用的中文字体也都是从国内的商业公司手中买来的。
由于没有公司愿意公开其私有字形字库免费给消费者使用(特别是在GNU/Linux领域),怀着让每一个中文电脑用户受益的梦想,“文泉驿”应运而生(http://wqy.sourceforge.net/cgi-bin/index.cgi)
这是一群致力于在计算机世界中推广汉字,丰富电子汉字资源的志愿者组成的非赢利性组织,他们要开发一套完整的、美观的、基于自由软件原则的汉字字库,将包含各个大小的点阵汉字以及标准宋体、细宋体、报宋体、黑体的可以无限放缩的矢量汉字、隶书、行书等矢量艺术字体,使得所有人无论在世界上任何一个角落,无论在什么不同的系统下都可以免费地获得电子汉字资源,无障碍地通过汉字进行交流。
由于汉字笔画相对复杂,“文泉驿”制作的汉字点阵都是小字体,这些字体都需要人工对点阵排布进行优化,既保证汉字结构的美观性,又保证其易读性。而这些优化目前还没有有效的算法来自动实现。
现在每天来自不同IP的浏览者大概有3000多个,每天平均点击数为8000多个。对于发送的点阵或者矢量字体,最后的质量审核、软件测试、文档和发布管理工作主要由少数的核心会员来负责。
去年5月,文泉驿推出了点阵宋体(文泉半两)0.5版,8月又推出改进的0.6版本。经过多半年的优化,今年3月发布了0.7(代号北斗)的beta版。经过上万点阵的优化、对每个字体无数细致的推敲和斟酌而产生,实现了从“能用”到“好用”的飞跃。
其实,只要每个愿意为之付出努力的公众抽出一天哪怕几分钟的时间描出一个字,将极大地缩短开源中文字体的最终面世时间,我们期望汉字无障碍自由使用的一天早日到来。
小提示
何处可以找到适用GNU/Linux的字型?http://wiki.debian.org.hk/w/Where_ can_ I_ find_ fonts_ for_ GNU/Linux