冷链服务平台“飞熊领鲜”获近亿元A轮融资,由深圳同创伟业、青岛财富中心、元嘉控股共同投资
06-18
当新的电子设备打开时,屏幕上显示的第一个交互页面往往是系统语言选择。
您可以上下滑动选择中文、英文、日文等数百种文本。
但如果把时间倒回40多年前,可能只有很少的选择,而且没有中文的。
我国的文字历史悠久,但数字化进程并不遥远。
我们现在之所以能在电子设备上阅读中文,与最初花费大量精力将中文“搬”到电脑上的那群人是分不开的。
近日,斯坦福大学收购了其剩余的中国现代信息技术藏品,其中包括数十台稀有的中文打字机、文字处理机、计算机等物品,使其成为全球最大的中国现代信息技术历史藏品。
▲首批中文数字字体模型。
图片来自:斯坦福大学中国历史研究员托马斯·穆拉尼(Thomas Mullaney)在这些珍贵的藏品中发现了许多有趣的故事。
其中包括世界上第一个中文数字字体的制作过程。
托马斯在《麻省理工科技评论》讲述了这段艰辛而又艺术的旅程。
我们也有机会目睹了这一具有划时代意义的历史事件。
▲托马斯·穆拉尼机器带来的机遇故事,从一份订单开始。
20 世纪 80 年代初,图形艺术研究基金会找到 Louis Rosenblum,要求他的团队为其正在开发的 Sintype III 机器创建中文字体。
。
当时路易斯已年近60岁。
毕业于麻省理工学院,是高级印刷排版专家。
Louis于2007年创立Photography Systems,专门解决数字工程、摄影、应用数学等相关问题。
▲Louis Rosenblum 尽管Louis 和他的团队此前曾多次与印艺研究基金会合作,但这次为Sinotype III 制作中文字体的项目是最困难的。
由于当时中国还没有开始生产个人电脑,其他国家或地区生产的电脑无法处理中文。
因此,在为实验机Sinotype III开发中文字体之前,Louis的团队首先需要对Apple II计算机进行编程,使其能够运行中文。
▲苹果二代。
图片来自:Wiki 万事开头难。
由于第二代Apple DOS 3.3操作系统无法输入和输出中文文本,因此必须从头开始编程,包括编写中文文字处理器。
该团队花了几个月的时间来研究这个问题。
他们想出的解决办法是,先通过BASIC编程语言编写一个“Gridmater”程序,然后将程序放入苹果二代电脑的软盘中运行。
这样就可以创建并保存汉字的数字位图。
然后将设计好的汉字位图及其相应的代码植入系统数据库中,使Sinotype III机器能够处理和显示中文。
▲Sinotype III 显示屏照片,显示 Gridmaster 程序和汉字“电”。
图片来自:斯坦福大学 在此插入背景知识。
早期的数字字体是使用位图图像(也称为位图图像)显示的。
这是存储图像的常见方式。
今天我们的相机拍摄的照片和屏幕截图都是以位图形式存储的。
JPEG、BMP、GIF 等格式的图片是由许多像素组成的。
这些点被排列并染色以形成图案。
例如,我们可以在电脑上将一张图片放大到一定程度,然后我们就可以看到正方形的像素。
早期的字体是通过在一定大小的网格内排列、染色而形成的。
▲ 如果放大左图中的眼部区域,可以看到中文数字字体的像素,制作起来比英文难很多。
中文数字字体制作困难的原因一是因为汉字太多,二是因为汉字的大小。
字形非常复杂且多样。
在计算机的早期,工程师和设计师同意使用 5X7 位图网格来创建低分辨率英文数字字体。
这样,每个字符的大小约为 5 个字节,而不会对计算机的内存造成太大压力。
存储美国信息交换标准代码 (ASCII) 中的所有低分辨率字符,包括英文字母表中的每个字母、数字 0 到 9 以及常见的标点符号,总共需要字节的内存。
当时苹果二代的内存为64KB,可以轻松承载英文字库。

▲ASCII字符表。
由于字形复杂,汉字会聚集在5X7的网格中,导致阅读困难。
所以至少需要16X16或者更大的网格。
这样换算下来,每个汉字的大小至少是32个字节。
如果打包0个低分辨率汉字,则至少需要2MB内存。
退一步讲,即使只将常用的三个汉字放入字库中,也需要大约KB的内存。
这无疑是一个大问题。
因为在20世纪80年代初期,大多数PC的内存总容量不超过64KB,无法容纳庞大的中文点阵字库。
▲Sinotype III 显示器照片,显示中文字体。
图片来自:斯坦福大学 内存短缺并不是最麻烦的,因为随着PC软件和硬件的进步,它可以得到解决。
如何在16X16的低分辨率网格中创建既易读又美观的中文字体是一个比较困难的问题。
为此,Louis团队的设计者们花费了数年时间,试图创造出满足低内存要求、清晰易读、甚至具有书法美感的中文位图。
其中,林焕明和艾伦·迪·乔瓦尼的贡献最为突出。
他们首先用纸、笔和涂改液手绘出汉字的位图,然后用前面提到的Gridmater程序将其数字化,并植入到Sinotype III系统中。
▲Sinotype III 显示的中文字体。
图片来自:Bruce Rosenblum 提供,制作背后的工匠精神,托马斯和教授在档案中发现了 Lewis 团队设计汉字位图的整个过程。
在一本充满网格图的书中,记录了设计师如何通过手绘散点符号创建汉字位图。
我们都知道,汉字的笔画不是“横、横、竖”的。
入口笔画、出口笔画、笔画渐变都有丰富的细节。
这也是设计师面临的核心问题,即如何在16X16的正方形中尽可能地展现这种书法之美。
在这本格子书里,你可以发现每一个汉字都经过了设计师的精心绘制。
绿色“X”是原始标记。
经过汉字编辑审核后,如果有不规范的地方,路易斯和他的团队就会用涂改液覆盖原来的标记,然后用红色的“X”标记。
▲“背”字草稿位图。
图片来自:斯坦福大学。
经过反复修改,最终确认后将位图输入系统。
如果要满足消费者的需求,字库中至少必须包含常用汉字。
这个项目的金额对于团队来说是巨大的。
人们可能想知道他们是否会寻找一些技巧。
例如,对于相同部首的汉字,可以直接复制部首。
就像下图中的“复习”和“阅读”这两个词一样,按理说设计师只需要设计右侧的不同部分即可。
▲中文位图草稿。
图片来自:斯坦福大学 但托马斯和教授发现档案中很少有类似的工作机制。
路易斯坚持要求设计师逐字调整和设计,确保每个字的部首看起来协调一致。
甚至有些变化非常微妙,难以察觉。
托马斯和教授根据档案资料重新创造了Sinotype III的汉字字体。
可以发现,“女”字旁边的“娟”和“生”两个字是相同的,但是两个字中“女”字旁边的设计风格不同。
▲你能看出“女”字旁边的不同吗?图片来自:斯坦福大学 “娟”字中“女”字旁边的宽度为 6 个像素(网格),但“生”字中只有 5 个像素。
另外,“生”字中“女”字旁边的点画比“娟”字长一个像素,视觉上更加纤细。
如此细致的设计并非独一无二。
托马斯教授在字库中发现了很多类似的作品。
当他将位图草稿与最终产品进行比较时,他可以看到许多微妙而有趣的变化。
例如“洛”字,左下角的笔画最初向下延伸45°。
但最终版本中,笔画末端被“压平”,更符合书法的艺术感。
▲“洛”字的两个版本,左边是最终版本。
图片来自:斯坦福大学 可见,增加或减少一个像素都会对整体的平衡和美观产生影响。
这也体现了设计师在创作第一批字体时所付出的艰辛,以及背后的工艺。
事实上,16X16的网格对于创建中文字体来说并不是很友好。
主要问题是对称性。
我们知道,大量的汉字是对称的,根据数学规则,只有奇数大小的空间区域才能创造出完全对称的形状。
因此,路易斯和他的团队决定只使用16X16网格中的15X15区域来实现汉字的对称。
这进一步缩小了设计人员的空间,对设计工作提出了更高的要求。
▲ 山、中部、田野的对称与不对称。
图片来自:斯坦福大学 经过团队的不懈努力和一丝不苟的态度,Sinotype III 的中文字库项目顺利完成。
虽然它没有商业发布,但它确实是世界上第一批可以处理、显示、输入和输出中文的个人电脑之一。
当然,在当今的技术背景下,路易斯和他的团队制作字体的方法可能显得过于老式和幼稚。
现在广泛使用的TrueType字体技术可以以矢量形式存储字体,占用空间小,渲染速度快,显示效果清晰锐利。
▲当今大多数字体都是 TrueType 格式。
图片来自:themex 但正是他们用“笨方法”,逐字画、反复修改,才让汉字进入了数字世界。
“当代毕升”王选院士研发的高分辨率字形信息压缩技术,彻底解决了汉字编码和存储的困境。
在这些前辈的努力下,汉语没有被互联网大潮抛在后面,汉语拉丁化理论也被扫进了历史的垃圾堆。
我们今天能用中文上网,我们应该感谢他们的青春。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-06
06-18
06-18
06-17
06-08
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态