首页 > 科技未来 > 内容

揭秘第一批中文电脑字体诞生过程,将汉字“搬”进数字设备有多难?

发布于:2024-06-21 编辑:匿名 来源:网络

当新的电子设备打开时,屏幕上显示的第一个交互页面往往是系统语言选择。

您可以上下滑动选择中文、英文、日文等数百种文本。

但如果把时间倒回40多年前,可能只有很少的选择,而且没有中文的。

我国的文字历史悠久,但数字化进程并不遥远。

我们现在之所以能在电子设备上阅读中文,与最初花费大量精力将中文“搬”到电脑上的那群人是分不开的。

近日,斯坦福大学收购了其剩余的中国现代信息技术藏品,其中包括数十台稀有的中文打字机、文字处理机、计算机等物品,使其成为全球最大的中国现代信息技术历史藏品。

▲首批中文数字字体模型。

图片来自:斯坦福大学中国历史研究员托马斯·穆拉尼(Thomas Mullaney)在这些珍贵的藏品中发现了许多有趣的故事。

其中包括世界上第一个中文数字字体的制作过程。

托马斯在《麻省理工科技评论》讲述了这段艰辛而又艺术的旅程。

我们也有机会目睹了这一具有划时代意义的历史事件。

▲托马斯·穆拉尼机器带来的机遇故事,从一份订单开始。

20 世纪 80 年代初,图形艺术研究基金会找到 Louis Rosenblum,要求他的团队为其正在开发的 Sintype III 机器创建中文字体。

当时路易斯已年近60岁。

毕业于麻省理工学院,是高级印刷排版专家。

Louis于2007年创立Photography Systems,专门解决数字工程、摄影、应用数学等相关问题。

▲Louis Rosenblum 尽管Louis 和他的团队此前曾多次与印艺研究基金会合作,但这次为Sinotype III 制作中文字体的项目是最困难的。

由于当时中国还没有开始生产个人电脑,其他国家或地区生产的电脑无法处理中文。

因此,在为实验机Sinotype III开发中文字体之前,Louis的团队首先需要对Apple II计算机进行编程,使其能够运行中文。

▲苹果二代。

图片来自:Wiki 万事开头难。

由于第二代Apple DOS 3.3操作系统无法输入和输出中文文本,因此必须从头开始编程,包括编写中文文字处理器。

该团队花了几个月的时间来研究这个问题。

他们想出的解决办法是,先通过BASIC编程语言编写一个“Gridmater”程序,然后将程序放入苹果二代电脑的软盘中运行。

这样就可以创建并保存汉字的数字位图。

然后将设计好的汉字位图及其相应的代码植入系统数据库中,使Sinotype III机器能够处理和显示中文。

▲Sinotype III 显示屏照片,显示 Gridmaster 程序和汉字“电”。

图片来自:斯坦福大学 在此插入背景知识。

早期的数字字体是使用位图图像(也称为位图图像)显示的。

这是存储图像的常见方式。

今天我们的相机拍摄的照片和屏幕截图都是以位图形式存储的。

JPEG、BMP、GIF 等格式的图片是由许多像素组成的。

这些点被排列并染色以形成图案。

例如,我们可以在电脑上将一张图片放大到一定程度,然后我们就可以看到正方形的像素。

早期的字体是通过在一定大小的网格内排列、染色而形成的。

▲ 如果放大左图中的眼部区域,可以看到中文数字字体的像素,制作起来比英文难很多。

中文数字字体制作困难的原因一是因为汉字太多,二是因为汉字的大小。

字形非常复杂且多样。

在计算机的早期,工程师和设计师同意使用 5X7 位图网格来创建低分辨率英文数字字体。

这样,每个字符的大小约为 5 个字节,而不会对计算机的内存造成太大压力。

存储美国信息交换标准代码 (ASCII) 中的所有低分辨率字符,包括英文字母表中的每个字母、数字 0 到 9 以及常见的标点符号,总共需要字节的内存。

当时苹果二代的内存为64KB,可以轻松承载英文字库。

揭秘第一批中文电脑字体诞生过程,将汉字“搬”进数字设备有多难?

▲ASCII字符表。

由于字形复杂,汉字会聚集在5X7的网格中,导致阅读困难。

所以至少需要16X16或者更大的网格。

这样换算下来,每个汉字的大小至少是32个字节。

如果打包0个低分辨率汉字,则至少需要2MB内存。

退一步讲,即使只将常用的三个汉字放入字库中,也需要大约KB的内存。

这无疑是一个大问题。

因为在20世纪80年代初期,大多数PC的内存总容量不超过64KB,无法容纳庞大的中文点阵字库。

▲Sinotype III 显示器照片,显示中文字体。

图片来自:斯坦福大学 内存短缺并不是最麻烦的,因为随着PC软件和硬件的进步,它可以得到解决。

如何在16X16的低分辨率网格中创建既易读又美观的中文字体是一个比较困难的问题。

为此,Louis团队的设计者们花费了数年时间,试图创造出满足低内存要求、清晰易读、甚至具有书法美感的中文位图。

其中,林焕明和艾伦·迪·乔瓦尼的贡献最为突出。

他们首先用纸、笔和涂改液手绘出汉字的位图,然后用前面提到的Gridmater程序将其数字化,并植入到Sinotype III系统中。

▲Sinotype III 显示的中文字体。

图片来自:Bruce Rosenblum 提供,制作背后的工匠精神,托马斯和教授在档案中发现了 Lewis 团队设计汉字位图的整个过程。

在一本充满网格图的书中,记录了设计师如何通过手绘散点符号创建汉字位图。

我们都知道,汉字的笔画不是“横、横、竖”的。

入口笔画、出口笔画、笔画渐变都有丰富的细节。

这也是设计师面临的核心问题,即如何在16X16的正方形中尽可能地展现这种书法之美。

在这本格子书里,你可以发现每一个汉字都经过了设计师的精心绘制。

绿色“X”是原始标记。

经过汉字编辑审核后,如果有不规范的地方,路易斯和他的团队就会用涂改液覆盖原来的标记,然后用红色的“X”标记。

▲“背”字草稿位图。

图片来自:斯坦福大学。

经过反复修改,最终确认后将位图输入系统。

如果要满足消费者的需求,字库中至少必须包含常用汉字。

这个项目的金额对于团队来说是巨大的。

人们可能想知道他们是否会寻找一些技巧。

例如,对于相同部首的汉字,可以直接复制部首。

就像下图中的“复习”和“阅读”这两个词一样,按理说设计师只需要设计右侧的不同部分即可。

▲中文位图草稿。

图片来自:斯坦福大学 但托马斯和教授发现档案中很少有类似的工作机制。

路易斯坚持要求设计师逐字调整和设计,确保每个字的部首看起来协调一致。

甚至有些变化非常微妙,难以察觉。

托马斯和教授根据档案资料重新创造了Sinotype III的汉字字体。

可以发现,“女”字旁边的“娟”和“生”两个字是相同的,但是两个字中“女”字旁边的设计风格不同。

▲你能看出“女”字旁边的不同吗?图片来自:斯坦福大学 “娟”字中“女”字旁边的宽度为 6 个像素(网格),但“生”字中只有 5 个像素。

另外,“生”字中“女”字旁边的点画比“娟”字长一个像素,视觉上更加纤细。

如此细致的设计并非独一无二。

托马斯教授在字库中发现了很多类似的作品。

当他将位图草稿与最终产品进行比较时,他可以看到许多微妙而有趣的变化。

例如“洛”字,左下角的笔画最初向下延伸45°。

但最终版本中,笔画末端被“压平”,更符合书法的艺术感。

▲“洛”字的两个版本,左边是最终版本。

图片来自:斯坦福大学 可见,增加或减少一个像素都会对整体的平衡和美观产生影响。

这也体现了设计师在创作第一批字体时所付出的艰辛,以及背后的工艺。

事实上,16X16的网格对于创建中文字体来说并不是很友好。

主要问题是对称性。

我们知道,大量的汉字是对称的,根据数学规则,只有奇数大小的空间区域才能创造出完全对称的形状。

因此,路易斯和他的团队决定只使用16X16网格中的15X15区域来实现汉字的对称。

这进一步缩小了设计人员的空间,对设计工作提出了更高的要求。

▲ 山、中部、田野的对称与不对称。

图片来自:斯坦福大学 经过团队的不懈努力和一丝不苟的态度,Sinotype III 的中文字库项目顺利完成。

虽然它没有商业发布,但它确实是世界上第一批可以处理、显示、输入和输出中文的个人电脑之一。

当然,在当今的技术背景下,路易斯和他的团队制作字体的方法可能显得过于老式和幼稚。

现在广泛使用的TrueType字体技术可以以矢量形式存储字体,占用空间小,渲染速度快,显示效果清晰锐利。

▲当今大多数字体都是 TrueType 格式。

图片来自:themex 但正是他们用“笨方法”,逐字画、反复修改,才让汉字进入了数字世界。

“当代毕升”王选院士研发的高分辨率字形信息压缩技术,彻底解决了汉字编码和存储的困境。

在这些前辈的努力下,汉语没有被互联网大潮抛在后面,汉语拉丁化理论也被扫进了历史的垃圾堆。

我们今天能用中文上网,我们应该感谢他们的青春。

揭秘第一批中文电脑字体诞生过程,将汉字“搬”进数字设备有多难?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 米业消费升级,“龙米之家”完成数千万元A1轮融资

    米业消费升级,“龙米之家”完成数千万元A1轮融资

    投资行业消息,据创业网消息,新消费品牌“龙米之家”完成数千万元A1轮融资年底A1轮融资。 本轮融资大部分资金将用于供应链体系建设,其次是品牌营销、资源整合、客户开发、信息化建设和团队建设。 此前,龙米家族曾获得德商资本、深圳联合创投、汇和裕廊创投、王老吉前董事长

    06-18

  • 云智物联完成数千万元Pre-A轮融资, “共享厕纸”是共享经济的正确打开方式吗?

    云智物联完成数千万元Pre-A轮融资, “共享厕纸”是共享经济的正确打开方式吗?

    继共享单车大战、共享充电宝大战之后,共享纸巾的战场也拉开了帷幕。    据投资界5月21日消息,以免费厕纸变现精准流量的云智物联网宣布,近日获得数千万元Pre-A轮融资,由九洲星投资领投本次投资及天使轮投资方易云投资及某股东跟投。 本轮融资将用于市场开拓、软件以及3.

    06-18

  • 最便宜的纯电动保时捷来了,网友:不是买不起,小米性价比更高

    最便宜的纯电动保时捷来了,网友:不是买不起,小米性价比更高

    第一要务:拉动销量。 销量最大的保时捷SUV将是电动化的。 1月25日,保时捷发布了第二款纯电动车型,也是首款SUV车型——全新纯电动Macan。 此次共发布了两款车型,分别是Macan 4和Macan Turbo。 中国市场已经开始预售。 至于正式上线时间,我们还需要等待。 官方计划在北京车

    06-18

  • 博宇歌乐完成1000万美元A轮融资,经纬创投独家领投

    博宇歌乐完成1000万美元A轮融资,经纬创投独家领投

    投资社区(ID:pedaily)1月21日消息,互联网科技公司博宇歌乐(BurningGalaxy)宣布完成千万融资A轮融资,本轮融资由经纬创投独家领投。 完成本轮融资后,计划于今年6月在北美地区启动服务。 经纬创投合伙人合伙人王华东表示:我们看到了“用户就是创作者”这一主题在全球内

    06-18

  • 赛默飞在SEMICON CHINA 2019上发布最新半导体解决方案

    赛默飞在SEMICON CHINA 2019上发布最新半导体解决方案

    致力于提高工厂和分析实验室效率,推动中国半导体行业快速发展2019年3月21日,上海 - 全球科学服务领导者赛默飞赛默飞科技(以下简称:赛默飞)亮相上海SEMICON CHINA展会。 现场发布并展示了其最新一代产品和集成半导体解决方案。 新产品致力于提高工厂和分析实验室的效率,

    06-06

  • 外媒:英特尔溢价60%收购Tower Semiconductor,或许是为了避免中国企业介入

    外媒:英特尔溢价60%收购Tower Semiconductor,或许是为了避免中国企业介入

    当地时间2月15日,据外媒semiwiki报道,英特尔宣布将收购以色列Tower Semiconductor 54 亿美元。 )。 这相当于每股 53 美元。 但该公司最后一笔交易价格为每股33美元,溢价高达60%。 据报道,塔半导体获得了更多中国业务和军工业务。 这些都是支持英特尔战略方向所需要的。

    06-08

  • 中冶已于本月初向香港联交所申请10月先A后H上市

    中冶已于本月初向香港联交所申请10月先A后H上市

    新闻人士透露,内地综合资源公司中国冶金科工集团(以下简称中冶集团)已于本月初向香港联交所提交A1申请上市申请,正式启动上市程序,拟募集资金逾亿元。 公司在中国和香港市场将维持先A后H的募集资金模式,但初步计划是H股上市日期仅比A股晚几天。   如果上市顺利,中冶集

    06-17

  • 三盟科技完成过亿元B1轮融资

    三盟科技完成过亿元B1轮融资

    据投资界9月4日消息,近日,三盟科技股份有限公司完成过亿元B1轮融资。 本轮融资由SBI学大基金、兆恒投资、基因资本及个人投资者共同参与投资,多鲸资本担任财务顾问本轮融资。 本轮融资将主要用于高等教育校园“教育大脑”系列的产品迭代和业务拓展、通识教育“城市教育大脑

    06-18

  • 瑞明新药完成A+轮融资,汇美资本领投,

    瑞明新药完成A+轮融资,汇美资本领投,

    投资圈(ID:pedaily)据6月15日消息,国内治疗性小分子眼科新药研发平台苏州瑞明新药研发有限公司(以下简称“瑞明新药”)明新药研发有限公司宣布完成近亿元A+轮融资,由汇美资本领投,现有股东泰煜投资、药明药业跟投。 本次融资是公司继去年A轮之后一年内完成的又一新一轮

    06-18

  • 海外呼叫中心服务:概念、功能、挑战、解决方案与前景

    海外呼叫中心服务:概念、功能、挑战、解决方案与前景

    .wp-block-column h3{margin-left:0} 一、引言 随着全球化的加速和海外市场的拓展,海外呼叫中心服务成为企业海外业务发展的重要支撑。 海外呼叫中心不仅提供语言翻译、时区适配等服务,还承担海外客户关怀、市场调研、业务拓展等任务。 本文将阐述海外呼叫中心服务的概念、功

    06-17

  • 深圳科技获数千万美元B轮融资,源码资本、启明创投领投,

    深圳科技获数千万美元B轮融资,源码资本、启明创投领投,

    投资圈(ID:pedaily)据1月17日消息,深圳科技宣布完成数千万美元B轮融资。 本轮融资由源码资本、启明创投联合领投,现有股东高瓴创投、经纬创投跟投。 奇迹资本担任本轮融资独家FA。 本轮融资将用于不断吸引行业顶尖人才,从而深化微观工业设计平台的建设以及相关技术在药物

    06-18

  • 徐州在投资界藏着一批独角兽

    徐州在投资界藏着一批独角兽

    城市招牌,我们来到了苏西北城市徐州。 徐州地处鲁、鲁、豫、皖四省交界处,东邻连云港,南接宿迁,西接苏州、淮北,北接山东多个城市。 京杭大运河贯穿其中。 徐州素有“五省纵贯”之称。 此外,徐州还是“中国工程机械之都”和国际新能源基地。 经过多年发展,徐州已形成“

    06-18