首页 > 科技未来 > 内容

揭秘第一批中文电脑字体诞生过程,将汉字“搬”进数字设备有多难?

发布于:2024-06-21 编辑:匿名 来源:网络

当新的电子设备打开时,屏幕上显示的第一个交互页面往往是系统语言选择。

您可以上下滑动选择中文、英文、日文等数百种文本。

但如果把时间倒回40多年前,可能只有很少的选择,而且没有中文的。

我国的文字历史悠久,但数字化进程并不遥远。

我们现在之所以能在电子设备上阅读中文,与最初花费大量精力将中文“搬”到电脑上的那群人是分不开的。

近日,斯坦福大学收购了其剩余的中国现代信息技术藏品,其中包括数十台稀有的中文打字机、文字处理机、计算机等物品,使其成为全球最大的中国现代信息技术历史藏品。

▲首批中文数字字体模型。

图片来自:斯坦福大学中国历史研究员托马斯·穆拉尼(Thomas Mullaney)在这些珍贵的藏品中发现了许多有趣的故事。

其中包括世界上第一个中文数字字体的制作过程。

托马斯在《麻省理工科技评论》讲述了这段艰辛而又艺术的旅程。

我们也有机会目睹了这一具有划时代意义的历史事件。

▲托马斯·穆拉尼机器带来的机遇故事,从一份订单开始。

20 世纪 80 年代初,图形艺术研究基金会找到 Louis Rosenblum,要求他的团队为其正在开发的 Sintype III 机器创建中文字体。

当时路易斯已年近60岁。

毕业于麻省理工学院,是高级印刷排版专家。

Louis于2007年创立Photography Systems,专门解决数字工程、摄影、应用数学等相关问题。

▲Louis Rosenblum 尽管Louis 和他的团队此前曾多次与印艺研究基金会合作,但这次为Sinotype III 制作中文字体的项目是最困难的。

由于当时中国还没有开始生产个人电脑,其他国家或地区生产的电脑无法处理中文。

因此,在为实验机Sinotype III开发中文字体之前,Louis的团队首先需要对Apple II计算机进行编程,使其能够运行中文。

▲苹果二代。

图片来自:Wiki 万事开头难。

由于第二代Apple DOS 3.3操作系统无法输入和输出中文文本,因此必须从头开始编程,包括编写中文文字处理器。

该团队花了几个月的时间来研究这个问题。

他们想出的解决办法是,先通过BASIC编程语言编写一个“Gridmater”程序,然后将程序放入苹果二代电脑的软盘中运行。

这样就可以创建并保存汉字的数字位图。

然后将设计好的汉字位图及其相应的代码植入系统数据库中,使Sinotype III机器能够处理和显示中文。

▲Sinotype III 显示屏照片,显示 Gridmaster 程序和汉字“电”。

图片来自:斯坦福大学 在此插入背景知识。

早期的数字字体是使用位图图像(也称为位图图像)显示的。

这是存储图像的常见方式。

今天我们的相机拍摄的照片和屏幕截图都是以位图形式存储的。

JPEG、BMP、GIF 等格式的图片是由许多像素组成的。

这些点被排列并染色以形成图案。

例如,我们可以在电脑上将一张图片放大到一定程度,然后我们就可以看到正方形的像素。

早期的字体是通过在一定大小的网格内排列、染色而形成的。

▲ 如果放大左图中的眼部区域,可以看到中文数字字体的像素,制作起来比英文难很多。

中文数字字体制作困难的原因一是因为汉字太多,二是因为汉字的大小。

字形非常复杂且多样。

在计算机的早期,工程师和设计师同意使用 5X7 位图网格来创建低分辨率英文数字字体。

这样,每个字符的大小约为 5 个字节,而不会对计算机的内存造成太大压力。

存储美国信息交换标准代码 (ASCII) 中的所有低分辨率字符,包括英文字母表中的每个字母、数字 0 到 9 以及常见的标点符号,总共需要字节的内存。

当时苹果二代的内存为64KB,可以轻松承载英文字库。

揭秘第一批中文电脑字体诞生过程,将汉字“搬”进数字设备有多难?

▲ASCII字符表。

由于字形复杂,汉字会聚集在5X7的网格中,导致阅读困难。

所以至少需要16X16或者更大的网格。

这样换算下来,每个汉字的大小至少是32个字节。

如果打包0个低分辨率汉字,则至少需要2MB内存。

退一步讲,即使只将常用的三个汉字放入字库中,也需要大约KB的内存。

这无疑是一个大问题。

因为在20世纪80年代初期,大多数PC的内存总容量不超过64KB,无法容纳庞大的中文点阵字库。

▲Sinotype III 显示器照片,显示中文字体。

图片来自:斯坦福大学 内存短缺并不是最麻烦的,因为随着PC软件和硬件的进步,它可以得到解决。

如何在16X16的低分辨率网格中创建既易读又美观的中文字体是一个比较困难的问题。

为此,Louis团队的设计者们花费了数年时间,试图创造出满足低内存要求、清晰易读、甚至具有书法美感的中文位图。

其中,林焕明和艾伦·迪·乔瓦尼的贡献最为突出。

他们首先用纸、笔和涂改液手绘出汉字的位图,然后用前面提到的Gridmater程序将其数字化,并植入到Sinotype III系统中。

▲Sinotype III 显示的中文字体。

图片来自:Bruce Rosenblum 提供,制作背后的工匠精神,托马斯和教授在档案中发现了 Lewis 团队设计汉字位图的整个过程。

在一本充满网格图的书中,记录了设计师如何通过手绘散点符号创建汉字位图。

我们都知道,汉字的笔画不是“横、横、竖”的。

入口笔画、出口笔画、笔画渐变都有丰富的细节。

这也是设计师面临的核心问题,即如何在16X16的正方形中尽可能地展现这种书法之美。

在这本格子书里,你可以发现每一个汉字都经过了设计师的精心绘制。

绿色“X”是原始标记。

经过汉字编辑审核后,如果有不规范的地方,路易斯和他的团队就会用涂改液覆盖原来的标记,然后用红色的“X”标记。

▲“背”字草稿位图。

图片来自:斯坦福大学。

经过反复修改,最终确认后将位图输入系统。

如果要满足消费者的需求,字库中至少必须包含常用汉字。

这个项目的金额对于团队来说是巨大的。

人们可能想知道他们是否会寻找一些技巧。

例如,对于相同部首的汉字,可以直接复制部首。

就像下图中的“复习”和“阅读”这两个词一样,按理说设计师只需要设计右侧的不同部分即可。

▲中文位图草稿。

图片来自:斯坦福大学 但托马斯和教授发现档案中很少有类似的工作机制。

路易斯坚持要求设计师逐字调整和设计,确保每个字的部首看起来协调一致。

甚至有些变化非常微妙,难以察觉。

托马斯和教授根据档案资料重新创造了Sinotype III的汉字字体。

可以发现,“女”字旁边的“娟”和“生”两个字是相同的,但是两个字中“女”字旁边的设计风格不同。

▲你能看出“女”字旁边的不同吗?图片来自:斯坦福大学 “娟”字中“女”字旁边的宽度为 6 个像素(网格),但“生”字中只有 5 个像素。

另外,“生”字中“女”字旁边的点画比“娟”字长一个像素,视觉上更加纤细。

如此细致的设计并非独一无二。

托马斯教授在字库中发现了很多类似的作品。

当他将位图草稿与最终产品进行比较时,他可以看到许多微妙而有趣的变化。

例如“洛”字,左下角的笔画最初向下延伸45°。

但最终版本中,笔画末端被“压平”,更符合书法的艺术感。

▲“洛”字的两个版本,左边是最终版本。

图片来自:斯坦福大学 可见,增加或减少一个像素都会对整体的平衡和美观产生影响。

这也体现了设计师在创作第一批字体时所付出的艰辛,以及背后的工艺。

事实上,16X16的网格对于创建中文字体来说并不是很友好。

主要问题是对称性。

我们知道,大量的汉字是对称的,根据数学规则,只有奇数大小的空间区域才能创造出完全对称的形状。

因此,路易斯和他的团队决定只使用16X16网格中的15X15区域来实现汉字的对称。

这进一步缩小了设计人员的空间,对设计工作提出了更高的要求。

▲ 山、中部、田野的对称与不对称。

图片来自:斯坦福大学 经过团队的不懈努力和一丝不苟的态度,Sinotype III 的中文字库项目顺利完成。

虽然它没有商业发布,但它确实是世界上第一批可以处理、显示、输入和输出中文的个人电脑之一。

当然,在当今的技术背景下,路易斯和他的团队制作字体的方法可能显得过于老式和幼稚。

现在广泛使用的TrueType字体技术可以以矢量形式存储字体,占用空间小,渲染速度快,显示效果清晰锐利。

▲当今大多数字体都是 TrueType 格式。

图片来自:themex 但正是他们用“笨方法”,逐字画、反复修改,才让汉字进入了数字世界。

“当代毕升”王选院士研发的高分辨率字形信息压缩技术,彻底解决了汉字编码和存储的困境。

在这些前辈的努力下,汉语没有被互联网大潮抛在后面,汉语拉丁化理论也被扫进了历史的垃圾堆。

我们今天能用中文上网,我们应该感谢他们的青春。

揭秘第一批中文电脑字体诞生过程,将汉字“搬”进数字设备有多难?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 冷链服务平台“飞熊领鲜”获近亿元A轮融资,由深圳同创伟业、青岛财富中心、元嘉控股共同投资

    冷链服务平台“飞熊领鲜”获近亿元A轮融资,由深圳同创伟业、青岛财富中心、元嘉控股共同投资

    据投资界(ID:pedaily)5月消息6、日前,生鲜冷冻产品数字化供应链服务平台青岛飞熊领鲜科技有限公司宣布完成近亿元A轮融资。 本轮融资由深圳同创伟业、青岛财富中心、元嘉控股共同投资。 据悉,本次融资将进一步夯实飞熊岭生鲜冻品平台猪、鸡、牛、羊、水产品等服务产品建

    06-18

  • 投资世界24小时 -比特大陆营业执照被抢;社区开始停止使用丰巢;跟谁学再次被做空

    投资世界24小时 -比特大陆营业执照被抢;社区开始停止使用丰巢;跟谁学再次被做空

    时间:2019年5月9日星期六重要消息,我不再开店了,在粥店里被房东带走了,随后王叶松了一口气。 “店铺转让”已经发布近一个月了,却没有人关注。 尽管疫情离开,但线下业务依然没有起色。 王叶没有承担每月高昂的费用,最终无奈选择及时止损,直接取消租约。 此前,他和他的

    06-18

  • 倍谙基宣布完成逾3亿元人民币C轮融资,纽尔利资本领投,

    倍谙基宣布完成逾3亿元人民币C轮融资,纽尔利资本领投,

    投资界(ID:pedaily)据5月16日消息,国内无血清培养基公司——上海倍谙基生物科技有限公司(以下简称“倍谙基”),宣布完成C轮融资融资超过3亿元。 所募资金将用于加速本土无血清培养基研发与创新、产业服务能力、信息化建设等方面,进一步将倍谙基打造成行业领先的细胞培

    06-18

  • 华润置地1月份销售额同比增长119.4%,斥资33亿元,征地3块,

    华润置地1月份销售额同比增长119.4%,斥资33亿元,征地3块,

    华润置地1月合同销售总额约1亿元,同比增长0.4%;总合同销售建筑面积约10,000平方米。 ,同比增长0.8%。

    06-18

  • 徐州博康获超6亿元融资,中平资本、国开科技、青松资本出手

    徐州博康获超6亿元融资,中平资本、国开科技、青松资本出手

    投资界(ID:pedaily)4月19日消息,徐州博康信息化学品有限公司成功募资超6亿元融资完成交付。 本轮融资由中平资本、国开创投领投,武汉泽森资本、浑朴投资、云辉资本、无锡实业巨峰、山东铁道基金、青松资本、青峰资本、汇智实业、深圳前海瑟瑞、佛山恒銮等跟投。 苏州国发

    06-18

  • 欧洲三大半导体厂商担心什么?

    欧洲三大半导体厂商担心什么?

    中国电子报 近期,意法半导体、恩智浦、英飞凌三大欧洲半导体公司相继公布财报,其中汽车半导体业务出现不同程度下滑。 然而,高通和英伟达等美国公司在汽车芯片市场正在经历强劲增长。 汽车芯片曾是欧洲三大半导体公司增长最快的业务,也是继工业半导体业务之后的第二条增长

    06-06

  • 全球语音通话系统:跨国沟通的全新解决方案

    全球语音通话系统:跨国沟通的全新解决方案

    .wp-block-column h3{margin-left:0} 随着全球化的深入和电子商务的快速发展,跨国企业越来越寻求提供卓越的服务全球客户服务。 全球语音呼叫系统是一种先进的通信技术,可以实现不同国家和地区之间的实时语音通信,为跨国企业提供更高效、便捷的通信解决方案。 本文将探讨全

    06-18

  • “艾目易”完成数千万元Pre-A轮融资,已服务多家手术机器人企业

    “艾目易”完成数千万元Pre-A轮融资,已服务多家手术机器人企业

    投资界(ID:pedaily)12月21日消息,近日,广州艾目易科技有限公司(以下简称“艾目易”)艾目易)宣布完成数千万元Pre-A轮融资。 投资方为广州市科技金融创新投资控股有限公司(简称“科金控股”)和广州高新区产业投资基金有限公司(简称“高新区基金”) )。 该笔资金将

    06-17

  • 坤厚自动化获高捷资本领投Pre-A轮数千万元融资

    坤厚自动化获高捷资本领投Pre-A轮数千万元融资

    据投资界3月23日消息,其主攻无人叉车,采用SLAM导航算法和基于FPGA的集群调度系统作为以计算核心为核心技术。 坤厚自动化近日完成由高捷资本(ECC)领投的数千万元Pre-A轮融资。 智能时代,制造业和物流运输行业正在从自动化走向数字化,再走向智能化转型。 此外,近年来,

    06-18

  • 最新造车独角兽正式诞生

    最新造车独角兽正式诞生

    又一新能源独角兽来了。 投资界获悉,元元新能源商用车(以下简称“元元”)近日宣布完成Pre-A轮融资,融资金额超3亿美元。 值得一提的是,本次首轮外部融资完成后,缘缘正式加入独角兽行列。 纵观本轮投资方阵容,可以说非常豪华:由普洛斯旗下银山资本领投,跟投方包括传化

    06-17

  • A小姐对话达闼和黄晓庆:机器人是人类的第三代计算机 -甲子光年

    A小姐对话达闼和黄晓庆:机器人是人类的第三代计算机 -甲子光年

    作者|助理小姐|刘杨楠年12月28日,工业和信息化部、国家发展改革委、科技部、公安部等15个部门联合印发《“十四五”机器人产业发展规划》。 该规划战略定位明确,目标明确,将“机器人”这个我们从小就熟悉的科幻概念定义为行业必答题。 规划提出,到2020年,我国将成为全球机

    06-17

  • 传闻日本大厂京瓷将在新工厂增加MLCC产能

    传闻日本大厂京瓷将在新工厂增加MLCC产能

    据日刊工业新闻近日报道,由于5G和汽车电动化,零部件需求大幅增加,供应继续超过需求。 因此,京瓷计划向Kazuya投资约1亿日元。 小岛国分工厂正在建设新的电子元件工厂。 新工厂将提前启动,目标年内开始量产。 报道指出,新的电子元件工厂预计将生产MLCC、晶体振荡器等产品

    06-08