【新字发布】京華老宋体
零、前言
七月盛夏,又到了发新字体的时节(有关系吗……
点击图片跳转到推文
壹、前面的废话
《汉语词典(原名:国语辞典)》重排版与原版印刷效果对比
紧接着另一本书到货了,那是 1973 年商务印书馆出版的《现代汉语词典(试用本)》,因为在孔网模糊的展示图上我发现他内文竟然是旧字形字体印刷的,于是果断下单看看。到手之后也是惊为天人,印刷效果非常漂亮,虽然和《汉语词典》用的字体字号大小并不一样,但这相似的感觉,我意识到这恐怕是同一套东西。
不过那时我完全不知道这字是什么来历,直到后来,在活字攷古群潜水偷师,才慢慢了解到这个字体—— 61-1 体的一些信息。进一步深入后,也知道了这款字体曾经的辉煌——它不光印刷效果清爽,而且繁简齐全,还有新旧字型两个版本,它印过大名鼎鼎的中华书局二十四史,各种点校的古籍、老课本都能见到其身影。但是到了现代,竟然有且仅有一个新字形的数字版留存于世。
「多可惜啊!」
痛惜之后,我就一发不可收拾了,四处搜集相关印刷品,想要复活旧字形版的 61-1 体。
不过一开始做我就感觉到,这困难和麻烦程度,和之前做的扫描字体完全不是一个等级。
之前做的字,虽然也有四处搜集字样的过程,但是其基底,都是有一个现成的字表的,类似《简化汉字方案》这种,一个字表,十几二十页,就能提供繁简两套上千字的字样,我要做的无非是扫描后按顺序一个个切下来封装进字体文件里而已。
这 61-1 体则不然,虽然也有词典存在,就是那本《现代汉语词典(试用本)》,可以保证大部分字我都能找到,但是一本词典几百上千页,字样均匀地分布在整本词典里,要从这里面提取出所有不重复的字,这工作量相当吓人。而且即使全部成功提取出来了,还有一个问题,就是当时的用字繁简混杂,一个字只要在这本词典里以简体形式出现,那我就收不到它的繁体了,反之亦然。要全是简体印刷也就算了,至少我能做个简体字体出来嘛,它偏偏是混的,这就很难受了,我必需其他字样书辅助。
但这个字体,我翻遍孔网,是真没找到什么堪用的成套字表存在。
我最先想到的当然是去找新华字模厂的官方字体样本,可惜,买了两三本,字倒是很全,但不是我想找的旧字形版本。
然后我就想到各种其他字词典、汉字理论书籍,或者其他什么比较大部头的书籍的检字表。确实找到了一些。但是有两个大的原因让我最终没法靠它们去完成这款字体。
首先,这些书有个对我来说不好的习惯,就是会出于描述、讲解汉字的需要,去改字的字形。这种毛病在字典里特别突出,因为旧字形的字和平时人手写的字,笔画数是有区别的,典型的就比如「者」字的旧字形多一个点,那我查字典的时候数笔画到底数不数那一点呢?还有些笔画虽然一样,但是写法不一样,比如「象」的中部,一些旧字形宋体是冂内一人,但楷体又是倒日的形状,字头和正文字形有差別,会让很多不明所以的人困惑:这字到底怎么写?
字典字头和正文字字形不同—— 1954 版《新華字典》
要找印刷效果好的,得到 70 年代后的了,比如一开始让我惊为天人的《现代汉语词典(试用本)》就是 70 年代印刷的,但也不是 70 年代后的印刷效果都好,像前面说的《韵辙常识》,都到 1978 年了,照样不咋地。反复筛选比较之后,终于确定了两部最佳字样书——中華書局 1973 年出版的《民國通俗演義》和商务印书馆 1972 年出版的《日本列岛改造论》。这两部书一套全繁体、一本全简体,收完后常用字基本不用愁了。且两书都是四号字印刷,本来笔画就比那些五号字印刷的清晰不少,而且纸张光洁,后期修起来方便,简直完美。
敲定了最佳样本,之后的工作就全是重复机械的劳动了。为了让重复的劳动有点乐趣,我决定按照字频表顺序来收字,用电子版的书定位想找的字在哪本书、哪一页、哪个位置,然后抠出来收进去。这样做看似麻烦,但其好处一是有了种按图探宝的乐趣,二是按字频表来做可以很快覆盖大多数常用字,不时拿来排排文章,比较容易产生成就感。
于是, 2021 年 9 月 9 日我正式开始扫描字体的制作。
如果说音乐是一种能唤起人回忆的开关,那做字对我来说可能也如是。日复一日,一个字一个字地收集、修整,每个字都如同一段记忆碎片一样,回头再看到时,总能让我回忆起一些当时的所感所想。虽然过程麻烦至极,但漫长的工期反而让其成为了我的一种生活动力,让我在无尽的本职工作中有了一些别样的乐趣与期盼。中间做做停停换了几次方向后,终于在历时一年半多之后,常用字收得七七八八了。(真要说起来,《民國通俗演義》我根本还没收完)
于是我迫不及待地开始了下一步计划——炼丹!
说白了就是用 AI 来补字了,我是一开始就有此打算的,毕竟有些现在日常会用到的字,是不可能在老 61-1 里收到的(比如一些姓名地名生僻字、日本新字形),更别说庞大的统一码扩展区的字,靠我一个人人力补着实可怕。之前的汇文明朝我就想用 AI 来补字了,但实在是因其本身过于零碎不成体系,炼出来的效果很难让人满意。但这次不同了,一套成体系的字体和优选修缮的字样,那出来的效果应该是不一样了。
当然对于代码小白来说,配置环境,搞清命令的含义得费一番功夫,多亏兔狲师油管的教学视频[1]手把手的教授,我才能把丹炉顺利跑起来。按着教程训练了 7、8 个小时,试验了好几种底子之后,成品输出来我一看,属于是我自己都吓一跳的程度:
这还抠个屁的字啊,直接往里灌吧!当然其中有一些没法用的东西,但之前扫描的东西不也烂字一堆嘛,不也是一个个修过来的嘛, AI 弄的烂字有啥可怕的,修他的!
这一下,字库就从 5700 字扩充到了 36000+ 了,什么叫科技改变生活?什么叫效率?这要用抠的我要抠到哪辈年?(何况很多字根本抠不到)当然,也得益于这是扫描字体,稍微烂点破点无所谓,不如说,反而更有味儿。
终于我觉得,这字体可以发出来了。
弍、发布
好了,终于到了发布的环节了。直接上图。
统一码基础汉字区:全收录 统一码扩展 A 区:全收录 统一码扩展 B - G 区:选择部分收录 喃字常用字表[2]:全收录 已编码二简字[3]:全收录
慢慢提高常用字部分原装 61-1 比例 全繁体版 半繁简版(仅保留第一次简化方案公布的简体字,不含类推)
提及书目
《汉语词典(原名:国语辞典)》商务印书馆,1962 《现代汉语词典(试用本)》商务印书馆,1973 《电报拼音化》文字改革出版社,1965 《韵辙常识》北京人民出版社,1978 《民國通俗演義》中華書局,1973 《日本列岛改造论》商务印书馆,1972 《北京新华字模厂汉文字模字体样本》,1961 《北京新华字模厂字目表》,1965 《中华人民共和国出版史料(1964-1966)13》 《初级中学课本 代数 第一册》人民教育出版社,1966 《初中代数课外习题集》上下两册 人民教育出版社,1966
参考
编辑:宇宙微光