汉语大全>计算机理论>计算机技术在汉字印刷字体评估体系中的应用环境和评测对象

计算机技术在汉字印刷字体评估体系中的应用环境和评测对象

详细内容

一、应用环境和评测对象应用环境基于Windows操作系统,评测对象为安装在系统字体子目录中所有TureType和OpenType汉字字体。汉字字形评测程序如图1。

二、基本功能与原理

1.重心检测在方框内设计汉字,设计师注重字的重心,横排左右平齐,直排上下垂直,其基本依据是重力平衡。重力平衡的物理意义是:组成字形的像素是有质量的,以重心为支点两端保持力平衡。重心检测依据下列算法:公式中,G(k)为k点位上的重力值,(k-x)为k点位到支点x的距离,x为支点坐标;n为以像素为单位的方框边长。计算求解:利用上述算法可以检测字库中每个汉字字形的重心坐标。随机检测结果表明,汉字字形的重心与设计师心目中的重心趋于一致。

2.斥力检测设计师为控制字面大小,对于靠近边缘的字形常常依据“满收虚放”的原则进行调整,满格的笔形向内收紧一些,而舒展型的笔形向外放宽一些,达到视觉上的大小一致。那么“满”与“虚”的判别依据在哪里?既然“满”是对靠边的空间挤压,根据作用力60研究与探索与反作用力原理,字形上每个像素都受到来自方框四周的斥力,斥力的大小与像素靠边距离有关。斥力计算的基本数学模型是:公式中,s为方框四周的某条边,R(s)为该条边对字形的总的斥力,方向向内并与该边垂直;a为一个放大系数,便于观察斥力值;w、v分别为方框水平和垂直边长;P(x,y)为像素与边的距离。为了对斥力做分析比较,将P(x,y)设定为三种可选模式,即1/P(x,y)的值与距离(靠边距离)成反比,与距离的平方成反比,与距离的3次方成反比。比较下来,1/P(x,y)的值选择“与距离成反比”比较合适一些。斥力检测既为“满收虚放”,也为“重心平衡” 提供了参考数据。

3.密度检测密度检测主要是统计字形的像素,与方框可容纳的总像素的比值称为密度比值。从密度比值可间接评估字形的粗细和大小,不同字体同一字位的密度比值较大者,笔形较粗或字形稍大。对一个字集做连续自动密度检测,然后取密度平均值,具有统计意义。

4.字面大小检测字面大小是指字形占据空间的面积,由于方框内的汉字字形四周需要留一些空白作为排版时的字隙,于是产生了字面大小的规范。字面大小是字体风格的一种体现,日本汉字字面普遍较满有点“撑”,而中国汉字字面稍小显得有点“敛”。字面大小有两种检测方法,一种是物理边界法,即用一个矩形框恰好将字形包围在里面,这个矩形框的面积即为该字形的字面大小;另一种方法是取字形的重力重心点到物理边界最大距离r,以重力重心点为几何中心,边长为2r 的正方形,称之为重心边界,并将它视为字面大小。两种方法得出字面大小比值略有不同,第二种方法字面会显得大一些。表1是汉字字形密度和字面大小对照分析表。表1记录了字数为6 763的常用字集合、9种字体的检测结果。密度平均比值较小的字体笔形较细,反之较粗,表中可以看到最细的字体为上海印刷技术研究所的宋体一号,最粗的是黑体;物理边界比值较小的字面较小,反之较大,表中可以看到楷体字面最小,方正报宋字面最大。将密度和物理边界综合评估,密度/边界的值较小者笔形较细、字面较大,反之笔形较粗、字面较紧,表中显示方正报宋体和上海印刷技术研究所的宋体一号笔形最细,黑体最粗,四种宋体除系统宋体外差别不大,系统宋体略偏细了一些。

5.均匀度检测汉字印刷字体与传统书法“疏处可以走马,密处不使通风”是相背的,强调灰色度匀称,忌讳太疏或太密,即笔画与笔画间的空隙(又称内白)要均匀。观表1 汉字字形密度和字面大小对照分析表上海印研所 方 正 汉 仪 系统字库字体名称 宋体一号 宋体二号 报宋 书宋 宋二体 宋体 黑体 仿宋 楷体密度最小 1.62% 2.33% 1.09% 2.65% 2.27% 2.10% 3.03% 28.17% 26.70% 最大 24.31% 32.05% 26.94% 30.81% 30.42% 28.18% 39.99% 1.85% 2.16% 平均 16.86% 21.08% 17.30% 21.33% 21.67% 19.03% 29.28% 17.92% 18.17% 物理边界最小 6.70% 7.72% 3.25% 9.20% 7.76% 7.90% 7.94% 7.23% 5.87% 最大 92.52% 86.98% 96.90% 95.74% 94.22% 87.49% 87.52% 93.46% 95.94% 平均 82.28% 80.95% 87.46% 84.73% 84.46% 80.80% 78.42% 79.27% 77.17% 重力边界最小 11.02% 12.36% 6.85% 16.82% 14.36% 12.92% 8.81% 10.26% 9.52% 平均 93.99% 91.99% 99.00% 96.29% 95.44% 92.20% 88.79% 96.65% 95.34% 密度/边界 0.201 0.260 0.198 0.252 0.257 0.236 0.373 0.226 0.235PRINTING FIELD 2011.07 研究与探索 61 察内白是否均匀,需要有十分丰富的字体设计经验。为了快速准确获得内白数据,并能用比较直观的形式展现,依据内白受到周边笔形的叠加影响,在均匀度检测上模拟水墨画的扩散原理,采取了以下算法:塌陷算法——将单位内像素和视为一个能级,然后以半径r向四周圆形扩散,每个扩散点获得的能量与圆心距离成反比,扩散后的能量总和不变;叠加算法——方格内的点有可能受到不同笔形扩散出来的能量,这些能量是允许叠加的。将两种算法运用到字形的内白检测,效果如下:图2-a是“燕”的原字形,图2-b是墨化处理后的内白图,图2-c是前两个图的叠加效果图。从中间的内白图上,可以比较清晰地了解内白状况,下面稍白,中上部位较黑,尤其“灬”与上面的结合处显得稍微有些空,这与字体设计师的观点是相符合的。内白的调整还要与字形设计的其他要素结合起来,这里提供的内白检测方法主要是克服经验化的困扰。

6.第二中心线检测绝大部分汉字是形声结构,根据上海印刷技术研究所研制的“基于GB 18030—2005汉字基本属性数据库”对GB 13000字集汉字的计算,超过90%的汉字是由两个部件构成的,或左右结构,或上下结构。经过长期的研究探索,字体设计师发现形声结构的汉字,除了字本身的中心线(第一中心线)外,构成汉字的两个部件也都存在着各自独立的中心线,称之为第二中心线。第二中心线位于第一中心线的两端,当字是左右结构时,第二中心线是位于第一中心线两端的两根竖线;上下结构时,是两根横线。第二中心线之间的距离控制着字身的松紧,按照前辈字体设计师的论述,在同一副字体中的第二中心线的距离应该是固定的,“第二中心线服从于第一中心线,是一种视觉上的杠杆原理”。第二中心线在形声结构为主的汉字字形设计中有着重要的应用价值,那么对由两个部件组成的汉字第二中心线检测,也就成了汉字字形评估体系中的重要内容。构件区分——应用程序提供了简单操作方法,可以随意将鼠标拖出的矩形区域内的字形设定为“红” 构件或“蓝”构件,任何复杂的构件都能区分;构件测试——被区分的构件,独立实现重心检测,计算第二中心线的距离,并依据F 1 D 1 =F 2 D 2 杠杆平衡原理,计算由此得出的重心与整字测试获得的重力重心的差异,其中F是部件的重力值,D是部件的重力支点到重力平衡点的距离;构件调整——应用程序提供了位置移动等操作,便于进一步探究构件组合的合理性。这些调整仅作为观察分析,不会对实际字库产生任何改变。图3-a是将“暘”区分为“日”和“昜”两个部件的例子。图3-b是对已经区分的构件标上各自的物理边界和重力重心线。 “暘”的第二中心线距离检测值为224个像素,上下距离为40个像素。综合数据显示,该字形设计得比较合理,如果稍稍向右整体移动3个像素,数据上将体现得更好。

7.字集的连续自动检测与评估应用程序提供了对指定的字集进行连续自动检测和评估的功能,通过对字集的整体检测分析,并作出图2 内白检测 a.原图 b.内白图 c.叠加效果图 a b 图3 构件区分62研究与探索适当的评估。实际操作如图4。检测内容为:重力重心、字形密度、边界、四周斥力等。评估内容为:平均密度、平均字面比值,密度与字面比等。 8.人工检测与评估系统计算机程序检测与人工检测事实上存在着差异,人工检测不仅受人员本身对字形认识能力的影响,同时也会受到环境和心理的干扰。但是,汉字字体毕竟是一种视觉产品,主要是通过人的视觉感受来最终验证的,所以缩小人机之间的检测差异,在评估上趋于一致,是应用程序追求的一个目标。应用程序(如图5)提供了人工检测和评估的功能,它是在常规检测基础上,制定了较为严格的检测流程,规定操作员必须完成某些操作,如重力重心的调整、构件的区分与调整、对字形的评估等。检测与评估结果会收集保存在文档中,不仅可以继续检测和评估,也可以将不同人员做的检测评估文档放在一起统一评估与鉴别。

三、结束语汉字是中华文化传承发展的永恒载体,现代汉字印刷字体的发展更是与社会主义政治、经济、文化的发展息息相关。历经50多年几代人的不懈努力,汉字印刷字体已经达到了令世界瞩目的高度,并正在向 “中华字库”更高目标努力。汉字字体设计的规范制定出来了,开发数字化汉字字库的计算机工具也有多种选择,但是评估汉字印刷字体品质的权威型体系并没有建立,汉字字形品质的检测还是依赖于人工检测,这是十分遗憾的。上海印刷技术研究所作为现代汉字印刷字体主要发源地,多年来致力于汉字印刷字体创写技艺的传承。2009年在上海市科委项目(项目编号:09dz1501600)支持下,开始了计算机技术在汉字印刷字体评估体系中的应用。应该看到,这仅仅是一个开端,有些算法和运用技术有待商榷和实践验证,但是毕竟迈出了第一步。从已经获得的资料中,还没有发现国内有机构或个人在做这方面的研究。由于程序研制开发的需要,曾多次向有经验的字体设计师讨教汉字设计的精髓与要领,逐渐对字形品质的评估有所领悟,在此感谢我国第一代尚健在的字体设计大师徐学成,同时也要感谢仍在一线辛勤劳作的字体设计师吴振平。

参考文献: [1] 字体设计论文集汇编[C].上海:上海印刷技术研究所,1965. [2] 汉字印刷字体创写技艺——上海印刷技术研究所申报国家级非物质文化遗产项目申报书[Z].上海:上海印刷技术研究所,2010. [3] 谢培元.第二中心线——印刷字体结构专论[C].上海:上海印刷技术研究所,1996. [4] 徐学成,盛莲红.漫谈汉字的书写体与印刷字体——兼谈 “宋、楷、仿、黑”字体的阅读效果[Z].

本文选自上海论文网 ://.shlunwenw.致力于论文,毕业论文,职称论文,本科论文,硕士论文