设为首页 添加收藏

大家谈·语言文字规范那些事儿

2018-06-21 11:57:24
  《光明日报》编者按:生活中无处不在的数字,似乎可以“随意”使用。然而,对于汉字数字和阿拉伯数字这两种不同的数字表达形式,他们的表达功能、使用场合有何不同,在正式的中文出版物中,应该如何使用数字等问题,恐怕仍不被大多数人所熟知。本刊特邀《出版物上数字用法》课题组首席专家詹卫东教授及其团队,解读标准背后的规律和“故事”。

小数字的大学问

——中文出版物使用数字应遵循的原则

作者:詹卫东(北京大学中文系教授)


  在现代社会生活中,需要用到数字的场合可谓比比皆是。身份证号、学号、银行账号、电话号码、邮政编码、书号……数字的具体应用恐怕多到无法列出一个完整的清单,但概括起来,数字的主要功能可以归纳为两个:计量和编号。

  与其表达功能相对应,数字在中文文本中主要有两种表达形式:一种是中文固有的书写形式,即汉字数字形式,基本符号有“零、一、二、三、四、五、六、七、八、九、十、百、千、万、亿”等;另一种是自19世纪末20世纪初开始,伴随西学东渐和中国现代化进程,逐步在中文中推行开的阿拉伯数字形式,基本符号有“0、1、2、3、4、5、6、7、8、9”等。在实际使用中,阿拉伯数字还可以根据需要,使用小数点“.”、多位数分节符“,”、以及短线“-”和分隔符“∶”等辅助符号。用汉字书写的数字则不含其他辅助符号。

  可见,数字的上述两种表达形式跟数字的主要表达功能之间是有大致对应关系的,即在强调精确计量和编号功能的场合,倾向于使用阿拉伯数字,而作为一般语词使用以及表达概数的场合,则倾向于使用汉字数字形式。

  不过,这种分工并不是绝对的。一方面,汉字数字也有计量和编号的功能。在阿拉伯数字进入中国之前,中国人正是用自己的汉字数字书写形式来计数的,包括做计算和用数字来编号、排序。另一方面,阿拉伯数字在使用过程中,其表达功能也逐渐拓宽,从最开始的主要用于精确计量发展到各种编号功能,进而发展到跟汉字成分结合在一起来表达概数。这样,就造成了在一些场合二者可以换用的情形。也正是因为这个原因,才需要对两种数字书写形式进行适当的规范,尽可能将不同的表达形式跟不同的表达功能对应起来,实现汉字数字跟阿拉伯数字相对分工明确,各司其职的目标,从整体上提升中文文本传递信息的效率。

  形式是为内容服务的,数字形式也不例外。在书面上选择数字书写形式时,总原则是根据数字的表达功能(或者说表达目的)来选择其书写形式。但正如上文指出的,数字的形式和功能之间尽管有大体的对应关系,但仍然存在交叉和可以换用的情况。因而,在具体落实根据表达功能来选择表达形式这一总原则的时候,要遵循四个更具体的原则。

  1.编码效率原则

  数字的主要功能是计量和编号。对于这两个功能来说,都要求信息传递的效率高。因而在用数字计量和编号的时候,需要用到的数字越多,就越应该使用阿拉伯数字书写形式。因为在表达同样的数值时,阿拉伯数字总是比汉字数字形式的编码简短。此外,从视觉效果上,因为编码简短,阿拉伯数字给人的整体感觉是结构紧凑。加之笔画线条简洁,不同于一般的汉字符号,文本中的阿拉伯数字总是能收到醒目之效,这也会节省辨识的时间,提高解读的效率。

  2.尊重传统原则

  汉字数字是中文书写系统中固有的符号,在中文文本中,其历史比阿拉伯数字要悠久得多。因而有许多表达场合,习惯上要使用汉字数字。特别是在不强调计量的时候,更是如此。使用汉字数字形式,可以让文本整体更好地保持中文文字系统的统一美感。在不影响信息传递效率的前提下,使用汉字数字书写形式,是对汉民族悠久历史文化的尊重和传承。

  3.表意清晰原则

  前两个原则是在宏观层面针对全体数字而言的。编码效率原则鼓励多使用阿拉伯数字形式。尊重传统原则鼓励多使用汉字数字形式。这里谈的表意清晰原则则是在微观层面,针对具体的数字形式而言的,一个数字形式在具体语境中出现的时候,总是要传递一定的表意信息。如果不同的数字形式在表意时清晰度有差别,则应该根据语境中实际表意的需要,选择表意更清晰、更准确的形式。

  为了更好地说明这个原则,不妨看一个对比例子:“他在等晚1点的航班。”和“他在等晚一点的航班。”前一句用阿拉伯数字形式“1”,后一句用汉字数字形式“一”。很显然,前一句意思更清晰,后一句则有歧解的可能性。“1点”只能理解为“1点钟”的意思,指一个确定的时点。“一点”则既可以指“1点钟”这个确定的时点,也可以指“一小段时间”这个模糊时间长度量。如果要表达“晚上1点钟”这个确定时点的意思,从编码效率高和表意清晰两个原则的要求来说,就应该选择用阿拉伯数字形式。如果选择用汉字数字形式,那么,为了提高表意的清晰度,就要增加字符,也就是加长编码(损失编码效率),来换取表意的清晰,比如上面两句可以分别写成:“他在等晚上一点的航班”和“他在等更晚一点的航班”。这样的表达形式,就完全满足“表意清晰原则”的要求了。

  4.系统一致原则

  系统一致原则,也可称为“同类别同形式”原则。这个原则主要是针对阿拉伯数字和汉字数字两种形式均可使用的情况,是兼顾宏观层面和微观层面提出的。无论是从中文文本整体的美观来说,还是从文本中每个具体表达形式的效率以及准确性来说,保持一个文本内部数字使用的一致性这个原则都是一个正向的推动力。反之,内部形式上的不一致,则不仅会增加阅读的负担,甚至还有可能造成表达不准确、不清楚的问题。

  比如在提到年份的时候,行文中应该使用完整的数字表达形式,如“1978年”或“一九七八年”,都指向的是公元纪年中的同一个年份。在同一篇文章中,应该根据表达的需要,选择其中一种形式,而不应该两种形式随意换用。再比如在表达具体的日期时,更不应该出现汉字数字形式和阿拉伯数字形式混用的情况,比如“一九七八年10月1日”,就是违反系统一致性原则的情形。遵循系统一致性原则的写法应该是“一九七八年十月一日”或“1978年10月1日”。

  概括而言,上述四个原则实际上回答了在有竞争的情况下,如何选择优先的书写形式的问题。四条原则的含义分别可简要表述为:编码短的书写形式优先,历史悠久的书写形式优先,无歧义的书写形式优先,无矛盾的书写形式优先。

  显然,上述四个原则各有自己的倾向:编码效率原则会突出阿拉伯数字的功用,尊重传统原则会突出汉字数字的功用,表达清晰原则会对前两条规则进行约束,无论是阿拉伯数字,还是汉字数字,其具体的使用形式,都应该追求清晰、准确的表达效果。系统一致原则将更多的选择主动权交给文本的作者,即由作者来决定文本中哪些数字是同类的表达功能,那么这些数字就应该选用相同的表达形式,不能随意换用不同的表达形式。

  在具体实践中,可能出现不同原则之间的冲突。如果发生这种情况,应该有更基本的“元规则”来决定如何处理冲突。这个元规则就是:应该选用适用原则多的那种数字形式,而不应该选用明显违反某个原则的那种数字形式。此外,上述原则也可以帮助我们更好的理解,两种数字表达形式有时候并不是非此即彼的关系,也可能是任选其一都合乎规范的要求。
 

数字表达常见错举隅

作者:黄思思(《出版物上数字用法》课题组成员)

  数字表达应该清晰准确,否则会造成理解上的困难。特定场合中的数字表达如果不准确还会造成严重的后果。例如,欠条、借条之类的文书中数字写得不准确,可能引起纠纷;工程报告、经济合同中数字表达不准确,可能造成经济损失。下面举例说明三类数字表达不准确的现象,并简要分析原因,希望引起注意。

  错误简写

  使用数字时恰当简写能够使表达更加简洁。但是,简写的时候一定要慎重,因为错误简写可能导致一种表达有多种理解。

  用阿拉伯数字表示年份,完整形式应该是四位。如果简写为两位,就有可能会被误解。比如,如果将“2010年之后,我们就再也没有联系了”简写为“10年之后,我们就再也没有联系了”,这里的“10年”就有可能被理解为“十年”。用汉字数字表达年份时如果简写也有类似问题。比如,如果将“我一九七八年才考上大学”简写为“我七八年才考上大学”,这里的“七八年”就有可能被理解为“七年或八年”。尽管在一定的语境中,这样简写并不必然导致错误理解,而且在口语中,人们以简略的两位形式表达年份很常见,比如用“一〇年”指“2010年”,用“七八年”指“一九七八年”。但是,在书面语上,简写形式不能很好地反映口语中的读音语调等特征,这样就增加了误解的可能性,影响表达的准确性。根据《出版物上数字用法》标准,这是不规范的书写形式。

  在表达公元前某两个年份之间的范围时,其中的“前”字是不能省略的。比如,“公元前2400年至公元前1900年”可以简写为“公元前2400年至前1900年”,也可以简写为“前2400年至前1900年”,但是不能简写为“公元前2400年至1900年”。显然,省略“前”字之后,“1900年”就有可能被理解为“公元1900年”,这就与原意不符了。

  除了跟年份有关的简写可能导致歧义之外,跟“科学计数法”有关的简写也有可能造成歧义。比如,如果将“1×105~5×105”简写为“1~5×105”,就可能造成其他的理解:“1~5×105”表示的数值范围是从1到5×105(即1到500000),而不是从1×105到5×105(即100000到500000)。

  有一些数字表达形式有意思含糊的问题,跟上面所说的歧义有所不同。比如“一年以上”包含“一年”在内吗?可能理解起来就有含糊的问题。为了明确起见,书面上往往采用加括号补充说明的方式来表达。比如,“驾龄一年以上(含一年)可报名参加”或“驾龄一年以上(不含一年)可报名参加”。除这种加括号的方式外,还可以选用其他的表示数值起点义更加明确的词语。比如,跟“以上”相对,但是表示不含本数意义的词语是“超过”。“超过一年”所指的时间量就是大于一年的(即不包含一年)。像“超过”这样的词语还有“低于”“不足”等。比如,“不足100公里”或“低于100公里”,都不包括“100公里”在内。在涉及数值边界的表达场合,应通过选用恰当的词语来使数字表达整体含义更明确清晰。

  通过上面的示例不难看到,涉及到数字表达形式的简写问题时,要力求准确,能否简写的判断标准是看是否符合“无歧义原则”。如果简写可能导致歧义,那就不能简写。

  上述简写导致的问题通俗来说就是“说得不够”,与此相对的是“说得太多”。“说得太多”会显得罗唆。比如,“超过300多”就表义重复了,因为“超过”和“多”都包含了“多于”的意思,同样给人表达不准确之感。

  混淆概念

  有些概念在形式或用法上比较接近,很容易混淆。下面列举三对近似概念并说明其异同。

  “增加了两倍”与“增加到两倍”。两者都表示增加,但是“增加了”表达的是增加的幅度,“增加到”表达的是达到的结果。假设原来是一,则“增加了两倍”之后是三。从一到三的过程,数量增加了两倍。如果是“增加到两倍”,则原来是一,现在是二。

  “倍”与“番”。两者都可以用来表达数值增加的程度,不过二者的含义和用法并不相同。当数值从m增大到n,而且“n=k×m”,就可以用“n是m的k倍”来描述数值增加的程度。而如果用“从m到n,翻了k番”来描述数值增加的程度,则意味着“n=2k×m”。举例来说,假设一个人的工资原来是100元,现在是800元,则可以说“现在的工资是原先工资的8倍”,即800=8×100,倍数k=8。另一种同义的说法是“现在的工资跟原先的工资相比,翻了三番”,即800=23×100,番数k=3。

  “百分比”与“百分点”。两者虽然形式上十分相近,但是用法并不相同。“百分比”,也称为“百分数”“百分率”,是分母为100的分数,用来表达两个数值之间的比例关系(也即除法关系)。“百分点”则用来表达两个百分比数值之间的差距(也即减法关系),统计学上称百分之一为一个百分点。举例来说,假设一个学校每年招生人数为100人,去年该校新生中男生为60人,今年该校新生中男生为48人,则可以说“去年该校新生中男生占60%,今年男生占48%。今年跟去年相比,男生的比例下降了12个百分点”,即“60%-48%=12%”,但不能说“男生的人数下降了12%”。如果要用百分数表示男生人数下降的幅度,则应该是“男生的人数下降了20%”,即(60-48)/60×100%=20%。

  逻辑混乱

  数字表达如果不讲逻辑,会让人不知所云。比如“减少了两倍”“降低了两倍”这样的说法,明显是从“增加了两倍”“提高了两倍”类推出来的。但是,仔细推敲不难发现,如果套用“增加了两倍”中“两倍”的含义,那么“减少两倍”之后,数值就变为负数了,这明显讲不通。之所以会出现这种误用,主要是对“倍”的用法认识不足,“倍”不能用于表示降低。表示降低时,应该用比例表示,一般采用百分比,如“减少了50%”;也可以用分数形式,如“减少了1/2”或“减少了二分之一”。

  再比如,“近500多”这一表达中,“近500”包含“少于500”的意思,“500多”则表示“多于500”,这两个意思放在一起显然是矛盾的。

  跟非数字表达相比,使用数字表达的目的,往往是要传达给读者更为准确的意义。因此应该多从读者的角度出发,给自己“挑挑毛病”,看看有没有犯上面所说的这些错误,或者其他类似的妨碍表达准确性的错误,养成习惯之后,就能更自觉地遵守《出版物上数字用法》规范,避免出现数字表达不准确的问题了。

阿拉伯数字是如何融入中文书写系统的

作者:刘洪超(《出版物上数字用法》课题组成员)

  汉语和汉字是中华文化的重要载体和组成部分,它们的继承代表了中华文化的一脉相传,它们的发展代表了中华文化的兼容并包。阿拉伯数字融入中文书写系统的过程就体现了中华文化兼容并包的一面。

  从“阿拉伯数字”这个名称就不难看出,它是实实在在的“外来户”。阿拉伯数字的发明权其实属于印度人。印度数字在公元8世纪左右传入阿拉伯,后经由阿拉伯传到欧洲。差不多在同一时期,印度数字随着佛学东渐也曾传入过中国,但并未被当时的中文书写系统所接纳。大约在公元13到14世纪之间,阿拉伯数字“卷土重来”,由伊斯兰教徒带入中国,不过,同样又以“销声匿迹”而告终。明末清初,中国学者开始大量翻译西方的数学著作,如李之藻与利玛窦合译的《同文算指》(1613年),但是书中的阿拉伯数字都被翻译为汉字数字。可以说,阿拉伯数字历经近千年岁月,一直未能在中文书写系统中站稳脚跟,这也体现了汉字数字在几千年中华文明传承中的稳定性。

  直到19世纪下半叶,由于西学东渐和洋务运动对西方科学知识的传播和普及,国人对于阿拉伯数字的了解日渐加深,其便利性也得到了认可。于是,有些数学启蒙书籍开始教授和使用阿拉伯数字,如1885年的《西算启蒙》。严敦杰的《阿拉伯数码字传到中国来》一文对20世纪之前阿拉伯数字在中国的传播和使用情况有详细介绍,但没有说明20世纪之后的情况。

  为了研究20世纪阿拉伯数字在中文书写系统中的扩展使用情况,我们选取了143种文献进行考察,包括一般书籍和刊物(学报、会刊和普通报纸),涵盖了自然科学类(如《理化杂志》)、社会科学类(如《法院编制法释义》)以及人文生活类(如《蛋歌集》)。材料的出版时间主要集中在1911年到1955年,少量材料出版时间是在1911年之前(如严复翻译的《天演论》)和1955年之后(如《苏联文学艺术论文集》)。

  通过考察发现,1911年之前只有部分介绍数学知识的自然科学类书籍在演示数学计算时使用阿拉伯数字,而其他场合,如标题编号、页码编号以及日期时间等,都没有使用阿拉伯数字的情况。

  1911年到1955年期间,阿拉伯数字无论是在领域类别还是在使用场合上都开始扩展。其扩展符合一定的规律。

  一是阿拉伯数字经历了从自然科学类书刊到社会科学类书刊,再到人文及生活类书刊发展的过程。如对于自然科学类书刊来说,早在1914年《蒙台梭利教育法》就开始使用阿拉伯数字演示数学运算;对于社会科学类书刊来说,直到1920年左右,《蔡孑民先生言行录》才开始使用阿拉伯数字;对于人文生活类书刊,直到1927年,《蛋歌》(民歌集)中才出现阿拉伯数字,而且直到1954年,人文生活类书刊中的阿拉伯数字使用场合也极为有限,如1954年的《文学论稿》,只是页码使用阿拉伯数字,其他场合使用的仍然是汉字数字。

  二是阿拉伯数字经历了从用于数学计算,到用于编号,到用于普通计量,再到用于表示日期时间这样一个扩展过程。早在1910年之前,介绍西方数学知识的书刊就开始使用阿拉伯数字,这是由其学科属性决定的,但其他计量场合,就不是如此了。比如1914年的《蒙台梭利教育法》在表示整数时仍然使用汉字数字,只有分数才使用阿拉伯数字;1915年的《实用单级教授法讲义》开始使用阿拉伯数字作为标题编号;1916年的《中国铁路借款合同全集》开始使用阿拉伯数字作为页码编号。直到20世纪20年代末,在行文中使用阿拉伯数字表示用于计量的整数和分数仍然非常罕见,用阿拉伯数字表示日期时间更是到了1949年的《中学数学教学法》才开始出现。1955年之后,行文中的计量和日期时间都开始使用阿拉伯数字,如1956年的《苏联文学艺术论文集》。

  阿拉伯数字在中文书写系统中的扩展一方面是由于文字自身的发展规律,它书写简便,与汉字的区别性好,在表示计量、编号等方面具有极大的便利性,因而在获得中文书写系统的接受后迅速在各个领域扩展使用。另一方面,其扩展也得益于社会发展和国家语言文字标准的引导,特别是一些重大历史事件及政策法规对其推广起到了至关重要的作用。

  新文化运动倡导白话文,反对文言文,积极传播西方文化,这些都有益于阿拉伯数字的传播和使用。我们考察的1916年出版的六本书刊全部采用了阿拉伯数字来给标题编号。

  五四运动对阿拉伯数字使用的推动与新文化运动相似。1919年之后,许多学术刊物如《北京大学月刊》,其页码和序号都使用了阿拉伯数字。

  1955年之后,中文出版物开始大范围推广横排,这使得阿拉伯数字在使用中的优势更加明显。国务院1956年发出的《关于在公文、电报和机关刊物中采用阿拉伯数字的试行办法》,更是直接从国家政策的高度上推广使用阿拉伯数字。

  总体来说,阿拉伯数字在中文书写系统中的应用是一个逐渐扩大范围的过程,发展到今天,已经很好地融入了中文书写系统,跟汉字数字形式大体上形成了分工互补、各司其职的格局。从其扩展过程的反复和逐步稳定中可以看出,书写系统自身的发展规律和国家的规范引导都起着重要作用。

  来源:《光明日报》2018年06月17日第8版

副省级市  ·杭州市  ·宁波市
地级市  ·温州市  ·嘉兴市  ·湖州市  ·绍兴市  ·金华市  ·衢州市  ·舟山市  ·台州市  ·丽水市

浙公网安备 33010602002497号