青羽的博客

恭喜你发现了一个不为人知的小岛

一个理想的符号系统

首先搞清楚一个概念,什么是“符号系统”?

我个人理解是 各国的文字、字母、数字、标点符号、表情符号等等进行排列组合生成的所有可能的符号及其相互作用的规则构成的集合。

比如“true”、“false”、“w”、“∫”、“d”、“*”、“/”、“\”等等这些都是符号系统的真子集。

知识的传承,人类的发展,几乎是与符号系统捆绑在一起的。


其实我并不是闲得没事干跑来设计符号系统,我只是察觉到有很多目前人们正在使用的符号的不合理性,不吐不快而已。

语言是符号系统的一个真子集,一门语言的生命力依附于使用这个语言的国家/地区的影响力,并不是很看重这个语言本身是否易于学习和使用。

比如,虽然某些小众语言很难学也很难用(至少我是这么觉得。在外国人眼中,貌似中文也很难学),但因为还有一些国家和地区的人们使用这些语言作为官方语言,所以目前这些语言的生命力还比较旺盛。

比如,虽然“世界语(Esperanto)”的语法严谨、语音优美、逻辑性强、表现力丰富,比英语更易学,但知道世界语的人显然没有知道英语的人多。

所以就算没多少人能看见这篇文章,我还是要吐槽一下目前的符号系统,不吐不快。


那么,正片开始!

首先,我吐槽几点:

  • “true”和“false”代表“真”和“假”,在编程中经常使用这两个单词。明明是反义词,但是字母数量却不相等,有没有搞错啊!导致书写的宽度不一样,逼死强迫症。类似的还有“big”和“small”等等等等。你看人家中文,“真”和“假”,“大”和“小”,“美女”和“帅哥”都是一致的宽度。

  • “w”,达不溜,26个英语基本字母之一,这个有什么问题呢?问题很大!“w”其实是“double v”(一说是“double u”)的意思,那么问题就来了,你拿一个复合符号当基本字母干啥呀!重新设计一个符号不行吗?“w”是依附于“v”之上的,二者不应该同为基本字母。逼死强迫症+1。

  • “∫”和“d”在数学里代表“积分运算符”和“微分运算符”,微积分可以说是数学大厦的基石了,相当重要,现在看似不重要是因为人类平均科学素质不高,几百年后微积分一定会和加减乘除一样被普遍使用(虽然频率可能略低于加减乘除)。可是你看看微积分的符号是啥?“∫”这个还好说,未来的键盘估计会有这个符号,可是“d”怎么解释?为什么拿一个英语基本字母当作微分运算符?“∫ dt”、“∫ dx”之类的,看起来很不和谐啊!“∫”和“d”明明互为逆运算,首先得基本对称吧,其次这么重要的符号,应该要有唯一性吧,这两个条件都不满足,逼死强迫症+2。

  • “*”,星号,在计算机领域一般用作乘法运算符,经常用作正则匹配的通配符。乘法就乘法,通配符就通配符,为什么搞在一起?再说乘法这么基本的运算为什么没有一个唯一的符号?就用“×”(不是英语字母x)不好吗?你说因为怕和字母“x”搞混,所以不用。那么请你解释一下“0”和“O”、“1”和“l”?好吧这可能是ASCII码的锅,属于历史遗留问题了。

  • “/”,斜杠我觉得我现在很杠,在计算机领域一般用作除法运算符,经常用作路径分隔符。除法就除法,分隔符就分隔符,为什么搞在一起?再说除法这么基本的运算为什么没有一个唯一的符号?就用“÷”不好吗?好吧这应该是ASCII码的锅,属于历史遗留问题了。

  • “\”,反斜杠,在计算机领域一般用作路径分隔符或者转义字符。关于斜杠和反斜杠,总结一下是这样的:在Windows系统中,斜杠表示除法运算符;反斜杠表示路径分隔符或转义字符。在Unix系统中,斜杠表示除法运算符或路径分隔符;反斜杠表示转义字符。乱吧?我也觉得乱。

  • 字符集,各种字符集,你品,你细品。虽然我知道微软要整一个BOM是有原因的,LE和BE也是有用的,每个国家和地区也都想搞一个自己的字符集,可是看着就是逼死强迫症。


那么,一个理想的符号系统应该是怎样的呢?

既然是理想的,那么我就天马行空了,不考虑现实了。换句话说,想象一万年以后,人类已经共产主义了,那时候的符号系统是怎样的呢?

  • 不保留任何对现有符号系统的兼容性。
    • 微分运算符、积分运算符等重要数学符号重新定义。
    • 基本符号重新构造。
    • 重新设计一套十六进制的数字符号系统。
  • 词汇集符合霍夫曼编码定理。
    • “true”、“false”等重要的词汇设计成单音节的。
  • 统一使用改进的世界语或者其他专为全人类设计的语言,但保留各个文化的语言。
  • 拼写即音标。读音具有唯一性。
  • 明确区分基本符号和复合符号,基本符号具有唯一性。
  • 数学、计算机科学和物理学等具有自洽而完备的符号系统。

开个脑洞,到时候中文这种表意文字的影响力不会被削弱,反而更具有生命力。原因如下:

  • 中文这种表意文字普遍比英语这种表音文字具有更大的信息密度。想想看,为什么目前只有中国和日本有大型的弹幕网站,并且形成了独有的弹幕文化?就因为中文和日文比英语具有更大的信息密度,换句话说就是更加易读(缺点就是相较于英语不易写)[1]。但是,在高新技术的支持下,还有多少人需要用笔来写?
  • 到时候需要用笔的,可能只有一个地方:书法。这是艺术。
  • 中文诗词非常优美:
    • “黄河之水天上来,奔流到海不复回”之磅礴;
    • “举杯邀明月,对影成三人”之浪漫;
    • “人生自古谁无死,留取丹心照汗青”之赤诚;
    • “问苍茫大地,谁主沉浮”之大气;
    • “落霞与孤鹜齐飞,秋水共长天一色”之意境;
    • “对酒当歌,人生几何”之感慨;
    • ……

好吧,可能是因为我是中国人,所以对中文情有独钟。总之,在一个理想的符号系统之下,世界人民都使用同一种语言——可能是改进的世界语或者其他专为全人类设计的语言,那时候,中文也还有一席之地。

另外,既然那时候基本不用笔写字了(书法除外),并且文盲应该也没有了,那么简化字就没有必要了,可以适当恢复繁体字。爱无心(愛),亲不见(親),怎么行呢?并且书法也基本都是写繁体字。

以上。


[1]: 为什么全世界只有中日两个国家弹幕视频网站成为流行? - Sithferia的回答 - 知乎 https://www.zhihu.com/question/65281224/answer/967240703