2012年4月6日 星期五

罕有的簡體字科學研究

2012年4月6日

「薄熙来」的疑惑

幾星期前《經濟學人》中國版登了一幅薄熙來沒精打采出席人大會議的照片,我對薄熙來毫無興趣,惟那桌上的名字牌吸引了我的注意。「薄熙来」三字,最難寫的二字沒有簡筆,反而最不需要簡化的「來」字則由八畫似有若無地減至七畫,設計簡體字的人是否有些本末倒置?

簡 體字並非為薄熙來而設,為的是簡化廣大群眾的日常用字。1956年1月,國務院正式公布《漢字簡化方案》,簡體化分批進行。1964年再公布《簡化字總 表》,就是今天內地通行的簡體字。【圖一、二】顯示了漢字簡化前後的筆畫分布。沒可能包括所有漢字,這裏是最常見的一千個,紅色表示最常見,愈趨淺藍的愈 是少見。
我採用了中文大學人文電算研究中心的現代漢語常用字頻率統計資料庫。由於簡化工作在五六十年代內地進行 ,簡化前後的變化亦應以當時的用字模式作準,故二圖及本文餘下的調查都是根據六十年代內地的一千個最常用字。為什麼一千個?這是方便的齊頭數,恰好涵蓋了 九成的用字頻率;時間所限,未能作更廣泛調查。【圖一、二】所見,漢字的筆畫範圍給「壓縮」了,這並不意外。簡化前,八至十二畫最多;簡化後,六至十畫最 多,而且更集中。

我一向懷疑,即使不用刻意簡化,較常用的漢字應該都是傾向較淺的,因為愈淺的字愈容易寫,愈常寫的字愈有動機去簡化(我指 的是民眾自行簡化,不必「中央主導」),官方推行的簡化運動只是人為加速了這一過程而已。圖一可見,紅色是偏向左邊的,表示繁體字已有「愈常用愈易寫」的 傾向,證實了我的懷疑。
節省20%「筆墨」

再參考下表【表】,繁體總筆畫由上而下不斷增多,證明愈常用的字筆 畫愈少,未簡化已有這種傾向。簡化「力度」最大在哪裏?【表】列出數據,讓我解釋「簡體字滲透率」及「筆畫簡化率」之後,大家可以自行咀嚼。拿第一橫行作 例,最常見的一百字之中,有簡體的31個,但簡體字滲透率不足31%,因為它把字的出現頻率計算在內,高頻率的簡體字能夠拉高簡體滲透率,低頻率的簡體字 影響較小;首一百字的簡體滲透率24.90%,即是說,如果只用最流行的一百字作一篇文章,裏面大概25%是簡體字。用最流行的一千字作一篇文章,裏面大 概三成是簡體(見「累積滲透率」)。
簡體字省去多少筆畫?這就是「筆畫簡化率」的意思,已將字頻計算在內。再拿第一橫行作例,首一百字的筆 畫簡化率82.98%,即是說,如果只用最流行的一百字作一篇文章,用繁體字寫需要一萬個筆畫,用簡體字寫同一文章大概需要 8298個筆畫。用最流行的一千字作一篇文章,用繁體字需要一萬個筆畫,用簡體字大概需要7912個筆畫(見「累積簡化率」),省去大約二成「筆墨」。
撰文:Nick Lee


放大圖片

沒有留言:

張貼留言