作者:阮海横 (越南) Tác giả: Nguyễn Hải Hoành (Việt Nam)
汉字拼音化是指用表音的字母书写汉语,创造一种新的汉语书写体系。所用的字母可以是拉丁 (罗马)、阿拉伯或斯拉夫等字母。汉字拉丁化是用拉丁字母书写汉语的。
众所周知, 中国人100多年前就兴起了汉字拼音化运动。这场运动的目的是将汉字改为字母文字,用一种拼音化、拉丁化表音文字 (phonograph) 逐渐代替、最终废除表意的方块汉字。这样,汉字拼音化牵涉到汉字的命运问题。曾作为“汉字文化圈”一员的我们越南、理所当然十分关注这场运动的进展情况。
这篇小文是笔者从越南语言情况出发对汉字拼音化、拉丁化问题提出自己的一些粗浅的看法。由于本人学理科、无语言学知识,不大了解汉语汉字发展情况,加上中文水平很低,这篇小文不免有许多不妥,敬请各位批评指正。
新中国成立后,由于获得政府的大力支持,汉字拼音化运动进入了飞快的发展阶段并取得了明显的成绩。1958年, 中国文字改革委员会发布 “汉语拼音方案”,但汉语拼音仅作为拼写汉字的辅助工具, 只用于语音教学,不能作为正规文字使用,并非可以代替汉字的。”汉语拼音方案”自制订以来,得到迅速的推广和应用,主要用于给汉字注音,用于教学普通话,用于字(词)典的注音、排序,书刊的索引,用于不便或不能使用汉字的领域、用于将汉字输入电脑等。
据了解、经过多年的研究,中国学界发现汉语根本不适合使用拼音文字,主要因为汉语中存在太多的异义同音字和同音词,无法制定出一套能够区分同音字(词)的拼音方案。此外,中国方言甚多,以某一种方言为标准读音的拼音文字可能变成其他方言的外语,不利于国家的统一。自1986年起,中国官方放弃了汉字拉丁化改革、把这个问题由国家政策改为学术问题。
这个决策是正确的,虽然也宣告汉字拼音化的努力暂时未成功。事实证明汉字拼音化是行不通的,但是现在仍有些越南学者提出疑问:为何在汉字基础上形成的越南喃字 (chữ Nôm) 早已能拼音化,而中国的汉字至今还不能拼音化?为解答这个问题,设想首先应该了解一下越南文字情况。
汉越词, 儒字和喃字
越南主体民族——京族 (Kinh, 即越族) 原来没有自己的文字。公元前2世纪左右,越南被赵佗占领,进入长达1000多年成为中国郡县的 “北属时期”。从此,汉字正式传入越南,对越南接受华夏文化,脱离蒙昧的史前时代,进入文明时代做出极大贡献。
汉字难认、难记、难读、难写, 汉字的读音十分复杂又没有统一读音, 没有表音符号。越南人学汉字发音更困难。越南精英分子认为 越南人只需要学汉字,不需要学中国话。为学汉字, 越南人祖先创造出一套独特的学习方法:他们给予每个汉字一个确定的越语名字 (称为 “汉越词Từ Hán-Việt”, Sino-Vietnamese words, 或 “汉越音”),即每个汉字在越语中相应有一个固定的越语词, 即 “汉越词”, 每个 “汉越词” 有一个规范的全国统一的读音。读汉文时, 越南人仅仅读每个汉字的相应 “汉越词”。显然, 不用汉语, 仅用母语读汉字, 越南读音的汉字将十分便于越南人认字、理解 、记忆, 这样学习汉字容易得多了。汉字不再那么难认、难记了, 好像不是外文, 而是本土的文字。汉越音的定音主要仿造汉语的南方方言 (粤语) 语音, 所以汉越词的发音保留大量汉语的古音。在仿造时, 曾尽量使用越语的丰富音节, 一个汉语音节可能对应几个越语音节, 结果能大大减轻同音字 (词) 现象。中国人听不懂 “汉越词”的;汉字盲的越南人虽能听, 但不大了解 “汉越词”的意义。国人称这种语音越南化了的汉字为 “儒字 Chữ Nho”,即 “有学问的人之文字”。儒字成为越南的书写符号,儒字能记录汉越词但不能记录“纯越词” , 即不能记录全部越语词汇。教学儒字的师傅被称为儒师,他们所用的毛笔和墨水叫做儒笔和儒墨水。从此越南人不学汉字、只学儒字 、 即读音被越南化了的汉字。学儒字时学生只学汉字的字形、字义和句法、 不学汉字的汉语字音 、即不学中国话, 但要学汉字的越语字音 (即汉越词) 。
这样一来 、 对应于每个汉字、越语中都有一个“汉越词”, 因此几乎所有汉语书面词语都自然而然地出现在越语中、为越语陆续引进大量汉语词汇。”汉越词” 约占越语词汇总量的一半以上,是越语外来词的最大来源。“汉越词”的记录文字,即儒字帮助越南顺利接受中国文化。相比较日本、韩国、越南文化是受华夏文化影响最深的。另一方面, 通过学习儒字、 越南人虽然学会并使用汉字长达2000多年、但没有人说汉语、因此母语仍然能够原原本本保存到现在 、从来没有因为被汉化而消失。尽管中国统治越南长达一千多年,却无法同化越南。也就是说越南民族从未被汉族同化。这是个世界上罕见的奇迹!
1075年、 越南李朝引进中国的科举制度,从此、儒字正式成为越南官方文字。但是,由于越语和汉语不属于同一语系、儒字仅能记录 “汉越词” , 不能记录 “纯越词”, 即不能记录全部越语词汇。 儒字仅是越南上层用文字,只用于文言文书写,不能用于口语,使用范围仅限于行政、学术、宗教、文化教育等领域。儒字文学不能记录越南平民的思想和情感。一些越南学者认为儒字文学属于中国文学,不属于越南文学。
公元10世纪、 越南取得独立。此后, 国人根据儒字(汉字) 发明了一种称为 “喃字Chữ Nôm” 的方块文字。喃字是在汉字的基础上、 以汉字及其部首为原料、 按照汉字的假借、形声和会意三种造字法创造出来的,基本上按汉字的汉越读音来识读,用于记录越南语的文字体系。喃字使用约几千个汉字及更多的越南人自造汉字,几乎能记录全部越语词汇,包括纯越词 和汉越词, 是一种既表意又表音的文字。喃字比汉字更难学,必须先会汉字才能学喃字,没有官方统一的书写规则,因而很难普及。再者喃字未曾被官方认同、 甚至被排斥,始终没有成为越南的正式文字。但是由于喃字能记录平民口语,不少文人学者使用喃字写出了大量出色文学作品,其中有享誉越南历史最优秀文学著作 “金云翘传” (Truyện Kiều)。喃字文学作品无论数量、质量 及影响力方面都远远超过越南人创作的儒字(汉字)文学作品。喃字和儒字同时存在到20世纪初就逐渐被淘汰。
喃字的拼音化和 “国语字”的问世
公元1612年, 日本江户幕府禁止基督教在日本的传播、驱逐传教士。1615年、 欧洲天主教耶稣会教士们开始来越南传教。他们之中有些人曾在中国或日本传教过、精通汉字、了解汉字拉丁化的工作。为了便于传教工作、Francisco de Pina 、Gaspar de Amaral 、Antonio Barbosa 等教士率先学越南话及喃字,一般来讲经过一两年都能够用越南话讲课并用喃字编写教材。 法国国家图书馆现存有意大利教士Girolamo Maiorica用喃字所写的讲义、 共15卷、 120万个喃字。为了学越南话、教士用拉丁字母为喃字注音、即拼写越语。具有明显表音功能的喃字使得注音工作进展顺利。经过约30年的努力、五六个传教士最终把喃字全部拼音化完毕,成功整合制定出一种全新的表音、拉丁化的文字系统并编纂了一本 “越南--葡萄牙--拉丁文词典” (Dictionarium Annamiticium Lusitanum et Latinum) 草稿。1649年, 法国传教士Alexandre de Rhodes (亚历山大·罗德, Đắc Lộ)把这份词典稿件带回罗马并于1651年印刷成书出版、 宣告一种表音、拉丁化的文字 (后来称为 “国语字Chữ Quốc ngữ”) 的问世。1919年、“国语字”正式成为越南法定官方文字。
“国语字”基本上能实现字话一律、见字知音, 非常适用于越南语, 刚出现时就立即受到全国民众的热烈欢迎。先进的越南汉学家们最先支持废除汉字和喃字、推行 “国语字” 并称之为民族的灵魂。大学者范琼说“国语字”是解放越南人智慧的奇妙工具。”国语字”扫盲时间极短、在农村一般只要3-6个月。
拼音化”国语字”的推行不仅并未造成传统文化的断层、反而对传统文化的学习和继承发挥更好的作用。至今越南汉喃学家已经把不少有价值的古代文献翻译成拼音文字。国家方面、这个任务交给汉喃研究院 (Institute of Sino-Nom studies, Viện Nghiên cứu Hán Nôm, 1979年成立)。何况、越南历史文献本来有限。明朝时期, 越南曾被明军占领统治30年, 他们销毁所有越南人撰写的著作。加上由于战争连绵及许多原因,国内至今还能保存的古代书籍总共不超过5000卷,用 “国语字” 翻译此类书籍是可行的。实际上、 自从普及了”国语字”,越南人才有机会接触大量本国及中国的古代典籍,世界各国文化 、文学及科学技术著作。几乎最重要的中国古代文献都已经翻译成 “国语字”了。
越语和汉语的相同和不同
为解答汉字至今未能拼音化这个问题,不妨看看越语和汉语有什么相同和不同。越语属于南亚语系 (Austroasiatic) 越芒语族越语支,汉语属于汉藏语系 (Sino-Tibetan)。语法上, 最明显的不同体现在名词修饰语的秩序:越语中, 名词修饰语在名词之后 (即形容词后置), 而汉语中, 名词修饰语在名词之前 (即形容词前置)。比如中文说”汉字”, “红旗”, 越文说”字汉”, “旗红”。
但是越语和汉语同样是单音节语言 (monosyllabic language), 一个词汇对应一个音节。有的学者认为汉语由于是单音节语言, 所以不适合使用拼音文字。其实不然,单音节的越南语仍然适合用拼音文字。设想,主要原因是越语拥有足够的音节。
单音节语言中, 每个单词汇占用一个音节, 因此语言需要拥有大量音节。如果音节总量少于通用词汇总量,势必出现同音字及同音词 (homophonic words) 的现象。过多的同音字 (词) 是应用拼音文字的不可克服的障碍。当语言所拥有的音节数量不少于语言的通用字数量就可以避免这种难关。
越语最大特点是语音丰富, 音素极多, 有6个声调, 词汇读音 (即有声调的音节) 总数约有两万个 (其中曾使用的不到一半), 远远多于通用词汇总量 , 因此越语很少遇到同音字 (词) 难区别的问题, 当然适合使用表音文字, 而表音文字的拼音化是可行的。喃字有明显的表音功能, 基本上看字就能读出字音, 因此喃字拼音化是可行的。显然无表音功能的汉字性质上是不同于喃字的。
依我们浅见,汉语中存在过多的异议同音字(词)现象, 其最主要根源是汉语音节总量远少于汉语的通用字总量,导致汉语不适用表音文字,仅适用表意文字,而表意文字的拼音化是行不通的。
我们曾对新华字典第10版双色本 (2006年出版, 有8700正体字) 进行音节统计, 发现这8700正体字分属415个基本音节(即不计声调的音节),平均每个音节有20. 96个字,其中无同音字的音节 (即独字音节) 有22个,有同音字的音节有393个,每个音节都有至少2个同音字,291个音节 (70%) 有至少10个同音字, 下列4 个音节有100多个同音字:音节 [xi],[yu], [ji], [yi] 分别有 103,118,123,135 个同音字 。我们的统计也发现汉语有 1309 个读音 (即有声调的音节)。
中国资料告知汉语大约有400个基本音节和1300个读音。2013年公布的 “通用规范汉字表” 有8105个汉字,即平均每个音节有19.30个同音字,平均每个读音有6个多同音字。据苏培成著 “二十世纪的现代汉语研究”, 如果用 “辞海” 统计则单个 [yì] 读音 (去声) 就有195个同音字!可以看得出汉语存在严重的同音字过多现象。
现实的情况为汉语的音节总量太少, 但汉字的通用字字量太多, 尤其汉字的总字数更是过多 (1994年出版“中华字海”收字86000多字), 而且是不断增加的。音节少, 用字多, 当然造成异议同音字多现象, 一旦实现拼音化, 这些本来由字形区别的字就无法识别, 势必将给语言文字的使用带来麻烦和混乱。由此可以断定汉语不适合用拼音文字 。
也许由于深知这个道理,聪明的中国前辈给汉语选择表意的方块字,即汉字,做为汉语的文字而不选拼音文字。汉字拉丁化不成的事实再次证明上述选择是正确的。1986 年中国官方停止汉字拼音化研究工作的决策是适时的。也就是说在可预见的将来(周有光说大概 500 年吧),汉字不会被任何文字所代替。好像大多数中国人都松了一口气。
多音节语言的特点
世界上大多数语言是多音节型 (multisyllabic language) 的。此种语言有个特点:即使音节少的也能适合用拼音文字。其原因是这种语言使用排列方式来造词汇,即每个单词由至少2个音节按顺序排列而成。这种造词方式能造出极多异音词汇,因此不易发生同音字(词)过多的难关。下面我们不妨运用排列 (permutation, chỉnh hợp, 组合数学术语) 概念证明多音节语言可造出大量的异音单词。我们已知排列的定义:从n个不同元素中取出k (k ≤ n) 个元素, 按照一定的顺序排成一列, 叫做从n个元素中取出k个元素的一个排列 (chỉnh hợp chập k) 。
举例: 某语言所拥有的音节总量为 n, 从n个不同音节中取出k (k ≤ n) 个音节,按照一定的顺序排成一单词, 即每个单词所含之音节数为k (例如city词有k = 2,basketball 有k = 3, anybody有k = 4, personality有k = 5), 该语言所能造出的异音单词总数 (即音节排列总数) 为 A (n, k), 其排列数A(n,k) 的计算公式是n×(n-1)×(n-2)×...×(n-k+1),即n的阶乘除以 (n-k) 的阶乘:
A(n, k) = n! / (n-k)! = n (n-1) (n-2) ...... (n-k+1) |
k值越大则 A 值越大, 即每单词所含的音节数越多则该语言所能造出的异音单词量越多。
若 k = 2, 则 A (n, 2) = n (n-1)。若 k = 3, 则 A (n, 3) = n (n-1) (n-2)。若 k = 4, 则 A (n, 4) = n (n-1) (n-2) (n-3), 等等。
设 n = 415 (相当于汉语拥有的基本音节总量) : 当每个单词都含有2个音节 ( k = 2) 时, 该语言能造出的异音单词总量为 A (415, 2) = 415×(415-1) = 171 810 个。这个例子证实,虽然语言只拥有415个音节, 但因为每单词是多音节的、它仍然可造出至少171810 个异音的单词, 也就是说由于异音单词数量很多、语言不会发生同音字 (词) 过多的现象。
当每个单词都含3个音节 (k = 3) 时, A (415, 3) = 415×414×413 = 70 957 530个异音单词。异音单词总量这么多、当然不出现同音字 (词) 过多的现象。
实际上, 语言的单词可能有些是单音节的, 有些是多音节的, 而多音节的单词可能含有2, 3, 4 ......不等音节的。
上述计算结果表明一个事实:多音节语言由于能造出很多异音单词,因此不会出现同音字 (词) 过多的现象,其 结果使得该语言是适合使用表音 (拼音) 文字的。难怪世界上大多数语言都是多音节, 并使用表音 (拼音)文字的。越南语和一些中国少数民族语言 (如壮语) 虽属于单音节语言但由于拥有大量音节所以都适合使用拼音 (表音)、拉丁化文字的。壮族虽然自古就有了方块文字,但新中国成立后、中央政府仍为壮族人民创制了一种以拉丁字母为基础的拼音文字新壮文,于1957年正式公布使用。20世纪80年代,又完成了《壮文方案》的修订工作。新壮文起了积极的作用,尤其在扫盲方面。
总之, 只要还是单音节语言并且音节总量还是不能增加, 汉语将是无法适用拼音文字的。也就是说汉字是适合于汉语的, 她将永远存在、永远使用的, 汉字拉丁化只是空想。
可能有人会问:能不能改变单音节语言成多音节语言及增加一种语言的音节总量?设想这些改变只有在古代才可能成为现实, 当使用这种语言的人还为数不多。现在, 当已有14亿人使用汉语及汉字, 则汉语的任可大改革将无法实现。绝大多数华人是坚持要传承汉字的伟大遗产的。
语言学家苏培成说过 : 古人认为汉字是 “宝贝”, 现代学者指出汉字既是 “宝贝”又是 “包袱”。是不是他要说中国人将一如既往背这个无比宝贵的包袱继续前进? 我们相信即然背这个包袱也不会减慢中国人前进的速度,因为他们历来都是世界上最有志气、最勤奋、最能吃苦耐劳的伟大民族之一。 (完END)
Bản dịch tiếng Việt
VẤN ĐỀ PHIÊN ÂM HÓA, LATIN HÓA CHỮ HÁN TRUNG QUỐC
--- GÓC NHÌN TỪ VIỆT NAM
Bài viết bằng chữ Hán Tác giả: Nguyễn Hải Hoành (Việt Nam)
Phiên âm hóa chữ Hán là nói việc dùng chữ cái biểu âm để viết Hán ngữ, tạo ra một hệ thống chữ viết mới cho Hán ngữ. Chữ cái được dùng có thể là chữ cái Latinh (La Mã), chữ cái Ả Rập hoặc chữ cái Cyrillic. Latinh hóa chữ Hán là nói việc sử dụng chữ cái Latinh để viết Hán ngữ.
Như đã biết, từ hơn 100 năm trước người Trung Quốc bắt đầu khởi xướng phong trào phiên âm hóa chữ Hán. Phong trào này nhằm mục đích chuyển đổi chữ Hán thành loại chữ viết bằng các chữ cái, dùng chữ biểu âm (phonograph) phiên âm hóa và Latinh hóa dần dần thay thế và tiến tới bỏ chữ Hán biểu ý hình vuông. Như vậy, việc phiên âm hóa chữ Hán liên quan đến số phận của chữ Hán. Là thành viên của “Vành đai văn hóa chữ Hán”, người Việt Nam chúng tôi đương nhiên rất quan tâm đến tình hình tiến triển của phong trào đó.
Trong bài viết nhỏ này, tác giả xuất phát từ tình hình ngôn ngữ Việt Nam nêu ra một số quan điểm nông cạn đối với việc phiên âm hóa và Latinh hóa chữ Hán. Vì tác giả học chuyên ngành kỹ thuật, thiếu kiến thức ngôn ngữ học, lại ít biết về tình hình phát triển của chữ Hán, cộng thêm trình độ tiếng Trung còn rất thấp nên bài viết này chắc chắn có nhiều sai sót, kính mong quý vị phê bình, chỉ bảo.
Như đã biết, sau khi nước Cộng hòa Nhân dân Trung Hoa ra đời, nhờ sự hỗ trợ mạnh mẽ từ chính phủ, phong trào phiên âm hóa chữ Hán bước vào giai đoạn phát triển nhanh chóng và đạt được những thành tích rõ rệt. Năm 1958, Ủy ban Cải cách chữ Hán Trung Quốc ban hành "Phương án phiên âm Hán ngữ", nhưng chữ phiên âm Hán ngữ chỉ được dùng làm công cụ phụ trợ để đánh vần chữ Hán, chỉ dùng để dạy ngữ âm, không thể dùng làm chữ viết chính quy và không thể thay thế chữ Hán. "Phương án phiên âm Hán ngữ" sau khi làm ra đã nhanh chóng được quảng bá và ứng dụng, chủ yếu được sử dụng để ghi chú âm đọc cho chữ Hán, để dạy tiếng Phổ thông, để ghi chú âm đọc, sắp xếp thứ tự các chữ trong tự/từ điển, để lập biên mục (index) cho sách báo và tạp chí, cũng như để dùng cho những lĩnh vực không tiện hoặc không thể sử dụng chữ Hán, dùng để đưa chữ Hán vào máy tính, v.v.
Theo tìm hiểu, được biết là sau nhiều năm nghiên cứu, giới học thuật Trung Quốc đã phát hiện thấy Hán ngữ căn bản không thích hợp sử dụng chữ phiên âm, chủ yếu là do Hán ngữ tồn tại quá nhiều chữ/ từ đồng âm có ý nghĩa khác nhau, và không thể làm được một phương án phiên âm có thể phân biệt các chữ/ từ đồng âm. Ngoài ra, Trung Quốc có rất nhiều phương ngữ; trong tình trạng đó, chữ viết phiên âm lấy một phương ngữ này làm âm đọc tiêu chuẩn có thể trở thành ngoại ngữ đối với các phương ngữ khác, điều đó không có lợi cho việc thống nhất đất nước. Từ năm 1986, Nhà nước Trung Quốc đã từ bỏ cải cách Latinh hóa chữ Hán và chuyển vấn đề đó từ chính sách nhà nước thành vấn đề học thuật.
Chúng tôi cho rằng quyết định này là đúng, mặc dù nó cũng tuyên bố các nỗ lực phiên âm hóa chữ Hán tạm thời vẫn chưa thành công. Thực tế đã chứng minh rằng việc phiên âm hóa chữ Hán là không khả thi, nhưng hiện nay một số học giả vẫn đặt câu hỏi: Tại sao chữ Nôm Việt Nam vốn được hình thành trên cơ sở chữ Hán đã được phiên âm hóa từ lâu mà chữ Hán của Trung Quốc cho tới nay vẫn chưa thể thực hiện phiên âm hóa? Để trả lời câu hỏi này, thiết nghĩ trước hết phải tìm hiểu tình hình chữ viết của Việt Nam.
Từ Hán-Việt, chữ Nho và chữ Nôm
Dân tộc chính ở Việt Nam là người Kinh (tức người Việt), ban đầu không có chữ viết riêng. Vào khoảng thế kỷ thứ 2 trước Công nguyên, Việt Nam bị Triệu Đà chiếm đóng và bước vào “Thời kỳ Bắc thuộc” trở thành quận huyện của Trung Quốc trong hơn 1.000 năm. Từ đó, chữ Hán chính thức vào Việt Nam, góp phần cực lớn cho việc giúp Việt Nam tiếp nhận văn hóa Hoa Hạ và ra khỏi thời kỳ tiền sử mông muội, tiến sang thời đại văn minh.
Chữ Hán khó nhận biết, khó nhớ, khó đọc, khó viết; âm đọc chữ Hán rất phức tạp, không có âm đọc thống nhất và không có ký hiệu biểu âm. Người Việt học phát âm chữ Hán càng khó khăn hơn. Giới tinh hoa Việt Nam cho rằng người Việt chỉ cần học chữ Hán chứ không cần học tiếng Hán. Để học chữ Hán, tổ tiên người Việt đã sáng tạo ra một phương pháp học độc đáo: đặt cho mỗi chữ Hán một cái tên tiếng Việt xác định (gọi là “từ Hán-Việt”, Sino-Vietnamese words hay “Âm Hán-Việt” ), tức là mỗi chữ Hán có một từ tiếng Việt cố định trong tiếng Việt, đó là “từ Hán -Việt”, và mỗi “từ Hán-Việt” đều có một âm đọc chuẩn thống nhất toàn quốc. Khi đọc văn bản chữ Hán, người Việt chỉ đọc “từ Hán-Việt” tương ứng với mỗi chữ Hán.
Hiển nhiên, không sử dụng tiếng Hán mà chỉ dùng tiếng mẹ đẻ để đọc chữ Hán thì chữ Hán đọc bằng âm tiếng Việt sẽ rất thuận tiện cho người Việt nhận biết, hiểu và ghi nhớ, giúp cho việc học chữ Hán trở nên dễ dàng hơn rất nhiều. Chữ Hán không còn quá khó để nhận biết và ghi nhớ, dường như chúng không phải là chữ ngoại văn nữa mà là chữ ta. Âm đọc từ Hán-Việt chủ yếu bắt chước âm đọc của phương ngữ tiếng Hán miền Nam (tiếng Quảng Đông); vì thế cách phát âm các từ Hán-Việt bảo lưu được một lượng lớn âm thời cổ của chữ Hán. Khi bắt chước, người Việt đã cố gắng sử dụng tối đa các âm tiết phong phú của tiếng Việt, một âm tiết tiếng Trung có thể ứng với nhiều âm tiết tiếng Việt, nhờ đó giảm được đáng kể hiện tượng chữ/từ đồng âm. Người Trung Quốc nghe không hiểu từ Hán-Việt, người Việt không biết chữ Hán tuy nghe được nhưng không hiểu hết ý nghĩa của từ Hán-Việt.
Người Việt Nam gọi chữ Hán được Việt hóa phần ngữ âm là “Chữ Nho”, nghĩa là “Chữ của người có học”. Chữ Nho trở thành chữ viết của Việt Nam, chữ Nho có thể ghi được các từ Hán-Việt nhưng không thể ghi được các “từ thuần Việt”, tức là không ghi được hết từ vựng tiếng Việt. Người ta gọi các thầy giáo dạy chữ Nho là “Thầy Đồ Nho”, bút lông và mực mà họ sử dụng là bút Nho và mực Nho. Từ đó về sau, người Việt không còn học chữ Hán mà chỉ học chữ Nho, tức là chữ Hán có âm đọc đã Việt Nam hóa. Khi học chữ Nho, học sinh chỉ học tự hình, ý nghĩa và cú pháp của chữ Hán mà không học âm đọc tiếng Hán của chữ Hán, tức là không học tiếng Trung Quốc mà phải học âm đọc tiếng Việt của chữ Hán. (tức là từ Hán-Việt).
Như vậy, ứng với mỗi chữ Hán, trong tiếng Việt đều có một “từ Hán-Việt”, vì thế lẽ tự nhiên hầu như tất cả từ ngữ của Hán ngữ đều xuất hiện trong tiếng Việt và một lượng lớn từ vựng Hán ngữ cũng dần dần nhập vào tiếng Việt. “Từ Hán-Việt” chiếm hơn một nửa tổng lượng từ vựng tiếng Việt và là nguồn từ ngoại lai lớn nhất trong Việt ngữ. Ký tự ghi chép từ Hán-Việt, tức chữ Nho, đã giúp Việt Nam tiếp thu thuận lợi văn hóa Trung Hoa. So với Nhật Bản, Hàn Quốc thì văn hóa Việt Nam chịu ảnh hưởng sâu sắc nhất từ văn hóa Hoa Hạ. Mặt khác, qua việc học chữ Nho, mặc dù người Việt đã học và sử dụng chữ Hán trong hơn 2.000 năm nhưng không ai nói tiếng Hán, vì vậy tiếng mẹ đẻ của người Việt được bảo tồn nguyên vẹn cho đến ngày nay và chưa bao giờ vì bị Hán hóa mà biến mất. Tuy Trung Quốc cai trị Việt Nam lâu đến hơn một nghìn năm nhưng vẫn không thể nào đồng hóa được Việt Nam. Nói cách khác, dân tộc Việt Nam chưa bao giờ bị người Hán đồng hóa. Đây là một kỳ tích hiếm thấy trên thế giới!
Năm 1075, triều đình nhà Lý đưa hệ thống khoa cử của Trung Quốc vào Việt Nam, từ đó chữ Nho chính thức trở thành chữ viết của nhà nước Việt Nam. Tuy nhiên, do tiếng Việt và tiếng Hán không thuộc cùng một họ ngôn ngữ nên chữ Nho chỉ ghi được “từ Hán-Việt” chứ không ghi được “từ thuần Việt”, tức là không ghi được hết từ ngữ tiếng Việt. Chữ Nho chỉ được tầng lớp thượng lưu ở Việt Nam sử dụng, chỉ dùng để viết thể văn Văn ngôn, không dùng trong ngôn ngữ nói, phạm vi sử dụng chỉ giới hạn trong các lĩnh vực hành chính, học thuật, tôn giáo, văn hóa, giáo dục. Văn học chữ Nho không thể ghi lại những suy nghĩ, cảm xúc của người bình dân Việt Nam. Một số học giả Việt Nam cho rằng văn học chữ Nho thuộc vào văn học Trung Quốc chứ không thuộc vào văn học Việt Nam.
Vào thế kỷ thứ 10 sau Công nguyên, Việt Nam giành được độc lập. Sau đó, người Việt dựa vào chữ Nho (chữ Hán đọc bằng từ Hán-Việt) sáng chế ra chữ viết hình vuông gọi là “Chữ Nôm”. Chữ Nôm được tạo ra trên cơ sở chữ Hán, dùng chữ Hán và các bộ thủ của nó làm nguyên liệu, dựa theo ba phương pháp tạo chữ của chữ Hán là giả tá (vay mượn), hình thanh và hội ý; về cơ bản dựa theo âm Hán-Việt của chữ Hán để đọc. Chữ Nôm được dùng làm hệ chữ viết ghi tiếng Việt. Chữ Nôm sử dụng khoảng vài nghìn chữ Hán và nhiều hơn nữa chữ Hán do người Việt tự tạo ra, nó có thể ghi được tất cả các từ tiếng Việt, kể cả từ thuần Việt và từ Hán-Việt. Chữ Nôm là loại chữ viết vừa biểu ý vừa biểu âm. Chữ Nôm khó học hơn chữ Hán, trước tiên phải biết chữ Hán mới có thể học chữ Nôm, và chữ Nôm chưa có quy tắc viết thống nhất chính thức nên rất khó phổ cập. Hơn nữa, chữ Nôm chưa bao giờ được nhà nước chính thức công nhận, thậm chí bị chèn ép, chưa bao giờ trở thành ngôn ngữ viết chính thức của Việt Nam.
Tuy nhiên vì chữ Nôm có thể ghi lại ngôn ngữ nói của dân thường nên nhiều văn nhân, học giả đã sử dụng chữ Nôm để viết một lượng lớn tác phẩm văn học xuất sắc, trong đó có Truyện Kiều, được coi là tác phẩm văn học ưu tú nhất trong lịch sử Việt Nam. Các tác phẩm văn học chữ Nôm xét về số lượng, chất lượng và tầm ảnh hưởng đều vượt xa các tác phẩm văn học chữ Nho (chữ Hán) do người Việt sáng tác. Chữ Nôm và chữ Nho đồng thời tồn tại đến đầu thế kỷ 20 thì dần dần bị loại bỏ.
Phiên âm hóa chữ Nôm và sự ra đời của “chữ Quốc ngữ”
Năm 1612, Mạc phủ Edo nước Nhật ra lệnh cấm truyền bá đạo Kitô ở Nhật và trục xuất các nhà truyền giáo. Năm 1615, các linh mục Dòng Tên Công giáo Châu Âu bắt đầu truyền giáo tại Việt Nam. Trong số họ có người từng làm giáo sĩ ở Trung Quốc hoặc Nhật, thông thạo chữ Hán và hiểu biết việc Latinh hóa chữ Hán. Để thuận tiện cho công việc truyền giáo, các giáo sĩ như Francisco de Pina, Gaspar de Amaral, Antonio Barbosa đã đi đầu học tiếng Việt và chữ Nôm. Nói chung sau một hoặc hai năm, họ có thể giảng bài bằng tiếng Việt và viết tài liệu giảng dạy bằng chữ Nôm. Thư viện Quốc gia Pháp hiện còn giữ 15 tập bài giảng viết bằng chữ Nôm của giáo sĩ người Ý Girolamo Maiorica, gồm 1,2 triệu chữ Nôm. Để học tiếng Việt, các giáo sĩ đã dùng chữ Latinh để ghi chú âm đọc chữ Nôm, tức phiên âm tiếng Việt. Chữ Nôm có chức năng biểu âm rõ ràng, giúp cho việc ghi âm diễn ra suôn sẻ. Sau khoảng 30 năm cố gắng, cuối cùng dăm sáu nhà truyền giáo đã hoàn thành việc phiên âm hóa toàn bộ chữ Nôm, thành công chỉnh lý và làm ra hệ thống chữ viết biểu âm, Latinh hóa mới và biên soạn được một bản thảo “Từ điển chữ Việt-Bồ Đào Nha-Latinh” (Dictionarium Annamiticium Lusitanum et Latinum). Năm 1649, giáo sĩ người Pháp Alexandre de Rhodes (Đắc Lộ) mang bản thảo từ điển này về Rome và năm 1651 đưa in thành sách, công bố sự ra đời một loại chữ viết phiên âm, Latinh hóa (sau này gọi là "chữ Quốc ngữ"). Năm 1919, “chữ Quốc ngữ” chính thức trở thành chữ viết hợp pháp của nhà nước Việt Nam.
Về cơ bản, “chữ Quốc ngữ” có thể thực hiện nói thế nào viết thế ấy, viết thế nào đọc thế ấy, nhìn chữ là biết âm đọc của chữ, vô cùng thích hợp với tiếng Việt, khi mới xuất hiện đã ngay lập tức được người dân cả nước đón nhận nồng nhiệt. Các nhà Nho tiên tiến của Việt Nam là những người đầu tiên ủng hộ việc bỏ chữ Hán, chữ Nôm và thực hiện “chữ Quốc ngữ”, gọi đó là linh hồn của dân tộc. Đại học giả Phạm Quỳnh cho rằng “chữ Quốc ngữ” là công cụ kỳ diệu để giải phóng trí tuệ của người Việt. Thời gian xóa mù “chữ Quốc ngữ” rất ngắn, ở nông thôn nói chung chỉ cần 3 đến 6 tháng.
Việc phổ cập “chữ Quốc ngữ” phiên âm hóa không những không gây ra sự đứt gãy văn hóa truyền thống mà còn có tác dụng tốt hơn trong việc học tập và kế thừa văn hóa truyền thống. Cho đến nay các nhà Hán Nôm Việt Nam đã dịch nhiều thư tịch cổ có giá trị thành chữ phiên âm. Về phía Nhà nước, nhiệm vụ này được giao cho Viện Nghiên cứu Hán Nôm (Institute of Sino-Nom studies, thành lập năm 1979). Huống chi, thư tịch lịch sử Việt Nam vốn còn lại không nhiều. Thời nhà Minh, Việt Nam bị quân Minh chiếm đóng và cai trị suốt 30 năm, chúng tiêu hủy toàn bộ thư tịch do người Việt viết. Ngoài ra, do chiến tranh liên miên và do nhiều nguyên nhân nên tổng số thư tịch cổ còn bảo tồn được ở Việt Nam không quá 5.000 tập, việc dùng “chữ Quốc ngữ” phiên dịch những thư tịch như vậy là khả thi. Thực tế là kể từ khi phổ cập “chữ Quốc ngữ”, người dân Việt Nam mới có cơ hội tiếp xúc với một lượng lớn các tác phẩm kinh điển cổ xưa của nước nhà và của Trung Quốc, cũng như các tác phẩm văn hóa, văn học, khoa học công nghệ của các nước trên thế giới. Hầu hết các sách cổ quan trọng nhất của Trung Quốc đã được dịch sang “chữ Quốc ngữ”.
Một số điểm giống và khác nhau giữa tiếng Việt với tiếng Hán
Để giải đáp vấn đề vì sao cho tới nay chữ Hán vẫn chưa thể phiên âm hóa, chúng ta có thể xem xét những điểm tương đồng và khác biệt giữa tiếng Việt với tiếng Hán. Tiếng Việt thuộc nhánh Môn-Khmer trong ngữ hệ Nam Á (Austroasiatic), còn tiếng Hán thuộc ngữ hệ Hán-Tạng (Sino-Tibetan). Về mặt ngữ pháp, sự khác biệt rõ ràng nhất được thể hiện ở thứ tự của từ ngữ bổ nghĩa cho danh từ: trong tiếng Việt, từ bổ nghĩa danh từ đứng sau danh từ (tức là tính từ đứng sau), trong khi ở tiếng Hán, từ bổ nghĩa danh từ đứng trước danh từ (tức là tính từ đứng trước). Ví dụ, tiếng Trung Quốc nói “Hán tự (Hán chữ)” và “Hồng kỳ (đỏ cờ)”, trong khi tiếng Việt nói “tự Hán (chữ Hán)” và “Kỳ hồng (cờ đỏ)”.
Nhưng tiếng Việt và tiếng Hán đều là ngôn ngữ đơn lập (đơn âm tiết, monosyllabic) , một đơn từ tương ứng với một âm tiết. Có học giả cho rằng vì Hán ngữ là ngôn ngữ đơn lập nên không thích hợp dùng chữ viết phiên âm. Thực ra không phải vậy, tiếng Việt đơn lập vẫn thích hợp dùng chữ viết phiên âm. Thiết nghĩ, ở đây nguyên nhân chính là do tiếng Việt có đầy đủ lượng âm tiết.
Trong các ngôn ngữ đơn lập, mỗi từ chiếm dùng một âm tiết nên ngôn ngữ đó cần có số lượng lớn âm tiết. Nếu tổng số âm tiết nhỏ hơn tổng số từ thông dụng thì chắc chắn sẽ xuất hiện các chữ/từ đồng âm (homophonic words). Quá nhiều chữ/từ đồng âm là một trở ngại không thể vượt qua đối với việc áp dụng chữ viết phiên âm. Khi số lượng âm tiết trong một ngôn ngữ không ít hơn số lượng từ thông dụng của ngôn ngữ đó thì có thể tránh được khó khăn này.
Đặc điểm lớn nhất của tiếng Việt là ngữ âm phong phú, nhiều âm vị, và có sáu thanh điệu, tổng số âm đọc (tức âm tiết có thanh điệu) khoảng 20.000 (trong đó số lượng đã sử dụng chiếm chưa đến một nửa), nhiều hơn nhiều so với tổng lượng từ vựng thông dụng. Vì vậy, tiếng Việt rất ít khi gặp phải vấn đề khó phân biệt từ đồng âm, tất nhiên tiếng Việt thích hợp sử dụng chữ viết phiên âm và việc phiên âm hóa ngôn ngữ biểu âm là khả thi. Chữ Nôm có chức năng biểu âm rõ ràng, về cơ bản nhìn chữ là có thể đọc được âm của chữ đó, vì vậy việc phiên âm hóa chữ Nôm là khả thi. Rõ ràng, chữ Hán không có chức năng biểu âm thì khác chữ Nôm về tính chất.
Theo quan điểm thiển cận của chúng tôi, sở dĩ tiếng Hán có quá nhiều chữ/từ đồng âm khác nghĩa, nguyên nhân chính là do tiếng Hán có tổng số âm tiết ít hơn rất nhiều so với tổng số đơn từ thông dụng; điều đó dẫn đến kết quả là Hán ngữ không thích hợp sử dụng chữ biểu âm mà chỉ thích hợp sử dụng chữ biểu ý, thế nhưng việc phiên âm hóa chữ biểu ý là không khả thi.
Chúng tôi đã tiến hành thống kê âm tiết đối với Tự điển Tân Hoa bản thứ 10 phiên bản song sắc (hai màu) xuất bản năm 2006 có 8.700 chữ Hán chính thể. Kết quả cho thấy 8.700 chữ Hán này thuộc vào 415 âm tiết cơ bản (tức âm tiết không xét thanh điệu), mỗi âm tiết có trung bình 20,96 chữ, trong đó 22 âm tiết không có chữ đồng âm (tức âm tiết một chữ, “độc tự âm tiết”), 393 âm tiết có chữ đồng âm, mỗi âm tiết có ít nhất 2 chữ đồng âm, và 291 âm tiết (70%) có ít nhất 10 chữ đồng âm. Bốn âm tiết sau đây có hơn 100 chữ đồng âm: các âm tiết [xi], [yu], [ji] và [yi] lần lượt có 103, 118, 123 và 135 chữ đồng âm. Thống kê của chúng tôi cũng cho thấy tiếng Hán chỉ có tất cả 1309 âm đọc (tức là các âm tiết có thanh điệu).
Các tài liệu Trung Quốc cho biết tiếng Hán có khoảng 400 âm tiết cơ bản và 1.300 âm đọc. "Biểu chữ Hán quy phạm thông dụng" công bố năm 2013 có 8105 chữ Hán, tức trung bình mỗi âm tiết có 19,30 chữ đồng âm và trung bình mỗi âm đọc có hơn 6 chữ đồng âm. Theo sách "Nghiên cứu Hán ngữ hiện đại trong thế kỷ 20" của Tô Bồi Thành (Su Peicheng), nếu sử dụng từ điển “Từ Hải” để thống kê âm tiết thì riêng một âm [yì] (khứ thanh) có 195 chữ đồng âm! Qua đây có thể thấy Hán ngữ tồn tại hiện tượng nghiêm trọng là có quá nhiều chữ đồng âm.
Tình hình thực tế là Hán ngữ có tổng số âm tiết quá ít nhưng số lượng chữ Hán thông dụng lại quá nhiều (8105 chữ), đặc biệt là tổng số chữ Hán quá nhiều (“Trung Hoa Tự hải” xuất bản năm 1994 có hơn 86.000 chữ), hơn nữa số lượng chữ Hán không ngừng tăng lên. Ít âm tiết mà nhiều chữ đương nhiên sẽ dẫn đến hiện tượng nhiều chữ đồng âm; một khi thực hiện phiên âm hóa thì những chữ vốn được phân biệt bằng hình dạng chữ (tự hình) này sẽ không thể nhận dạng được, điều đó chắc chắn sẽ gây rắc rối và nhầm lẫn cho việc sử dụng tiếng nói và chữ viết. Qua đây có thể kết luận Hán ngữ không thích hợp sử dụng chữ viết phiên âm.
Có lẽ vì nhận thức rõ chân lý này nên tổ tiên thông minh của người Trung Quốc đã chọn ký tự hình vuông biểu ý, tức chữ Hán, làm chữ viết cho Hán ngữ mà không chọn chữ viết phiên âm Việc Latinh hóa chữ Hán không thành công một lần nữa chứng tỏ lựa chọn nói trên là đúng. Sự kiện năm 1986 nhà nước Trung Quốc chính thức quyết định đình chỉ nghiên cứu phiên âm hóa chữ Hán là kịp thời. Nói cách khác, trong tương lai có thể dự kiến (Châu Hữu Quang nói đại để khoảng 500 năm), chữ Hán sẽ không bị thay thế bằng bất kỳ loại chữ viết nào. Có vẻ như phần đông người dân Trung Quốc đều cảm thấy nhẹ nhõm với quyết định trên.
Đặc điểm của ngôn ngữ đa lập
Hầu hết các ngôn ngữ trên thế giới đều là ngôn ngữ đa lập (đa âm tiết, multisyllabic). Loại ngôn ngữ này có một đặc điểm: dù ít âm tiết nhưng vẫn có thể thích hợp dùng chữ phiên âm. Nguyên nhân là ngôn ngữ đa lập sử dụng phương pháp tổ hợp để tạo đơn từ, tức là mỗi đơn từ gồm ít nhất 2 âm tiết được sắp xếp theo thứ tự. Phương pháp tạo từ này có thể tạo ra một số lượng lớn các từ có âm đọc khác nhau nên không dễ phát sinh hiện tượng có quá nhiều chữ đồng âm.
Sau đây, chúng tôi sử dụng khái niệm “chỉnh hợp” (permutation, thuật ngữ toán học tổ hợp) để chứng minh rằng ngôn ngữ đa lập có thể tạo ra một lượng lớn các đơn từ khác âm. Chúng ta đã biết định nghĩa chỉnh hợp: từ n phần tử khác nhau lấy ra k phần tử (k ≤ n) và sắp xếp chúng vào một dãy theo một thứ tự nhất định, gọi là từ n phần tử khác nhau sắp xếp lấy ra một chỉnh hợp chập k gồm k phần tử.
Ví dụ: một ngôn ngữ có tổng số âm tiết là n, từ n âm tiết khác nhau lấy k (k ≤ n) âm tiết và sắp xếp chúng thành một dãy theo thứ tự nhất định, tức là số lượng âm tiết trong mỗi đơn từ bằng k (Ví dụ: đơn từ city có k = 2, basketball có k = 3, anybody có k = 4, personality có k = 5), tổng số đơn từ khác âm có thể được tạo ra trong ngôn ngữ này (tức là tổng số chỉnh hợp âm tiết) bằng A (n, k ).
Như vậy công thức tính số lượng chỉnh hợp A(n,k) thì bằng n×(n-1)×(n-2)×...×(n-k+ 1), tức n giai thừa chia cho (n-k) giai thừa.
A(n, k) = n! / (n-k)!
= n (n-1) (n-2) ... (n-k+1)
Giá trị k càng lớn thì giá trị A càng lớn, nghĩa là mỗi đơn từ càng chứa nhiều âm tiết thì càng tạo ra nhiều từ khác âm. Nếu k = 2 thì A(n, 2) = n(n-1). Nếu k = 3 thì A(n, 3) = n(n-1)(n-2). Nếu k = 4 thì A(n, 4) = n(n-1)(n-2)(n-3), v.v.
Giả thiết n = 415 (tương đương tổng số âm tiết cơ bản trong tiếng Hán): Khi mỗi đơn từ có 2 âm tiết (k = 2) thì ngôn ngữ này có thể tạo ra tổng số đơn từ khác âm bằng A(415, 2) = 415×(415-1) = 171 810. Ví dụ này chứng tỏ tuy rằng ngôn ngữ chỉ có 415 âm tiết nhưng vì mỗi đơn từ là đa âm tiết nên nó vẫn có thể tạo ra ít nhất 171.810 đơn từ có âm đọc khác nhau. Nói cách khác, do số lượng các từ khác âm rất nhiều nên ngôn ngữ sẽ không xảy ra hiện tượng có quá nhiều chữ/từ đồng âm.
Khi mỗi từ có 3 âm tiết (k = 3) thì A(415, 3) = 415×414×413 = 70 957 530 đơn từ khác âm. Vì có rất nhiều từ âm đọc khác nhau nên tất nhiên không xuất hiện quá nhiều chữ/từ đồng âm.
Trên thực tế, ngôn ngữ có thể có một số từ đơn âm tiết, một số từ đa âm tiết, và các từ đa âm tiết này có thể chứa 2, 3, 4... âm tiết.
Kết quả tính toán trên cho thấy một sự thực: ngôn ngữ đa lập có thể tạo ra nhiều từ khác âm, cho nên sẽ không xuất hiện quá nhiều chữ/từ đồng âm, kết quả là ngôn ngữ đa lập thích hợp sử dụng chữ viết phiên âm (biểu âm). Bởi vậy phần lớn các ngôn ngữ trên thế giới đều là ngôn ngữ đa lập và sử dụng chữ viết phiên âm (biểu âm). Tiếng Việt và một số ngôn ngữ dân tộc thiểu số của Trung Quốc (như Tráng ngữ) tuy là ngôn ngữ đơn lập nhưng do có nhiều âm tiết cho nên lại thích hợp sử dụng chữ viết phiên âm (biểu âm) Latinh hóa. Mặc dù dân tộc Tráng thời cổ đã có chữ viết hình vuông, nhưng sau khi thành lập nước Cộng hòa Nhân dân Trung Hoa, chính quyền trung ương vẫn tạo ra cho dân tộc này một loại chữ viết mới là chữ Tráng phiên âm dựa trên nền tảng chữ cái Latinh, được công bố chính thức sử dụng từ năm 1957. Trong thập niên 1980 lại đã hoàn thành việc sửa đổi "Phương án chữ Tráng". Chữ Tráng mới đã đóng một vai trò tích cực, đặc biệt là trong việc xóa nạn mù chữ.
Tóm lại, chừng nào vẫn là ngôn ngữ đơn lập và tổng số âm tiết không thể tăng lên thì Hán ngữ sẽ không thích hợp sử dụng chữ viết phiên âm. Nói cách khác, chữ Hán thích hợp với Hán ngữ, nó sẽ mãi mãi tồn tại và mãi mãi được sử dụng, Latinh hóa chữ Hán chỉ là chuyện viển vông.
Có người hỏi: Có thể chuyển ngôn ngữ đơn lập thành ngôn ngữ đa lập và tăng tổng số âm tiết trong ngôn ngữ lên được không? Thiết nghĩ những thay đổi ấy chỉ có thể xảy ra vào thời cổ, khi số lượng người nói ngôn ngữ đó vẫn còn tương đối ít. Giờ đây, khi 1,4 tỷ người đã sử dụng tiếng Hán và chữ Hán thì bất kỳ cải cách lớn nào đối với Hán ngữ đều sẽ không thể thực hiện được. Tuyệt đại đa số người Hoa kiên trì kế thừa di sản vĩ đại của chữ Hán.
Nhà ngôn ngữ học Trung Quốc Tô Bồi Thành từng nói: Người xưa coi chữ Hán là “báu vật”, các học giả hiện đại lại chỉ ra rằng chữ Hán vừa là “báu vật” vừa là “gánh nặng”. Phải chăng ông Tô muốn nói là người Trung Quốc sẽ vẫn mang trên mình gánh nặng vô cùng quý giá này tiếp tục tiến về phía trước? Chúng tôi tin rằng việc mang gánh nặng ấy sẽ không làm chậm bước tiến của người Trung Quốc, bởi lẽ xưa nay họ luôn luôn là một trong những dân tộc vĩ đại có chí khí, siêng năng và chịu khó chịu khổ nhất trên thế giới.