Danh ngôn

Trong mọi cộng đồng, chúng ta cần một nhóm thiên thần gây rối.

We need, in every community, a group of angelic troublemakers.

(Bayard Rustin – trích bài phát biểu tại New York City 1963)

Trong mọi trường hợp, chắc chắn rằng sự thiếu hiểu biết, đi kèm với quyền lực, là kẻ thù tàn bạo nhất có thể có của công lý.

It is certain, in any case, that ignorance, allied with power, is the most ferocious enemy justice can have.

(James Baldwin - No Name in the Street 1972)

Các cuộc cách mạng và các cá nhân có thể bị giết hại, nhưng bạn không thể giết chết các ý tưởng.

While revolutionaries and individuals can be murdered, you cannot kill ideas.

(Thomas Sankara, một tuần trước khi bị ám sát, 1987)

Không có cảm giác nào cô đơn hơn việc bị chính đất nước mình trục xuất.

There's not a more lonely feeling than to be banished by my own country.

(Kiyo Sato – Kiyo’s Story 2009)

Ban Biên tập

Địa chỉ liên lạc:

1. Thơ

tho.vanviet.vd@gmail.com

2. Văn

vanviet.van14@gmail.com

3. Nghiên cứu Phê Bình

vanviet.ncpb@gmail.com

4. Vấn đề hôm nay

vanviet.vdhn1@gmail.com

5. Thư bạn đọc

vanviet.tbd14@gmail.com

6. Tư liệu

vanviet.tulieu@gmail.com

7. Văn học Miền Nam 54-75

vanhocmiennam5475@gmail.com

Tra cứu theo tên tác giả

Thứ Hai, 14 tháng 12, 2020

Vài nhận xét về máy dịch Google (Google Translate)

Trần Ngọc Cư

Google Translate được định nghĩa “là một dịch vụ dịch máy nhanh nhạy đa ngôn ngữ miễn phí do Google phát triển, để dịch văn bản và trang web từ ngôn ngữ này sang ngôn ngữ khác” (Wikipedia).

“Dịch vụ dịch máy” này ngày càng được cải tiến và trở nên tinh vi hơn đến nỗi nhiều người nghĩ rằng nó có thể thay thế một dịch giả chuyên nghiệp. Tuy nhiên, nếu có thì giờ ngồi vọc chơi với Google Translate vài giờ, chúng ta có thể dễ dàng có những nhận xét sau đây:

(1) Máy chỉ dịch “từ theo từ” (word for word translation), thông thường với độ chính xác khá cao, nhưng có một tần suất không thể bỏ qua là máy không dịch đúng với nghĩa trong văn cảnh (contextual meaning). Nó sẵn sàng dịch “cây gạo” là “rice plant” thay vì dịch là “silk-cotton tree; red silk-cotton; red cotton tree; silk-cotton”, chẳng hạn.

Hàng chục cụm từ chuyển mạch như that said, that being said (tuy vậy), after all (dẫu sao), to be sure (tuy vậy), cấu trúc “For all the...” (bất chấp/mặc dù), chẳng hạn, đều bị dịch “word for word”.

Đầu vào: “For all the efforts he made for re-election, Trump ended up as a political loser.”

Đầu ra: “Đối với tất cả những nỗ lực mà ông ấy đã thực hiện để tái đắc cử, Trump cuối cùng đã trở thành một kẻ thất bại chính trị.”

(Câu này đáng lẽ phải dịch: “Mặc dù với [Bất chấp] tất cả nỗ lực mà ông thể hiện để tái đắc cử, Trump cuối cuối cùng đã trở thành một kẻ thất bại chính tri.”)

Khi đi bác sĩ, bạn có thể được hỏi, “Are you allergic to anything?” (Anh có bị dị ứng gì không?” Nếu muốn trả lời “không” theo kinh nghiệm của mình, bạn sẽ nói, “Not that I know of.” Ta thử cho câu này vào máy nhé!

Đầu vào: “Not that I know of.”

Đầu ra: “Không phải là tôi biết.”

Đây là một câu rất thông thường nhưng Google Translate vẫn còn dịch sai. “Not that I know of.” phải dịch: “Theo chỗ tôi biết thì không.”

(2) Tác động của Google Translate lên từ vựng tiếng Việt:

Qua thời gian, tuy nhiên, một số từ vựng cài đặt trong Google Translate đã được người sử dụng đưa vào thị trường chữ nghĩa và giúp chúng trở thành phổ biến rộng rãi dù có khi được dùng sai nghĩa. Hoặc theo chiều ngược lại, người lập trình chọn cách dùng phổ biến nhất. Tuy nhiên, trong lãnh vực ngôn ngữ, một từ được dùng sai lâu ngày vẫn có thể được chấp nhận là chuẩn mực, theo giả thuyết cho rằng sự phát triển của ngôn ngữ có tính võ đoán (the development of language is arbitrary.)

Chúng tôi ghi nhận một vài trường hợp trong đó có lẽ nhờ máy dịch mà một số từ đã trở nên thông dụng và đang trên con đường trở thành chuẩn mực. Để làm ví dụ, chúng tôi chú ý đến từ elites và từ certain. Thứ nhất, hễ máy gặp từ elites thì nó sẽ tự động dịch ngay là “giới tinh hoa”. Hai chữ tinh hoa gợi lên trong trí óc người đọc một tầng lớp được chọn lọc vào vị trí lãnh đạo nhờ tài năng và đức hạnh, do đó được người đời kính nể. Nhưng, elites còn có nghĩa là “giới chóp bu,” vì thế các tác giả trong thế giới tiếng Anh, chẳng hạn, thường dùng từ elites để chỉ giới lãnh đạo hay giai cấp thống trị nói chung thậm chí kể cả ở các nước độc tài mà các lãnh đạo có thể có những hành động tàn bạo và gian ác. Trong trường hợp này, thiết tưởng ta nên chọn “giới chóp bu” để dịch elites. Nói cách khác, elites có thể dịch hoặc là “giới tinh hoa” hoặc là “giới chóp bu”, nhưng máy dịch luôn chọn “giới tinh hoa”.

Một ví dụ khác: Không biết do từ nguồn gốc nào, từ ngoài xã hội hay do người lập trình cài đặt từ vựng vào máy, hễ gặp từ certain thì máy liền dịch là “nhất định”(sure; having no doubt). Và từ này đã tìm đường đi vào báo chí trong nước, chẳng hạn với những câu như “Các nỗ lực cứu hộ gặp phải một số hạn chế nhất định.” Nhưng certain còn có nghĩa như “some” khi một điều gì đó không được biết đến hay không được mô tả rõ ràng, trong trường hợp này thiết tưởng phải dịch là “nào đó” mới đúng. “A Certain Smile,” tên của một cuốn phim dựa trên tác phẩm “Un certain sourire” của François Sagan, nếu cho vào máy, sẽ được dịch ngay là “Một nụ cười nhất định”. Thiển nghĩ phải dịch là “Một nụ cười nào đó” mới có ý nghĩa. Nói cách khác, certain có thể dịch hoặc là “nhất định” hoặc là “nào đó”, nhưng máy dịch luôn luôn chọn “nhất định”.

Có lẽ do người lập trình có lập trường chính trị, đôi khi Google Translate tỏ ra biết chọn từ ngữ một cách rất phải đạo chính trị (in a politically correct fashion). Người sử dụng không khỏi buồn cười khi thấy máy dịch đặt chữ “ông” trước một số tên và gọi trổng  đối với một số tên khác. Chẳng hạn, “Trump” không có chữ ông đứng trước, nhưng máy lại dịch “Xi” thành “ông Tập”. Ta thử so sánh cặp ví dụ sau đây:

Nếu đầu vào là: “Donald Trump has married three times. Trump now has five children.”

Đầu ra sẽ là: “Donald Trump đã kết hôn ba lần. Trump hiện có năm người con.”

Nhưng nếu đầu vào là: “Xi Jinping is the President of the People’s Republic of China. Xi is going to Hanoi next month.” [Nhớ chấm câu].

Đầu ra sẽ là: Tập Cận Bình là Chủ tịch nước Cộng hòa Nhân dân Trung Hoa. Ông Tập sẽ đến Hà Nội vào tháng tới.

Tò mò hơn một chút, tôi mượn hai câu này từ cuốn Mass Mobilization in the Democratic Republic of Vietnam, 1945–1960 của Alec Holcombe và cho vào máy dịch:

“Immediately after its founding by Hồ Chí Minh in September 1945, the Democratic Republic of Vietnam (DRV) faced challenges from rival Vietnamese political organizations and from a France determined to rebuild her empire after the humiliations of WWII. Hồ, with strategic genius, courageous maneuver, and good fortune, was able to delay full-scale war with France for sixteen months in the northern half of the country.”

Kết quả là:

“Ngay sau khi được Hồ Chí Minh thành lập vào tháng 9 năm 1945, Việt Nam Dân chủ Cộng hòa (VNDCCH) đã phải đối mặt với những thách thức từ các tổ chức chính trị đối thủ của Việt Nam và từ một nước Pháp quyết tâm xây dựng lại đế chế của mình sau những nhục nhã của Thế chiến thứ hai. Hồ, với thiên tài chiến lược, tài thao lược dũng cảm và tài giỏi, đã có thể trì hoãn cuộc chiến toàn diện với Pháp trong mười sáu tháng ở nửa phía Bắc của đất nước ”.

Google Translate không dịch Hồ thành “ông Hồ.” Điều này cho ta cảm tưởng có yếu tố Trung Quốc trong đó.

(3) Google Translate cực kỳ yếu kém khi đụng đến thành ngữ (idioms), tiếng lóng (slangs). Ta thử xem qua vài ví dụ về idioms:

Đầu vào: "He knocked her up and left her.”

Đầu ra: “Anh ấy hất cô ấy lên và bỏ mặc cô ấy". (Sai. Knock up = cho mang bầu. Câu này phải dịch: “Anh ấy cho cô ấy mang bầu rồi quất ngựa truy phong.”)

Đầu vào: “Donald Trump Jr.'s 'Radicle' Typo Has Twitter Users In Stitches.”

Đầu ra: “Typo 'Radicle' của Donald Trump Jr. có người dùng Twitter trong các lần cắt.” (Sai. In stitches = cười bể bụng. Câu này phải dịch: “Lỗi đánh máy ‘Radicle’ của Donald Trump, Jr. đã làm người sử dụng Twitter cười bể bụng.”)

(4) Về ngữ pháp, Google Translate xử lý tốt những mẫu câu thông dụng, hiện hành, phù hợp với ngôn ngữ báo chí, thương mại, khoa học kỹ thuật. Nhưng khi gặp những cấu trúc cú pháp (syntactical structures) văn chương xưa, nó rất dễ dịch sai lạc, như trong trường hợp chữ “but” làm liên đại danh từ (relative pronoun) chẳng hạn, but = mà không. Ví dụ:

Đầu vào: “There is no mother but loves her children.”

Đầu ra của máy dịch: “Có mẹ nào mà thương con.”

(Máy đã dịch phản nghĩa. Câu trên tương đương với: “There is no mother that doesn’t love her children.” = “Có mẹ nào mà không thương con mình.”)

Ở trên, tôi nói “Google Translate vẫn còn dịch sai” với ngụ ý máy dịch đang được chỉnh sửa, cải tiến không ngừng. Có thể trong một hai, giờ nữa nó sẽ dịch đúng những câu tôi đem ra làm ví dụ ở trên. Đã qua rồi cái thời nó dịch “The Universe in a Nutshell” là “Vũ trụ trong một hạt dẻ.”

Cứ lẽ thường, trừ thơ văn xưa ra, Google Translate trong trình trạng hiện nay đã giúp ích chúng ta rất nhiều trong việc đọc hiểu các bản tin, dịch các bản văn trong các bộ môn khoa học kỹ thuật và khoa học nhân văn nếu chúng ta có một trình độ tiếng Anh đủ nhận biết chỗ nào máy đã dịch sai. Nếu không có trình độ đó, nhiều khi đoạn văn dịch của Google Translate vẫn nghe rất suôn sẻ, thậm chí có vẻ văn chương, nhưng nó đã nói ngược lại điều tác giả muốn nói.