Tải bản đầy đủ (.pdf) (13 trang)

Góp phần xác định nguồn gốc tiếng Việt qua “Bảng 100 từ cơ bản Swadesh”

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (251.47 KB, 13 trang )

TẠP CHÍ KHOA HỌC, ðại học Huế, Số 66, 2011
GĨP PHẦN XÁC ðỊNH NGUỒN GỐC TIẾNG VIỆT
QUA “BẢNG 100 TỪ CƠ BẢN SWADESH”
Võ Trung ðịnh
Trường ðại học Ngoại ngữ, ðại học Huế

TÓM TẮT
“Bảng 100 từ cơ bản Swadesh” là Bảng từ cơ bản thông dụng trên thế giới. Ứng dụng
Bảng này trong việc truy tìm từ ngun tiếng Việt có thể phát hiện ra mối quan hệ giữa tiếng
Việt và các thứ tiếng khác trong khu vực Châu Á thuộc ngữ hệ Nam Á, ngữ hệ Nam ðảo hay cả
với ngữ hệ Hán Tạng. Thực ra 100 từ cơ bản này là 100 khái niệm, trên cơ sở đó có thể quy nạp,
tổng kết hàng ngàn lớp từ vựng cơ bản khác trong tiếng Việt, từ đó có cái nhìn tồn diện hơn,
chính xác hơn về nguồn gốc tiếng Việt.

1. ðặt vấn ñề
Về vấn ñề xác ñịnh nguồn gốc tiếng Việt, kể từ mốc 1852 khi J.R. Logan trong
bài nghiên cứu Ethnology of the Indo-Pacific Islands lần ñầu tiên xếp tiếng Việt vào
dịng Mơn-Khmer, họ Nam Á thì quan điểm này cho ñến nay vẫn ñược nhiều người
chấp nhận nhất và trở thành quan điểm chính thống cho các nhà nghiên cứu lịch sử tiếng
Việt. Như giáo sư Nguyễn Tài Cẩn trong cuốn Giáo trình lịch sử ngữ âm tiếng Việt (sơ
thảo) ñã chỉ ra rằng, tiếng Việt “là một ngơn ngữ thuộc nhóm Việt Mường, tiểu chi ViệtChứt (vẫn thường gọi là tiểu chi Việt-Mường) nằm trong khối Việt-Katu thuộc khu vực
phía ðơng của ngành Mon-Khmer, họ Nam Á” [1, trang 332], cho dù trong một quãng
thời gian sau này tiếng Việt có mối quan hệ và ảnh hưởng sâu đậm với tiếng Hán, nhưng
đó chỉ là quan hệ tiếp xúc chứ không phải quan hệ thân thuộc.
Tuy nhiên, ngồi quan điểm chính thống đó, tiếng Việt cịn được nhiều học giả
khác xếp vào các ngữ hệ khác nhau, do bởi trong quá trình sinh sống và di trú của cư
dân Việt cổ, tổ tiên chúng ta ñã tiếp xúc và vay mượn rất nhiều các ngôn ngữ trong khu
vực. Tiêu biểu như học giả người Pháp H. Maspéro trong cơng trình Nghiên cứu lịch sử
ngữ âm tiếng An Nam-Các âm ñầu (Étude sur la phonétique historique de la langue
Annamite. Les initiales, 1912) sau khi nghiên cứu tiếng Hán Việt, tiếng Mường, tiếng
Thái và một số ngôn ngữ Môn-Khmer khác ñã ñưa ra nhận xét rằng “hệ thống thanh


ñiệu làm cho tiếng Việt khác với các ngôn ngữ Môn-Khmer và đó là một căn cứ quan
trọng để tách nó ra khỏi các ngơn ngữ Mơn-Khmer được biết đến như là những ngơn
ngữ khơng thanh điệu. Hệ thống thanh điệu của tiếng Việt đã được hình thành dựa trên
những ngun tắc chung như trong tiếng Hán, tiếng Thái và ngôn ngữ Tạng Miến,
nhưng nó thống nhất với hệ thanh của tiếng Thái cổ, tiếng Việt phải ñược quy vào họ
45


Thái” [1, trang 336]. Có rất nhiều nhà ngơn ngữ học tán thành quan ñiểm này như
W.Schmidt (1926), K.Wuff (1934), R.Shafer (1942)… Nhà ngôn ngữ học trứ danh
Trung Quốc Vương Lực cũng theo quan điểm này. Năm 1939 ơng đến Hà Nội nghiên
cứu tiếng Việt, sau đó ra mắt cơng trình Nghiên cứu tiếng Hán Việt. Do chịu ảnh hưởng
sâu sắc của lớp từ Việt gốc Hán trong tiếng Việt nên Vương Lực ñã xếp tiếng Việt vào
“ngữ hệ Hán Tạng, ngữ tộc Hán Thái” [2, trang 25].
Một nhà nghiên cứu khác là Bình Ngun Lộc đã xếp tiếng Việt vào họ ngôn
ngữ Nam ðảo. Trong hai cuốn Nguồn gốc Mã Lai của dân tộc Việt Nam (Sài Gòn,
1972) và Lột trần Việt ngữ (Sài Gịn, 1973) ơng đã có sự so sánh tương ứng giữa từ
vựng tiếng Việt với các ngôn ngữ khác nhau trong họ Nam ðảo, từ ñó nhiều lần ñưa ra
kết luận tiếng Việt “ñã mượn ñến 40% danh từ của Mã Lai Nam Dương” [3, trang 383].
Tuy các quan điểm trên có nhiều mức độ ñúng sai khác nhau, nhưng chính
những nhận ñịnh này khiến chúng ta khi ñặt vấn ñề xác minh nguồn gốc tiếng Việt
khơng thể khơng xét đến các yếu tố Tày-Thái, yếu tố gốc Hán và cả yếu tố Nam ðảo
trong lớp từ vựng cơ bản tiếng Việt ngày nay. Vấn ñề ñặt ra ở ñây là sử dụng phương
pháp nào trong việc xác ñịnh nguồn gốc tiếng Việt? Bởi ñối với bất kỳ một loại ngôn
ngữ nào, ba hệ thống lớn ngữ âm, từ vựng, ngữ pháp và các tiểu hệ thống của nó đều có
sự diễn biến khác nhau trong lịch sử, có yếu tố được bảo tồn lâu dài bên cạnh những
yếu tố bị mất ñi và nhanh chóng được thay thế bằng những yếu tố khác, tuyệt đối khơng
thể có sự đồng đều về mặt diễn biến ngơn ngữ. Do vậy, việc xác định cho được một
phương pháp nghiên cứu ñáng tin cậy là ñiều tối quan trọng.
2. Phương pháp nghiên cứu

“Mỗi một từ đều có lịch sử của nó”, đây là cách nhìn nhận của trường phái
Phương ngữ học (dialectology) [4, trang 315]. Nhận ñịnh này càng nghĩ càng thấy ñúng,
vấn ñề ñặt ra là chúng ta ñi nghiên cứu lịch sử của từ như thế nào? Trong các phương
pháp so sánh ñối chiếu hiện nay, phương pháp so sánh-lịch sử có thể giúp chúng ta phát
hiện ra sự thân thuộc giữa các ngôn ngữ về mặt cội nguồn. ðây là phương pháp thơng
qua sự đối sánh về mặt ngữ âm, từ vựng và ngữ pháp giữa hai hoặc nhiều phương ngữ
hoặc các ngôn ngữ thân thuộc để rút ra quy luật diễn biến, từ đó xác định nguồn gốc của
một ngơn ngữ. Phương pháp này dựa trên yếu tố tĩnh của sự phân bố từ vựng để xem
xét yếu tố động của q trình diễn biến từ, như sự sản sinh từ mới nghĩa mới, sự tiêu
vong lớp từ cũ nghĩa cũ… Ngoài ra, phương pháp này cũng xem xét ñặc ñiểm phân bố
về mặt ñồng ñại và quy luật diễn biến về mặt lịch ñại các từ mục trong nhóm từ có
trường nghĩa.
Do vậy, phương pháp phân tích trường nghĩa cũng khơng thể thiếu khi xác ñịnh
nguồn gốc từ. F. de Saussure trong Giáo trình ngơn ngữ học đại cương đã chỉ ra hai
dạng quan hệ, đó là quan hệ ngang (quan hệ tuyến tính, quan hệ ngữ đoạn) và quan hệ
dọc (quan hệ liên tưởng, quan hệ hệ hình). Theo hai dạng quan hệ đó có thể có hai loại
46


trường nghĩa: trường nghĩa ngang (trường nghĩa tuyến tính) và trường nghĩa dọc (trường
nghĩa liên tưởng). Chúng ta nên sử dụng trường nghĩa dọc (bao gồm trường nghĩa biểu
vật và trường nghĩa biểu niệm) ñể khảo sát và xác ñịnh từ ngun. A.G.Haudricourt khi
phân tích một nhóm từ cụ thể (nhóm từ chỉ bộ phận cơ thể như mắt, tai mũi, miệng,
răng, lưỡi, cổ, tay…) ñã cho thấy “sự tương ứng về từ vựng cơ bản giữa tiếng Việt và
các ngơn ngữ Mơn-Khmer là sự tương ứng mang tính bản chất cội nguồn, khác với sự
tương ứng giữa tiếng Việt với các ngôn ngữ Thái” [5, trang 96]. ðể xác định giữa các
ngơn ngữ có quan hệ đồng ngun đồng tộc, thì phải có một số lượng từ đồng ngun
đáng kể để chứng minh. Ngơn ngữ học lịch sử (historical linguistics) dựa lớp từ vựng cơ
bản đó so sánh đối chiếu để “quyết định những ngơn ngữ nào cùng có chung một tổ tiên,
và do đó, có những ngữ hệ nào, tiến hành phục ngun để vạch ra đặc tính của cái ngơn

ngữ gốc khơng được ghi (các tiền ngơn ngữ), nhận diện những thay đổi khác nhau khiến
mỗi ngơn ngữ mẹ phân tách thành một số ngôn ngữ con” [6, trang 294]. A. G.
Haudricourt cũng từng nhấn mạnh trong trường hợp xếp loại nguồn gốc tiếng Việt “cái
quyết ñịnh là từ vựng cơ bản” [7, trang 20]. Tuy nhiên, việc xác ñịnh cho ñược ñâu là
lớp từ vựng cơ bản, ñâu là lớp từ vựng vay mượn hay từ vựng văn hóa thực sự khơng dễ
dàng. Do bởi trong q trình phát triển, có rất nhiều ngơn ngữ đã bị phân hóa thành
nhiều nhóm, nhiều dịng ngơn ngữ khác nhau. Tiếng Việt cũng không ngoại lệ. Công
việc của các nhà ngôn ngữ học lịch sử là truy nguyên ngôn ngữ được cho là ngơn ngữ
nguồn đó, là “bà mẹ” sản sinh ra các dịng ngơn ngữ sau này, từ ñó tiến hành quy nạp
chúng vào những chi, những họ, những ngành khác nhau dựa trên mức ñộ thân thuộc
nhiều hay ít. Khi tiến hành nghiên cứu so sánh-lịch sử, nếu chúng ta chưa xác ñịnh ñược
ñâu là cội nguồn, ñâu là vay mượn trong nhóm từ vựng giống nhau giữa hai hay nhiều
ngơn ngữ, thì chưa đủ điều kiện ñể xác ñịnh quan hệ họ hàng thân thuộc giữa chúng.
Tuy nhiên, A. G. Haudricourt cũng thừa nhận các ngôn ngữ khơng có biến hóa hình thái
như tiếng Việt cũng có sự vay mượn từ vựng cơ bản. Do vậy, các nhà nghiên cứu muốn
đạt được mục đích phân loại trong số những từ tương ứng giữa hai hay nhiều ngơn ngữ,
từ nào mang tính cội nguồn, từ nào mang tính vay mượn, thì phải xem xét chúng theo
từng nhóm từ vựng có ý nghĩa trọn vẹn, tức là sử dụng phương pháp phân tích trường
nghĩa như đã nói ở trên.
3. Bảng 100 từ cơ bản của Swadesh
Morris Swadesh (1909-1967) là nhà ngơn ngữ học người Mỹ. Ơng đề nghị
phương pháp xác ñịnh thời gian tách rời (length of separation) của hai ngơn ngữ cùng
một nguồn, bằng cách tìm ra bao nhiêu từ thay ñổi khi so sánh số vốn từ căn bản. ðây
cũng là nền tảng của một ngành ngơn ngữ học mới gọi là Glottochronology (mơn học
xác định tuổi của ngơn ngữ), hay cịn gọi là “phương pháp Ngữ thời học, vắn tắt hơn là
phương pháp Swadesh” [8, trang 8]. Chính phương pháp này đã đưa ngơn ngữ học, một
ngành theo truyền thống khoa học nhân văn, trở nên một ngành ngơn ngữ định lượng
(quantitative linguistics) và đem mơn này đến gần các ngành khoa học chính xác khác.
47



GS. Nguyễn Tài Cẩn trong giáo trình Lịch sử ngữ âm tiếng Việt (sơ thảo) đã vận
dụng có phê phán phương pháp Swadesh, đó là phương pháp xuất phát từ quan niệm
cho rằng, qua thời gian, việc thay thế từ vựng cơ bản cổ bằng từ vựng mới là một việc
xảy ra theo quy luật chung cho mọi ngôn ngữ. Theo sự thống kê và tính tốn trên một số
lượng rất nhiều ngơn ngữ, phương pháp này đưa ra cách xác định như sau: cứ qua 1000
năm thì số lượng từ trong kho từ vựng cơ bản của một ngôn ngữ sẽ bị mất đi 15%, chỉ
cịn lại 85%. Như vậy, nếu hai ngôn ngữ hay hai phương ngữ A, B cùng gốc tách nhau
khoảng 1.000 năm, thì trong bảng từ vựng chúng chỉ còn giữ lại 74% là chung
(85% 85%=74%); nếu tách nhau 2.000 năm, thì số từ vựng chung còn lại chiếm
khoảng 55% (74% 74%=55%); tách nhau 4.000 năm, thì số từ vựng chung cịn lại chỉ
chiếm khoảng 30% (55% 55%=30%); tách nhau 8.000 năm, thì số từ vựng chung cịn
lại càng ít hơn, chỉ chiếm khoảng 9% (30% 30%=9%). Qua hơn 8000 năm thì lượng từ
cơ bản chung sẽ rút đi tới mức khơng thể xác lập nổi mối quan hệ nguồn gốc giữa hai
ngôn ngữ nữa.
Swadesh năm 1952 ñề xuất ra Bảng 200 từ cơ bản. 200 từ này có được trên cơ
sở ơng phân tích, quy nạp các ngôn ngữ ở châu Âu, châu Mỹ, châu Phi và châu Úc. Ban
đầu ơng cho rằng 200 từ này là lớp từ cơ bản ổn ñịnh nhất trong tất cả các ngơn ngữ,
nhưng trong q trình nghiên cứu sau đó, ơng nhận thấy có khá nhiều từ trong Bảng có
thể vay mượn qua lại lẫn nhau, vì thế năm 1955 ơng rút gọn lại chỉ cịn 100 từ cơ bản. Ý
đồ của ơng là muốn có một ranh giới dứt khốt giữa vấn đề vay mượn hay không vay
mượn, tuy nhiên sau này theo khảo sát của một số nhà nghiên cứu thì trong Bảng 100 từ
này vẫn có một số từ có thể vay mượn, nhưng ít hơn nhiều so với Bảng 200 từ. Có thể
nói Bảng 100 từ cơ bản ñã xác ñịnh ñược lớp từ vựng ổn định nhất trong mọi ngơn ngữ
và đã trở thành Bảng 100 từ thông dụng trên thế giới khi khảo sát nguồn gốc từ. Vì vậy
ứng dụng Bảng 100 từ cơ bản của Swadesh vào truy nguyên gốc tích tiếng Việt sẽ trở
nên thuận tiện hơn cho các nghiên cứu khi so sánh ñối chiếu với Bảng 100 từ cơ bản của
các ngơn ngữ khác mà đã được khảo sát trước đó. ðiều cần lưu ý là do Swadesh chỉ
khảo sát các ngơn ngữ Ấn Âu. Vì vậy, khi áp dụng vào các ngôn ngữ vùng châu Á nói
chung và ðơng Nam Á nói riêng, nơi liên tục xảy ra các cuộc di cư và hội tụ của các tộc

người, nơi mà sự tiếp xúc giữa các chi nhóm ngơn ngữ là xảy ra thường xun và lâu
dài, thì khi áp dụng phương pháp này địi hỏi phải nghiên cứu trên quan điểm so sánh đa
ngữ thì mới có cái nhìn khoa học hơn về nguồn gốc tiếng Việt.
F. de Saussure trong Giáo trình ngơn ngữ học đại cương (1916) cũng đã dành
một chương Ngơn ngữ học địa lý phân tích khá rõ nguyên nhân tạo nên sự khác biệt
trong lịch sử diễn biến ngơn ngữ, đó là tìm hiểu những vấn đề địa lý liên quan tới nó.
Bởi vì, “mối liên hệ giữa lịch sử phát triển, tức mặt thời gian, với môi trường phát triển,
tức mặt khơng gian, là một liên hệ có tính bản chất của bất kỳ một sự phát triển nào” [9,
trang 334]. Như đã nói ở trên, do hiện nay nhận thức chung của đa số các nhà ngơn ngữ
là tiếng Việt thuộc ngữ hệ Nam Á, do đó, dấu vết từ vựng của họ ngôn ngữ này trong
48


tiếng Việt được coi là cội nguồn, các ngơn ngữ khác chỉ được coi là ngơn ngữ láng
giềng chứ khơng phải là ngôn ngữ thân thuộc. Quan hệ giữa tiếng Việt với các ngôn ngữ
láng giềng này chỉ là quan hệ tiếp xúc vay mượn lẫn nhau, do vị trí ñịa lý quá gần nhau,
và những sự tiếp xúc lâu dài giữa cư dân các vùng miền xảy ra trong một thời gian dài.
Tuy nhiên, cũng chính vì điều này mà khiến cho lớp từ vựng ñược coi là vay mượn đơi
khi thực sự rất khó xác định, vơ hình trung được coi là yếu tố cội nguồn. Ví dụ như theo
một số kết quả nghiên cứu hiện nay, thì chúng ta có thể nhận định rằng tiếng ViệtMường đã từng có những sự tiếp xúc lâu dài với các ngôn ngữ thuộc họ Nam ðảo.
Chứng cứ của sự tiếp xúc này là trong vốn từ tiếng Việt hiện nay vẫn cịn một lớp từ rất
cổ xưa có nguồn gốc Mã Lai-ða đảo (xem thêm mục 4.3). Bởi vì thời gian tiếp xúc q
xa xưa, vì vậy khó có thể kết luận ngôn ngữ nào vay mượn ngôn ngữ nào, và cũng khó
có thể nói những từ rất cơ bản, rất cổ xưa ấy là những từ vay mượn chứ khơng phải là từ
cơ bản. ðây chính là khó khăn lớn nhất, gây nhiều tranh cãi nhất khi xác ñịnh nguồn
gốc tiếng Việt, và sự tranh cãi trong gần suốt 200 năm này thậm chí cho đến giờ xem ra
vẫn còn chưa ngã ngũ…
Từ lúc lý thuyết của Swadesh ra đời đã có những khảo cứu từ những ngơn ngữ
khác nhau trên thế giới cho thấy kết quả tương ñối khả quan và hiện đang được sử dụng
vì có một số lợi ích thiết thực và thành tựu đáng kể. Tuy nhiên cũng có nhiều tranh luận

về các tiền đề cơ bản của lý thuyết này, như tốc ñộ thay đổi của ngơn ngữ khơng ln
đều đặn. Có q nhiều yếu tố ảnh hưởng đến sự thay đổi của ngơn ngữ như các biến cố
lịch sử xã hội (chiến tranh xâm lược, thơn tính đất đai, các cuộc cách mạng…), vì vậy
mốc thời gian thay đổi khơng thể là một hằng số. Mặc dù vậy, Bảng 100 từ cơ bản của
Swadesh có thể được coi là Bảng chuẩn hiện nay cho việc xác ñịnh từ vựng cơ bản của
tất cả các ngơn ngữ. Bảng này có thể tạm chia thành các nhóm sau:
a. Nhóm sự vật hiện tượng thiên nhiên
1. Mặt trời (sun); 2. Mặt trăng (moon); 3. Sao (star); 4. Nước (water); 5. Mưa
(rain); 6. Mây (cloud); 7. ðá (stone); 8. Cát (sand); 9. ðất (earth); 10. Núi (mountain);
11. ðường (path); 12. Lửa (fire); 13. Khói (smoke); 14. Tro (ash); 15. ðêm (night).
b. Nhóm bộ phận cơ thể người
16. ðầu (head); 17. Tóc (hair); 18. Mắt (eye); 19. Mũi (nose); 20 Răng (tooth);
21. Lưỡi (tongue); 22. Tai (ear); 23. Miệng (mouth); 24. Cổ (neck); 25. Tay (hand); 26.
Bụng (belly); 27. Vú (breasts); 28. Chân (foot); 29. Da (skin); 30. Tim (heart); 31. Gan
(liver); 32. Xương (bone); 33. ðầu gối (knee); 34. Máu (blood); 35. Thịt (flesh).
c. Nhóm động thực vật
36. Chim (bird); 37. Cá (fish); 38. Chó (dog); 39 Chí/Rận (louse); 40. Cây (tree);
41. Hạt (seed); 42. Lá (leaf); 43. Gốc/Rễ (root); 44. Vỏ cây (bark); 45. Dầu/Mỡ
(grease); 46. Trứng (egg); 47. ðuôi (tail); 48. Sừng (horn); 49. Lông (feather); 50. Móng
49


(claw).
d. Nhóm động tác
51. Ăn (eat); 52. Uống (drink); 53. Cắn (bite); 54. Nói (say); 55. Nhìn (see); 56.
Nghe (hear); 57. Biết (know); 58. Ngủ (sleep); 59. Chết (die); 60. Giết (kill); 61. ði
(walk); 62. Bay (fly); 63. Bơi (swim); 64. ðến (come); 65. Ngồi (sit); 66. ðứng (stand);
67. Nằm (lie); 68. Cho/Tặng (give); 69. ðốt (burn).
e. Nhóm tính chất trạng thái
70. Mới (new); 71. Tốt/ðẹp (good); 72. Nóng (hot); 73. Lạnh (cold); 74. ðầy

(full); 75. Khô (dry); 76. ðỏ (red); 77. Xanh (green); 78. Vàng (yellow); 79. Trắng
(white); 80. ðen (black); 81. To/Lớn (big); 82. Nhỏ/Bé (small); 83. Dài (long); 84.
Nhiều (many); 85. Trịn (round).
f. Nhóm cịn lại
86. Một (one); 87. Hai (two); 88. Tôi (I); 89. Chúng tôi (we); 90. Anh/Bạn (you);
91. ðây/Này (this); 92. Kia/ðó (that); 93. Ai (who); 94. Gì/Cái gì (what); 95. Người
(person); 96. ðàn bà (woman); 97. ðàn ông (man); 98. Tên (name); 99. Khơng (not);
100. ðều/Tồn bộ (all).
4. Khảo sát sơ bộ sự tương đồng giữa với tiếng Việt với các ngơn ngữ vùng ngữ hệ
ðông Nam Á trong Bảng 100 từ cơ bản
Trong q trình tìm hiểu lịch sử tiếng Việt, có nhiều học giả ñã sử dụng lớp từ
vựng cơ bản ñể nghiên cứu quan hệ thân thuộc giữa hai hay nhiều ngơn ngữ có liên
quan, trong đó đại đa số những từ cơ bản được đề xuất đều có xuất hiện trong Bảng 100
từ cơ bản của Swadesh.
4.1. Chứng minh nguồn gốc Nam Á của tiếng Việt
H. Maspéro trong công trình nổi tiếng Nghiên cứu lịch sử ngữ âm tiếng An Nam.
Những phụ âm ñầu khi xem xét về mặt từ vựng cơ bản ñã chỉ ra rất nhiều từ trong tiếng
Việt tương ứng với tiếng Mơn-Khmer, ví dụ các từ chỉ sự vật hiện tượng thiên nhiên
(ñất, núi, ñá, cát, mưa, gió, nước…), bộ phận cơ thể (chân, cằm, mặt, mũi, tóc, răng…),
tên súc vật, cỏ cây (cá, trâu, chí, chim, chó, thịt, cây, rễ, gốc, lúa…); các từ liên quan
đến người (mẹ, bố, con, cháu, mày, nó…), các hành ñộng cơ bản (ñi, chạy, ngửi, chiên,
thui, cầm, cắn…); hệ số ñếm (một, hai, ba, bốn, năm). Tổng cộng ông ñã so sánh tất cả
185 từ tiếng Việt với các ngôn ngữ Môn-Khmer và các ngôn ngữ Thái và ơng đưa ra kết
luận có 87 từ là tương đương với các ngơn ngữ Mơn-Khmer và 98 từ cịn lại thuộc ngơn
ngữ Thái. Giáo sư Trần Trí Dõi cho rằng những từ ông Maspéro dẫn ra không thuần túy
là những từ thuộc lớp từ cơ bản, mà có rất nhiều từ thuộc lớp từ văn hóa. Vì thế ơng rút
gọn lại chỉ cịn 39 từ tương ứng với các ngơn ngữ Môn-Khmer và 21 từ tương ứng với
các ngôn ngữ Thái, do đó “chỉ có 60/187 từ được Maspéro sử dụng là những từ thuộc
50



lớp từ cơ bản của ngôn ngữ.” [5, 83] Qua kiểm tra thì hầu hết 60 từ này đều nằm trong
Bảng 100 từ của Swadesh, rất thuận tiện cho chúng ta quy nạp, thống kê sau này.
GS. Nguyễn Ngọc San trong cơng trình Tìm hiểu tiếng Việt lịch sử từ trang 121
ñến 134 cũng ñã liệt kê ra hàng trăm từ có gốc Mơn-Khmer qua các thời kỳ. So sánh với
Bảng 100 từ Swadesh (chưa tính các từ thuộc trường nghĩa) thì có đến gần một nửa là
gốc Mơn-Khmer. Kết quả này khá trùng khớp với khảo sát sơ bộ của chúng tôi với Bảng
100 từ sau khi so sánh đối chiếu với rất nhiều ngơn ngữ thuộc nhóm Mơn-Khmer là có
đến hơn 50% từ vựng cơ bản có nguồn gốc Mơn-Khmer. ðiều này càng củng cố thêm
quan điểm cho rằng tiếng Việt thuộc dịng Mơn-Khmer trong ngữ hệ Nam Á.
4.2. Các từ có gốc Tày-Thái
Như đã nói ở trên, Maspéro đã chỉ ra trong tiếng Việt có khá nhiều từ cơ bản
tương đương với tiếng Thái, chính vì thế mà ơng đã đưa ra một kết luận lưỡng lự về
nguồn gốc tiếng Việt, đó là “tiếng tiền Việt đã sinh ra từ một sự hỗn hòa của một
phương ngữ Mơn-Khmer, một phương ngữ Thái và có thể của cả một ngơn ngữ thứ ba
cịn chưa biết, rồi sau đó tiếng Việt ñã vay mượn một số lượng lớn những từ Hán.
Nhưng cái ngơn ngữ có ảnh hưởng quyết định ñể tạo ra cho tiếng Việt trạng thái hiện
ñại của nó (tức là có thanh điệu như ơng nghiên cứu) là chắc chắn, theo ý tôi, một ngôn
ngữ Thái, và vì thế tơi nghĩ rằng tiếng Việt phải được xếp vào họ Thái” [5, trang 89].
Mặc dù quan ñiểm của Maspéro sau này đã được A.G.Haudricourt chứng minh lại cịn
nhiều khiếm khuyết nhưng ơng cũng bước đầu chỉ ra được một số từ gốc Thái trong
tiếng Việt. GS. Nguyễn Ngọc San cũng nhận định rằng, “sự hịa đúc giữa tiếng MonKhmer và tiếng Tày-Thái cổ đã dần dần hình thành ra ngơn ngữ Việt Mường chung
trong đó lưu lại một cơ tầng Tày-Thái ñáng kể. Tuy nhiên sự xác ñịnh nguồn gốc TàyThái của các từ tiếng Việt không dễ dàng gì” [8, trang 135].
Theo nhận định của nhiều nhà ngơn ngữ học và dân tộc học thì những từ tiếng
Việt gốc Tày-Thái phần nhiều thuộc nền văn minh lúa nước. Tiêu biểu cho quan ñiểm
này là ý kiến của GS. Phạm ðức Dương, ơng cho rằng “một điều hết sức quan trọng cần
nhấn mạnh là nếu nhìn vào lớp từ vựng cơ bản ngoài hệ thống từ chỉ các hoạt ñộng tự
nhiên, cơ thể và hoạt ñộng của con người, số đếm… thì trong các ngơn ngữ tiền ViệtMường chỉ có từ chỉ văn hóa săn bắt, hái lượm và hệ thống canh tác nương rẫy, còn lớp
từ vựng về văn minh nơng nghiệp lúa nước hồn tồn khơng có. Trong khi đó hệ thống
từ này trong ngơn ngữ Việt-Mường lại có chung một gốc với các ngơn ngữ Tày-Thái”

[10, trang 129-130].
Kết luận của GS. Phạm ðức Dương tuy nhận được nhiều ý kiến đồng tình ủng
hộ nhưng cũng có ý kiến cho rằng chưa thực sự thuyết phục. Bởi vì để khẳng định từ
vựng phản ánh nền văn minh nơng nghiệp lúa nước hồn tồn khơng có trong các ngơn
ngữ thời kỳ tiền Việt-Mường thì cần phải thống kê đầy đủ và chứng minh thêm. GS.
Trần Trí Dõi cho rằng từ quan trọng nhất của văn mình lúa nước là từ “ruộng/ñồng” lại
51


có gốc gác thời kỳ tiền Việt-Mường. Từ việc phân tích nhiều từ vựng cơ bản khác ơng
đã nhận định rằng “tiếng Việt ở giai ñoạn tiền Việt-Mường dường như đã có lớp từ vựng
về văn minh nơng nghiệp lúa nước. Do đó khơng thể chờ mãi đến thời kỳ Việt-Mường
chung cộng ñồng cư dân Việt mới biết ñến kỹ thuật canh tác này.” [5, trang 230].
GS. Nguyễn Ngọc San còn cho biết thêm, “trong những bảng thống kê từ TàyThái trước đây người ta cịn đưa vào đó những từ gốc Hán” [8, trang 137]. Sau khi loại
ra những từ gốc Hán, ơng đã đưa ra danh sách hơn 100 các từ Việt gốc Tày-Thái. ðối
chiếu với Bảng 100 từ của Swadesh, thì số lượng từ trùng khớp chỉ có vài từ, ví dụ:
này\đây, chóc (chim chóc), nhận (ra)/nhìn (thấy), tất (cả)/sất/tuốt; một số từ chỉ quan hệ
thân thuộc dùng cho xưng hô như: bố/bủ/bọ, mợ… ðiều này cho thấy kết luận của
Maspéro tiếng Việt có gốc Thái là hồn tồn khơng chính xác. Chỉ có thể nói rằng,
chính yếu tố Tày-Thái đã góp phần làm thay đổi sâu sắc diện mạo văn hóa của người
Việt vào thời tiền sử và sơ sử, góp phần làm phong phú hơn những gì người Việt đã có
từ thời kỳ văn hóa ðơng Sơn.
4.3 Các từ có họ Nam ðảo
Ngữ hệ Nam ðảo (Austronesian) hay cịn gọi là Mã Lai-ða đảo (MalayoPolynesian) là một trong những họ ngôn ngữ lớn, phân bố ở quần đảo Indonesia,
Philippines, một số khu vực ở ðơng Dương, ðài Loan, Châu ðại Dương... Có khoảng
800 ngơn ngữ khác nhau thuộc họ Nam ðảo. Ở Việt Nam, ngôn ngữ của 5 dân tộc
Chăm, Êñê, Gia Rai, Ra Glai, Churu cư trú ở các tỉnh Nam Trung Bộ và Cao ngun
Trung bộ thuộc ngữ hệ này. Trong khi đó ở khu vực này còn cư trú các dân tộc Kơ Ho,
Mnông, Xtiêng, Mạ, Chơ Ro, Ba Na, Xơ ðăng, Hrê…, ngôn ngữ các dân tộc này lại
thuộc họ Nam Á. Chính vì địa bàn cư trú của các dân tộc đan xen với nhau, vì thế có rất

nhiều từ tương ñồng giữa chúng khiến cho việc phân ñịnh rạch rịi nguồn gốc ngơn ngữ
hồn tồn khơng hề đơn giản.
Như ñã nói ở phần 3, tiếng Việt ñã có quá trình tiếp xúc lâu dài với những ngơn
ngữ Nam ðảo lên đến hàng ngàn năm, vị trí địa lý gần nhau, cư dân sinh sống xen kẽ
với nhau, vì thế những từ vay mượn giữa chúng khơng thể khơng có. Ngồi số lượng
175 từ gốc Mã Lai do Bình Ngun Lộc liệt kê và so sánh (nhưng ông không phân biệt
nhóm dân tộc nào là Nam ðảo, nhóm nào là Nam Á), thì năm 1992, trong bài báo Từ
Nam Á trong tiếng Việt, tác giả Hồ Lê với cách làm tương tự (cho rằng các từ thuần Việt
gồm các ngôn ngữ Môn-Khmer lẫn các ngôn ngữ Nam ðảo và ngôn ngữ Thái) ñã liệt kê
ra 193 từ tiếng Việt mà theo ơng đều là từ thuần Việt, trong đó có khá nhiều từ có trong
Bảng 100 từ Swadesh, ví như: anh/eng (Danaw: êl, Riang: êq, Palaung: yêo, Wa: eql, Vu,
Son Tailoi: êk); ăn (Khmer: chya, Palaung: ham, Sakai: chaa, Xơñăng, Kơho, Bahna: sa,
Khasi: bsa, Laha: ăn/kuôn, Thái: kun, Li: khan, Indonesia: pangan…) [11, trang 110].
Theo khảo sát sơ bộ của chúng tơi, trong Bảng 100 từ Swadesh, có ít nhất 20-25
từ có nguồn gốc Nam ðảo. Một số ví dụ tiêu biểu:
52


Mặt trời (sun). Tiếng Indonesia: mata hari, tiếng Aceh: mata ur , tiếng MalayTagalog (PMT): mata haraj… có ý nghĩa so sánh “mắt của trời”. [12, trang 116] “Mặt
trời” trong tiếng Việt là một trong số ít những từ cơ bản song tâm tiết, ñọc trại của “mắt
trời”, bảo lưu ý nghĩa của nhóm ngơn ngữ này. Tiếng Kam-Tai (PKT) ñọc là *pra*blan,
cũng vay mượn ý nghĩa “mắt trời” từ tiếng Nam ðảo [4, trang 248].
Mặt trăng (moon). “Mặt trăng” trong tiếng Việt là cách nói dựa theo từ “mặt
trời”, thực ra nó vốn là từ đơn âm tiết “trăng”. Tiếng Indonesia: bulan, tiếng Aceh:
bul , tiếng Gialai: blan, PMT: bulan, PKT *C-blin [12, trang 117]. GS. Ngô An Kỳ
sau khi phân tích các âm song tiết *pl-, *bl-, *m-l- trong tiếng ðồng ðài và Nam ðảo
cổ với âm ñơn *N- trong tiếng Hán Thượng cổ cịn đưa ra nhận ñịnh rằng “từ 月*Nat
(nguyệt, mặt trăng) có thể có nguồn gốc từ tiếng ðồng ðài, Nam ðảo”, từ đó rút ra kết
luận “tiếng Kam-Tai nguyên thủy *C-blin cũng có thể xuất phát từ âm tiếng Nam ðảo
cổ” [4, trang 315].

Ngoài ra, theo khảo sát của chúng tơi, cịn có một từ cơ bản khác có thể có
nguồn gốc từ tiếng Nam ðảo như: bụi, ñường, núi, ñêm, tai, mắt, lưỡi, bụng, trứng,
uống, ăn, cắn, mất, ñứng, ni (này)… Như vậy, số lượng từ gốc Nam ðảo trong Bảng
100 từ Swadesh là khá lớn, có thể chiếm tới 20-25%, điều này phản ánh đúng thực tế
như GS. Trần Trí Dõi chứng minh là vào giai ñoạn phát triển ñầu tiên trong lịch sử tiếng
Việt (cách đây khoảng 1.000 năm trước Cơng ngun cho đến những thế kỷ đầu sau
Cơng ngun), lúc tiếng tiền Việt-Mường tách ra khỏi khối Mơn-Khmer để có một lịch
sử phát triển riêng, thì tiếng tiền Việt-Mường đã có tiếp xúc với các ngơn ngữ thuộc họ
Nam ðảo. Và ơng có nhận định thêm là “tính chất nhập nhằng khiến người ta khó xác
định ngơn ngữ nào vay mượn ngôn ngữ nào. Trong tương lai, khi thuần túy xem xét từ
vựng lịch sử tiếng Việt, chắc chắn ñây sẽ là một vấn ñề thú vị nhưng cũng sẽ ñầy rẫy
khó khăn” [5, trang 162].
4.4. Các từ gốc Hán
Như ñã nói ở trên, khi khảo sát nguồn gốc tiếng Việt, chúng ta không nên chỉ so
sánh song ngữ mà phải đặt nó trong mối quan hệ đa ngữ, đa chiều, ở ñây là các thứ tiếng
Mon-Khmer, tiếng Tày-Thái, tiếng Nam ðảo và thậm chí cả tiếng Hán. Tuy tiếng Hán
cũng như tiếng Thái chỉ du nhập vào tiếng Việt ở thời kỳ thứ hai của lịch sử phát triển
tiếng Việt (thế kỷ I sau Cơng ngun cho đến khoảng thế kỷ VIII-IX), nhưng cũng đã
hình thành một lớp từ mà ñược các nhà nghiên cứu gọi là từ Hán-Việt cổ hay cổ HánViệt, và “ñiều cần chú ý là những từ vay mượn tiếng Hán vào thời kỳ này cũng dường
như là những từ khá cơ bản trong vốn từ tiếng Việt. Chẳng hạn đó là những từ như ñầu,
mả, mùa, mùi, buồng, bến, buồm…” [5, trang 172]. Khảo sát trong Bảng 100 từ
Swadesh thì chỉ có trên dưới 10 từ là có gốc Hán. Ví dụ khi khảo sát 2 đại từ nhân xưng
Tơi (I) và Chúng tơi (we) trong bảng 100 từ, chúng tôi nhận thấy chúng có những mối
tương quan như sau:
53


ðại từ nhân xưng ngơi thứ nhất số ít “I” trong tiếng Việt có những cách nói “tơi,
ta, tau, tớ...”. Trong đó “Tơi” (đọc trại “tui”) tương ứng với [tai2]-[dai4] và “tớ”
tương ứng với 卒[zu2], hai ñại từ nhân xưng ngôi thứ nhất trong tiếng Quảng ðông

(Cantonese) và tiếng Khách Gia (cịn gọi tiếng Hẹ, Hakka), hai ngơn ngữ thuộc ngữ hệ
Hán Tạng. Ý nghĩa của hai từ này cũng tương đồng với ý nghĩa gốc của từ “tơi tớ” trong
tiếng Việt. ðịa bàn cư trú của những tộc người này cũng gần sát Việt Nam, nằm trong
mối tương quan Bách Việt ngày xưa. Tiếng Mường đọc là [thơi] (bật hơi), tiếng Hmong
ñọc là [Tub] (b chỉ âm cao, tương tự dấu sắc trong tiếng Việt).
ðại từ nhân xưng ngôi thứ nhất số nhiều “we” trong tiếng Việt có những cách
nói “chúng tơi, chúng ta, chúng tao, chúng tớ”; “bọn tơi, bọn tao…”; “tụi tao…”
Trong đó các tiền tố như “chúng”, “bọn” và có thể cả “tụi” là có nguồn gốc từ tiếng Hán.
Chúng 众: tiếng Khách Gia [chung]; Bọn 帮: tiếng Quảng ðông [bong]; Tụi 隊: tiếng
Khách Gia [tui]…
Hay như các từ ñầu, tim, gan (ñọc trại từ tâm, can), ơng (đàn ơng), bà (đàn
bà)… là những từ vay mượn gốc Hán, nhưng ñây rõ ràng là những từ thuộc lớp từ rất cơ
bản. Tuy nhiên khi xét về mặt trường nghĩa thì chúng đều chưa mang tính hệ thống, đối
chiếu với Bảng 100 từ thì số lượng cũng rất ít, vì vậy những nhận định tiếng Việt có
nguồn gốc Hán-Tạng là hồn tồn khơng chính xác, mặc dù trong tiếng Việt ngày nay
có hơn 70% số lượng từ vựng là từ Hán-Việt, nhưng những từ này rõ ràng thuộc lớp từ
vựng văn hóa mới du nhập vào tiếng Việt ở những giai đoạn muộn hơn, chứ khơng
thuộc lớp từ vựng cơ bản.
5. Kết luận
Do khuôn khổ bài báo có hạn nên chúng tơi khơng thể liệt kê và phân tích chi
tiết từ nguyên của 100 từ cơ bản trong Bảng từ Swadesh. Tuy nhiên dựa vào kết quả
nghiên cứu của các học giả ñi trước cũng như sự so sánh đối chiếu mới nhất sau này, có
thể tạm ñưa ra những nhận ñịnh như sau:
Với số lượng áp ñảo trên 50% từ cơ bản trong Bảng 100 từ Swadesh có gốc tích
từ các ngơn ngữ trực hệ của dịng Mơn-Khmer, những kết luận tiếng Việt có nguồn gốc
chính thuộc họ Nam Á, dịng Mơn-Khmer là hồn tồn có cơ sở thuyết phục. Mở rộng
ra nghiên cứu thêm Bảng 200 từ cơ bản của Swadesh, chúng ta có thể nhận thấy số
lượng các từ này vẫn chiếm ña số. Có thể nói, những từ gốc Mơn-Khmer trong lớp từ
vựng cơ bản tiếng Việt hiện nay là khá nhiều và là nền tảng cơ bản của tiếng Việt. GS.
Nguyễn Ngọc San cịn nhận định thêm rằng, “để tái lập nhằm khẳng ñịnh nguồn gốc

những từ gốc Mon-Khme trong tiếng Việt, người ta có thể sử dụng đến phương pháp
Ngữ thời học, thậm chí có thể đi ngược nguồn gốc q thời Mon-Khme lên tới Nam Á.
Tất nhiên số từ gốc Nam Á vừa chung cho Mon-Khme vừa chung cho các tiểu chi khác,
ví dụ số đếm như một, hai, ba, bốn và các từ như bay, bú, mũi, mắt, mày (ñại từ)…” [8,
trang 118]. Như vậy GS. Nguyễn Ngọc San cũng ñã bước ñầu áp dụng phương pháp
54


Swadesh trong việc xác ñịnh nguồn gốc từ vựng, tuy khơng nói rõ cụ thể là so sánh với
Bảng 100 từ hay Bảng 200 từ, nhưng ñối chiếu với những từ cơ bản ơng đưa ra thì thấy
chúng đa phần có xuất hiện trong Bảng thống kê của Swadesh.
Một nguồn gốc khác của từ vựng tiếng Việt mà chúng ta khơng thể khơng nhắc
tới là lớp từ có gốc Nam ðảo cổ. Với số lượng khoảng 25% từ cơ bản có xuất hiện trong
Bảng 100 từ, mốc thời gian của chúng cũng xa xưa như lớp từ gốc Nam Á, và hơn nữa
ñều thuộc những từ rất cơ bản của ngơn ngữ. Vì thế chúng ta khó có thể quy chúng vào
lớp từ vay mượn hay lớp từ văn hóa. Nhận định chính xác về diện mạo lớp từ này địi
hỏi chúng ta phải có sự so sánh đối chiếu nhiều hơn với các ngôn ngữ trực hệ của ngữ
hệ Nam ðảo có liên quan đến tiếng Việt, ví dụ tiếng Chăm chẳng hạn. Chúng ta ít khi
nhắc tới sự liên quan hay vay mượn giữa tiếng Việt và tiếng Chăm, có chăng là những
địa danh gốc Chăm cịn tồn tại trên lãnh thổ Việt Nam, phần nhiều nằm ở vùng Nam
Trung Bộ. Tuy nhiên, thử ñi sâu vào so sánh một số từ trong Bảng 100 từ với từ gốc
Chăm, ví dụ: bay (Chăm: pơr), mơi (Chăm: cabơi)… chúng ta có thể thấy giữa chúng có
những sự tương ứng khá thú vị. Việc nhận ñịnh ñúng ñắn bản chất của những sự tương
ứng này sẽ giúp chúng ta hiểu rõ hơn lịch sử của tiếng Việt trong mối tương quan với
tiếng Nam Á và Nam ðảo.
Sự du nhập của lớp từ vựng gốc Tày-Thái và gốc Hán vào tiếng Việt cũng muộn
hơn so với gốc Môn-Khmer và gốc Nam ðảo, chiếm thiểu số trong Bảng 100 từ. ðiều
này cho thấy rằng, ñây là lớp từ vay mượn sau này. Tuy nói là vay mượn nhưng xét về
bản chất cũng là những từ chỉ những khái niệm cơ bản trong vốn từ của một ngơn ngữ
(có lẽ đó là lý do mà chúng có xuất hiện trong Bảng 100 từ cơ bản của Swadesh). Có

một điều mà hiện các nhà nghiên cứu vẫn cịn đang tranh luận là ngơn ngữ nào vay
mượn của ngơn ngữ nào. Ví dụ như pnar (cái ná) vốn thuộc gốc Nam Á. Từ này tiếng
Hán ñã vay mượn khá sớm, viết là 弩, lúc này tiếng Hán chỉ có ngun âm a trịn mơi
nên phải ñọc từ trên thành [no], từ này lúc du nhập lại vào tiếng Việt thì tạo ra từ “nỏ”
bên cạnh từ “ná” đã có. Sau thế kỷ thứ X từ này lại ñược ñọc theo âm Hán Việt tạo ra từ
“nỗ” [8, trang 116].
Trong quá trình tìm hiểu lịch sử tiếng Việt, chúng ta không nên bỏ qua các
phương ngữ ở Việt Nam, vì đây là những nguồn cứ liệu sinh động và phong phú cho
cơng tác nghiên cứu. Trong ñó, các phương ngữ như Bắc Trung Bộ chẳng hạn, là
“nguồn cung cấp tư liệu giúp chúng ta có cơ sở chắc chắn để giải thích nhiều hiện tượng
có từ thời Việt-Mường” [5, trang 135]. Ví dụ khi khảo sát Bảng 100 từ, chúng ta cần mở
rộng ra khảo sát thêm các từ ñịa phương khác, chẳng hạn như: cây-kơn, chí-chấy, đầutrốc, này-ni…
Kết hợp nhiều phương pháp nghiên cứu khác với việc ứng dụng Bảng 100 từ cơ
bản của Swadesh sẽ cho chúng ta cái nhìn khoa học hơn, tồn diện hơn về sự hình thành
vốn từ cơ bản trong tiếng Việt, về những phương pháp sản sinh từ cũng như sự diệt
vong của một lớp từ cổ trong một giai đoạn nào đó của lịch sử tiếng Việt. Trên cơ sở đó,
55


chúng ta sẽ có những nhận định sâu sắc hơn, chính xác hơn về bình diện Từ ngun học
(etymology) tiếng Việt cũng như xu hướng phát triển của tiếng Việt sau này.
TÀI LIỆU THAM KHẢO
[1]. Nguyễn Thiện Giáp, Lược sử Việt ngữ học, tập I, Nxb. Giáo dục, 2008.
[2]. 王力, 汉语史稿, 中华书局, (Vương Lực, Hán ngữ sử cảo, Trung Hoa thư cục), 2002.
[3]. Bình Nguyên Lộc, Nguồn gốc Mã Lai của dân tộc Việt Nam, Nxb. Lá Bối, Sài Gòn,
1975.
[4]. 吴安其, 汉藏语同源研究, 中央民族大学出版社, (Ngơ An Kỳ, Hán Tạng ngữ đồng
ngun nghiên cứu, Trung ương Nhân dân ðại học Xuất bản xã), 2002.
[5]. Trần Trí Dõi, Giáo trình lịch sử tiếng Việt (sơ thảo), Nxb. ðại học Quốc gia Hà Nội,
2007.

[6]. Nguyễn Thiện Giáp, 777 Khái niệm Ngôn ngữ học, Nxb. ðại học Quốc gia Hà Nội,
2010.
[7]. A. G. Haudricourt, Vị trí của tiếng Việt trong các ngơn ngữ Nam Á, Ngơn ngữ, số 1,
1991.
[8]. Nguyễn Ngọc San, Tìm hiểu tiếng Việt lịch sử, Nxb. ðại học Sư phạm Tp HCM, 2003.
[9]. Ferdinand de Saussure, Giáo trình ngơn ngữ học đại cương (1916), Nxb. Khoa học Xã
hội, Hà Nội, 1973.
[10]. Phạm Ngọc, Phạm ðức Dương, Tiếp xúc ngôn ngữ ở ðông Nam Á, Viện ðông Nam
Á xuất bản, Hà Nội, 1983.
[11]. Hồ Lê, Từ Nam Á trong tiếng Việt, Tiếng Việt và các ngơn ngữ dân tộc phía Nam, Nxb.
Khoa học Xã hội, Hà Nội, 1992.
[12]. 吴安其,南岛语分类研究, 商务印书馆, 北京, (Ngô An Kỳ, Nam ðảo ngữ phân loại
nghiên cứu, Thương Vụ ấn thư quán, Bắc Kinh), 2009.

SYSTEMATICALLY IDENTIFYNING THE HISTORY OF VIETNAMESE
FORMATION BY APPLYING “SWADESH 100-WORD LIST”
Vo Trung Dinh
College of Foreign Languages, Hue University

SUMMARY
The “Swadesh 100-word list” is the most common kernel word list in the world.
Applying this word list to researching Vietnamese etymology, we could find out the relationship
56


between Vietnamese and some other languages in Asia such as those belonging to the
Austroasiatic, Austronesian and Sino-Tibetan families. In fact, these 100 kernel words are 100
concepts, from which we could gather thousands of basic vocabulary in Vietnamese as a
foundation, so that we would take an overall and more exact vision on the history of Vietnamese
formation.


57



×