Tải bản đầy đủ (.pdf) (13 trang)

Báo cáo nghiên cứu khoa học đề tài " Góp phần xác định nguồn gốc tiếng việt qua “bảng 100 từ cơ bản Swadesh” " pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (251.47 KB, 13 trang )



45
TẠP CHÍ KHOA HỌC, ðại học Huế, Số 66, 2011

GÓP PHẦN XÁC ðỊNH NGUỒN GỐC TIẾNG VIỆT
QUA “BẢNG 100 TỪ CƠ BẢN SWADESH”
Võ Trung ðịnh
Trường ðại học Ngoại ngữ, ðại học Huế
TÓM TẮT
“Bảng 100 từ cơ bản Swadesh” là Bảng từ cơ bản thông dụng trên thế giới. Ứng dụng
Bảng này trong việc truy tìm từ nguyên tiếng Việt có thể phát hiện ra mối quan hệ giữa tiếng
Việt và các thứ tiếng khác trong khu vực Châu Á thuộc ngữ hệ Nam Á, ngữ hệ Nam ðảo hay cả
với ngữ hệ Hán Tạng. Thực ra 100 từ cơ bản này là 100 khái niệm, trên cơ sở ñó có thể quy nạp,
tổng kết hàng ngàn lớp từ vựng cơ bản khác trong tiếng Việt, từ ñó có cái nhìn toàn diện hơn,
chính xác hơn về nguồn gốc tiếng Việt.

1. ðặt vấn ñề
Về vấn ñề xác ñịnh nguồn gốc tiếng Việt, kể từ mốc 1852 khi J.R. Logan trong
bài nghiên cứu Ethnology of the Indo-Pacific Islands lần ñầu tiên xếp tiếng Việt vào
dòng Môn-Khmer, họ Nam Á thì quan ñiểm này cho ñến nay vẫn ñược nhiều người
chấp nhận nhất và trở thành quan ñiểm chính thống cho các nhà nghiên cứu lịch sử tiếng
Việt. Như giáo sư Nguyễn Tài Cẩn trong cuốn Giáo trình lịch sử ngữ âm tiếng Việt (sơ
thảo) ñã chỉ ra rằng, tiếng Việt “là một ngôn ngữ thuộc nhóm Việt Mường, tiểu chi Việt-
Chứt (vẫn thường gọi là tiểu chi Việt-Mường) nằm trong khối Việt-Katu thuộc khu vực
phía ðông của ngành Mon-Khmer, họ Nam Á” [1, trang 332], cho dù trong một quãng
thời gian sau này tiếng Việt có mối quan hệ và ảnh hưởng sâu ñậm với tiếng Hán, nhưng
ñó chỉ là quan hệ tiếp xúc chứ không phải quan hệ thân thuộc.
Tuy nhiên, ngoài quan ñiểm chính thống ñó, tiếng Việt còn ñược nhiều học giả
khác xếp vào các ngữ hệ khác nhau, do bởi trong quá trình sinh sống và di trú của cư
dân Việt cổ, tổ tiên chúng ta ñã tiếp xúc và vay mượn rất nhiều các ngôn ngữ trong khu


vực. Tiêu biểu như học giả người Pháp H. Maspéro trong công trình Nghiên cứu lịch sử
ngữ âm tiếng An Nam-Các âm ñầu (Étude sur la phonétique historique de la langue
Annamite. Les initiales, 1912) sau khi nghiên cứu tiếng Hán Việt, tiếng Mường, tiếng
Thái và một số ngôn ngữ Môn-Khmer khác ñã ñưa ra nhận xét rằng “hệ thống thanh
ñiệu làm cho tiếng Việt khác với các ngôn ngữ Môn-Khmer và ñó là một căn cứ quan
trọng ñể tách nó ra khỏi các ngôn ngữ Môn-Khmer ñược biết ñến như là những ngôn
ngữ không thanh ñiệu. Hệ thống thanh ñiệu của tiếng Việt ñã ñược hình thành dựa trên
những nguyên tắc chung như trong tiếng Hán, tiếng Thái và ngôn ngữ Tạng Miến,
nhưng nó thống nhất với hệ thanh của tiếng Thái cổ, tiếng Việt phải ñược quy vào họ


46
Thái” [1, trang 336]. Có rất nhiều nhà ngôn ngữ học tán thành quan ñiểm này như
W.Schmidt (1926), K.Wuff (1934), R.Shafer (1942)… Nhà ngôn ngữ học trứ danh
Trung Quốc Vương Lực cũng theo quan ñiểm này. Năm 1939 ông ñến Hà Nội nghiên
cứu tiếng Việt, sau ñó ra mắt công trình Nghiên cứu tiếng Hán Việt. Do chịu ảnh hưởng
sâu sắc của lớp từ Việt gốc Hán trong tiếng Việt nên Vương Lực ñã xếp tiếng Việt vào
“ngữ hệ Hán Tạng, ngữ tộc Hán Thái” [2, trang 25].
Một nhà nghiên cứu khác là Bình Nguyên Lộc ñã xếp tiếng Việt vào họ ngôn
ngữ Nam ðảo. Trong hai cuốn Nguồn gốc Mã Lai của dân tộc Việt Nam (Sài Gòn,
1972) và Lột trần Việt ngữ (Sài Gòn, 1973) ông ñã có sự so sánh tương ứng giữa từ
vựng tiếng Việt với các ngôn ngữ khác nhau trong họ Nam ðảo, từ ñó nhiều lần ñưa ra
kết luận tiếng Việt “ñã mượn ñến 40% danh từ của Mã Lai Nam Dương” [3, trang 383].
Tuy các quan ñiểm trên có nhiều mức ñộ ñúng sai khác nhau, nhưng chính
những nhận ñịnh này khiến chúng ta khi ñặt vấn ñề xác minh nguồn gốc tiếng Việt
không thể không xét ñến các yếu tố Tày-Thái, yếu tố gốc Hán và cả yếu tố Nam ðảo
trong lớp từ vựng cơ bản tiếng Việt ngày nay. Vấn ñề ñặt ra ở ñây là sử dụng phương
pháp nào trong việc xác ñịnh nguồn gốc tiếng Việt? Bởi ñối với bất kỳ một loại ngôn
ngữ nào, ba hệ thống lớn ngữ âm, từ vựng, ngữ pháp và các tiểu hệ thống của nó ñều có
sự diễn biến khác nhau trong lịch sử, có yếu tố ñược bảo toàn lâu dài bên cạnh những

yếu tố bị mất ñi và nhanh chóng ñược thay thế bằng những yếu tố khác, tuyệt ñối không
thể có sự ñồng ñều về mặt diễn biến ngôn ngữ. Do vậy, việc xác ñịnh cho ñược một
phương pháp nghiên cứu ñáng tin cậy là ñiều tối quan trọng.
2. Phương pháp nghiên cứu
“Mỗi một từ ñều có lịch sử của nó”, ñây là cách nhìn nhận của trường phái
Phương ngữ học (dialectology) [4, trang 315]. Nhận ñịnh này càng nghĩ càng thấy ñúng,
vấn ñề ñặt ra là chúng ta ñi nghiên cứu lịch sử của từ như thế nào? Trong các phương
pháp so sánh ñối chiếu hiện nay, phương pháp so sánh-lịch sử có thể giúp chúng ta phát
hiện ra sự thân thuộc giữa các ngôn ngữ về mặt cội nguồn. ðây là phương pháp thông
qua sự ñối sánh về mặt ngữ âm, từ vựng và ngữ pháp giữa hai hoặc nhiều phương ngữ
hoặc các ngôn ngữ thân thuộc ñể rút ra quy luật diễn biến, từ ñó xác ñịnh nguồn gốc của
một ngôn ngữ. Phương pháp này dựa trên yếu tố tĩnh của sự phân bố từ vựng ñể xem
xét yếu tố ñộng của quá trình diễn biến từ, như sự sản sinh từ mới nghĩa mới, sự tiêu
vong lớp từ cũ nghĩa cũ… Ngoài ra, phương pháp này cũng xem xét ñặc ñiểm phân bố
về mặt ñồng ñại và quy luật diễn biến về mặt lịch ñại các từ mục trong nhóm từ có
trường nghĩa.
Do vậy, phương pháp phân tích trường nghĩa cũng không thể thiếu khi xác ñịnh
nguồn gốc từ. F. de Saussure trong Giáo trình ngôn ngữ học ñại cương ñã chỉ ra hai
dạng quan hệ, ñó là quan hệ ngang (quan hệ tuyến tính, quan hệ ngữ ñoạn) và quan hệ
dọc (quan hệ liên tưởng, quan hệ hệ hình). Theo hai dạng quan hệ ñó có thể có hai loại


47
trường nghĩa: trường nghĩa ngang (trường nghĩa tuyến tính) và trường nghĩa dọc (trường
nghĩa liên tưởng). Chúng ta nên sử dụng trường nghĩa dọc (bao gồm trường nghĩa biểu
vật và trường nghĩa biểu niệm) ñể khảo sát và xác ñịnh từ nguyên. A.G.Haudricourt khi
phân tích một nhóm từ cụ thể (nhóm từ chỉ bộ phận cơ thể như mắt, tai mũi, miệng,
răng, lưỡi, cổ, tay…) ñã cho thấy “sự tương ứng về từ vựng cơ bản giữa tiếng Việt và
các ngôn ngữ Môn-Khmer là sự tương ứng mang tính bản chất cội nguồn, khác với sự
tương ứng giữa tiếng Việt với các ngôn ngữ Thái” [5, trang 96]. ðể xác ñịnh giữa các

ngôn ngữ có quan hệ ñồng nguyên ñồng tộc, thì phải có một số lượng từ ñồng nguyên
ñáng kể ñể chứng minh. Ngôn ngữ học lịch sử (historical linguistics) dựa lớp từ vựng cơ
bản ñó so sánh ñối chiếu ñể “quyết ñịnh những ngôn ngữ nào cùng có chung một tổ tiên,
và do ñó, có những ngữ hệ nào, tiến hành phục nguyên ñể vạch ra ñặc tính của cái ngôn
ngữ gốc không ñược ghi (các tiền ngôn ngữ), nhận diện những thay ñổi khác nhau khiến
mỗi ngôn ngữ mẹ phân tách thành một số ngôn ngữ con” [6, trang 294]. A. G.
Haudricourt cũng từng nhấn mạnh trong trường hợp xếp loại nguồn gốc tiếng Việt “cái
quyết ñịnh là từ vựng cơ bản” [7, trang 20]. Tuy nhiên, việc xác ñịnh cho ñược ñâu là
lớp từ vựng cơ bản, ñâu là lớp từ vựng vay mượn hay từ vựng văn hóa thực sự không dễ
dàng. Do bởi trong quá trình phát triển, có rất nhiều ngôn ngữ ñã bị phân hóa thành
nhiều nhóm, nhiều dòng ngôn ngữ khác nhau. Tiếng Việt cũng không ngoại lệ. Công
việc của các nhà ngôn ngữ học lịch sử là truy nguyên ngôn ngữ ñược cho là ngôn ngữ
nguồn ñó, là “bà mẹ” sản sinh ra các dòng ngôn ngữ sau này, từ ñó tiến hành quy nạp
chúng vào những chi, những họ, những ngành khác nhau dựa trên mức ñộ thân thuộc
nhiều hay ít. Khi tiến hành nghiên cứu so sánh-lịch sử, nếu chúng ta chưa xác ñịnh ñược
ñâu là cội nguồn, ñâu là vay mượn trong nhóm từ vựng giống nhau giữa hai hay nhiều
ngôn ngữ, thì chưa ñủ ñiều kiện ñể xác ñịnh quan hệ họ hàng thân thuộc giữa chúng.
Tuy nhiên, A. G. Haudricourt cũng thừa nhận các ngôn ngữ không có biến hóa hình thái
như tiếng Việt cũng có sự vay mượn từ vựng cơ bản. Do vậy, các nhà nghiên cứu muốn
ñạt ñược mục ñích phân loại trong số những từ tương ứng giữa hai hay nhiều ngôn ngữ,
từ nào mang tính cội nguồn, từ nào mang tính vay mượn, thì phải xem xét chúng theo
từng nhóm từ vựng có ý nghĩa trọn vẹn, tức là sử dụng phương pháp phân tích trường
nghĩa như ñã nói ở trên.
3. Bảng 100 từ cơ bản của Swadesh
Morris Swadesh (1909-1967) là nhà ngôn ngữ học người Mỹ. Ông ñề nghị
phương pháp xác ñịnh thời gian tách rời (length of separation) của hai ngôn ngữ cùng
một nguồn, bằng cách tìm ra bao nhiêu từ thay ñổi khi so sánh số vốn từ căn bản. ðây
cũng là nền tảng của một ngành ngôn ngữ học mới gọi là Glottochronology (môn học
xác ñịnh tuổi của ngôn ngữ), hay còn gọi là “phương pháp Ngữ thời học, vắn tắt hơn là
phương pháp Swadesh” [8, trang 8]. Chính phương pháp này ñã ñưa ngôn ngữ học, một

ngành theo truyền thống khoa học nhân văn, trở nên một ngành ngôn ngữ ñịnh lượng
(quantitative linguistics) và ñem môn này ñến gần các ngành khoa học chính xác khác.


48
GS. Nguyễn Tài Cẩn trong giáo trình Lịch sử ngữ âm tiếng Việt (sơ thảo) ñã vận
dụng có phê phán phương pháp Swadesh, ñó là phương pháp xuất phát từ quan niệm
cho rằng, qua thời gian, việc thay thế từ vựng cơ bản cổ bằng từ vựng mới là một việc
xảy ra theo quy luật chung cho mọi ngôn ngữ. Theo sự thống kê và tính toán trên một số
lượng rất nhiều ngôn ngữ, phương pháp này ñưa ra cách xác ñịnh như sau: cứ qua 1000
năm thì số lượng từ trong kho từ vựng cơ bản của một ngôn ngữ sẽ bị mất ñi 15%, chỉ
còn lại 85%. Như vậy, nếu hai ngôn ngữ hay hai phương ngữ A, B cùng gốc tách nhau
khoảng 1.000 năm, thì trong bảng từ vựng chúng chỉ còn giữ lại 74% là chung
(85%85%=74%); nếu tách nhau 2.000 năm, thì số từ vựng chung còn lại chiếm
khoảng 55% (74%74%=55%); tách nhau 4.000 năm, thì số từ vựng chung còn lại chỉ
chiếm khoảng 30% (55%55%=30%); tách nhau 8.000 năm, thì số từ vựng chung còn
lại càng ít hơn, chỉ chiếm khoảng 9% (30%30%=9%). Qua hơn 8000 năm thì lượng từ
cơ bản chung sẽ rút ñi tới mức không thể xác lập nổi mối quan hệ nguồn gốc giữa hai
ngôn ngữ nữa.
Swadesh năm 1952 ñề xuất ra Bảng 200 từ cơ bản. 200 từ này có ñược trên cơ
sở ông phân tích, quy nạp các ngôn ngữ ở châu Âu, châu Mỹ, châu Phi và châu Úc. Ban
ñầu ông cho rằng 200 từ này là lớp từ cơ bản ổn ñịnh nhất trong tất cả các ngôn ngữ,
nhưng trong quá trình nghiên cứu sau ñó, ông nhận thấy có khá nhiều từ trong Bảng có
thể vay mượn qua lại lẫn nhau, vì thế năm 1955 ông rút gọn lại chỉ còn 100 từ cơ bản. Ý
ñồ của ông là muốn có một ranh giới dứt khoát giữa vấn ñề vay mượn hay không vay
mượn, tuy nhiên sau này theo khảo sát của một số nhà nghiên cứu thì trong Bảng 100 từ
này vẫn có một số từ có thể vay mượn, nhưng ít hơn nhiều so với Bảng 200 từ. Có thể
nói Bảng 100 từ cơ bản ñã xác ñịnh ñược lớp từ vựng ổn ñịnh nhất trong mọi ngôn ngữ
và ñã trở thành Bảng 100 từ thông dụng trên thế giới khi khảo sát nguồn gốc từ. Vì vậy
ứng dụng Bảng 100 từ cơ bản của Swadesh vào truy nguyên gốc tích tiếng Việt sẽ trở

nên thuận tiện hơn cho các nghiên cứu khi so sánh ñối chiếu với Bảng 100 từ cơ bản của
các ngôn ngữ khác mà ñã ñược khảo sát trước ñó. ðiều cần lưu ý là do Swadesh chỉ
khảo sát các ngôn ngữ Ấn Âu. Vì vậy, khi áp dụng vào các ngôn ngữ vùng châu Á nói
chung và ðông Nam Á nói riêng, nơi liên tục xảy ra các cuộc di cư và hội tụ của các tộc
người, nơi mà sự tiếp xúc giữa các chi nhóm ngôn ngữ là xảy ra thường xuyên và lâu
dài, thì khi áp dụng phương pháp này ñòi hỏi phải nghiên cứu trên quan ñiểm so sánh ña
ngữ thì mới có cái nhìn khoa học hơn về nguồn gốc tiếng Việt.
F. de Saussure trong Giáo trình ngôn ngữ học ñại cương (1916) cũng ñã dành
một chương Ngôn ngữ học ñịa lý phân tích khá rõ nguyên nhân tạo nên sự khác biệt
trong lịch sử diễn biến ngôn ngữ, ñó là tìm hiểu những vấn ñề ñịa lý liên quan tới nó.
Bởi vì, “mối liên hệ giữa lịch sử phát triển, tức mặt thời gian, với môi trường phát triển,
tức mặt không gian, là một liên hệ có tính bản chất của bất kỳ một sự phát triển nào” [9,
trang 334]. Như ñã nói ở trên, do hiện nay nhận thức chung của ña số các nhà ngôn ngữ
là tiếng Việt thuộc ngữ hệ Nam Á, do ñó, dấu vết từ vựng của họ ngôn ngữ này trong


49
tiếng Việt ñược coi là cội nguồn, các ngôn ngữ khác chỉ ñược coi là ngôn ngữ láng
giềng chứ không phải là ngôn ngữ thân thuộc. Quan hệ giữa tiếng Việt với các ngôn ngữ
láng giềng này chỉ là quan hệ tiếp xúc vay mượn lẫn nhau, do vị trí ñịa lý quá gần nhau,
và những sự tiếp xúc lâu dài giữa cư dân các vùng miền xảy ra trong một thời gian dài.
Tuy nhiên, cũng chính vì ñiều này mà khiến cho lớp từ vựng ñược coi là vay mượn ñôi
khi thực sự rất khó xác ñịnh, vô hình trung ñược coi là yếu tố cội nguồn. Ví dụ như theo
một số kết quả nghiên cứu hiện nay, thì chúng ta có thể nhận ñịnh rằng tiếng Việt-
Mường ñã từng có những sự tiếp xúc lâu dài với các ngôn ngữ thuộc họ Nam ðảo.
Chứng cứ của sự tiếp xúc này là trong vốn từ tiếng Việt hiện nay vẫn còn một lớp từ rất
cổ xưa có nguồn gốc Mã Lai-ða ñảo (xem thêm mục 4.3). Bởi vì thời gian tiếp xúc quá
xa xưa, vì vậy khó có thể kết luận ngôn ngữ nào vay mượn ngôn ngữ nào, và cũng khó
có thể nói những từ rất cơ bản, rất cổ xưa ấy là những từ vay mượn chứ không phải là từ
cơ bản. ðây chính là khó khăn lớn nhất, gây nhiều tranh cãi nhất khi xác ñịnh nguồn

gốc tiếng Việt, và sự tranh cãi trong gần suốt 200 năm này thậm chí cho ñến giờ xem ra
vẫn còn chưa ngã ngũ…
Từ lúc lý thuyết của Swadesh ra ñời ñã có những khảo cứu từ những ngôn ngữ
khác nhau trên thế giới cho thấy kết quả tương ñối khả quan và hiện ñang ñược sử dụng
vì có một số lợi ích thiết thực và thành tựu ñáng kể. Tuy nhiên cũng có nhiều tranh luận
về các tiền ñề cơ bản của lý thuyết này, như tốc ñộ thay ñổi của ngôn ngữ không luôn
ñều ñặn. Có quá nhiều yếu tố ảnh hưởng ñến sự thay ñổi của ngôn ngữ như các biến cố
lịch sử xã hội (chiến tranh xâm lược, thôn tính ñất ñai, các cuộc cách mạng…), vì vậy
mốc thời gian thay ñổi không thể là một hằng số. Mặc dù vậy, Bảng 100 từ cơ bản của
Swadesh có thể ñược coi là Bảng chuẩn hiện nay cho việc xác ñịnh từ vựng cơ bản của
tất cả các ngôn ngữ. Bảng này có thể tạm chia thành các nhóm sau:
a. Nhóm sự vật hiện tượng thiên nhiên
1. Mặt trời (sun); 2. Mặt trăng (moon); 3. Sao (star); 4. Nước (water); 5. Mưa
(rain); 6. Mây (cloud); 7. ðá (stone); 8. Cát (sand); 9. ðất (earth); 10. Núi (mountain);
11. ðường (path); 12. Lửa (fire); 13. Khói (smoke); 14. Tro (ash); 15. ðêm (night).
b. Nhóm bộ phận cơ thể người
16. ðầu (head); 17. Tóc (hair); 18. Mắt (eye); 19. Mũi (nose); 20 Răng (tooth);
21. Lưỡi (tongue); 22. Tai (ear); 23. Miệng (mouth); 24. Cổ (neck); 25. Tay (hand); 26.
Bụng (belly); 27. Vú (breasts); 28. Chân (foot); 29. Da (skin); 30. Tim (heart); 31. Gan
(liver); 32. Xương (bone); 33. ðầu gối (knee); 34. Máu (blood); 35. Thịt (flesh).
c. Nhóm ñộng thực vật
36. Chim (bird); 37. Cá (fish); 38. Chó (dog); 39 Chí/Rận (louse); 40. Cây (tree);
41. Hạt (seed); 42. Lá (leaf); 43. Gốc/Rễ (root); 44. Vỏ cây (bark); 45. Dầu/Mỡ
(grease); 46. Trứng (egg); 47. ðuôi (tail); 48. Sừng (horn); 49. Lông (feather); 50. Móng


50
(claw).
d. Nhóm ñộng tác
51. Ăn (eat); 52. Uống (drink); 53. Cắn (bite); 54. Nói (say); 55. Nhìn (see); 56.

Nghe (hear); 57. Biết (know); 58. Ngủ (sleep); 59. Chết (die); 60. Giết (kill); 61. ði
(walk); 62. Bay (fly); 63. Bơi (swim); 64. ðến (come); 65. Ngồi (sit); 66. ðứng (stand);
67. Nằm (lie); 68. Cho/Tặng (give); 69. ðốt (burn).
e. Nhóm tính chất trạng thái
70. Mới (new); 71. Tốt/ðẹp (good); 72. Nóng (hot); 73. Lạnh (cold); 74. ðầy
(full); 75. Khô (dry); 76. ðỏ (red); 77. Xanh (green); 78. Vàng (yellow); 79. Trắng
(white); 80. ðen (black); 81. To/Lớn (big); 82. Nhỏ/Bé (small); 83. Dài (long); 84.
Nhiều (many); 85. Tròn (round).
f. Nhóm còn lại
86. Một (one); 87. Hai (two); 88. Tôi (I); 89. Chúng tôi (we); 90. Anh/Bạn (you);
91. ðây/Này (this); 92. Kia/ðó (that); 93. Ai (who); 94. Gì/Cái gì (what); 95. Người
(person); 96. ðàn bà (woman); 97. ðàn ông (man); 98. Tên (name); 99. Không (not);
100. ðều/Toàn bộ (all).
4. Khảo sát sơ bộ sự tương ñồng giữa với tiếng Việt với các ngôn ngữ vùng ngữ hệ
ðông Nam Á trong Bảng 100 từ cơ bản
Trong quá trình tìm hiểu lịch sử tiếng Việt, có nhiều học giả ñã sử dụng lớp từ
vựng cơ bản ñể nghiên cứu quan hệ thân thuộc giữa hai hay nhiều ngôn ngữ có liên
quan, trong ñó ñại ña số những từ cơ bản ñược ñề xuất ñều có xuất hiện trong Bảng 100
từ cơ bản của Swadesh.
4.1. Chứng minh nguồn gốc Nam Á của tiếng Việt
H. Maspéro trong công trình nổi tiếng Nghiên cứu lịch sử ngữ âm tiếng An Nam.
Những phụ âm ñầu khi xem xét về mặt từ vựng cơ bản ñã chỉ ra rất nhiều từ trong tiếng
Việt tương ứng với tiếng Môn-Khmer, ví dụ các từ chỉ sự vật hiện tượng thiên nhiên
(ñất, núi, ñá, cát, mưa, gió, nước…), bộ phận cơ thể (chân, cằm, mặt, mũi, tóc, răng…),
tên súc vật, cỏ cây (cá, trâu, chí, chim, chó, thịt, cây, rễ, gốc, lúa…); các từ liên quan
ñến người (mẹ, bố, con, cháu, mày, nó…), các hành ñộng cơ bản (ñi, chạy, ngửi, chiên,
thui, cầm, cắn…); hệ số ñếm (một, hai, ba, bốn, năm). Tổng cộng ông ñã so sánh tất cả
185 từ tiếng Việt với các ngôn ngữ Môn-Khmer và các ngôn ngữ Thái và ông ñưa ra kết
luận có 87 từ là tương ñương với các ngôn ngữ Môn-Khmer và 98 từ còn lại thuộc ngôn
ngữ Thái. Giáo sư Trần Trí Dõi cho rằng những từ ông Maspéro dẫn ra không thuần túy

là những từ thuộc lớp từ cơ bản, mà có rất nhiều từ thuộc lớp từ văn hóa. Vì thế ông rút
gọn lại chỉ còn 39 từ tương ứng với các ngôn ngữ Môn-Khmer và 21 từ tương ứng với
các ngôn ngữ Thái, do ñó “chỉ có 60/187 từ ñược Maspéro sử dụng là những từ thuộc


51
lớp từ cơ bản của ngôn ngữ.”
[5, 83]
Qua kiểm tra thì hầu hết 60 từ này ñều nằm trong
Bảng 100 từ của Swadesh, rất thuận tiện cho chúng ta quy nạp, thống kê sau này.
GS. Nguyễn Ngọc San trong công trình Tìm hiểu tiếng Việt lịch sử từ trang 121
ñến 134 cũng ñã liệt kê ra hàng trăm từ có gốc Môn-Khmer qua các thời kỳ. So sánh với
Bảng 100 từ Swadesh (chưa tính các từ thuộc trường nghĩa) thì có ñến gần một nửa là
gốc Môn-Khmer. Kết quả này khá trùng khớp với khảo sát sơ bộ của chúng tôi với Bảng
100 từ sau khi so sánh ñối chiếu với rất nhiều ngôn ngữ thuộc nhóm Môn-Khmer là có
ñến hơn 50% từ vựng cơ bản có nguồn gốc Môn-Khmer. ðiều này càng củng cố thêm
quan ñiểm cho rằng tiếng Việt thuộc dòng Môn-Khmer trong ngữ hệ Nam Á.
4.2. Các từ có gốc Tày-Thái
Như ñã nói ở trên, Maspéro ñã chỉ ra trong tiếng Việt có khá nhiều từ cơ bản
tương ñương với tiếng Thái, chính vì thế mà ông ñã ñưa ra một kết luận lưỡng lự về
nguồn gốc tiếng Việt, ñó là “tiếng tiền Việt ñã sinh ra từ một sự hỗn hòa của một
phương ngữ Môn-Khmer, một phương ngữ Thái và có thể của cả một ngôn ngữ thứ ba
còn chưa biết, rồi sau ñó tiếng Việt ñã vay mượn một số lượng lớn những từ Hán.
Nhưng cái ngôn ngữ có ảnh hưởng quyết ñịnh ñể tạo ra cho tiếng Việt trạng thái hiện
ñại của nó (tức là có thanh ñiệu như ông nghiên cứu) là chắc chắn, theo ý tôi, một ngôn
ngữ Thái, và vì thế tôi nghĩ rằng tiếng Việt phải ñược xếp vào họ Thái” [5, trang 89].
Mặc dù quan ñiểm của Maspéro sau này ñã ñược A.G.Haudricourt chứng minh lại còn
nhiều khiếm khuyết nhưng ông cũng bước ñầu chỉ ra ñược một số từ gốc Thái trong
tiếng Việt. GS. Nguyễn Ngọc San cũng nhận ñịnh rằng, “sự hòa ñúc giữa tiếng Mon-
Khmer và tiếng Tày-Thái cổ ñã dần dần hình thành ra ngôn ngữ Việt Mường chung

trong ñó lưu lại một cơ tầng Tày-Thái ñáng kể. Tuy nhiên sự xác ñịnh nguồn gốc Tày-
Thái của các từ tiếng Việt không dễ dàng gì” [8, trang 135].
Theo nhận ñịnh của nhiều nhà ngôn ngữ học và dân tộc học thì những từ tiếng
Việt gốc Tày-Thái phần nhiều thuộc nền văn minh lúa nước. Tiêu biểu cho quan ñiểm
này là ý kiến của GS. Phạm ðức Dương, ông cho rằng “một ñiều hết sức quan trọng cần
nhấn mạnh là nếu nhìn vào lớp từ vựng cơ bản ngoài hệ thống từ chỉ các hoạt ñộng tự
nhiên, cơ thể và hoạt ñộng của con người, số ñếm… thì trong các ngôn ngữ tiền Việt-
Mường chỉ có từ chỉ văn hóa săn bắt, hái lượm và hệ thống canh tác nương rẫy, còn lớp
từ vựng về văn minh nông nghiệp lúa nước hoàn toàn không có. Trong khi ñó hệ thống
từ này trong ngôn ngữ Việt-Mường lại có chung một gốc với các ngôn ngữ Tày-Thái”
[10, trang 129-130].
Kết luận của GS. Phạm ðức Dương tuy nhận ñược nhiều ý kiến ñồng tình ủng
hộ nhưng cũng có ý kiến cho rằng chưa thực sự thuyết phục. Bởi vì ñể khẳng ñịnh từ
vựng phản ánh nền văn minh nông nghiệp lúa nước hoàn toàn không có trong các ngôn
ngữ thời kỳ tiền Việt-Mường thì cần phải thống kê ñầy ñủ và chứng minh thêm. GS.
Trần Trí Dõi cho rằng từ quan trọng nhất của văn mình lúa nước là từ “ruộng/ñồng” lại


52
có gốc gác thời kỳ tiền Việt-Mường. Từ việc phân tích nhiều từ vựng cơ bản khác ông
ñã nhận ñịnh rằng “tiếng Việt ở giai ñoạn tiền Việt-Mường dường như ñã có lớp từ vựng
về văn minh nông nghiệp lúa nước. Do ñó không thể chờ mãi ñến thời kỳ Việt-Mường
chung cộng ñồng cư dân Việt mới biết ñến kỹ thuật canh tác này.” [5, trang 230].
GS. Nguyễn Ngọc San còn cho biết thêm, “trong những bảng thống kê từ Tày-
Thái trước ñây người ta còn ñưa vào ñó những từ gốc Hán” [8, trang 137]. Sau khi loại
ra những từ gốc Hán, ông ñã ñưa ra danh sách hơn 100 các từ Việt gốc Tày-Thái. ðối
chiếu với Bảng 100 từ của Swadesh, thì số lượng từ trùng khớp chỉ có vài từ, ví dụ:
này\ñây, chóc (chim chóc), nhận (ra)/nhìn (thấy), tất (cả)/sất/tuốt; một số từ chỉ quan hệ
thân thuộc dùng cho xưng hô như: bố/bủ/bọ, mợ… ðiều này cho thấy kết luận của
Maspéro tiếng Việt có gốc Thái là hoàn toàn không chính xác. Chỉ có thể nói rằng,

chính yếu tố Tày-Thái ñã góp phần làm thay ñổi sâu sắc diện mạo văn hóa của người
Việt vào thời tiền sử và sơ sử, góp phần làm phong phú hơn những gì người Việt ñã có
từ thời kỳ văn hóa ðông Sơn.
4.3 Các từ có họ Nam ðảo
Ngữ hệ Nam ðảo (Austronesian) hay còn gọi là Mã Lai-ða ñảo (Malayo-
Polynesian) là một trong những họ ngôn ngữ lớn, phân bố ở quần ñảo Indonesia,
Philippines, một số khu vực ở ðông Dương, ðài Loan, Châu ðại Dương Có khoảng
800 ngôn ngữ khác nhau thuộc họ Nam ðảo. Ở Việt Nam, ngôn ngữ của 5 dân tộc
Chăm, Êñê, Gia Rai, Ra Glai, Churu cư trú ở các tỉnh Nam Trung Bộ và Cao nguyên
Trung bộ thuộc ngữ hệ này. Trong khi ñó ở khu vực này còn cư trú các dân tộc Kơ Ho,
Mnông, Xtiêng, Mạ, Chơ Ro, Ba Na, Xơ ðăng, Hrê…, ngôn ngữ các dân tộc này lại
thuộc họ Nam Á. Chính vì ñịa bàn cư trú của các dân tộc ñan xen với nhau, vì thế có rất
nhiều từ tương ñồng giữa chúng khiến cho việc phân ñịnh rạch ròi nguồn gốc ngôn ngữ
hoàn toàn không hề ñơn giản.
Như ñã nói ở phần 3, tiếng Việt ñã có quá trình tiếp xúc lâu dài với những ngôn
ngữ Nam ðảo lên ñến hàng ngàn năm, vị trí ñịa lý gần nhau, cư dân sinh sống xen kẽ
với nhau, vì thế những từ vay mượn giữa chúng không thể không có. Ngoài số lượng
175 từ gốc Mã Lai do Bình Nguyên Lộc liệt kê và so sánh (nhưng ông không phân biệt
nhóm dân tộc nào là Nam ðảo, nhóm nào là Nam Á), thì năm 1992, trong bài báo Từ
Nam Á trong tiếng Việt, tác giả Hồ Lê với cách làm tương tự (cho rằng các từ thuần Việt
gồm các ngôn ngữ Môn-Khmer lẫn các ngôn ngữ Nam ðảo và ngôn ngữ Thái) ñã liệt kê
ra 193 từ tiếng Việt mà theo ông ñều là từ thuần Việt, trong ñó có khá nhiều từ có trong
Bảng 100 từ Swadesh, ví như: anh/eng (Danaw: êl, Riang: êq, Palaung: yêo, Wa: eql, Vu,
Son Tailoi: êk); ăn (Khmer: chya, Palaung: ham, Sakai: chaa, Xơñăng, Kơho, Bahna: sa,
Khasi: bsa, Laha: ăn/kuôn, Thái: kun, Li: khan, Indonesia: pangan…) [11, trang 110].
Theo khảo sát sơ bộ của chúng tôi, trong Bảng 100 từ Swadesh, có ít nhất 20-25
từ có nguồn gốc Nam ðảo. Một số ví dụ tiêu biểu:


53

Mặt trời (sun). Tiếng Indonesia: mata hari, tiếng Aceh: mata ur , tiếng Malay-
Tagalog (PMT): mata haraj… có ý nghĩa so sánh “mắt của trời”. [12, trang 116]

“Mặt
trời” trong tiếng Việt là một trong số ít những từ cơ bản song tâm tiết, ñọc trại của “mắt
trời”, bảo lưu ý nghĩa của nhóm ngôn ngữ này. Tiếng Kam-Tai (PKT) ñọc là *pra*blan,
cũng vay mượn ý nghĩa “mắt trời” từ tiếng Nam ðảo [4, trang 248].
Mặt trăng (moon). “Mặt trăng” trong tiếng Việt là cách nói dựa theo từ “mặt
trời”, thực ra nó vốn là từ ñơn âm tiết “trăng”. Tiếng Indonesia: bulan, tiếng Aceh:
bul , tiếng Gialai: blan, PMT: bulan, PKT *C-blin [12, trang 117].

GS. Ngô An Kỳ
sau khi phân tích các âm song tiết *pl-, *bl-, *m-l- trong tiếng ðồng ðài và Nam ðảo
cổ với âm ñơn *N- trong tiếng Hán Thượng cổ còn ñưa ra nhận ñịnh rằng “từ 月*Nat
(nguyệt, mặt trăng) có thể có nguồn gốc từ tiếng ðồng ðài, Nam ðảo”, từ ñó rút ra kết
luận “tiếng Kam-Tai nguyên thủy *C-blin cũng có thể xuất phát từ âm tiếng Nam ðảo
cổ” [4, trang 315].


Ngoài ra, theo khảo sát của chúng tôi, còn có một từ cơ bản khác có thể có
nguồn gốc từ tiếng Nam ðảo như: bụi, ñường, núi, ñêm, tai, mắt, lưỡi, bụng, trứng,
uống, ăn, cắn, mất, ñứng, ni (này)… Như vậy, số lượng từ gốc Nam ðảo trong Bảng
100 từ Swadesh là khá lớn, có thể chiếm tới 20-25%, ñiều này phản ánh ñúng thực tế
như GS. Trần Trí Dõi chứng minh là vào giai ñoạn phát triển ñầu tiên trong lịch sử tiếng
Việt (cách ñây khoảng 1.000 năm trước Công nguyên cho ñến những thế kỷ ñầu sau
Công nguyên), lúc tiếng tiền Việt-Mường tách ra khỏi khối Môn-Khmer ñể có một lịch
sử phát triển riêng, thì tiếng tiền Việt-Mường ñã có tiếp xúc với các ngôn ngữ thuộc họ
Nam ðảo. Và ông có nhận ñịnh thêm là “tính chất nhập nhằng khiến người ta khó xác
ñịnh ngôn ngữ nào vay mượn ngôn ngữ nào. Trong tương lai, khi thuần túy xem xét từ
vựng lịch sử tiếng Việt, chắc chắn ñây sẽ là một vấn ñề thú vị nhưng cũng sẽ ñầy rẫy

khó khăn” [5, trang 162].

4.4. Các từ gốc Hán
Như ñã nói ở trên, khi khảo sát nguồn gốc tiếng Việt, chúng ta không nên chỉ so
sánh song ngữ mà phải ñặt nó trong mối quan hệ ña ngữ, ña chiều, ở ñây là các thứ tiếng
Mon-Khmer, tiếng Tày-Thái, tiếng Nam ðảo và thậm chí cả tiếng Hán. Tuy tiếng Hán
cũng như tiếng Thái chỉ du nhập vào tiếng Việt ở thời kỳ thứ hai của lịch sử phát triển
tiếng Việt (thế kỷ I sau Công nguyên cho ñến khoảng thế kỷ VIII-IX), nhưng cũng ñã
hình thành một lớp từ mà ñược các nhà nghiên cứu gọi là từ Hán-Việt cổ hay cổ Hán-
Việt, và “ñiều cần chú ý là những từ vay mượn tiếng Hán vào thời kỳ này cũng dường
như là những từ khá cơ bản trong vốn từ tiếng Việt. Chẳng hạn ñó là những từ như ñầu,
mả, mùa, mùi, buồng, bến, buồm…” [5, trang 172].

Khảo sát trong Bảng 100 từ
Swadesh thì chỉ có trên dưới 10 từ là có gốc Hán. Ví dụ khi khảo sát 2 ñại từ nhân xưng
Tôi (I) và Chúng tôi (we) trong bảng 100 từ, chúng tôi nhận thấy chúng có những mối
tương quan như sau:


54
ðại từ nhân xưng ngôi thứ nhất số ít “I” trong tiếng Việt có những cách nói “tôi,
ta, tau, tớ ”. Trong ñó “Tôi” (ñọc trại “tui”) tương ứng với [tai2]-[dai4] và “tớ”
tương ứng với 卒[zu2], hai ñại từ nhân xưng ngôi thứ nhất trong tiếng Quảng ðông
(Cantonese) và tiếng Khách Gia (còn gọi tiếng Hẹ, Hakka), hai ngôn ngữ thuộc ngữ hệ
Hán Tạng. Ý nghĩa của hai từ này cũng tương ñồng với ý nghĩa gốc của từ “tôi tớ” trong
tiếng Việt. ðịa bàn cư trú của những tộc người này cũng gần sát Việt Nam, nằm trong
mối tương quan Bách Việt ngày xưa. Tiếng Mường ñọc là [thôi] (bật hơi), tiếng Hmong
ñọc là [Tub] (b chỉ âm cao, tương tự dấu sắc trong tiếng Việt).
ðại từ nhân xưng ngôi thứ nhất số nhiều “we” trong tiếng Việt có những cách
nói “chúng tôi, chúng ta, chúng tao, chúng tớ”; “bọn tôi, bọn tao…”; “tụi tao…”

Trong ñó các tiền tố như “chúng”, “bọn” và có thể cả “tụi” là có nguồn gốc từ tiếng Hán.
Chúng 众: tiếng Khách Gia [chung]; Bọn 帮: tiếng Quảng ðông [bong]; Tụi 隊: tiếng
Khách Gia [tui]…
Hay như các từ ñầu, tim, gan (ñọc trại từ tâm, can), ông (ñàn ông), bà (ñàn
bà)… là những từ vay mượn gốc Hán, nhưng ñây rõ ràng là những từ thuộc lớp từ rất cơ
bản. Tuy nhiên khi xét về mặt trường nghĩa thì chúng ñều chưa mang tính hệ thống, ñối
chiếu với Bảng 100 từ thì số lượng cũng rất ít, vì vậy những nhận ñịnh tiếng Việt có
nguồn gốc Hán-Tạng là hoàn toàn không chính xác, mặc dù trong tiếng Việt ngày nay
có hơn 70% số lượng từ vựng là từ Hán-Việt, nhưng những từ này rõ ràng thuộc lớp từ
vựng văn hóa mới du nhập vào tiếng Việt ở những giai ñoạn muộn hơn, chứ không
thuộc lớp từ vựng cơ bản.
5. Kết luận
Do khuôn khổ bài báo có hạn nên chúng tôi không thể liệt kê và phân tích chi
tiết từ nguyên của 100 từ cơ bản trong Bảng từ Swadesh. Tuy nhiên dựa vào kết quả
nghiên cứu của các học giả ñi trước cũng như sự so sánh ñối chiếu mới nhất sau này, có
thể tạm ñưa ra những nhận ñịnh như sau:
Với số lượng áp ñảo trên 50% từ cơ bản trong Bảng 100 từ Swadesh có gốc tích
từ các ngôn ngữ trực hệ của dòng Môn-Khmer, những kết luận tiếng Việt có nguồn gốc
chính thuộc họ Nam Á, dòng Môn-Khmer là hoàn toàn có cơ sở thuyết phục. Mở rộng
ra nghiên cứu thêm Bảng 200 từ cơ bản của Swadesh, chúng ta có thể nhận thấy số
lượng các từ này vẫn chiếm ña số. Có thể nói, những từ gốc Môn-Khmer trong lớp từ
vựng cơ bản tiếng Việt hiện nay là khá nhiều và là nền tảng cơ bản của tiếng Việt. GS.
Nguyễn Ngọc San còn nhận ñịnh thêm rằng, “ñể tái lập nhằm khẳng ñịnh nguồn gốc
những từ gốc Mon-Khme trong tiếng Việt, người ta có thể sử dụng ñến phương pháp
Ngữ thời học, thậm chí có thể ñi ngược nguồn gốc quá thời Mon-Khme lên tới Nam Á.
Tất nhiên số từ gốc Nam Á vừa chung cho Mon-Khme vừa chung cho các tiểu chi khác,
ví dụ số ñếm như một, hai, ba, bốn và các từ như bay, bú, mũi, mắt, mày (ñại từ)…” [8,
trang 118].

Như vậy GS. Nguyễn Ngọc San cũng ñã bước ñầu áp dụng phương pháp



55
Swadesh trong việc xác ñịnh nguồn gốc từ vựng, tuy không nói rõ cụ thể là so sánh với
Bảng 100 từ hay Bảng 200 từ, nhưng ñối chiếu với những từ cơ bản ông ñưa ra thì thấy
chúng ña phần có xuất hiện trong Bảng thống kê của Swadesh.
Một nguồn gốc khác của từ vựng tiếng Việt mà chúng ta không thể không nhắc
tới là lớp từ có gốc Nam ðảo cổ. Với số lượng khoảng 25% từ cơ bản có xuất hiện trong
Bảng 100 từ, mốc thời gian của chúng cũng xa xưa như lớp từ gốc Nam Á, và hơn nữa
ñều thuộc những từ rất cơ bản của ngôn ngữ. Vì thế chúng ta khó có thể quy chúng vào
lớp từ vay mượn hay lớp từ văn hóa. Nhận ñịnh chính xác về diện mạo lớp từ này ñòi
hỏi chúng ta phải có sự so sánh ñối chiếu nhiều hơn với các ngôn ngữ trực hệ của ngữ
hệ Nam ðảo có liên quan ñến tiếng Việt, ví dụ tiếng Chăm chẳng hạn. Chúng ta ít khi
nhắc tới sự liên quan hay vay mượn giữa tiếng Việt và tiếng Chăm, có chăng là những
ñịa danh gốc Chăm còn tồn tại trên lãnh thổ Việt Nam, phần nhiều nằm ở vùng Nam
Trung Bộ. Tuy nhiên, thử ñi sâu vào so sánh một số từ trong Bảng 100 từ với từ gốc
Chăm, ví dụ: bay (Chăm: pơr), môi (Chăm: cabôi)… chúng ta có thể thấy giữa chúng có
những sự tương ứng khá thú vị. Việc nhận ñịnh ñúng ñắn bản chất của những sự tương
ứng này sẽ giúp chúng ta hiểu rõ hơn lịch sử của tiếng Việt trong mối tương quan với
tiếng Nam Á và Nam ðảo.
Sự du nhập của lớp từ vựng gốc Tày-Thái và gốc Hán vào tiếng Việt cũng muộn
hơn so với gốc Môn-Khmer và gốc Nam ðảo, chiếm thiểu số trong Bảng 100 từ. ðiều
này cho thấy rằng, ñây là lớp từ vay mượn sau này. Tuy nói là vay mượn nhưng xét về
bản chất cũng là những từ chỉ những khái niệm cơ bản trong vốn từ của một ngôn ngữ
(có lẽ ñó là lý do mà chúng có xuất hiện trong Bảng 100 từ cơ bản của Swadesh). Có
một ñiều mà hiện các nhà nghiên cứu vẫn còn ñang tranh luận là ngôn ngữ nào vay
mượn của ngôn ngữ nào. Ví dụ như pnar (cái ná) vốn thuộc gốc Nam Á. Từ này tiếng
Hán ñã vay mượn khá sớm, viết là 弩, lúc này tiếng Hán chỉ có nguyên âm a tròn môi
nên phải ñọc từ trên thành [no], từ này lúc du nhập lại vào tiếng Việt thì tạo ra từ “nỏ”
bên cạnh từ “ná” ñã có. Sau thế kỷ thứ X từ này lại ñược ñọc theo âm Hán Việt tạo ra từ

“nỗ” [8, trang 116].


Trong quá trình tìm hiểu lịch sử tiếng Việt, chúng ta không nên bỏ qua các
phương ngữ ở Việt Nam, vì ñây là những nguồn cứ liệu sinh ñộng và phong phú cho
công tác nghiên cứu. Trong ñó, các phương ngữ như Bắc Trung Bộ chẳng hạn, là
“nguồn cung cấp tư liệu giúp chúng ta có cơ sở chắc chắn ñể giải thích nhiều hiện tượng
có từ thời Việt-Mường” [5, trang 135].

Ví dụ khi khảo sát Bảng 100 từ, chúng ta cần mở
rộng ra khảo sát thêm các từ ñịa phương khác, chẳng hạn như: cây-kơn, chí-chấy, ñầu-
trốc, này-ni…
Kết hợp nhiều phương pháp nghiên cứu khác với việc ứng dụng Bảng 100 từ cơ
bản của Swadesh sẽ cho chúng ta cái nhìn khoa học hơn, toàn diện hơn về sự hình thành
vốn từ cơ bản trong tiếng Việt, về những phương pháp sản sinh từ cũng như sự diệt
vong của một lớp từ cổ trong một giai ñoạn nào ñó của lịch sử tiếng Việt. Trên cơ sở ñó,


56
chúng ta sẽ có những nhận ñịnh sâu sắc hơn, chính xác hơn về bình diện Từ nguyên học
(etymology) tiếng Việt cũng như xu hướng phát triển của tiếng Việt sau này.
TÀI LIỆU THAM KHẢO
[1]. Nguyễn Thiện Giáp, Lược sử Việt ngữ học, tập I, Nxb. Giáo dục, 2008.
[2]. 王力,
汉语史稿
, 中华书局, (Vương Lực, Hán ngữ sử cảo, Trung Hoa thư cục), 2002.
[3]. Bình Nguyên Lộc, Nguồn gốc Mã Lai của dân tộc Việt Nam, Nxb. Lá Bối, Sài Gòn,
1975.
[4]. 吴安其,
汉藏语同源研究

, 中央民族大学出版社, (Ngô An Kỳ, Hán Tạng ngữ ñồng
nguyên nghiên cứu, Trung ương Nhân dân ðại học Xuất bản xã), 2002.
[5]. Trần Trí Dõi, Giáo trình lịch sử tiếng Việt (sơ thảo), Nxb. ðại học Quốc gia Hà Nội,
2007.
[6]. Nguyễn Thiện Giáp, 777 Khái niệm Ngôn ngữ học, Nxb. ðại học Quốc gia Hà Nội,
2010.
[7]. A. G. Haudricourt, Vị trí của tiếng Việt trong các ngôn ngữ Nam Á, Ngôn ngữ, số 1,
1991.
[8]. Nguyễn Ngọc San, Tìm hiểu tiếng Việt lịch sử, Nxb. ðại học Sư phạm Tp HCM, 2003.
[9]. Ferdinand de Saussure, Giáo trình ngôn ngữ học ñại cương (1916), Nxb. Khoa học Xã
hội, Hà Nội, 1973.
[10]. Phạm Ngọc, Phạm ðức Dương, Tiếp xúc ngôn ngữ ở ðông Nam Á, Viện ðông Nam
Á xuất bản, Hà Nội, 1983.
[11]. Hồ Lê, Từ Nam Á trong tiếng Việt, Tiếng Việt và các ngôn ngữ dân tộc phía Nam, Nxb.
Khoa học Xã hội, Hà Nội, 1992.
[12]. 吴安其,
南岛语分类研究
, 商务印书馆, 北京, (Ngô An Kỳ, Nam ðảo ngữ phân loại
nghiên cứu, Thương Vụ ấn thư quán, Bắc Kinh), 2009.

SYSTEMATICALLY IDENTIFYNING THE HISTORY OF VIETNAMESE
FORMATION BY APPLYING “SWADESH 100-WORD LIST”
Vo Trung Dinh
College of Foreign Languages, Hue University
SUMMARY
The “Swadesh 100-word list” is the most common kernel word list in the world.
Applying this word list to researching Vietnamese etymology, we could find out the relationship


57

between Vietnamese and some other languages in Asia such as those belonging to the
Austroasiatic, Austronesian and Sino-Tibetan families. In fact, these 100 kernel words are 100
concepts, from which we could gather thousands of basic vocabulary in Vietnamese as a
foundation, so that we would take an overall and more exact vision on the history of Vietnamese
formation.

×