Tải bản đầy đủ (.doc) (128 trang)

Đồng cấu âm trong tiếng việt 1

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.81 MB, 128 trang )

§ång cÊu ©m trong tiÕng
ViƯt
Mục lục

Lời cảm ơn …………………………………………………………..…………………….
Mục lục…………………………………………………………………………………. …
Lời nói đầu……………………………………………………………………………... ….

5
6
8

Chương I
Giới thiệu đề tài………………………………………………………………
1. Sự cần thiết trong việc cấu trúc hoá tiếng Việt………………………………………..
2. Thực tế về tổng hợp tiếng nói trên thế giới và ở Việt Nam……………………………
3. Nhiệm vụ và mục tiêu của đề tài…………………..……………………………………
4. Tóm tắt những cơng việc đã thực hiện ………………………………………………..

8
8
9
9
10

Chương II Cơ sở lý thuyết ngữ âm tiếng Việt……………………………………………
1. Ngữ âm học và âm vị học………………………………………………………………
1.1. Cơ sở âm học……………………………………………………………………….
1.2. Cơ sở sinh lí học……………………………………………………………………
2. Âm tố…………………………………………………………………………………..
2.1. Ðịnh nghĩa…………………………………………………………………………..


2.2. Các loại âm tố ………………………………………………………………………

11
11
11
11
11
11
11
12

2.2.1. Phân loại âm tố về mặt cấu âm ………………………………………………..
2.2.1.1 Âm tố nguyên âm……………………………………………………….. 12
12
2.2.1.2 Âm tố phụ âm……………………………………………………………
13
2.2.1.3. Âm tố bán âm……………………………………………………………
14
2.2.2. Phân loại âm tố về mặt âm học: ……………………………………………….
2.2.3 Ý nghĩa của sự phân loại âm tố về mặt cấu âm và âm học…………………….. 15
3. Âm vị…………………………………………………………………………………… 16
3.1. Ðịnh nghĩa………………………………………………………………………….. 16
3.2. Biến thể của âm vị………………………………………………………………….. 16
     3.3. Các nét khu biệt âm vị và sự đối lập âm vị………………………………………… 17
3.3.1. Các nét khu biệt âm vị………………………………………………………. 17
3.3.2. Sự đối lập âm vị……………………………………………………………... 17
3.4. Phiên âm ngữ âm học………………………………………………………………. 18
4. Âm tiết…………………………………………………………………………………. 18
18
4.1 Ðịnh nghĩa…………………………………………………………............

………..
4.2. Cấu tạo về cách phát âm của âm tiết tiếng Việt……………………………….……. 18
4.3. Ðặc điểm của âm tiết tiếng Việt…………………………………………………….. 19
4.3.1. Các vị trí trong mơ hình âm tiết……………………………………………… 20
4.3.2. Phân loại âm tiết tiếng Việt………………………………………………….. 20

1


§ång cÊu ©m trong tiÕng
ViƯt
4.3.3. Hệ thống phụ âm đầu…………………………………………………………

     

4.3.3.1. Ðặc trưng ngữ âm tổng quát của các âm đầu…………………………
4.3.3.2. Các tiêu chí khu biệt phụ âm đầu:…………………………………….
4.3.4. Hệ thống âm đệm……………………………………………………………..
4.3.4.1. Các đặc trưng ngữ âm……………………………………………..……
4.3.4.2 Tính chất nước đơi của âm đệm……………………………………….
4.3.5. Hệ thống âm chính…………………………………………………………….
4.3.5.1. Tiêu chí khu biệt các âm vị nguyên âm………………………………...
4.3.6. Hệ thống âm cuối………………………………………………………………
4.3.6.1. Các tiêu chí khu biệt……………………………………………………
4.3.7. Thanh điệu……………………………………………………………………..
4.3.7.1. Ðịnh nghĩa:……………………………………………………………..
4.3.7.2. Thanh điệu trong phương ngữ Bắc Bộ…………………………………
4.3.7.3. Sự phân bố thanh điệu trong các loại hình âm tiết……………………..
4.3.8 Ngữ điệu………………………………………………………………………..


Chương III Lý thuyết cơ bản về đồng cấu âm…………………………………………….
1. Giới thiệu chung……………………………………………………………………….
2. Đồng cấu âm là gì……………………………………………………………………..
3. Cơ sở của đồng cấu âm………………………………………………………………..
3.1.
Các
âm
nói…………………………………………………………..

vị

3.2.
Sự
thái………………………………………………………………..
3.3.
Cách
phản…………………………………………………………..
3.4.
Qn
tính
âm………………………………………………..

của

3.5.
Nền
tảng
âm………………………………………………………….

trong

chuyển

phát
các

âm
bộ

của

phận
đồng

tiếng
trạng
tương
phát
cấu

3.6. Đồng cấu âm và âm tiết…………………………………………………………
Chương IV Phương pháp nghiên cứu và xây dựng phần mềm……………………………

2

20
21
21
21
21
21

22
22
22
22
24
24
24
24
25
26
26
26
27
27
27
28
29
29
29
32


§ång cÊu ©m trong tiÕng
ViƯt
1. Hướng nghiên cứu………………………………………………………………………
2. Các khó khăn gặp phải…………………………………………………………… …..
2.1 Nghiên cứu với tập CSDL rộng lớn…………………………………………….…...
2.2 Đảm bảo mục tiêu nghiên cứu………………………………………………………
3. Mơ hình nghiên cứu………………………………………………………………………
3.1. Mơ hình tổng qt…………………………………………………………………..

3.2 Mơ hình nghiên cứu chi tiết………………………………………………………..
4. Mơ hình tốn học của vấn đề và lựa chọn giải pháp……………………………………..
4.1 Mơ hình tốn học của vấn đề………………………………………………………..
4.2
Giải
pháp


sở
khoa
học………………………………………………………..
5.
Thuật
tốn
cho
phần
mềm………………………………………………………………..
5.1 Sơ đồ tổng quát……………………………………………………………………...
5.2 Sơ đồ khối của thuật toán……………………………………………………………
5.3 Giải thuật tính các tham số………………………………………………………….
5.4 Minh hoạ bằng ví dụ cụ thể cho giải pháp của bài toán …………………………....
5.4.1 Phát biểu bài tốn bằng ngơn ngữ tự nhiên……………………………………
5.4.2 Chuyển bài tốn sang ngơn ngữ tốn học……………………………………..
6. Phân tích và thiết kế………………………………………………………………………
6.1. Biểu đồ phân cấp chức năng………………………………………………………...
6.2. Biểu đồ luồng dữ liệu mức khung cảnh…………………………………………….
6.3. Biểu đồ luồng dữ liệu mức đỉnh …………………………………………………….
7. Hướng dẫn sử dụng phần mềm…………………………………………………………...
7.1 Cài đặt phần mềm:…………………………………………………………………...
7.2 Hướng dẫn sử dụng phần mềm………………………………………………………


32
32
32
34
34
34
34
35
35
36

Chương V
Phân tích sự biến đổi cao độ của âm tiết trong ngữ đoạn……………….……
1. Sự biến đổi hình dáng đường cong F0 của âm tiết. ………………………………..……
1.1 Giới thiệu chung…………………………………………………………………......
1.2. Tóm tắt kết quả phân tích……………………………………………………….……
1.3. Phân tích cụ thể……………………………………………………………………...
2. Phân tích sự thay đổi giá trị trung bình cao độ của âm tiết (mean pitch) trong ngữ
đoạn
2.1. Giới thiệu chung…………………………………………………………………….
2.2. Tóm tắt kết quả…………………………………………………………………......
2.3. Phân tích cụ thể……………………………………………………………………..

47
47
47
47
50


Chương VI Phân tích và tổng hợp đặc tính trường độ của tiếng Việt………………….…..
1. Các kết quả nghiên cứu bằng phần mềm Wave Sufer …………………………….....
1.1. Tóm tắt kết quả…………………………………………………………………
1.2. Dữ liệu và cơng cụ sử dụng trong nghiên cứu………………………………….

53
53
53
53

3

37
37
38
40
40
40
40
40
44
44
45
45
45
46

51
51
52



§ång cÊu ©m trong tiÕng
ViƯt
1.3. Trường độ của các phần tín hiệu……………………………………………….
1.3.1. Độ dài các âm vị trong âm tiết………………………………………………
1.3.2. Thay đổi độ dài âm tiết………………………………………………………
1.3.3. Độ dài âm tiết trong ngữ đoạn………………………………………………
1.3.3.1. Thay đổi độ dài âm tiết do vị trí……………………………………
1.3.3.2. Thay đổi độ dài âm tiết do tốc độ đọc. …………………………….
1.4. Trường độ các phần nghỉ………………………………………………….…….
1.4.1. Nghỉ ứng với các dấu ngắt đoạn…………………………………………..
1.4.2. Nghỉ do chủ ý của người đọc……………………………………….…….
1.4.3. Nghỉ ứng với các dấu cách………………………………………………...
2. Ảnh hưởng của vị trí ngữ đoạn đến độ dài âm tiết……………………………….……
3. Kết luận………………………………………………………………………….……

54
54
56
56
56
57
57
57
58
58
60
61


ChươngVII: Kết luận và hướng phát triển tiếp theo………………………………………… 62
1. Kết luận …………………………………………………...…………………………… 62
2. Hướng phát triển tiếp theo……………………………………………………………... 62
Phụ lục A: Sự thay đổi hình dáng đường cong F0 của âm tiết trong ngữ đoạn………. . .
1. Thanh không dấu…………………………………………………………………………
1.1. Thanh không dấu…………………………………………………………….……
1.2. Thanh huyền………………………………………………………………………
1.3. Thanh sắc…………………………………………………………………….……
1.4. Thanh nặng………………………………………………………………….…….
1.5. Thanh hỏi……………………………………………………………………..…...
1.6. Thanh ngã…………………………………………………………………….…...
2. Thanh huyền……………………………………………………………………………...
2.1. Thanh không dấu………………………………………………………………….
2.2. Thanh huyền………………………………………………………………………
2.3. Thanh sắc…………………………………………………………………………
2.4. Thanh nặng………………………………………………………………….…….
2.5. Thanh hỏi…………………………………………………………………….……
2.6. Thanh ngã…………………………………………………………………….…..
3. Thanh sắc…………………………………………………………………………………
3.1. Thanh không dấu………………………………………………………………….
3.2. Thanh huyền………………………………………………………………………
3.3. Thanh sắc…………………………………………………………………………
3.4. Thanh hỏi…………………………………………………………………………
3.5. Thanh ngã…………………………………………………………………………
4. Thanh hỏi…………………………………………………………………………….…..
4.1. Thanh không dấu…………………………………………………………….……
4.2. Thanh huyền………………………………………………………………………

4


64
64
64
65
65
67
68
69
70
71
73
74
75
77
78
78
79
80
81
82
83
83
84


§ång cÊu ©m trong tiÕng
ViƯt
4.3. Thanh sắc…………………………………………………………………………
5. Thanh nặng………………………………………………………………………….……
5.1. Thanh không dấu…………………………………………………………….……

5.2. Thanh huyền………………………………………………………………………
5.3. Thanh sắc……………………………………………………………………..…...
Phụ lục B: Sự biến đổi cao độ trung bình của âm tiết trong ngữ đoạn………………….......
1. Âm tiết không dấu………………………………………………………………………
2. Âm tiết mang thanh huyền………………………………………………………………
3. Âm tiết mang thanh nặng…………………………………………………………….....
4. Âm tiết mang thanh sắc………………………………………………………….……..
5. Âm tiết mang thanh hỏi………………………………………………………….……..
Phụ lục C: Sự biến đổi trường độ âm tiết trong ngữ đoạn…………………………….……
Phụ lục D: Từ khoá và viết tắt……………………………………………………………...
Phụ lục E: Tài liệu tham khảo………………………………………………………..……..

Lời cảm ơn
Sau một thời gian nỗ lực thực hiện đề tài, em đã hoàn thành đồ án này
theo yêu cầu đặt ra. Để đạt được kết quả như ngày hôm nay em xin chân
thành cảm ơn sự giúp đỡ, hỗ trợ q báu của gia đình, nhà trường, thầy cơ,
và bạn bè.
Em xin gửi lời cảm ơn sâu sắc tới Thầy giáo, tiến sĩ Trịnh Văn Loan,
người đã trực tiếp hướng dẫn, chỉ bảo em trong quá trình em thực hiện đề
tài.

5

85
87
87
88
90
91
91

95
97
98
100
103
104
105


§ång cÊu ©m trong tiÕng
ViƯt
Em xin trân trọng cảm ơn Trung tâm nghiên cứu MICA (Multimedia
InF0rmation Communication and Applications) đặc biệt là TS. Eric
Castelli, Khoa Công nghệ thông tin đã tạo điều kiện thuận lợi cho em trong
quá trình học tập và nghiên cứu tại trường cũng như trong quá trình em
thực hiện đề tài này. Em xin trân trọng cảm ơn các Thầy, Cơ giáo đã tận
tình truyền đạt cho em những kiến thức bổ ích về mọi lĩnh vực.
Em xin gửi lời cảm ơn tới bạn bè, những người đã giúp đỡ em trong quá
trình thực hiện đề tài này.

Lời nói đầu
Ngày nay, khi mà khoa học cơng nghệ phát triển mạnh mẽ và đặc biệt là
công nghệ thơng tin, thì con người ngày càng mong muốn các hệ thống hỗ
trợ cho cuộc sống phải càng trở nên hồn thiện hơn. Có thể nói, hiện nay,
trong tất cả các lĩnh vực của đời sống, việc sử dụng các phần mềm, các
công cụ để trợ giúp sản xuất, tăng năng xuất lao động là điều hết sức bình
thường và phổ biến. Sự phát triển đó chính là những dấu hiệu khả quan cho

6



§ång cÊu ©m trong tiÕng
ViƯt
phép chúng ta tin tưởng và tiếp tục cải tiến theo những hướng đi mà chúng
ta đã chọn.
Sự phát triển của công nghệ thông tin cũng tạo điều kiện cho rất nhiều
ngành khoa học khác phát triển. Kết hợp với công nghệ thông tin, các
ngành này ngày càng thể hiện vai trò to lớn về mặt thực tiễn. Tuy nhiên ở
đây chúng ta khơng có tham vọng liệt kê và nói chi tiết tất cả các ngành
công nghệ ấy, mà nội dung chủ yếu chúng ta sẽ đề cập liên quan đến một
ngành khoa học đang rất được quan tâm hiện nay, đó chính là khoa học xử
lý tiếng nói.
Khoa học xử lý tiếng nói đã được phát triển tương đối lâu, đây là một
ngành khoa học phải có kiến thức chuyên sâu về xử lý tín hiệu, và những
hiểu biết về mặt ngơn ngữ, ngữ âm. Khoa học xử lý tiếng nói bao gồm hai
nội dung cơ bản là tổng hợp tiếng nói và nhận dạng tiếng nói. Cả hai nội
dung này đều đã được nghiên cứu và được thử nghiệm bởi nhiều nhà khoa
học hàng đầu, và cho đến nay đã thu được những kết quả rất đáng khích lệ.
Trong khi trên thế giới cả hai nội dung này đã đưa vào ứng dụng rộng rãi và
đã mang lại nhiều lợi ích to lớn cả cho người sử dụng cũng như người cung
cấp dịch vụ, thì ở Việt Nam nhu cầu ứng dụng các bộ tổng hợp và nhận
dạng tiếng nói cũng trở thành một vấn đề hết sức cần thiết.
Ở nước ta hiện nay, việc xây dựng một mơ hình tiếng nói hồn chỉnh,
và có chất lượng chấp nhận được cịn gặp rất nhiều khó khăn bới cấu trúc
tiếng Việt là rất phức tạp và chưa được nghiên cứu phổ biến. Tuy nhiên
bên cạnh đó chúng ta lại có được nhiều kinh nghiệm thu được từ việc xây
dựng các bộ tổng hợp và nhận dạng của các ngôn ngữ khác trên thế giới.
Nguyên nhân các bộ tổng hợp và nhận dạng tiếng Việt chưa đạt đến
chất lượng như mong muốn, là do chưa tích hợp được với các yếu tố cấu
trúc tiếng Việt. Đề tài nghiên cứu của em cũng khơng nằm ngồi phạm vi

đó. Q trình nghiên cứu đã phát hiện ra một số cấu trúc tiếng Việt quan
trọng xoay quanh vấn đề đồng cấu âm. Các kết quả này có thể ứng dụng để
viết các modun nhằm cải thiện chất lượng bộ tổng hợp tiếng nói. Do thời
gian có hạn, phạm vi đề tài rộng lớn liên quan trực tiếp đến nhiều ngành
khoa hoc khác như ngôn ngữ học, ngữ âm học, khoa học xử lý tín hiệu số.
Hơn nữa, đối với Việt Nam nội dung của đề tài lại chưa được quan tâm đến
nhiều, và em là một trong những người đầu tiên nghiên cứu cấu trúc tiếng
Việt dựa vào đồng cấu âm, nên chắc chắn không tránh khỏi những sai sót.
Vì vậy em rất mong nhận được sự đóng góp ý kiến và chỉ bảo của các thầy
cơ giáo và các bạn. Em xin chân thành cảm ơn.

7


§ång cÊu ©m trong tiÕng
ViƯt
Sinh viên thực hiện
Lê Văn Sơn

Chương I
Giới thiệu đề tài
1. Sự cần thiết trong việc cấu trúc hố tiếng Việt
Tổng hợp tiếng nói là nội dung được bao hàm trong các khái niệm về
xử lý tiếng nói. Vậy xử lý tiếng nói là gì? Một cách chung nhất, xử lý tiếng

8


§ång cÊu ©m trong tiÕng
ViƯt

nói có thể hiểu là việc xử lý thơng tin chứa trong tín hiệu tiếng nói nhằm
truyền, lưu trữ tín hiệu hoặc trong tổng hợp, nhận dạng tiếng nói.
Xử lý tiếng nói nói chung và tổng hợp tiếng nói nói riêng từ lâu đã là
một trong các lĩnh vực nghiên cứu của các nhà khoa học đầu ngành. Thực
tế đây là một lĩnh vực hết sức phức tạp, bởi nó yêu cầu người nghiên cứu
phải có kiến thức chuyên sâu trong nhiều lĩnh vực: ngữ âm học, ngơn ngữ
học, xử lý tín hiệu tiếng nói và đặc biệt là khoa học máy tính.
Trong nhiều năm gần đây, thế giới đã đạt được những thành công và
những bước tiến đáng kể trong cả hai lĩnh vực chính của tiếng nói: tổng hợp
và nhận dạng. Trong đó các ứng dụng sử dụng bộ tổng hợp tiếng nói ngày
càng nhiều và chúng thực sự đã đóng góp đáng kể vào sự phát triển của xã
hội.
Tại Việt Nam, với sự phát triển đời sống kinh tế và xã hội, nhu cầu ứng
dụng của một bộ tổng hợp tiếng nói có chất lượng đáp ứng được các yêu
cầu đề ra là hết sức cần thiết.
Tuy nhiên do các đặc thù riêng của tiếng Việt, mà việc xây dựng một bộ
tổng hợp có chất lượng chấp nhận được là điều hết sức khó khăn. Một trong
những khó khăn lớn nhất là đảm bảo tính tự nhiên của tiếng nói tổng hợp.
Đây là bước cản lớn nhất của việc ứng dụng các giải thuật tổng hợp tiếng
nói cho tiếng Việt như giải thuật TD-PSOLA. Để đạt được điều này, chúng
ta cần phải có những kiến thức chuyên sâu về ngữ âm tiếng Việt. Nhưng
tiếng Việt lại là một ngơn ngữ có nét đặc thù riêng và chưa được nghiên
cứu phổ biến, các kết quả nghiên cứu từ trước đến nay chỉ tập chung vào
nguyên âm, phụ âm, hay các âm tiết độc lập. Cho nên việc cấu trúc hố
tiếng Việt trong câu nói liên tục là cần thiết và cũng đầy khó khăn.

2. Thực tế về tổng hợp tiếng nói trên thế giới và ở Việt Nam
Như đã đề cập, việc mô phỏng tiếng nói con người từ lâu đã là một
trong những hướng nghiên cứu của các nhà khoa học hàng đầu, và một
trong những cơng trình nghiên cứu sớm nhất đã được thực hiện bởi nhà

khoa học Wolfgang von Kemplen vào năm 1791. Vào đầu thế kỷ này, năm
1939, một mô hình tiếng nói được xây dựng và đã thu được những kết quả
nhất định trong việc mơ phỏng tiếng nói của con người. Ngày nay với việc
phát triển của khoa học và kỹ thuật, cùng với khả năng hỗ trợ đắc lực của
máy tính, giọng nói tổng hợp khơng những được thực hiện dễ dàng mà
ngày càng gần với tiếng nói tự nhiên.

9


§ång cÊu ©m trong tiÕng
ViƯt
Hiện nay, có nhiều bộ tổng hợp tiếng nói cho các ngơn ngữ khác nhau
như: Anh, Pháp, Đức, Nhật, Hàn,….và đặc biệt là hầu hết các bộ tổng hợp
này đã đạt được đến chất lượng của tiếng nói tự nhiên. Điều này đã mở ra
khả năng ứng dụng trong nhiều lĩnh vực khác nhau của hệ thống văn bản tiếng nói (TTS).
Đối với tiếng Việt, hiện nay chưa tồn tại một bộ tổng hợp có thể đạt
tới chất lượng như kể trên, mặc dù với sự phát triển của nước ta, nhu cầu
ứng dụng một bộ tổng hợp như vậy ngày càng trở nên cần thiết. Việc xây
dựng bộ tổng hợp tiếng Việt có chất lượng chấp nhận được rõ ràng là một
trong những thách thức lớn bởi tính phức tạp và rắc rối của ngơn ngữ tiếng
Việt. Nó địi hỏi phải có kiến thức cơ bản và chuyên sâu trên nhiều lĩnh vực
liên quan đặc biệt là ngữ âm tiếng Việt, lĩnh vực chưa được nghiên cứu phổ
biến nhưng lại ảnh hưởng sâu sắc, trực tiếp tới đặc tính tự nhiên của tiếng
nói tổng hợp. Tuy nhiên bên cạnh những khó khăn trên, việc xây dựng một
bộ tổng hợp tiếng Việt có chất lượng chấp nhận được cũng có một số thuận
lợi, vì nó có thể kế thừa những kinh nghiệm từ việc xây dựng các bộ tổng
hợp của ngôn ngữ khác mang lại.

3. Nhiệm vụ và mục tiêu của đề tài

Như đã đề cập ở trên, mục tiêu của đề tài là nghiên cứu nhằm nâng cao
đặc tính tự nhiên của bộ tổng hợp tiếng nói theo phương pháp tiếp cận ngữ
âm học. Có thể nói, để tạo ra câu nói tổng hợp đạt được chất lượng của
tiếng nói tự nhiên thì cần phải nghiên cứu về các đặc tính sau trong ngữ
đoạn:
 Sự biến đổi cao độ của âm tiết
 Trường độ của âm tiết và của khoảng lặng cũng như dự đoán
được độ dài của các âm vị trong âm tiết
 Sự biến đổi về năng lượng
 Ngữ điệu
Trong đề tài này, phạm vi nghiên cứu là sự biến đổi cao độ của âm tiết
và các đặc tính về trường độ trong ngữ đoạn. Và ngữ đoạn nghiên cứu là
“câu trần thuật”, giọng nữ (4 người) chuẩn Bắc Bộ được lấy ra từ CSDL
rộng lớn của Trung tâm nghiên cứu MICA. Qua quá trình nghiên cứu đã
phát hiện ra các cấu trúc tiếng Việt về sự biến đổi cao độ và trường độ.

10


§ång cÊu ©m trong tiÕng
ViƯt
Do giới hạn về mặt thời gian, khi mà dữ liệu để nghiên cứu chưa đủ lớn
để khẳng định các kết luận của em nêu ra trong đề tài này là quy luật. Cho
nên các kết luận này chưa thể đủ mạnh để có thể áp dụng được vào trong
tổng hợp tiếng nói. Ngoại trừ, các đặc tính về trường độ đã được em nghiên
cứu, tham khảo, so sánh với các kết quả của Viện nghiên cứu Công nghệ.
Các kết quả về trường độ đã được thử nghiệm cài đặt trong bộ tổng hợp và
tiếng nói tạo ra nghe tự nhiên hơn.

4. Tóm tắt những cơng việc đã thực hiện

Đồ án được nghiên cứu dựa trên các phần sau:
Chương 1: Giới thiệu đề tài. Xác định được nhiệm vụ và mục tiêu của
đề tài để có hướng nghiên cứu về sau.
Chương 2: Nghiên cứu lý thuyết về ngôn ngữ tiếng Việt
Chương 3: Nghiên cứu về ngữ âm tiếng Việt
Chương 4: Lựa chọn phương pháp nghiên cứu và xây dựng phần mềm
phục vụ nghiên cứu.
Chương 5: Phân tích các đặc trưng về sự biến đổi cao độ của âm tiết
trong ngữ đoạn.
Chương 6: Phân tích các đặc trưng về trường độ.
Chương 7: Kết luận và hướng phát triển tiếp theo.

Chương II
Cơ sở lý thuyết ngữ âm tiếng Việt

11


§ång cÊu ©m trong tiÕng
ViƯt
Trước khi đi vào nghiên cứu tìm hiểu cấu trúc tiếng Việt dựa trên cơ sở
đồng cấu âm, chúng ta sẽ đi vào tìm hiểu những kiến thức về ngữ âm tiếng
Việt, những kiến thức cơ bản về đồng cấu âm.

1. Ngữ âm học và âm vị học
1.1. Cơ sở âm học
Âm thanh ngôn ngữ cũng như mọi âm thanh khác trong cuộc sống,
chúng đều có chung một cơ sở vật chất, đó là cơ sở vật lí. Những âm thanh
nói chung được tạo thành nhờ sự chấn động của các phân tử khơng khí, các
vật thể đàn hồi, chúng phụ thuộc vào các yếu tố như: vật thể chấn động,

môi trường truyền âm, lực tác động..
Âm thanh ngôn ngữ được tạo thành do sự rung động của dây thanh và
sự hoạt động của các khí quan khác trong bộ máy phát âm. Khác với các
âm thanh tự nhiên, âm thanh ngôn ngữ phải là các âm thanh đi qua bộ máy
phát âm của con người và có mang nội dung thơng báo. Chính vì vậy, âm
thanh ngơn ngữ có những đặc trưng riêng biệt về:
 Ðộ cao
 Ðộ mạnh
 Ðộ dài
 Âm sắc

1.2. Cơ sở sinh lí học
Bộ máy phát âm tức là tồn bộ những cơ cấu sinh lí có liên quan đến âm

thanh ngôn ngữ như: môi, răng, lưỡi, khoang miệng, khoang mũi,...

2. Âm tố
      2.1. Ðịnh nghĩa
 Là đơn vị ngữ âm nhỏ nhất không mang chức năng phân biệt
nghĩa và nhận diện từ.
 Là đơn vị âm thanh nhỏ nhất của lời nói có thể tách ra về mặt cấu
âm thính giác, đồng chất trong một khoảng thời gian nhất định và
thường tương ứng với mỗi một âm vị.

12


§ång cÊu ©m trong tiÕng
ViƯt
 Liên quan đến mặt tự nhiên của ngữ âm (bao gồm cơ sở âm học

và sinh lí).
 Phụ thuộc vào các yếu tố như: ngữ điệu, hoàn cảnh phát âm khi
chúng kết hợp với các yếu tố khác trong cùng một âm tiết, bộ
máy phát âm của mỗi cá nhân. Chính vì vậy, khi nói về số lượng
của âm tố người ta không thể đếm được, chúng có vơ vàn trong
cuộc sống và chúng khơng phải là các yếu tố chuẩn.


Kí hiệu của âm tố là chúng được phiên âm giữa hai gạch vuông
[ ]. Ví dụ: [b], [d],... Ngồi chúng cịn có một số các yếu tố phụ như:
mơi hóa, ngắn, dài....

2.2. Các loại âm tố 
2.2.1. Phân loại âm tố về mặt cấu âm
2.2.1.1 Âm tố nguyên âm
Các nguyên âm không thể phân loại theo tiêu chuẩn như của phụ âm.
Về mặt phương thức cấu âm, nguyên âm chỉ thuộc vào một phương thức đó
là luồng hơi ra tự do. Ngun âm khơng có vị trí cấu âm vì các khí quan
khơng tạo thành khe, cũng không tạo thành chỗ tắc. Các nguyên âm cũng
khơng thể phân loại theo tiếng thanh, vì bình thường, bất cứ nguyên âm nào
cũng có tiếng thanh.
Các nguyên âm chỉ khác nhau ở các hoạt động của các khí quan phát
âm, trong đó quan trọng nhất là lưỡi. Vì sự thay đổi vị trí của lưỡi gây ra sự
khác nhau rất lớn giữa các nguyên âm. Lưỡi chuyển động tới - lui và lên xuống trong khoang miệng tạo nên những tương quan phức tạp giữa các
khoang cộng minh (khoang miệng và mũi), làm thay đổi hình dáng và thể
tích của chúng. Mơi trịn lại và đưa về trước, làm kéo dài lối thốt của
luồng khơng khí, hoặc mơi chành ra, làm luồng khí phía trước ngắn lại.
Người ta thường phân loại nguyên âm theo vị trí của lưỡi, độ nâng của
lưỡi và hình dáng của mơi.
 Phân loại theo vị trí của lưỡi

 Dịng trước (khi lưỡi dồn về trước) [i], [e], [ê]

13


§ång cÊu ©m trong tiÕng
ViƯt
 Dịng sau (khi lưỡi dồn về sau) [u], [o], [ơ], [â]
 Dịng giữa (khi lưỡi ở giữa miệng nâng lên) [ư], [ơ], [a]
 Theo độ nâng của lưỡi (tương ứng với độ mở của miệng)
 Hẹp [i], [u],....
 Hơi hẹp [ê], [ư],...
 Hơi rộng [o], [e],...
 Rộng [ă], [a],...
 Theo hình dáng mơi
 Trịn mơi [u], [ơ], [â], [o]
 Khơng trịn mơi [i],[ê] [e],[ư],[ơ], [a]

2.2.1.2 Âm tố phụ âm
Trước tiên, theo mối quan hệ giữa tiếng thanh và tiếng ồn trong cấu tạo
của phụ âm, các phụ âm được chia thành các phụ âm vang (tiếng thanh
nhiều hơn tiếng ồn) và các phụ âm ồn. Trong các phụ âm ồn lại chia ra các
phụ âm hữu thanh (phát âm có sự tham gia của tiếng thanh, do dây thanh
rung động) và phụ âm vô thanh (phát âm khơng có sự tham gia của tiếng
thanh). Nhóm các phụ âm vang có thể được coi là một nhóm trung gian
giữa các nguyên âm và các phụ âm ồn. Khi phát âm các phụ âm vang,
chướng ngại được tạo thành nhưng có thể là chỗ tắc yếu (như ở phụ âm [r]
tiếng Nga hay [R] tiếng Pháp hay [l] tiếng Việt) hoặc khơng khí khơng
những trực tiếp vượt qua chỗ có chướng ngại mà cịn đi ra tự do qua mũi
(như ở các phụ âm [m], [n] trong tiếng Việt).

Sự phân chia thứ hai của các phụ âm là phân chia theo phương thức cấu
tạo tiếng ồn, tức theo tính chất của chướng ngại, đó là các phụ âm tắc, xát
và rung.
 Phụ âm tắc được tạo thành khi hai khí quan tiếp xúc nhau, tạo thành
chỗ tắc, cản trở hồn tồn lối ra của luồng khơng khí. Ví dụ [p], [b],
[t], [d].

14


§ång cÊu ©m trong tiÕng
ViƯt
 Phụ âm xát được tạo thành khi hai khí quan nhích lại gần nhau, làm
cho lối ra của luồng khơng khí bị thu hẹp, luồng khơng khí đi qua
khe hẹp này cọ xát vào thành của bộ máy phát âm. Ví dụ [f], [v], [s],
[z], [h].
 Phụ âm rung được tạo thành khi các khí quan dễ rung động (như đầu
lưỡi, mơi) nhích lại gần nhau tạo thành một khe hở rất hẹp hay một
chỗ tắc yếu, luồng khơng khí đi ra mạnh làm cho các khí quan ấy
rung lên (Ví dụ [r] trong tiếng Nga hay [R] trong tiếng Pháp).
Trong cách cấu âm của phụ âm, người ta thường phân biệt ba giai đoạn:
 Giai đoạn tiến: khí quan phát âm chuyển đến vị trí cấu âm.
 Giai đoạn giữ: khí quan phát âm ở vị trí cấu âm.
 Giai đoạn lùi: khí quan phát âm rời khỏi vị trí cấu âm.
Hai giai đoạn đầu giống nhau ở bất cứ âm tắc nào. Về giai đoạn thứ ba,
cần phân biệt các tiểu loại âm tắc: âm nổ, âm mũi, âm tắc-xát và âm khép.
Sự phân chia thứ ba của phụ âm là sự phân chia theo vị trí cấu tạo ra
tiếng ồn hay theo khí quan chủ động khi cấu âm.
Theo vị trí cấu tạo tiếng ồn, các phụ âm thường được chia ra thành các
loạt chính như: phụ âm mơi, răng, lợi, ngạc mạc, lưỡi con, yết hầu, thanh

hầu.
Theo khí quan chủ động, các phụ âm được chia thành các loạt: phụ âm
môi, lưỡi trước, lưỡi giữa, lưỡi sau, lưỡi con, yết hầu, thanh hầu.
Trong các nhóm này, có một số cần chia nhỏ ra nữa. Thí dụ trong các
âm mơi, người ta phân biệt các âm hai môi, thường gọi là âm mơi- mơi (ví
dụ: [p], [b], [m]) với các âm một mơi, thường gọi là âm mơi- răng (ví dụ:.
[f], [v]).
Các âm lưỡi trước thường chia thành nhiều nhóm nhỏ nhưng đáng chú ý
là âm đầu lưỡi (apical) và âm quặt lưỡi (cacuminal).
Trong tiếng Việt, các cấu âm bổ sung có vai trò quan trọng hơn cả là:
hiện tượng bật hơi tức là kèm theo một lưu lượng khơng khí lớn khi chỗ tắc
được bật ra (ví dụ: phụ âm th), hiện tượng thanh hầu hóa, tức là bổ sung
động tác tắc kèm theo sự nâng lên của thanh hầu; và yết hầu hóa- bổ sung

15


§ång cÊu ©m trong tiÕng
ViƯt
động tác khép của yết hầu. Hai hiện tượng sau góp phần hiện thực hóa một
số phụ âm đầu và thanh điệu tiếng Việt. Các cấu âm bổ sung, cũng như các
cấu âm khác, đều có thể được sử dụng để khu biệt các âm tố, hay các hiện
tượng âm thanh trong ngơn ngữ. Vì vậy, chúng có giá trị bình đẳng với
nhau, xét về mặt âm vị học. Các âm bổ sung này tạo cho các âm tố có
những kí hiệu phụ khác nhau trong từng trường hợp cụ thể khi chúng được
thể hiện trên mỗi âm tiết) Ví dụ: ngạc hóa, mơi hóa, ngắn, dài,....

2.2.1.3. Âm tố bán âm
Những âm tố có đặc tính giống nguyên âm về cách phát âm, cách thể
hiện kí hiệu, nhưng thường chỉ đi kèm, bản thân không tạo thành âm tiết

được. Nói cách khác, chúng có chức năng khác với chức năng của nguyên
âm. Không tạo nên âm sắc chính của âm tiết, khơng ở đỉnh âm tiết.

2.2.2. Phân loại âm tố về mặt âm học
Sự phân loại các âm tố về mặt âm học đã được xây dưng trên tài liệu âm
phổ. Các máy phân tích âm phổ cho chúng ta các phổ hình, qua đó các âm
tố thể hiện rõ các đặc trưng âm học: cao độ, cường độ, trường độ...
Khi phân loại âm tố theo tiêu chí này người ta nhận thấy rằng nhiều khi
các nguyên âm hoặc phụ âm phụ thuộc vào các yếu tố khác như: ồn - không
ồn, vang - không vang, các yếu tố bổng - trầm....và chúng ta có thể kể ra
khá nhiều các chi tiết thuộc về các yếu tố âm học.
 Bổng trầm: Những âm bổng có tần số lớn, cịn những âm trầm có tần
số nhỏ. Âm bổng là các nguyên âm hàng trước, phụ âm răng, các
phụ âm lưỡi trước (giữa). Âm trầm là các nguyên âm hàng sau, các
phụ âm môi và phụ âm lưỡi sau.
 Ngắt- khơng ngắt: Ðó là sự đối lập giữa có và khơng có sự chuyển
tiếp đột ngột, giữa sự có mặt và vắng mặt của âm thanh, các phụ âm
xát thường có khởi âm từ từ. Ngược lại, các phụ âm tắc thường có sự
ngắt đột ngột sóng âm đi trước bằng một khoảng im lặng hoàn toàn.
Các phụ âm tắc (trừ nhóm mũi) là những âm ngắt. Cịn lại là những
âm khơng ngắt.
 Lỗng đặc: Các âm lỗng là những âm có độ nâng của lưỡi cao
(những nguyên âm có độ mở của miệng hẹp- hơi hẹp), những phụ
âm răng, phụ âm mơi. (Trên phổ hình chúng có các phoóc măng ở
gần trung tâm của phổ hơn). Các âm đặc là những âm có độ nâng

16


§ång cÊu ©m trong tiÕng

ViƯt
của lưỡi thấp (những ngun âm có độ mở miệng hơi rộng rộng), các
phụ âm lưỡi trước, lưỡi giữa, lưỡi sau (trên phổ hình chúng có các
phoóc măng ở xa trung tâm của phổ hơn).
Trên đây là bảng phân loại theo âm học tương ứng với cách phân loại
theo cấu âm. Hữu thanh - vô thanh: Ðó là sự đối lập giữa có hay khơng có
những dao động điều hoà ở vùng tần số thấp, tương ứng với sự có hay
khơng có sự dao động của dây thanh về mặt cấu âm.
 Căng lới: Những âm căng là những âm có độ dài lớn, năng lượng lớn
và có thanh cộng hưởng thể hiện rõ trên phổ hình. (Các phụ âm căng
là những phụ âm mạnh, cịn những phụ âm khơng căng là những phụ
âm yếu. Cịn ở nguyên âm: âm căng là những âm đặc, âm lới là
những âm lỗng).
 Gắt khơng gắt: Ðó là đối lập giữa cường độ lớn hay nhỏ của tiếng
ồn. Trên phổ hình, các âm gắt có vùng tối thay đổi sắc thái rõ rệt.
Các phụ âm xát điển hình, các âm tắc- xát, bật hơi, phụ âm rung là
những phụ âm gắt. Những loại hình âm cịn lại là những âm không
gắt.
 Giáng hay không giáng: Các âm giáng là những âm trầm hóa, (có
một số các phoóc măng của chúng bị hạ thấp so với các âm không
giáng). Các ngun âm trịn mơi [ u ], [ ơ ], [ o ],... và các phụ âm
đứng trước chúng bị mơi hóa đều là những âm giáng.
 Thăng hay khơng thăng: Ngược lại so với âm giáng, chúng là những
âm bổng hóa. Các nguyên âm hàng trước thường là các âm có một
trong số các phoóc măng cao hơn các âm không thăng tương ứng.
Ðiều này thể hiện rõ trong các tiếng nước ngoài như tiếng Nga.
 Mũi- miệng (hay mũi- khơng mũi): Phổ hình của các âm mũi có mật
độ phoóc- măng dày hơn so với các âm miệng tương ứng. Ở các
nguyên âm mũi giữa F1 và F2 xuất hiện thêm một phoóc- măng phụ,
và đồng thời có sự giảm cường độ của F1 và F2. Về mặt cấu âm, các

âm mũi được tạo thành khi ngạc mềm hạ xuống. Trong tiếng Việt
có các âm mũi được thể hiện bằng các chữ cái: m, n, nh, ng. (Chúng
chịu ảnh hưởng trực tiếp của khoang mũi).


Thanh hầu hóa - khơng thanh hầu hóa: Các âm thanh hầu hóa đặc
trưng bởi tốc độ biến đổi năng lượng lớn trong một khoảng thời gian
ngắn (về mặt cấu âm đó là sự có mặt của sự xiết hay tắc khe thanh).
Trong tiếng Việt, âm thanh hầu hóa có thể xuất hiện trong các âm

17


§ång cÊu ©m trong tiÕng
ViƯt
tiết vắng các thủy âm (phụ âm đầu) trên chữ viết như ăn, uống, uể,
oải,...  hoặc trước các phụ âm hữu thanh, đặc biệt là trước [b], [đ],
và [l].

2.2.3 Ý nghĩa của sự phân loại âm tố về mặt cấu âm và
âm học
Nghiên cứu cấu âm để dạy và học ngoại ngữ, lồng tiếng cho phim từ
ngôn ngữ này sang ngôn ngữ khác (làm cho âm thanh của lời dịch khớp với
cấu âm của diễn viên đang nói trên màn ảnh)...v.v.
Nghiên cứu các âm trên phương diện âm học đã xác định đặc điểm của âm tố
một cách trực tiếp, không thông qua hoạt động của bộ máy phát âm. Vì vậy chúng
đã giúp người đọc có được sự cảm nhận chính xác mặt âm thanh của mỗi một ngôn
ngữ.

3. Âm vị

3.1. Ðịnh nghĩa
Theo cuốn Ngữ âm học tiếng Việt hiện đại NXBGD 1972, nhóm tác giả
Cù Ðình Tú thì âm vị là đơn vị nhỏ nhất của ngữ âm có mang chức năng
phân biệt nghĩa và nhận diện từ.
Theo cuốn Ngữ âm tiếng Việt của ơng Ðồn Thiện Thuật thì âm vị là
tổng thể các nét khu biệt, được xuất hiện đồng thời (được con người tri giác
theo trật tự trước sau) và có chức năng khu biệt vỏ âm thanh của từ hoặc
hình vị.
Như vậy, ta có thể hình dung những định nghĩa trên đều được định
nghĩa ở hai bình diện: Bình diện chức năng khu biệt, tức thuộc về bình diện
ngơn ngữ học, và bình diện thời gian, tức mặt thể chất hay vật lí. Âm vị,
một là có thể định nghĩa như một đơn vị âm vị học: Có tác dụng khu biệt,
khơng thể phân tích thành những đơn vị nhỏ hơn kế tiếp nhau trong thời
gian. Hai là được định nghĩa như một tập hợp những nét khu biệt được thực
hiện đồng thời. Ví dụ: các từ tơi và đơi, ta và đa trong tiếng Việt phân biệt
nhau bởi các âm vị / t /, / đ /. Như vậy, nếu thay âm vị này bằng một âm vị
khác trong cùng một âm tiết sẽ làm cho âm tiết đó thay đổi về nghĩa hoặc
mất nghĩa.

18


§ång cÊu ©m trong tiÕng
ViƯt
Về chức năng của âm vị: Các âm vị trên nguyên tắc nhất định phải có
sự khác nhau, ít nhất là về một đặc trưng nào đó. Chính nhờ sự khác biệt
này mà các âm vị có thể tạo ra sự khác biệt về hình thức âm thanh của các
hình vị và từ, tạo nên những tín hiệu khác biệt đối với sự cảm thụ của con
người
Kí hiệu âm vị: Xác định chính xác các âm vị mang chức năng khu biệt

nghĩa, khi đó mới đặt chúng vào trong hai gạch đứng . Ví dụ / k /, / b /,...

3.2. Biến thể của âm vị
Mỗi một ngơn ngữ có số lượng hữu hạn các âm vị mang nghĩa, vì thế
những âm vị này đã kết hợp với nhau trong nhiều hồn cảnh và vị trí khác
nhau. Khơng những thế các âm vị lại cịn được thể hiện cụ thể hố trong
những lời nói của các cá nhân ở các địa phương khác nhau. Chính vì vậy,
âm vị được thể hiện đa dạng dưới hình thức các biến thể. Chúng ta gọi tất
cả những âm tố khác nhau cùng thể hiện một âm vị là những biến thể của âm
vị đó.

       3.3. Các nét khu biệt âm vị và sự đối lập âm vị
3.3.1 Các nét khu biệt âm vị
Ðó là bao gồm hàng loạt các đặc trưng tồn tại đồng thời để tạo thành
một âm vị thống nhất. Trong số các đặc trưng ấy người ta phân biệt những
đặc trưng cần yếu để khu biệt các âm vị. Những đặc trưng cần yếu của âm
vị được gọi là nét khu biệt.
Ví dụ: /d/: Hữu thanh - đầu lưỡi / răng - tắc.
/t/: Vô thanh - đầu lưỡi / răng - tắc.
Nét khu biệt giữa hai âm vị trên là: hữu thanh và vô thanh.
Như vậy: Nét khu biệt được xác định trên cơ sở sự đối lập âm vị trên
một ngôn ngữ cụ thể. Nét khu biệt có thể xảy ra có lúc là hai yếu tố đối lập
nhau.

3.3.2. Sự đối lập âm vị
19


§ång cÊu ©m trong tiÕng
ViƯt

Sự đối lập giữa hai âm vị tạo thành thế đối lập. Ví dụ: / v / và / f / : có nét
đối lập giữa hữu thanh và vô thanh.

3.4. Phiên âm ngữ âm học
Phiên âm ngữ âm học là hình thức cơ bản của việc phân tích các ngơn
ngữ. Các nhà ngơn ngữ học dựa trên sự phân đoạn của các kí hiệu ngơn ngữ
trên một ngôn ngữ cụ thể, sự phiên âm này dựa trên sự phân đoạn các âm vị
học. Nó sử dụng một hệ thống chặt chẽ của các kí hiệu, thường là một kí
hiệu ghi một âm vị. Ví dụ: trong tiếng Anh pace được phiên âm như sau:
/ peis /. Trong tiếng Việt nhà: / na /

4. Âm tiết
4.1 Ðịnh nghĩa
Tiếng Việt là ngôn ngữ khác với các ngôn ngữ Á, Âu nó là ngơn ngữ
đơn tiết. Việc này có thể thấy rất rõ qua một chuỗi phát âm của người Việt.
Chuỗi phát âm có thể được chia ra thành những khúc đoạn nhỏ, lớn khác
nhau. Chính vì vậy khi định nghĩa âm tiết người ta thường định nghĩa một
cách đơn giản:
Âm tiết là đơn vị phát âm nhỏ nhất, đơn vị tự nhiên nhất trong lời nói
của con người. Mỗi âm tiết là một tiếng.
Ví dụ: Tiến lên tồn thắng ắt về ta.
Qua ví dụ trên chúng ta sẽ có 7 âm tiết khác nhau.
Ðiều đặc biệt trong tiếng Việt là âm tiết có thể trùng với từ khi từ đó là
từ đơn (bàn: một âm tiết và đồng thời cũng là một từ), cũng có khi âm tiết
trùng với một âm vị (ví dụ u vừa là âm tiết vừa là âm vị).

4.2. Cấu tạo về cách phát âm của âm tiết tiếng Việt
Mỗi âm tiết khi phát âm đều trải qua ba giai đoạn:
 Giai đoạn tăng độ căng
 Giai đoạn đỉnh điểm của độ căng


20



×