Tải bản đầy đủ (.pdf) (22 trang)

Tách âm dùng phương pháp phân tích thành phần độc lập ( thuật toán fastica )

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.82 MB, 22 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH

LUẬN VĂN THẠC SĨ
QUÁCH NGUYỄN LỆ HIỀN

TÁCH ÂM DÙNG PHƯƠNG PHÁP
PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP
(THUẬT TOÁN FASTICA)

NGÀNH: KỸ THUẬT ĐIỆN TỬ - 60520203

S K C0 0 4 6 6 0

Tp. Hồ Chí Minh, tháng 10/2015


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC SƢ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH

LUẬN VĂN THẠC SĨ
QUÁCH NGUYỄN LỆ HIỀN

TÁCH ÂM DÙNG PHƢƠNG PHÁP
PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP
(THUẬT TOÁN FASTICA)

NGÀNH: KỸ THUẬT ĐIỆN TỬ - 60520203
Hướng dẫn khoa học:


PGS.TS. Dương Hoài Nghĩa

TP.Hồ Chí Minh - Tháng 10/ 2015


LÝ LỊCH KHOA HỌC
I. LÝ LỊCH SƠ LƢỢC:
Họ& tên: Quách Nguyễn Lệ Hiền

Giới tính: Nữ

Ngày, tháng, năm sinh: 15/12/1988

Nơi sinh: Bình Dương

Quê quán: Tân Uyên - Bình Dương

Dân tộc: Kinh

Địa chỉ liên lạc: Tổ 1-Khu phố 4-P.Uyên Hưng - Tx.Tân Uyên - Bình Dương
Điện thoại cơ quan:

Điện thoại nhà riêng:

Fax:

E-mail:

II. QUÁ TRÌNH ĐÀO TẠO:
1. Trung học chuyên nghiệp:

Hệ đào tạo:

Thời gian đào tạo từ …/…đến …/ …

Nơi học (trường, thành phố):
Ngành học:
2. Đại học:
Hệ đào tạo: Đại học

Thời gian đào tạo từ 09/2007 đến 02/2012

Nơi học (trường, thành phố): Đại Học Sư Phạm Kỹ Thuật TPHCM.
Ngành học: Công Nghệ Điện Tử Viễn Thông.
Tên đồ án, luận án hoặc môn thi tốt nghiệp: Nhận dạng tiếng nói.
Ngày & nơi bảo vệ đồ án, luận án hoặc thi tốt nghiệp: 21/02/2012 - Đại Học
Sư Phạm Kỹ Thuật TPHCM.
Người hướng dẫn: TS. Trần Tiến Đức.
III. QUÁ TRÌNH CÔNG TÁC CHUYÊN MÔN KỂ TỪ KHI TỐT NGHIỆP
ĐẠI HỌC:
Thời gian

Nơi công tác

Công việc đảm nhiệm

i


LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi.

Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai
công bố trong bất kỳ công trình nào khác.
Tp. Hồ Chí Minh, ngày 23 tháng 8 năm 2015
(Ký tên và ghi rõ họ tên)

Quách Nguyễn Lệ Hiền

ii


LỜI CẢM TẠ
Trong suốt quá trình học tập, nghiên cứu và hoàn thành luận văn này, tôi đã
nhận được sự hướng dẫn, giúp đỡ quý báu của các thầy cô giáo, các anh chị và các
bạn. Với lòng biết ơn sâu sắc, tôi xin được bày tỏ lời cám ơn chân thành tới tất cả
cá nhân và tập thể đã tận tình giúp đỡ, đóng góp ý kiến, khích lệ tinh thần để tôi có
điều kiện tốt nhất để hoàn thành luận văn của mình.
Đầu tiên, tôi xin bày tỏ sự biết ơn sâu sắc đến Thầy PGS. TS Dương Hoài
Nghĩa đã tận tình, tận tâm chỉ bảo, hướng dẫn và định hướng cho tôi trong suốt quá
trình nghiên cứu và hoàn thành luận văn.
Tôi cũng xin bày tỏ lòng biết ơn của mình đến Ban giám hiệu, phòng đạo tạo
sau đại học trường Đại học sư phạm kỹ thuật TP. HCM đã tạo mọi điều kiện thuận
lợi để tôi hoàn thành tốt khóa học và tốt nghiệp.
Cuối cùng, tôi muốn gửi lời cám ơn đến gia đình, người thân và bạn bè đã
quan tâm, động viên và giúp đỡ tôi về mọi mặt trong suốt quá trình nghiên cứu,
hoàn thành luận văn này.
Tp. Hồ Chí Minh, ngày 10 tháng 8 năm 2015

Quách Nguyễn Lệ Hiền

iii



MỞ ĐẦU
Mọi sự vật, hiện tượng trong tự nhiên đều không xuất hiện hoặc biến đổi
đơn độc mà xuất hiện đồng thời với sự xuất hiện và biến đổi của các sự kiện khác
trong mối quan hệ tương tác, phụ thuộc và ảnh hưởng lẫn nhau vừa mang tính quy
luật vừa mang tính ngẫu nhiên.
Trong âm thanh thường ít khi xảy ra sự cô lập. Khi có nhiều tín hiệu ở các
khoảng tần số khác nhau được trộn lại, ta có thể lọc ra từng tín hiệu riêng biệt như
lúc ban đầu. Còn nếu các tín hiệu nằm trong cùng khoảng tần số (ví dụ nhiều người
cùng nói, tiếng hát trên nền nhạc, nhiều bản nhạc cùng chơi…), ta không thể dùng
phương pháp lọc hay phân tích phổ thông thường để tách. Quá trình này được gọi
là tách nguồn. Bài toán được đặt ra là, từ nhiều tín hiệu đã được trộn lẫn, làm thế
nào để khôi phục lại từng tín hiệu nguồn riêng lẻ?
Bản thân tai người cùng một thời điểm luôn tiếp nhận nhiều nguồn âm
nhưng chúng ta luôn lắng nghe và nhận rõ nguồn âm có chủ định. Một hệ thống xử
lý, nhận dạng tiếng hay điều khiển cần đạt mục tiêu như vậy. Kết quả của bài toán
tách tín hiệu tiếng nói là cơ sở cho rất nhiều những ứng dụng trong thực tiễn liên
quan tới xử lý tiếng nói. Kết quả của quá trình tách có tốt thì kết quả của nhận dạng
mới chính xác được.
Trong hơn chục năm qua, người ta đã phát triển một phương pháp mới giúp
giải bài toán tách nguồn mù (Blind Source Separation – BSS) nêu trên rất hiệu quả,
đó là phân tích thành phần độc lập (Independent Component Analysis – ICA).
Trong luận văn này, người nghiên cứu thực hiện tách âm dùng phương pháp
phân tích thành phần độc lập ( thuật toán flastICA). Trong đó đề cập đến lý thuyết,
ứng dụng tách âm với nhiều hỗn hợp, chủ yếu tập trung vào các vấn đề tách nguồn
xác định nơi số nguồn bằng số lượng các kênh trong hỗn hợp quan sát (số trộn).

iv



Abstract
All subjects and natural phenomena very rarely appear or transform
individually but concurrently with emergence and transformation of others in the
interactive relationships, dependencies and influence to each other. It might be
methodical or random.
In acoustics, isolation rarely happens. When multiple signals in different
frequency ranges are mixed together, we can filter out individual signal as in the
beginning. If the signals are in the same frequency range (for example: people are
talking or singing , many songs are being played....), we can’t use filtering methods
or conventional spectrum analyzer to separate them. This process is called source
separation.The problem here is how to separate them from each other?
Human ear at the same time always received many sound sources, but we
always listen and recognize the sound source intentional. A processing system,
recognition or control should achieve such goal. Results of the problem separating
voice signal is the basis for many practical applications related to speech
processing. The results of the process with good separation, the result of new
speech processing is accurate.
Over the last decade, people have been developing a new method to solve
blind source separation (Blind Source Separation - BSS) very efficiently, which is
independent component analysis (Independent Component Analysis-ICA).
In this thesis, acoustical source separation method will be performed using
independentcomponent
analysis(flastICAalgorithm).Themethodologyandapplication

of

the

proposed


method to mixed sounds, mainly focused on the source separation from a mixture
of observations (the mixture), will be presented here.

v


MỤC LỤC
Trang tựa

TRANG

Lý lịch khoa học

i

Lời cam đoan

ii

Lời cảm tạ

iii

Mở đầu

iv

Abstract


v

Mục lục

vi

Danh sách các hình

x

Danh sách các bảng

xii

Chƣơng 1. TỔNG QUAN

1

1.1. Lý do chọn đề tài

2

1.3 Mục tiêu nghiên cứu

2

1.4 Nhiệm vụ nghiên cứu

2


1.5 Khách thể và đối tƣợng nghiên cứu

2

1.6 Giả thuyết nghiên cứu

2

1.7 Phạm vi nghiên cứu

2

1.8 Phƣơng pháp nghiên cứu

2

1.9 Kế hoạch thực hiện

3

Chƣơng 2. KỸ THUẬT PHÒNG ẢO

4

2.1 Kỹ thuật âm học phòng

4

2.2 Mô hình âm học phòng


5

2.3 Phƣơng pháp theo sóng

6

2.4 Phƣơng pháp theo tia

7

2.4.1 Phƣơng pháp vạch tia

8

2.4.2 Phƣơng pháp nguồn ảnh

9

2.5 Minh họa giải thuật

10
vi


2.6 Kết luận

11

Chƣơng 3.GIỚI THIỆU TỔNG QUAN VỀBÀI TOÁN XỬ LÝ MÙ


13

3.1 Giới thiệu bài toán phân tách nguồn mù Blind Signal Processing (BSP) 21
3.2 Các mô hình đặc trƣng

23

3.3 Ứng dụng của bài toán BSS

13

3.3.1 Xử lý văn bản

14

3.3.2 Xử lý tín hiệu y sinh

15

3.3.3 Dự báo tài chính

17

3.3.4 Hệ thống viễn thông

19

3.3.5 Xử lý âm thanh

21


Chƣơng 4. PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP

26

4.1 Đặt vấn đề - bài toán cooktail-party

27

4.2 Mô hình ICA cơ bản

30

4.3 Các điểm không xác định trong ICA

31

4.4 Sự độc lập thống kê

32

4.4.1 Bất tƣơng quan

32

4.4.2 Độc lập thống kê

33

4.4.3 Tính phi Gauss


33

4.4.4 Hạn chế của ICA

34

4.5 Ƣớc lƣợng ICA

34

4.5.1 Phƣơng pháp ICA sử dụng tính phi Gauss

35

4.5.2 Phƣơng pháp ICA sử dụng thông tin hỗ tƣơng

43

4.5.3 Phƣơng pháp ICA sử dụng tính phi tƣơng quan phi tuyến 44
4.6 PCA và ICA

45

4.7 Kết luận

48

Chƣơng 5. THUẬT TOÁN FASTICA


49

5.1 Tiền xử lý ở ICA

49

5.1.1 Qui tâm

49

5.1.2 Trắng hóa

50

vii


5.2 Xấp xỉ hóa negentropy

53

5.3 Thuật toán FastICA

54

Chƣơng 6. THỰC NGHIỆM TÁCH ÂM

58

6.1 Mô hình thực hiện


58

6.2 Chuẩn đánh giá

59

6.3 Thực nghiệm và kết quả

60

6.4 Kết luận

77

Chƣơng 7. KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN

78

TÀI LIỆU THAM KHẢO

82

PHỤ LỤC

84

Thuật toán FastICA

84


viii


DANH MỤC TỪ VIẾT TẮT/ KÍ HIỆU KHOA HỌC
Ký tự viết tắt

Tiếng Anh

Tiếng Việt

BEM

Boundary Element Method

phương pháp phần tử biên

BSP

Blind Signal Processing

Xử lý tín hiệu mù

BSS

Blind Sources Separation

Phân tách nguồn mù

BEM


Boundary Element Method

phương pháp phần tử biên

FDTD

Finite Difference Time Domain

phương pháp miền thời gian vi
sai hữu hạn

FEM

Finite Element Method

phương pháp phần tử hữu hạn

ICA

Independent Component

Phân tích các thành phần độc

Analysis

lập

IC


Independent Component

Thành phần độc lập

PCA

Principal Component Analysis

Phân tích các thành phần chính

PDF

probability density function

Hàm mật độ xác suất

STFT

Short Time Fourier Transform

Biến đổi Fourier thời gian ngắn

ix


DANH SÁCH CÁC HÌNH
HÌNH

TRANG


Hình 2.1: Cấu trúc hình học một phòng đơn giản

4

Hình 2.2: Minh họa đáp ứng xung và trường âm của khán phòng thu được

5

Hình 2.3: Các mô hình chính thống mô tả âm học phòng

6

Hình 2.4: Các tuyến âm trực tiếp và phản xạbậc một và hai

8

Hình 2.5: Theo phương pháp nguồn ảnh, nguồn âm phản xạ tại mỗi bề mặt

9

Hình 2.6: Các nguồn ảnh tìm được trong một khán phòng

10

Hình 2.7: Chia đáp ứng xung phòng thành âm trực tiếp

11

Hình 3.1 : Tách mù văn bản từ một tín hiệu bị trùng lặp


14

Hình 3.2 : Ứng dụng trong y tế của bài toán xử lý tín hiệu mù

15

Hình 3.3 : Thu nhiều tín hiệu tác động vào não bộ dùng EEG và MEG

16

Hình 3.4 : Năm mẫu của dòng tiền mặt theo trình tự thời gian

17

Hình 3.5 : Bốn thành phần độc lập được tìm thấy từ các dữ liệu dòng tiền mặt

18

Hình 3.6 : Môi trường truyền thông không dây

19

Hình 3.7: Bài toán xử lý tín hiệu mù trong quân sự

20

Hình 3.8 : Ứng dụng BSS trong xử lý âm thanh

21


Hình 4.1: Các tín hiệu âm gốc s1  t  , s2  t  và s3  t 

28

Hình 4.2: Hỗn hợp lai ghép của các tín hiệu âm trong hình 4.1

29

Hình 4.3: Các ước lượng của tín hiệu gốc

29

Hình 4.4 : Mục đích của phân tách nguồn mù

30

Hình 4.5 : Hàm mật độ xác suất của phân bố Gauss

36

Hình 4.6 : Hàm mật độ xác suất của phân bố Laplace

36

Hình 4.7 : Phân bố đều

37

Hình 4.8 : Minh họa định lý giới hạn trung tâm


37

Hình 4.9 : Sự phân bố chung của các thành phần độc lập

38

Hình 4.10 :Mật độ của một thành phần độc lập phân bố đều

39

x


Hình 4.11 : Phân bố chung của hai thành phần độc lập

39

Hình 4.12 :Mật độ phân bố của các tín hiệu trộn xi  t 

40

Hình 4.12: PCA của đám mây dữ liệu hai chiều

46

Hình 4.13: PCA tìm kiếm trục trực giao theo hướng cực đại phương sai

47

Hình 3.14: Hình chiếu hai cụm dữ liệu vào một trục sử dụng PCA và ICA


47

Hình 6.1: Minh họa quá trình tạo tín hiệu lai ghép với kỹ thuật phòng ảo

58

Hình 6.2: Sơ đồ hệ thống tách âm

59

Hình 6.3 : Trộn âm

61

Hình 6.4 : Tách âm

61

Hình 6.5 :Tín hiệu nguồn ban đầu

63

Hình 6.6 : Tín hiệu trộn

64

Hình 6.7 : Tín hiệu được ước lượng theo phương pháp ICA

65


Hình 6.8 :Biểu diễn các tín hiệu trong thực nghiệm 2

66

Hình 6.9 :Biểu diễn các tín hiệu trong thực nghiệm 3

69

Hình 6.10 : Tín hiệu nguồn s1, s2, s3, s4, s5

71

Hình 6.11: Tín hiệutrộn x1, x2, x3, x4, x5

71

Hình 6.12:Tín hiệu ước lượng y1, y2, y3, y4, y5

72

Hình 6.13:Tín hiệu nguồn s1, s2,, s10

73

Hình 6.14 : Tín hiệu trộn x1, x2,, x10

74

Hình 6.15 : Tín hiệu ước lượng y1, y2,, y10


75

xi


DANH SÁCH CÁC BẢNG
BẢNG

TRANG

Bảng 6.1: Danh sách các nguồn âm thực nghiệm

62

Bảng 6.2: Kết quả đánh giá thực nghiệm 2

67

Bảng 6.3: Kết quả đánh giá thực nghiệm 3

68

Bảng 6.4: Kết quả đánh giá thực nghiệm 4

70

Bảng 6.5: Kết quả đánh giá thực nghiệm 5

76


xii


Chƣơng 1

TỔNG QUAN
1.1. Lý do chọn đề tài
Gần đây, công nghệ xử lý tiếng nói, xử lý ảnh, truyền thông không dây,
mạng và các thiết bị thông tin cá nhân đã và đang đuợc phát triển rất mạnh mẽ. Bắt
đầu từ những năm 90 những nghiên cứu và thành công trong công nghệ mang lại
tính năng hỗ trợ đa phương tiện, dễ sử dụng, nhỏ gọn và linh động. Một trong
những công nghệ tham gia và phát triển hỗ trợ như vậy chính là xử lý tiếng nói.
Mặc dù, nghiên cứu trong lĩnh vực đã tiến hành từ vài thập kỷ qua, nhưng nó vẫn
còn là vấn đề cần quan tâm và làm sáng tỏ hơn.
Xử lý tiếng nói được tóm gọn phát triển trong năm hướng [1] thì ba trong số
đó là có liên quan đến nhận dạng tiếng nói. Công việc nghiên cứu này thực ra
không còn gì mới mẻ với nhiều nghiên cứu trên thế giới và cảở Việt Nam. Tuy
nhiên để đạt đến sự hoàn thiện theo tham vọng của chúng ta thì vẫn còn những
bước rất dài phía trước.
Kết quả của bài toán tách tín hiệu tiếng nói là cơ sở cho rất nhiều những ứng
dụng trong thực tiễn liên quan tới xử lý tiếng nói. Kết quả của quá trình tách có tốt
thì kết quả của nhận dạng mới chính xác được.Ví dụ như trong mô hình nhận dạng
tiếng nói, tức là chuyển từ tiếng nói sang dạng text, tín hiệu đưa vào để nhận dạng
được lấy từ dữ liệu ở các micro thu. Do đó, để có dữ liệu tiếng nói cho quá trình
nhận dạng, trước hết cần tách ra được tín hiệu mong muốn từ dữ liệu bị trộn lẫn và
chịu ảnh hưởng của môi trường từ các micro thu để không chỉ lấy được tín hiệu
tiếng nói nào đó cần xử lý mà còn làm "sạch" nó khỏi nhiễu. Vậy suy nghĩ tự nhiên
sẽ là: từ nhiều tín hiệu âm đã đƣợc trôn lẫn, làm thế nào để khôi phục lại từng
tín hiệu nguồn riêng lẻ?


1


Giải pháp như vậy sẽ được đề cập và giải quyết trong luận văn này, mà
phương pháp chính có tên là: phân tích thành phần độc lập (Independent
Component Analysis_ICA) [2],[3],[4],[5].
1.2 Mục tiêu nghiên cứu
Luận văn này góp phần trình bày kiến thức tổng quan về bài toán phân tách
nguồn mù âm thanh, kỹ thuật ICA. Trên cơ sở đó lựa chọn một thuật toán ICA hiệu
quả đểứng dụng tách các nguồn âm mù độc lập.
1.3 Nhiệm vụ nghiên cứu
Trong luận văn này, trình bày tổng quan về bài toán phân tách nguồn mù âm
thanh, kỹ thuật ICA và ứng dụng vào việc tách âm, thuật toán fastICA.
Người thực nghiên cứu tập trung vào các vấn đề tách nguồn xác định nơi số
nguồn bằng số lượng các kênh trong hỗn hợp quan sát (số trộn).
1.4 Khách thể và đối tƣợng nghiên cứu
Luận văn thực hiện tách âm. Mỗi nguồn phát được tạo từ các mẫu âm chuẩn
và thu mẫu từ máy tính với tốc độ lấy mẫu là 8KH mã hoá PCM 16 bit. Chiều dài
mỗi đoạn dữ liệu mẫu là 10 giây. Do không có điều kiện thu trực tiếp nên ở đây các
thực nghiệm tiến hành trên tín hiệu thu ảo, tức là mô tả ma trận lai ghép qua đặc
trưng phòng âm hoặc là một ma trận hệ số bất kỳ.
1.5 Giả thuyết nghiên cứu
Người nghiên cứu thực hiện tất cả thực nghiệm dựa trên mô hình ICA cơ sở
tuân theo giả thuyết về đặc trưng nguồn phát: độc lập và phi Gauss; tuân theo giả
thuyết là quá trình lai ghép xảy ra tức thì, không nhiễu, số đầu thu bằng số tín hiệu.
1.6 Phạm vi nghiên cứu
Phạm vi nghiên cứu trong luận văn này là người thực nghiên cứu tập trung
vào các vấn đề tách nguồn âm xác định nơi số nguồn bằng số lượng các kênh trong
hỗn hợp quan sát (số trộn).

1.7 Phƣơng pháp nghiên cứu
Luận văn nghiên cứu lý thuyết kết hợp với thực nghiệm để kiểm chứng, cụ
thể tiến hành theo các bước như sau:

2


- Tìm hiểu các vấn đề lý thuyết cụ thể gồm: tổng quan về bài toán xử lý mù,
phương pháp phân tích thành phần độc lập, lý thuyết và mô hình toán của thuật
toán fastICA...Sau đó áp dụng tách nguồn mù âm thanh bằng thuật toán FastICA.
- Thực hiện mô phỏng trên phần mềm mô phỏng Matlab 2013a.
1.8Kế hoạch thực hiện
Thời gian thực hiện

Nội dung thực hiện

23/2/2015 – 20/3/2015

Nghiên cứu thuật toán fastICA

20/3/2015 – 20/6/2015

Thực hiện tách âm bằng thuật toán fastICA

20/6/2015 – 20/7/2015

Đánh giá chất lượng của âm tách

20/7/2015 – 20/8/2015


Viết báo cáo luận văn tốt nghiệp

3


Chƣơng 2

KỸ THUẬT PHÒNG ẢO
Việc thử nghiệm mô hình ICA với nhiều nguồn tín hiệu và nhất là tín hiệu
âm thanh đòi hỏi thực hiện với tín hiệu nhân tạo. Cụ thể là lấy tín hiệu âm thực
chập với đáp ứng xung biết trước của một căn phòng. Lý do bởi số đầu thu giới hạn
và khó mở rộng mạng thu âm. Ngoài ra có hai yếu tố quan trọng đối với thử
nghiệm nhân tạo: một là giới hạn kích thước bộ lọc tách, hai là với các bộ lai biết
trước, xác định ma trận giả lai trộn sẽ dễ dàng hơn trong phân tích định lượng, so
sánh kết quả. Phần này sẽ trình bày các giải pháp xác định đáp ứng xung của một
căn phòng từ các thông số đặc tả của chúng. Kết quả là cơ sở cho việc hình thành
ma trận lai trong mô hình ICA cơ sở.
2.1Kỹ thuật âm học phòng
Hình2.1 biểu diễn cấu trúc hình học đơn giản của một phòng và các tuyến
truyền trực tiếp và phản xạ của âm. Trong hình này tất cả các hướng phản xạ được
xem là khúc xạ luôn tồn tại thành phần khuyếch tán ( xem thêm [6] ).

Hình 2.1: Cấu trúc hình học một phòng đơn giản, và biểu diễn của âm trực
tiếp (đường liền) và các phản xạ bậc một (đường gạch) và bậc hai (đường chấm)

4


Hình 2.2: (a) minh họa đáp ứng xung của một khán phòng. Trong một đáp
ứng xung phòng gồm ba phần: âm trực tiếp, các phản xạ sớm và rung động trễ,

trường âm được xem là khuyếch tán. (b) trường âm của khán phòng thu được.
Đáp ứng xung của một phòng hòa nhạc có thể tách thành ba phần sau: âm
trực tiếp, âm phản xạ sớm và âm vang trễ. Đáp ứng minh họa như trong hình 2.2(a)
là một mạng đơn giản, trong đó không có các tuyến khuyếch tán hay nhiễu xạ.
Trong đáp ứng thực tế sẽ có phần năng lượng khuyếch tán giữa các phản xạ sớm
như trong hình 2.2(b).
2.2Mô hình âm học phòng
Các tuyến truyền âm được mô tả toán học bởi phương trình sóng (phương
trình Henholtz). Đáp ứng xung từ nguồn đến người nghe có thể nhận được bằng
cách giải phương trình sóng, nhưng hiếm khi thực hiện theo phương pháp giải tích.
Do đó nghiệm được xấp xỉ và có ba mô hình tính toán âm học phòng khác nhau
được minh họa trong hình 2.3.

5


Hình 2.3: Các mô hình chính thống mô tả âm học phòng dựa trên các tia âm hoặc
trên giải phương trình sóng hoặc kỹ thuật thống kê.
• Các phương pháp dựa theo sóng (wave-based methods).
• Các phương pháp dựa theo tia (ray-based methods).
• Các mô hình thống kê (statistical models)
Các phương pháp theo tia, phương pháp ray-tracing [7] và phương pháp
nguồn ảnh (image-source) [8], thường được sử dụng nhất. Gần đây các kỹ thuật
dựa theo sóng đòi hỏi cao về tính toán như phương pháp phần tử hữu hạn (Finite
Element Method - FEM), phương pháp phần tử biên (Boundary Element Method BEM) và các phương pháp miền thời gian vi sai hữu hạn ( Finite Difference Time
Domain - FDTD) cũng được quan tâm đáng kể [7], [9]. Các kỹ thuật này chỉ phù
hợp mô phỏng âm tần số thấp.
Các phương pháp mô hình thống kê như phân tích năng lượng thống kê
(Statistical Energy Analysis - SEA) [7], được áp dụng chủ yếu trong dự đoán mức
nhiễu ở các hệ ghép có cấu trúc truyền âm giữ vai trò quan trọng.

2.3 Phƣơng pháp theo sóng
Phương pháp này cho kết quả chính xác nhất. Nghiệm giải tích của phương
trình sóng chỉ có thể tìm được trong một số ít trường hợp như với một phòng hình
chữ nhật có tường rắn. Do đó, cần sử dụng các phương pháp số toán với phương
6


trình sóng. Các phương pháp phần tử như FEM và BEM chỉ thích hợp với không
gian nhỏ và các tần số thấp do yêu cầu tính toán cao. Điểm khác biệt ở đây chính là
cấu trúc phần tử, FEM rời rạc toàn bộ không gian, trong khi BEM chỉ thực hiện với
các biên của không gian rời rạc. Thực tế điều đó có nghĩa là các ma trận FEM lớn
và thưa còn các ma trận BEM nhỏ và dày hơn.
Các phương pháp FDTD đưa ra các kỹ thuật khả thi khác cho việc mô phỏng
âm học phòng [9]. Nguyên lý chính của phương pháp này chính là đạo hàm của
phương trình sóng được thay bằng vi sai hữu hạn. Phương pháp FDDT cho đáp ứng
xung thích hợp hơn FEM và BEM.
Một lợi điểm của các phương pháp phần tử theo FDDT là tạo nên cấu trúc
lưới chặt tại các vị trí cần thiết như các góc. Ngoài ra, các phương pháp này cho
khả năng kết nối các mô hình dễ dàng.
2.4 Phƣơng pháp theo tia
Phương pháp theo tia của hình 2.3 dựa trên các đặc trưng âm hình học của
phòng, trong đó âm được xem như các tia. Giả thuyết này đúng khi bước sóng âm
nhỏ so với diện tích bề mặt phòng và lớn so với mức độ gồ ghề bề mặt. Do đó tất cả
các hiện tương tuân theo bản chất sóng, chẳng hạn nhiễu xạ và giao thoa có thể bỏ
qua.
Các kết quả của mô hình theo tia giống với đáp ứng trong hình 2.2(a) do âm
thanh được xem là các tia với phản xạ hoàn toàn. Trong hầu hết các hệ thống kết
quả là bình phương của đáp ứng xung.
Phương pháp theo tia phổ biến nhất là phương pháp vạch tia (ray-tracing)
[7] và phương pháp nguồn ảnh (image-source) [8]. Điểm phân biệt cơ sở của hai

phương pháp này là cách tính toán các tuyến phản xạ. Để mô hình một đáp ứng
xung lý tưởng cần đưa ra tất cả các tuyến phản xạ âm có thể. Phương pháp nguồn
ảnh tìm tất cả các tuyến này, tuy nhiên vì thực tế khối lượng tính toán lớn nên chỉ
một tập hợp các phản xạ sớm được tính. Bậc phản xạ cực đại có thể đạt được phụ
thuộc vào cấu trúc hình học phòng và khả năng tính toán cho phép. Bên cạnh đó
yếu tố đặc trưng hình học phải thiết lập trên các mặt phẳng. Phương pháp vạch tia

7


S

K

L

0

0

2

1

5

4




×