Tải bản đầy đủ (.pdf) (13 trang)

Bài soạn xử lý âm THANH – HÌNH ẢNH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.05 MB, 13 trang )

Bài soạn XỬ LÝ ÂM THANH – HÌNH ẢNH
1.

Phối màu
3 màu cơ bản: Red – Green – Blue (màu RGB)
Các màu trong tự nhiên đều được phối từ 3 màu cơ bản theo phương trình:
f’F = r’R + g’G + b’B
3 màu được phối từ 3 màu cơ bản
 Red + Green = Yellow (Y)
 Red + Blue = Magenta (M)
 Blue + Green = Cyan (C)

Bài tập 1:

Hai màu F1 và F2 có tọa độ trong hệ màu RGB như sau
F1 (0.3 ; 0.5 ; 0.2)
F2 (0 ; 0.5 ; 0.5)
Tìm tọa độ của màu F nhận được sau khi trộn 1 phần F1 và 2 phần F2.

Giải
F1 =
F2 =
F1 + 2F2 =
=
Fz =

0.3R
+ 0.5G
+ 0.2B
0R
+ 0.5G


+ 0.5B
0.3R + (0.5 + 2 * 0.5)G + (0.2 + 2 * 0.5)B
0.3R
+ 1.5G
+ 1.2B
.
.

.

.

+

.
.

.

=
0.1R
=> FZ (0.1 ; 0.5 ; 0.4)

.

+ 0.5G

+

.

.

.

.

+ 0.4B

Bài tập 2:
Vẽ các tín hiệu video thành phần RGB để tạo ra ảnh màu gồm 8 sọc dọc: đen, trắng,
red (R), green (G), blue (B), Cyan (C), Magenta (M), Yellow (Y) (độ bão hòa màu 100%). Được biết
tín hiệu video trên tạo ra ảnh có các sọc với mức chói tăng dần từ đen sang trắng trên màn hình
TV đen trắng. Vẽ 1 dòng tín hiệu chói.

EY = 0.3ER + 0.59EG + 0.11EB
Giải
ER , EG , EB ϵ [0;1]


Sọc

Đen

Trắng

R

G

B


C

M

Y

ER

0

1

1

0

0

0

1

1

EG

0

1


0

1

0

1

0

1

EB

0

1

0

0

1

1

1

0


EY

0

1

0.3

0.59

0.11

0.7

0.41

0.89

TH

Ghi chú:
K: blacK
G: Green

B: Blue
C: Cyan

R: Red
Y: Yellow


M: Magenta
W: White


2.

Xác định số mức xám trong ảnh số

m=

(

)

+1

k =


m: số lượng mức xám mắt người nhìn thấy được cùng lúc trên màn hình
k’: độ tương phản khi chịu tác động của nguồn sáng ngoài (Lng)
Lmax: độ chói cao nhất
Lmin: độ chói thấp nhất
Bài tập 3:
Tìm số lượng bit cần thiết để lượng tử hóa tín hiệu truyền hình số khi màn hình
máy thu trong hệ thống truyền hình số có độ chói thay đổi từ Lmin = 1cd/m2 đến Lmax =
100cd/m2, nguồn sáng bên ngoài chiếu lên bề mặt màn hình có độ chói Lng = 5cd/m2, giá trị
ngưỡng tương phản σ = 0.03.

Giải

=

=

= 17.5

=

(

)

+ 1 = 98

=> Số lượng bits: k = 7
Bài tập 4:
Tín hiệu truyền hình màu được số hóa thành phần (Y, u, v) theo chuẩn 4 : 2 : 0. Tần
số lấy mẫu là 13.5 MHz, mã hóa nhị phân 8 bits/mẫu. Tìm tốc độ luồng bits của tín hiệu video số.
Giải
Y
RY = fS * k = 13.5 * 106 * 8 = 108 Mbps
u
Ru = ¼ * (fS * k) = ¼ * 13.5 * 10 6 * 8 = 27 Mbps
v
Rv = 27 Mbps
=> R∑ = 162 Mbps
Các tiêu chuẩn mã hóa :


4:4:4
Tần số lấy mẫu màu bằng tần số lấy mẫu độ chói
4:2:2
Tần số lấy mẫu màu bằng ½ tần số lấy mẫu độ chói
4:2:0
Tần số lấy mẫu màu bằng ¼ tần số lấy mẫu độ chói
4:1:1
Tần số lấy mẫu màu bằng ¼ tần số lấy mẫu độ chói
So sánh luồng bits của 2 chuẩn mã hóa 4 : 4 : 4 và 4 : 1 : 1
B4 : 4 : 4 = 3 * f S * k
B4 : 1 : 1 = fS * k + ¼ * fS * k + ¼ * fS * k = 1.5 * fS * k


3.

Quan hệ giữa các điểm ảnh

Liên kết m
Vd: V ϵ [5 – 8]
Liên kết m sẽ tạo kết nối giữa 2 điểm
ảnh có độ chói nằm trong tập V. Liên kết m
tạo kết nối chéo như ND (hình a) hoặc kết
nối thẳng (hình b). Liên kết m sẽ ưu tiên cho
kết nối thẳng (hình b).
4.

Khoảng cách giữa 2 điểm ảnh
Với tọa độ điểm ảnh:
p (x ; y)
q (s ; t)

Khoảng cách D 4 giữa 2 điểm ảnh:
4( , )= | − |+ | − |
Khoảng cách D 8 gi ữa 2 điểm ảnh:
8 ( , ) = max (| − | + | − |)

Bài tập 5:
Cho ảnh số 3 sọc dọc: vàng, đen, xám 50%. Ảnh được xử lý trong không gian màu
RGB. Phương trình tạo màu xám là Y = 1/3 R + 1/3 G + 1/3 B. Vẽ đặc tuyến biến đổi s = T[r] cho
từng kênh màu để nhận được ảnh kết quả có 3 sọc Cyan, lam (blue), xám 70%. Biểu diễn một
dòng tín hiệu chói của ảnh kết quả.
Giải


Sọc

Vàng

Đen

Xám
50%

R1

1

0

0.5


G1

1

0

B1

0

Y1

2/3

TH

Cyan

Blue

Xám
70%

R2

0

0

0.7


0.5

G2

1

0

0.7

0

0.5

B2

1

1

0.7

0

0.5

Y2

2/3


1/3

0.7

Đặc tuyến biến đổi s = T[r]

Biểu diễn một dòng tín hiệu chói ảnh kết quả

Sọc
TH


5. Tách mặt phẳng bit
Bài tập 6:
Ảnh gốc có kích thước 16 x 10 dạng sọc dọc với mức chói tăng dần đều từ trái sang
phải. Các mức chói mã hóa 4 bits. Vẽ đặc tuyến biến đổi để tách mặt phẳng bit LSB. Mô tả ảnh
kết quả, vẽ lược đồ xám của ảnh kết quả (ảnh LSB).
Giải
4 bits/mẫu => 24 = 16 mức chói

Đặc tuyến biến đổi để tách mặt phẳng bit LSB

* Lược đồ xám thể hiện số điểm ảnh có mức chói bằng nhau
Ảnh kết quả (ảnh LSB) có kích thước 16 x 10, hai mức chói 0 và 1
=> Số điểm ảnh có mức chói bằng 0: 80
Số điểm ảnh có mức chói bằng 1: 80
Số điểm ảnh 0: 8 cột có mức chói 0 (s = 0) tại các cột có r = 0, 2, 4, 6, 8, 10, 12, 14. Mỗi cột có
10 điểm ảnh => Số điểm ảnh có mức chói bằng 0 = 8 x 10 = 80
Số điểm ảnh 1: 8 cột có mức chói 1 (s = 1) tại các cột có r = 1, 3, 5, 7, 9, 11, 13, 15. Mỗi cột có

10 điểm ảnh => Số điểm ảnh có mức chói bằng 1 = 8 x 10 = 80
* Xác suất xuất hiện điểm ảnh của 1 mức chói trong lược đồ xám chuẩn = Số điểm ảnh của 1
mức chói ÷ Tổng số điểm ảnh


Lược đồ xám ảnh kết quả

6.

Lược đồ xám chuẩn ảnh kết quả

Tách mức chói ảnh
Mức chói mã hóa 8 bits/mẫu => 28 = 256 mức chói (0 -> 255)
Mức chói được tách L ϵ [L1 ; L2]
Tách mức chói có nền
Tách mức chói không nền

Bài tập 7:
Ảnh gốc có kích thước 128 x 48 pixels có dạng sọc dọc với mức chói tăng dần đều từ
trái sang phải (đen -> trắng), được xử lý bằng cách tách mức chói có nền. Mức chói mã hóa 6
bits/mẫu. Mức chói được tách nằm trong khoảng [10 – 19]. Vẽ đặc tuyến hàm biến đổi, lược đồ
xám chuẩn của ảnh kết quả và ảnh gốc. Mô tả 1 ảnh bất kỳ có lược đồ xám giống ảnh gốc.
Giải
6 bits/mẫu => 26 = 64 mức chói (0 -> 63)
Kích thước ảnh 128 x 48 pixels dạng sọc dọc
=> Mỗi mức chói có 2 cột (128/64 = 2), mỗi cột có 48 điểm ảnh => Số điểm ảnh của mỗi mức
chói: 2 x 48 = 96.


Mô tả ảnh gốc


Lược đồ xám ảnh gốc

Lược đồ xám chuẩn ảnh gốc
Xác suất xuất hiện điểm ảnh của 1 mức chói: 96 / (128 x 48) = 1/64

Đặc tuyến biến đổi ảnh gốc sang ảnh kết quả (mức chói được tách nên lấy trong khoảng [10 ;
19]

Lược đồ xám ảnh kết quả
* Số điểm ảnh có mức chói 15: 10 x 2 x 48 = 10 x (2 x 48) = 10 x 96 = 960 pixels


Lược đồ xám chuẩn ảnh kết quả
Xác suất xuất hiện điểm ảnh có mức chói từ 0 -> 9 và 20 -> 63: 96 / (128 x 48) = 1/64
Xác xuất xuất hiện điểm ảnh có mức chói 15: 960 / (128 x 48) = 5/32

7.

Cân bằng lược đồ xám

Sk = T[rk] = ∑
Bài tập 8:

= ∑

( )

Cho ảnh có kích thước 6 x 6 như sau:
9


11

14

9

10

13

11

9

15

13

15

12

10

15

9

12


9

12

10

12

14

15

13

10

8

9

15

8

9

9

8


14

9

13

15

12

Độ chói mã hóa 4 bits. Tìm lược đồ xám của ảnh, cân bằng lược đồ xám.


Giải
rk

0

1

2

3

4

5

6


7

8

9

10

11

12

13

14

15

nk

0

0

0

0

0


0

0

0

3

9

4

2

5

4

3

6

P(rk)

0

0

0


0

0

0

0

0

0

0

0

0

0

0

0

0

9
36
12

36

4
36
16
36

2
36
18
36

5
36
23
36

4
36
27
36

3
36
30
36

6
36


Sk

3
36
3
36

Sk*

0

0

0

0

0

0

0

0

1

5

7


8

10

11

13

15

1

Sk* = Sk x 15
Ảnh kết quả
5

8

13

5

7

11

8

5


15

11

15

10

7

15

5

10

5

10

7

10

13

15

11


7

1

5

15

1

5

5

1

13

5

11

15

10

Lược đồ xám ảnh kết quả

Bài tập 9:

Cho ảnh đen trắng có kích thước 13 x 13, mức chói mã hóa 4 bits/mẫu. Lược đồ
xám có dạng:
rk

0

1

2

3

4

5

6

7

8

9

10

11

12


13

14

15

nk

5

13

38

17

13

5

1

1

1

3

6


19

31

11

2

3

Ảnh đã được cân bằng lược đồ xám. Tìm lược đồ xám của ảnh kết quả.


Giải
rk

0

1

2

3

4

5

6


7

8

9

10

11

12

13

14

15

nk

5

13

38

17

13


5

1

1

1

3

6

19

31

11

2

3

P(rk
13 38 17 13
1
1
1
3
6
19 31 11

2
3
5
5
)
169 169 169 169 169 169 169 169 169 169 169 169 169 169 169 169
18 56 73 86 91 92 93 94 97 103 122 153 164 166
5
Sk
1
169 169 169 169 169 169 169 169 169 169 169 169 169 169 169
Sk*

0

2

5

6

8

8

8

8

8


9

9

11

14

15

15

15

4

5

6

7

8

9

10

11


12

13

14

15

38

17

21

9

31

16

Lược đồ xám ảnh kết quả
rk

0

nk

5


1

2

3

13

19

8. Quá trình nhân chập ảnh và ma trận (mặt nạ) lọc
Bài tập 10: Cho ảnh gốc và ma trận lọc như sau:
0

0

0

0

0

0

0

0

0


0

0

0

0

0

0

0

0

0

0

0

0

0

0

0


0

0

0

0

0

0

0

0

0

0

0

0

0

0

0


0

1

0

0

0

0

0

0

0

0

0

0

0

0

0


0

0

0

0

0

0

0

0

0

¼

0

0

0

0

0


0

0

0

0

0

0

¼

0

0

0

0

0

0

0

0


0

0

0

¼

¼

0

Ảnh gốc
Ma trận lọc
Điểm ảnh đen có giá trị 0, trắng có giá trị 1. Hệ số trong ma trận lọc 1/4 . Thực hiện quá trình lọc
không gian, quan sát và nhận xét kết quả.
Giải
0
¼
¼
* Trước khi đưa ma trận lọc vào ảnh gốc để lọc, xoay ma trận lọc 1 góc 180o.
=> Ma trận lọc sau khi xoay
0
0
¼
0

0

¼



Ảnh kết quả sau khi lọc
0

0

0

0

0

0

0

0

0

0

0

0

0

0


0

0

0

0

0

0

0

0

0

0

0

0

0

0

0


0

¼

0

0

0

0

0

0

0

0

¼

0

0

0

0


0

0

0

0

¼

¼

0

0

0

0

0

0

0

0

0


0

0

0

0

0

0

0

0

0

0

0

0

0

0

0


0

0

0

0

0

0

0

Bài tập 11: Xử lý ảnh bằng bộ lọc trung bình cộng có kích thước 3 x 3. Các điểm ảnh ngoài có giá
trị 0.
Ảnh gốc
Ma trận lọc tb cộng
Ảnh kết quả (lọc tb cộng)

9.

2

9

6

1


1

1

2

4

3

3

5

8

1

1

1

3

5

4

4


7

2

1

1

1

2

3

2

Các loại ma trận lọc
Lọc trung bình cộng: Đặt ma trận lọc vào ảnh gốc, tính tổng mức chói của các điểm ảnh nằm
trong ma trận lọc rồi chia số điểm ảnh đang xét (kích thước ma trận lọc), kết quả đặt tại trọng tâm
của ma trận lọc.
Lọc trung vị: Đặt ma trận lọc vào ảnh gốc, sắp xếp các mức chói nằm trong ma trận lọc theo
mức chói tăng dần, lấy giá trị mức chói ở giữa dãy số đặt vào trọng tâm ma trận lọc. Nếu chuỗi số
chẵn thì cần quy định trước trọng tâm của ma trận lọc ở đâu ? ? ?
Lọc giả trung vị: Đặt ma trận lọc vào ảnh gốc, lấy 2 mức chói lớn nhất và nhỏ nhất nằm trong
ma trận lọc rồi chia 2, kết quả đặt tại trọng tâm ma trận lọc.
Lọc cực đại: Đặt mà trận lọc vào ảnh gốc, lấy mức chói lớn nhất trong ma trận lọc đặt vào
trọng tâm của ma trận lọc.
Lọc cực tiểu: lấy giá trị mức chói nhỏ nhất



Lọc nét ảnh bằng toán tử Laplace: Lọc ảnh bẳng ma trận lọc bên dưới. Nhân hệ số ma trận cho
mỗi mức chói nằm trong ma trận lọc rồi tính tổng. Kết quả đặt tại trọng tâm của ma trận lọc.
Điểm ảnh trọng tâm (kết quả) = 5Z5 – (Z2 + Z4 + Z6 + Z8)
Z1

Z2

Z3

0

-1

0

Z4

Z5

Z6

-1

5

-1

Z7


Z8

Z9

0

-1

0

10. Phương pháp nén ảnh tĩnh chuẩn JPEG

f  i, j 

F  u, v 

Fq  u, v 

Ảnh gốc sẽ được tách thành từng khối ảnh có kích thước 8 x 8 (64 mẫu).
DCT (Discrete Cosine Transform): Biến đổi dữ liệu từ miền không gian sang miền tần số.
Lượng tử hóa (không đồng đều): Để thực hiện quá trình nén dữ liệu, ma trận các hệ số triển
khai sau DCT phải được chia cho bảng trọng số Q (u,v) để loại bỏ một phần các hệ số DCT có biên
độ nhỏ (thường là các thành phần cao tần).
Quét zig-zag: Mục đích làm tăng tối đa độ dài của chỗi các giá trị 0 liên tiếp. Như vậy, hiệu
quả nén khi dùng mã RLC sẽ tăng.
Hệ số DC: hệ số đầu tiên có tọa độ (0,0).
Hệ số AC: là 63 hệ số còn lại trừ tọa độ (0,0).
DPCM: Mã hóa hệ số DC
RLC: Mã hóa loạt dài, bao gồm từ mã Huffman và giá trị biên độ (nhị phân) của hệ số AC.
Mã hóa Entropy: Mã hóa theo xác suất xuất hiện mẫu.




×