HỌC VIỆN
CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
----------
BÀI TẬP LỚN
XỬ LÍ ÂM THANH VÀ HÌNH ẢNH
Giáo viên:
Nhóm sinh viên:
1.PHẠM ĐÌNH SƠN
2.ĐẬU VĂN THẮNG
3.ĐINH DUY ANH
4.HỒ ĐĂNG HẠNH
5.NGUYỄN ĐỨC LONG
LỚP: D13VT6
Hà Nội – 4/2016
Câu 2.8:
a. Trình bày hiệu ứng che trong mã hóa âm thanh.
b. Giải thích sự khác nhau giữa che miền thời gian và che miền tần số?
c. Xác định số bit cần thiết để mã hóa cho các băng 7 và 9 ?. Biết băng 8 che 12
dB ở băng 7, 15 dB ở băng 9 và tín hiệu gốc được mã hóa 8 bit/mẫu/băng.
--------------------------------------------------------------------------------------Băng
Mức (db)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
0 8 12 10 6 2 20 60 14 20 15 2 3
Bài làm:
5 3 1
c. – Băng 9 bị che 15dB, thực chất nó chỉ có 14dB -> băng 9 nằm dưới ngưỡng nghe
-> khơng cần mã hóa.
- Băng 7 bị che 12dB, thực chất nó có 20dB -> băng 7 nằm ở ngưỡng nghe, và còn
20-12=8dB cần phải mã hóa.
- Ta có: SNR=6.n
- Khi tăng hoặc giảm 1 bit -> SNR tăng hoặc giảm 6dB.
- Mà băng 7 bị che 12dB -> bị che mất 2 bit.
=> số bít cần để mã hóa là: 8-2=6 (bit).
Câu 2.13:
Xét ch̃i video được mã hóa sử dụng H.263 ở chế độ PB, có kích cỡ ảnh 4CIF,
tớc độ 30 fps. Ch̃i video được trình chiếu trong 90 phút. Các tham số nén được cho
như sau: trung bình có 2 ảnh I được mã hóa trong 1 giây. Ch̃i video ở chất lượng yêu
cầu có tỉ lệ nén trung bình ảnh I, P, B tương ứng là 10:1, 20:1, 40:1. Tính dung lượng
của ch̃i video trên sau khi mã hóa? Tính thời gian để tải đoạn video đó trong trường
hợp sử dụng ADSL2+?
Bài làm:
-1-
Câu 2.14:
Cho hệ thống LPC tổng quát như hình vẽ dưới đây:
Tính giá trị 10 mẫu tổng hợp đầu tiên tại đầu ra? Biết:
- Bộ dự đốn có bậc p=4 với các hệ sớ dự đốn: a1=1,793; a2=-1,401;
a3=0,566; a4=-0,147.
- Độ lợi G=2, độ dài chu kỳ pitch=60; giả thiết là âm hữu thanh,
-2-
- u(m)=1 tại m=1 và u(m)=0 tại các giá trị m khác.
Các điều kiện đầu =0 tại thời điểm bắt đầu của chu kỳ pitch
Bài làm:
Câu 2.15:
Sử dụng thuật toán Levinson-Durbin để tìm các hệ sớ dự đốn của bộ dự đốn
bậc 3 (ai, i=1,2,3)? Biết khới dữ liệu thoại có các giá trị tự tương quan như sau: R(0)=1;
R(1)=0,866; R(2)=0,554 và R(3)=0,225.
Bài làm:
-3-
Câu 2.16:
Sử dụng phương pháp tới thiểu hóa bình phương sai sớ để tìm các hệ sớ dự đốn
của bộ dự đốn bậc 2 (ai, i=1,2)? Biết khới dữ liệu thoại có các giá trị tự tương quan
như sau: R(0)=1; R(1)=0,6 và R(2)=-0,2 . Cho x[4]=0,5 và x[3]=-0,1 và giả thiết bộ dự
đốn lỡi bình phương trung bình có độ dài là 2. Tính giá trị dự đoán cho mẫu tín hiệu
x[5]=?
Bài làm:
-4-
Câu 2.17:
a. Trình bày về các mô hình màu trong ảnh?
b. Cho ảnh màu RGB với R=200, G=150, B=40. Xác định các thành phần Y, Cb,
Cr cho ảnh theo mô hình Y, Cb, Cr? Giả sử với ảnh màu RGB đã cho có các thành
phần mầu được mã hóa 8 bit/pixel. Nếu chúng ta muốn biểu diễn thành ảnh màu 8 bít
sử dụng bộ lượng tử hóa đều với tỷ lệ R, G, B tương ứng dùng 3, 3, 2 bit mã hóa. Xác
định các giá trị màu sau khi lượng tử hóa?
Bài làm:
Câu 2.18:
Mã hóa ch̃i sau {3, 5, 2, 4, 7, 8, 6, 5, 3, 1,…} bằng việc sử dụng bộ mã hóa
DPCM? Ở đây, sử dụng bộ dự đoán x p (n) =
1
[ xˆ (n − 1) + xˆ (n − 2)] và bộ lượng tử 3 mức
2
dưới đây:
-5-
2 d ≥ −1
Q(d ) = 0
d <1
− 2 d ≤ −1
Giả sử rằng giá trị tạo lại của 2 mẫu đầu tiên là 3, 3. Mã sau được sử dụng để mã hóa
tín hiệu sai sớ: Error “0”-> “1”, Error “2” -> “01”, Error “-2” -> 00”.
Bài làm:
Câu 2.19:
Cho nguồn ký hiệu A, B, C, D, E, F, G, H có xác suất xuất hiện của các ký hiệu
như sau:
m
A
B
C
D
E
F
G
H
P(m)
0.11
0.19
0.41
0.06
0.05
0.09
0.06
0.03
a. Xác định mã Huffman cho các ký hiệu nói trên?
Tính độ dài từ mã trung bình và hiệu suất mã?
Bài làm:
-6-
Câu 2.20:
Cho một chuỗi 4 ký tự {a, b, c, d}. Xác suất xuất hiên của 4 ký tự là:
p(a)=0.4, p(b) = 0.1, p(c)=0.2, p(d)= 0.3.
a. Thiết kế Huffman codebook cho các ký tự đó. Tính tớc độ bít trung bình
(average bit rate) và so sánh nó với entropy của nguồn.
Dùng codebook vừa thiết kế viết luồng bít nhị phân cho chuỗi {baacddacbda}
Bài làm:
-7-
Câu 2.23:
Nêu ý nghĩa của tăng cường ảnh? Cho ảnh đa mức xám I với các mức xám nằm
trong đoạn [0, 255]. Dùng biến đổi s=log(1+r) để tìm ảnh đầu ra?
-8-
Bài làm:
Câu 2.24:
-9-
Nêu ý nghĩa phương pháp cân bằng lược đồ xám? Cho ảnh đầu vào I có 10 mức
xám. Thực hiện cân bằng lược đồ xám ảnh I đã cho?
Bài làm:
Câu 2.25:
Cho khối ảnh 8x8 sau khi biến đổi DCT và lượng tử được bảng dưới đây. Hãy
mã hóa khới ảnh này bằng mã RLC và VLC biết rằng giá trị DC có trong khới DCT
trước là 20?
75 -6 -3
3
0
0
0
0
2
0
3
0
0
0
0
0
0
-2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
- 10 -
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Bài làm:
Câu 3.7:
- 11 -
Xác định các hệ số DC và AC(0,1), AC(1,0) của phép biến đổi DCT cho khối
block ảnh 8x8 dưới đây ?
97
91
94
79
74
81 67
49
96
90
93
78
73
80 66
48
94
88
91
76
71
78 64
46
92
86
89
74
69
76 62
44
90
84
87
72
67
74 60
42
88
82
85
70
65
72 58
40
86
80
83
68
63
70 56
38
84
78
81
66
61
68 54
36
Bài làm:
- 12 -
- 13 -
Câu 3.8:
9 3
÷.
3 9
Cho khới ảnh S(2x2): S =
a. Hãy tìm các ảnh cơ sở của biến đổi DCT-2D đối với ảnh S trên?
b. Biểu diễn ảnh S qua các ảnh cơ sở tìm đươc ở trên?
Bài làm:
- 14 -
- 15 -
Câu 3.9:
8 2
÷.
2 8
Cho khới ảnh S(2x2): S =
a. Mã hóa ảnh S trên sử dụng chuẩn nén ảnh JPEG (bỏ qua bước trừ 128 điểm
3 2
÷ và DC của khới trước đó là 3.
2 5
ảnh). Biết ma trận lượng tử Q =
b. Tính tỷ số nén CR, RMS, PSNR, BPP?
Bài làm:
- 16 -
- 17 -
Câu 3.10:
Cho ma trận ảnh 4x4:
126 126 39 39
126 126 39 39
126 126 126 39
39 39 39 126
a. Sử dụng mã hóa từ điển LZW để mã hóa ảnh trên. Tính tỷ sớ nén?
Với dữ liệu ảnh nén có được ở câu a, sử dụng giải mã LZW để tìm ảnh ban đầu? (Giả
thiết ảnh được đọc và hiển thị theo thứ tự từ trái qua phải, từ trên xuống dưới).
Bài làm:
- 18 -
Câu 3.11:
- 19 -
a. Mã hóa chuỗi ký tự sau sử dụng mã hóa số học: MEDIA; biết các ký tự xuất
hiên vơi các xác suất như sau: M = 0.1, E = 0.3, D = 0.3, I = 0.2 va A = 0.1.
b. Cho bảng sau:
Kí tư Tần suất Xác suất
Dải
A
2
0.5
[0.0, 0.5)
B
1
0.25
[0.5, 0.75)
C
1
0.25
[0.75, 1.0)
Giải mã sớ học ch̃i đã mã hóa có 4 ký tự là: 0.59375?
Bài làm:
- 20 -
Câu 3.12:
Trình bày các khuôn dạng lấy mẫu YcbCr ? Cho một hệ thống truyền hình chất
lượng cao với số dịng z=1080, tỷ lệ khn hình 16:9, tần sớ quét là 60 mành/giây (quét
- 21 -
đan xen). Tín hiệu video được sớ hóa với độ phân giải theo chiều ngang và chiều dọc
giống nhau. Mức lượng tử là 256 cho thành phần chói và 128 cho hai thành phần màu.
Tính khối lượng thông tin số có được sau khi thực hiện sớ hóa một chương trình trùn
hình có thời gian là 2 giờ với khn dạng lấy mẫu : 4:2:0?
Bài làm:
+256 mức cho chói => có 8 bit biểu diễn chói.
+128 mức cho màu => có 7 bit biểu diễn màu.
+Kích thước ảnh 16:9
Sớ dịng z= 1080 => Số cột: (1080x16)/9=1920
Số điểm ảnh: (1920x1080) pixel.
+ 1 điểm ảnh sử dụng 8 bit chói, 14 bit màu (2 màu) => 22 bit
+ Tần số quét: 60/2=30(Hz)
+ Lấy mẫu theo chuẩn 4:2:0 => Tần số quét cho màu =1/2 tần cớ quét cho chói.
Dung lượng trong 2h: 1080x1920(8.30 + 7.30/2 + 7.30/2).2.3600=6718.464 Gb
Câu 3.13:
Cho đoạn tiếng nói đã được sớ hóa, x(n). Nguồn X, được giả thiết là quá trình
dừng WSS, có trung bình 0. Ước lượng nguồn có hàm tự tương quan như sau:
RX (k ) = 1;0,9;0,7;0,2;0,5;0,8;0,5;0,1 , k = 0,...,7
trong đó: k = i − j , vơi I à j được xác định từ ma trận tự tương quan,
RX (i, j ) = E { X (i )X ( j )} .
a. Ước tính chu kỳ pitch, P, của tín hiệu tiếng nói đó.
b. Tính hệ sớ dự đốn, a1 của bộ dự đốn tún tính (LPC) bậc 1 (p=1) đới với tín
hiệu này.
c. Cho 4 giá trị đầu tiên của đoạn tiếng nói: x(n)=[1,2,3,5]:
- Hãy tính các hệ sớ MDCT sử dụng N=2. Biết ma trận biến đổi thuận A (2x4)
như sau:
0,7 −0,7 −1,8 −1,8
−1,8 1,8 −0,7 −0,7
- 22 -
- Lượng tử hóa các hệ sớ MDCT sử dụng bộ lượng tử hóa đều mid-tread với
bước lượng tử = 1.
Khôi phục x(n) qua việc thực hiện biến đổi MDCT ngược các hệ sớ đã lượng tử
T
hóa. Biết ma trận biến đổi ngược là A 8 .
Bài làm:
Câu 3.14:
Cho đoạn tiếng nói gồm 8 mẫu thoại như sau:
X(n)=[1,-2,-1,0,1,2,-1,0] với n=0,…,7.
Thực hiện phân tích đa phân giải tín hiệu trên, với các sóng con:
a. Tìm biến đổi Haar 2 mức.
b. Khơi phục lại x(n) qua biến đổi Haar ngược. Tính MSE giữa tín hiệu bạn đầu và
tín hiệu khôi phục?
Bài làm:
- 23 -
- 24 -