Khoa Điện – Điện Tử
Bộ Mơn Viễn Thơng
Đề Thi Cuối Kỳ I 2013‐2014
Mơn Thi: Xử Lý Ảnh và Xử Lý Tiếng Nói
Ngày thi 30‐12‐2013, 12h30; Thời Gian: 90 phút
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
.c
om
Câu hỏi 1 (3.0 điểm): Cho ảnh mức xám có kích thước 4x4. Tìm pixel của ảnh ngõ ra tại các vị trí
trung tâm 2x2 (các pixel được đánh dấu g; và các pixel ở biên được xem như giữ ngun) khi áp
dụng các bộ lọc tương ứng sau:
Ảnh vào
Ảnh ra
0
80 80
0
0
80 80
0
70 70 85 75
70
g
g
75
75 255 75 70
75
g
g
70
70 75 85 70
70 75 85 70
a. Median 1x3 (một hàng 3 cột).
b. Max 3x3.
c. Midpoint 3x3.
d. Trung bình 1x3 (một hàng 3 cột).
e. Alpha‐trimmed mean với d = 2, cửa sổ địa phương là hình chữ thập với 5 thành phần
theo hình vẽ sau:
ng
an
co
x
x
x
x
x
f. Nếu mục tiêu là triệt nhiễu muối tại vị trí pixel có mức xám 255, và ngõ ra đưa về mức
xám tầm [70:85], thì những bộ lọc nào thỏa mãn điều kiện này.
cu
u
du
o
ng
th
Câu hỏi 2 (1.5 điểm): Video định dạng 4K có kích thước 3840x2160 một khung hình (frame), tốc
độ khung hình là 30 frame/s, mỗi pixel màu RGB với số bit cần biễu diễn một pixel màu là 24
bit/pixel (3 byte/pixel).
a. Tính số MB cần để lưu trữ một khung hình khơng nén (1MB=1024KB, 1KB=1024Byte).
b. Tính số kB cần để lưu trữ một khung hình nén bằng JPEG suy hao với tỉ lệ nén 10 :1.
c. Tính số TB cần để lưu trữ một video khơng nén có độ dài 1 giờ 30 phút(1TB=1024GB,
1GB=1024MB).
d. Tính số GB cần để lưu trữ một video nén bằng H.264 có độ dài 1 giờ 30 phút suy hao với
tỉ lệ nén 60 :1.
e. Nếu cần truyền một video nén trên bằng H.264 qua kênh truyền theo thời gian thực
(khơng bị dừng) thì băng thơng tối thiểu cần là bao nhiêu Mbps?.
Câu hỏi 3 (1.0 điểm): Tìm khung xương (skeleton) và hình lồi (convex hull) của và .
G H
R/8
R/2
H
G
2R R/4
R R/4
CuuDuongThanCong.com
/>
cu
u
du
o
ng
th
an
co
ng
.c
om
Câu hỏi 4 (2.5 điểm): Cho các tập và thành phần sau. Tìm các kết quả của q trình hình thái
R
học sau
R
R/3
R/2
R
R
B
R/4
C
A
a. Tìm .
b. Tìm .
A B
A B
c. Tìm .
d. Tìm .
A B
A B
e. Tìm thành phần và phép tốn cần thiết để kết quả tác động lên có kết quả là tập .
B
A
C
Câu hỏi 5 (1.0 điểm): Cho vật thể sau
D
F
D
E
a. Với kết nối 4 ở hình , tìm mã xích (chain code), mã vi sai (different code) và chỉ số
E
hình dạng (shape number) của .
D
b. Với kết nối 8 ở hình , tìm mã xích (chain code), mã vi sai (different code) và chỉ số
F
D
hình dạng (shape number) của .
Câu hỏi 6 (1.0 điểm): Chọn câu trả lời đúng nhất.
1. Mã xích (chain code) kết nối 8 có chỉ số hình dạng (shape number) gấp đơi chỉ số hình dạng
của mã xích kết nối 4
a. đúng
b. sai
2. Bộ lọc nào sau đây khơng thích hợp để triệt nhiễu muối.
a. trung bình
b. max c. median d. alpha trimmed mean
3. Phép tốn nào sau làm thay đổi histogram
d. cả a, b và c
a. lấy trung bình b. âm bản (negative)
c. lọc median
4. Định dạng nào sau đây khơng phải cho video
a. avi
b. jpeg
c. mpg
d. wmv
5. Chữ ký (signature) là một miêu tả một‐một, nghĩa là những vật thể khác nhau sẽ có chữ ký
khác nhau
a. đúng
b. sai
CuuDuongThanCong.com
/>
Đán án
cu
u
du
o
ng
th
an
co
ng
.c
om
Câu hỏi 1 (3.0 điểm): Cho ảnh mức xám có kích thước 4x4. Tìm pixel của ảnh ngõ ra tại các vị trí
trung tâm 2x2 (pixel đánh dấu x, các pixel ở biên được xem như giữ ngun) khi áp dụng các bộ
lọc
Ảnh vào
0
80
80
0
70 70
85
75
75 255 75
70
70 75
85
70
Ảnh ra
0
80
80
0
70
x
x
75
75
x
x
70
70 75
85
70
a. Median 1x3 ( một hàng 3 cột).
0
80
80
0
70 70
75
75
75 75
75
70
70 75
85
70
b. Max 3x3.
0
80
80
0
70 255 255 75
75 255 255 70
70 75
85
70
c. Midpoint 3x3.
0
80
80
0
70 128 128 75
75 163 163 70
70 75
85
70
d. Trung bình 1x3 (một hàng 3 cột).
0
80
80
0
70 75
77
75
75 135 133 70
70 75
85
70
CuuDuongThanCong.com
/>
e. Alpha‐trimmed mean với d = 2, cửa sổ địa phương là hình chữ thập với 5 thành phần
theo hình vẽ sau:
0
70
75
70
80
78
75
75
80
77
82
85
0
75
70
70
cu
u
du
o
ng
th
an
co
ng
.c
om
f. Nếu mục tiêu là triệt nhiễu muối tại vị trí pixel có mức xám 255, và đưa về mức xám
[70,…,85], thì những bộ lọc nào thỏa mãn điều kiện này.
Bộ lọc median 1x3 và bộ lọc alpha trimmed mean
Câu hỏi 2 (1.5 điểm): Video định dạng 4K có kích thước 3840x2160 một khung hình (frame), tốc
độ khung hình 30 frame/s, mỗi pixel màu RGB với số bit cần biễu diễn một pixel màu là 24
bit/pixel.
a. Tính số MB cần để lưu trữ một khung hình khơng nén (1MB=1024KB, 1KB=1024Byte).
3840x2160x24/8/1024/1024=23.73MB
b. Tính số kB cần để lưu trữ một khung hình nén bằng JPEG suy hao với tỉ lệ nén 10 :1.
23.73MB/10 = 2.373MB
c. Tính số TB cần để lưu trữ một video khơng nén có độ dài 1 giờ 30 phút(1TB=1024GB,
1GB=1024MB).
23.73MB * 30 * 90 *60/1024/1024 = 3.67TB
d. Tính số GB cần để lưu trữ một video nén bằng H.264 có độ dài 1 giờ 30 phút suy hao với
tỉ lệ nén 60 :1.
3.67TB*1024/60 = 62.57GB
e. Nếu cần truyền một video nén trên bằng H.264 qua kênh truyền theo thời gian thực
(khơng bị dừng) thì băng thơng tối thiểu cần là bao nhiêu Mbps?.
62.57GB/90/60*8*1024=94.92Mbps
CuuDuongThanCong.com
/>
Trường ĐH Bách Khoa TP. HCM
Khoa Điện – Điện Tử
Bộ mơn Viễn Thơng
Chương trình PFIEV
THI CUỐI HỌC KỲ
MƠN XỬ LÝ ẢNH
Ngày thi: 26/12/2013
Thời gian: 90 phút
(Được sử dụng tài liệu, không sử dụng laptop và điện thoại di động)
39
39
39
39
126
126
126
126
126
126
126
126
ng
39
40
40
39
.c
om
Câu 1: Nén tự điển (LZW) (2đ)
Cho ảnh gốc có các giá trị thang xám như sau:
ng
th
an
co
a) Xác định chuỗi thang xám được mã hoá, địa chỉ từ (dictionary address) và nội dung từ
(dictionary entry) của bộ mã hoá.
b) Xác định tỉ số nén giữa ảnh sau khi mã hoá và ảnh gốc.
c) Giải mã chuỗi thang xám được mã hoá ở câu a), xác định địa chỉ từ (dictionary address) và
nội dung từ (dictionary entry) của bộ giải mã.
cu
u
du
o
Câu 2: Phân tích hình thái (2d)
Cho ảnh nhị phân như Hình 1. Các hình trịn thuộc về 3 nhóm có 3 kích thước khác nhau.
a) Đề xuất phương pháp xác định số lượng hình trịn có kích thước lớn nhất.
b) Đề xuất phương pháp xác định số lượng hình trịn tương ứng với 3 nhóm kích thước khác
nhau như trong Hình 1.
Hình 1
1
CuuDuongThanCong.com
/>
Câu 3: Ma trận co-occurrence (2đ)
Cho 2 ảnh nhị phân có kích thước giống nhau gồm 60 × 60 điểm ảnh (pixel) như Hình 2. Màu đen
trong 2 ảnh là vị trí các điểm ảnh có giá trị thang xám là 0 và màu trắng là vị trí các điểm ảnh có giá
trị thang xám là 1.
Hình 2
.c
om
(b)
(a)
ng
Tìm các ma trận co-occurrence P(i, j; d, θ) cho 2 ảnh nhị phân ở Hình 2, với i và j là giá trị thang
co
xám; i = 0, 1; j = 0, 1; d = 1; và θ = 0o.
th
an
Câu 4: Nhận dạng đối tượng (4đ)
Giả sử các vector mẫu 2 chiều (2-D pattern vectors) gồm 2 đặc trưng (features) thuộc về 2 lớp mẫu
(pattern classes) ω1 và ω2 được cho như sau:
ng
• Lớp mẫu ω1 có N1 = 4 vector mẫu: {(3, 2)T, (2, 2)T, (2, 0)T, (1, 0)T}
du
o
• Lớp mẫu ω2 có N2 = 4 vector mẫu: {(4, 3)T, (6, 3)T, (2, 4)T, (4, 2)T}
với ký hiệu T là chuyển vị của vector. Giả sử các vector mẫu có phân bố Gauss, 2 lớp mẫu xảy ra với
cu
u
xác suất như nhau: P(ω1) = P(ω1) = 1/2.
a) Tìm các vector trung bình (mean vector) mj (j = 1, 2) và ma trận hiệp phương sai (covariance
matrix) Cj (j = 1..2) của các vector mẫu của 2 lớp mẫu trên.
b) Xác định các hàm quyết định dj (j = 1, 2) cho 2 lớp mẫu trên dùng phương pháp cực tiểu
khoảng cách Euclid. Xác định đường biên quyết định theo phương pháp này.
c) Xác định các hàm quyết định dj (j = 1, 2) cho 2 lớp mẫu trên dùng phương pháp tối ưu Bayes.
Xác định đường biên quyết định Bayes cho 2 lớp mẫu trên.
Hết.
2
CuuDuongThanCong.com
/>
Đán án
cu
u
du
o
ng
th
an
co
ng
.c
om
Câu hỏi 1 (3.0 điểm): Cho ảnh mức xám có kích thước 4x4. Tìm pixel của ảnh ngõ ra tại các vị trí
trung tâm 2x2 (pixel đánh dấu x, các pixel ở biên được xem như giữ ngun) khi áp dụng các bộ
lọc
Ảnh vào
0
80
80
0
70 70
85
75
75 255 75
70
70 75
85
70
Ảnh ra
0
80
80
0
70
x
x
75
75
x
x
70
70 75
85
70
a. Median 1x3 ( một hàng 3 cột).
0
80
80
0
70 70
75
75
75 75
75
70
70 75
85
70
b. Max 3x3.
0
80
80
0
70 255 255 75
75 255 255 70
70 75
85
70
c. Midpoint 3x3.
0
80
80
0
70 128 128 75
75 163 163 70
70 75
85
70
d. Trung bình 1x3 (một hàng 3 cột).
0
80
80
0
70 75
77
75
75 135 133 70
70 75
85
70
CuuDuongThanCong.com
/>
e. Alpha‐trimmed mean với d = 2, cửa sổ địa phương là hình chữ thập với 5 thành phần
theo hình vẽ sau:
0
70
75
70
80
78
75
75
80
77
82
85
0
75
70
70
cu
u
du
o
ng
th
an
co
ng
.c
om
f. Nếu mục tiêu là triệt nhiễu muối tại vị trí pixel có mức xám 255, và đưa về mức xám
[70,…,85], thì những bộ lọc nào thỏa mãn điều kiện này.
Bộ lọc median 1x3 và bộ lọc alpha trimmed mean
Câu hỏi 2 (1.5 điểm): Video định dạng 4K có kích thước 3840x2160 một khung hình (frame), tốc
độ khung hình 30 frame/s, mỗi pixel màu RGB với số bit cần biễu diễn một pixel màu là 24
bit/pixel.
a. Tính số MB cần để lưu trữ một khung hình khơng nén (1MB=1024KB, 1KB=1024Byte).
3840x2160x24/8/1024/1024=23.73MB
b. Tính số kB cần để lưu trữ một khung hình nén bằng JPEG suy hao với tỉ lệ nén 10 :1.
23.73MB/10 = 2.373MB
c. Tính số TB cần để lưu trữ một video khơng nén có độ dài 1 giờ 30 phút(1TB=1024GB,
1GB=1024MB).
23.73MB * 30 * 90 *60/1024/1024 = 3.67TB
d. Tính số GB cần để lưu trữ một video nén bằng H.264 có độ dài 1 giờ 30 phút suy hao với
tỉ lệ nén 60 :1.
3.67TB*1024/60 = 62.57GB
e. Nếu cần truyền một video nén trên bằng H.264 qua kênh truyền theo thời gian thực
(khơng bị dừng) thì băng thơng tối thiểu cần là bao nhiêu Mbps?.
62.57GB/90/60*8*1024=94.92Mbps
CuuDuongThanCong.com
/>
.c
om
Câu hỏi 3 (1.0 điểm): Tìm khung xương (skeleton) và hình lồi (convex hull) của và .
G H
R/2
R/2
G
G
R R/4
R R/4
R/2
R/4
th
an
co
ng
R
G
R/8
H
H
2R R/4
cu
u
2R R/4
du
o
ng
R/8
R/8
H
2R R/4
CuuDuongThanCong.com
/>
cu
u
du
o
ng
th
an
co
ng
.c
om
Câu hỏi 4 (2.5 điểm): Cho các tập và thành phần sau. Tìm các kết quả của quá trình hình thái
học sau
R
R
R/3
R/2
R
R
B
R/4
A
C
a. Tìm các kết quả của .
A B
4R/3
4R/3
A B
b. Tìm các kết quả của .
2R/3
2R/3
CuuDuongThanCong.com
/>
c. Tìm các kết quả của .
A B
R
.c
om
R
d. Tìm các kết quả của .
A B
an
co
ng
R
du
o
ng
th
R
u
e. Tìm thành phần và phép tốn cần thiết để kết quả tác động lên tập để có kết quả là
B
A
cu
tập . Có thể chọn đáp án sau:
C
R
R/4
A
R/2
B
R/2
R
R/4
B
B
CuuDuongThanCong.com
/>
A
B
co
ng
.c
om
Câu hỏi 5 (1.5 điểm): Cho vật thể sau
D
F
D
E
a. Với kết nối 4 ở hình , tìm mã xích (chain code), mã vi sai (different code) và chỉ số
E
hình dạng (shape number) của .
D
mã xích (chain code): 0012122303
mã vi sai (different code): 1011310113
chỉ số hình dạng (shape number): 0113101131
b. Với kết nối 8 ở hình , tìm mã xích (chain code), mã vi sai (different code) và chỉ số
E
D
hình dạng (shape number) của .
th
an
mã xích (chain code): 0024244606
mã vi sai (different code): 2022620226
chỉ số hình dạng (shape number): 0226202262
cu
u
du
o
ng
Câu hỏi 6 (1.0 điểm): Chọn câu trả lời đúng nhất.
1. Mã xích (chain code) kết nối 8 có chỉ số hình dạng (shape number) gấp đơi chỉ số hình dạng
của mã xích kết nối 4
a. đúng
b. sai
2. Bộ lọc nào sau đây khơng thích hợp để triệt nhiễu muối.
a. trung bình
b. max c. median d. alpha trimmed mean
3. Phép tốn nào sau làm thay đổi histogram
d. cả a, b và c
a. lấy trung bình b. âm bản (negative)
c. lọc median
4. Định dạng nào sau đây khơng phải cho video
a. avi
b. jpeg
c. mpg
d. wmv
5. Chữ ký (signature) là một miêu tả một‐một, nghĩa là những vật thể khác nhau sẽ có chữ ký
khác nhau
a. đúng
b. sai
CuuDuongThanCong.com
/>
Trường ĐH Bách Khoa TP. HCM
Khoa Điện – Điện Tử
Bộ mơn Viễn Thơng
Chương trình PFIEV
ĐÁP ÁN THI CUỐI HỌC KỲ
MƠN XỬ LÝ ẢNH
Ngày thi: 26/12/2013
Thời gian: 90 phút
(Được sử dụng tài liệu, không sử dụng laptop và điện thoại di động)
39
39
39
39
126
126
126
126
126
126
126
126
ng
39
40
40
39
.c
om
Câu 1: Nén tự điển (LZW) (2đ)
Ảnh gốc có các giá trị thang xám như sau:
co
a) Xác định chuỗi thang xám được mã hố (chuỗi bit sau khi mã hóa), địa chỉ từ (dictionary
address) và nội dung từ (dictionary entry) của bộ mã hoá (0,75đ).
Chuỗi thang xám
được mã hoá
(Encoded output)
th
ng
39
39
126
126
40
257
259
261
256
258
du
o
u
cu
39
39
126
126
40
39
126
126
40
39
126
126
39
39
126
126
an
Pixel được xử lý
(Pixel processed)
Địa chỉ từ (dictionary Nội dung từ
address)
(dictionary entry)
256
257
258
259
260
261
262
263
264
-
39-39
39-126
126-126
126-40
40-39
39-126-126
126-40-39
39-126-126-39
39-39-126
-
1
CuuDuongThanCong.com
/>
b) Xác định tỉ số nén giữa ảnh sau khi mã hoá và ảnh gốc (0,5đ).
Số bit sau khi mã hóa là: 10 × 9 bits = 90 bits
Số bit ảnh gốc là: 16 × 8 bits = 128 bits
Tỉ số nén là: 128/90 = 1,42
c) Giải mã chuỗi thang xám được mã hoá ở câu a), xác định địa chỉ từ (dictionary address) và
nội dung từ (dictionary entry) của bộ giải mã (0,75đ).
Địa chỉ từ (dictionary Nội dung từ
address)
(dictionary entry)
39
39
126
126
40
39-126
126-40
39-126-126
39-39
126-126
256
257
258
259
260
261
262
263
264
an
co
ng
.c
om
Chuỗi thang xám
đã giải mã
39-39
39-126
126-126
126-40
40-39
39-126-126
126-40-39
39-126-126-39
39-39-126
th
Chuỗi thang xám
được mã hoá
(Encoded output)
39
39
126
126
40
257
259
261
256
258
du
o
ng
Câu 2: Phân tích hình thái (2đ)
Gọi r1, r2 và r3 lần lượt là bán kính của các vịng trịn có kích thước lớn nhất, trung bình và
nhỏ nhất.
a) Đề xuất phương pháp xác định số lượng hình trịn có kích thước lớn nhất (1,0đ).
cu
u
• Bước 1: Áp dụng phép tốn erosion lên ảnh gốc I1 dùng phần tử cấu trúc là hình trịn
có bán kính r1. Kết quả nhận được ảnh mới I2 với chỉ có 3 điểm pixel có mức xám là 1
(màu trắng), các pixel cịn lại có mức xám là 0 (màu đen).
• Bước 2: Qt tồn bộ ảnh I2, để tìm số lượng pixel có mức xám là 1, đây cũng chính là
số lượng hình trịn có kích thước lớn nhất. Kết quả nhận được số lượng hình trịn có
kích thước lớn nhất là 3.
b) Đề xuất phương pháp xác định số lượng hình trịn tương ứng với 3 nhóm kích thước khác
nhau như trong Hình 1 (1,0đ).
• Bước 1: Áp dụng phép tốn opening lên ảnh gốc I1 dùng phần tử cấu trúc là hình trịn
có bán kính r1. Kết quả nhận được ảnh mới I3 với chỉ gồm các hình trịn có kích thước
lớn nhất. Áp dụng phép toán erosion lên ảnh I3 dùng phần tử cấu trúc là hình trịn có
bán kính r1, sau đó áp dụng phương pháp tương tự câu a) để xác định số lượng hình
trịn có kích thước lớn nhất.
• Bước 2: Áp dụng phép tốn trừ ảnh I1 cho ảnh I3. Kết quả nhận được ảnh mới I4 với
chỉ gồm các hình trịn có kích thước trung bình và nhỏ nhất.
2
CuuDuongThanCong.com
/>
• Bước 3: Áp dụng phép toán opening lên ảnh I4 dùng phần tử cấu trúc là hình trịn có
bán kính r2. Kết quả nhận được ảnh mới I5 với chỉ gồm các hình trịn có kích thước
trung bình. Áp dụng phép toán erosion lên ảnh I5 dùng phần tử cấu trúc là hình trịn có
bán kính r2, sau đó áp dụng phương pháp tương tự câu a) để xác định số lượng hình
trịn có kích thước trung bình.
an
co
Hình 1
ng
.c
om
• Bước 4: Áp dụng phép toán trừ ảnh I4 cho ảnh I5. Kết quả nhận được ảnh mới I6 với
chỉ gồm các hình trịn có kích thước nhỏ nhất. Áp dụng phép toán erosion lên ảnh I6
dùng phần tử cấu trúc là hình trịn có bán kính r3, sau đó áp dụng phương pháp tương
tự câu a) để xác định số lượng hình trịn có kích thước nhỏ nhất.
cu
u
du
o
ng
th
Câu 3: Ma trận co-occurrence (2đ)
(b)
(a)
Hình 2
Các ma trận co-occurrence P(i, j; d, θ) ở Hình 2 (với i = 0, 1; j = 0, 1; d = 1; và θ = 0o) như sau:
Hình 2(a): (1,0đ)
59 × 2 × 30
0
3540
0
𝑃(𝑖, 𝑗, 1, 0𝑜 ) = �
�=�
�
0
59 × 2 × 30
0
3540
Hình 2(b): (1,0đ)
9 × 2 × 10 × 18
0
3240 150
�=�
𝑃(𝑖, 𝑗, 1, 0𝑜 ) = �
�
0
9 × 2 × 10 × 18
150 3240
3
CuuDuongThanCong.com
/>
Câu 4: Nhận dạng đối tượng (4đ)
a) Tìm các vector trung bình (mean vector) mj (j = 1, 2) và ma trận hiệp phương sai
(covariance matrix) Cj (j = 1..2) của các vector mẫu của 2 lớp mẫu trên (2,0đ).
2
𝐦1 = � �
1
4
𝐦2 = � �
3
0,5 0,5
4 −2
�
�
𝐂1 = �
→ 𝐂1−1 = �
0,5 1
−2 2
0,667 0,667
2
−0,5
𝐂2 = �
�
�
→ 𝐂2−1 = �
0,667 2,667
−0,5 0,5
.c
om
b) Xác định các hàm quyết định dj (j = 1, 2) cho 2 lớp mẫu trên dùng phương pháp cực tiểu
khoảng cách Euclid. Xác định đường biên quyết định theo phương pháp này (1,0đ).
Các hàm quyết định:
𝑑1 (𝐱) = 2𝑥1 + 𝑥2 − 2,5
ng
𝑑2 (𝐱) = 4𝑥1 + 3𝑥2 − 12,5
Đường biên giữa 2 lớp:
co
𝑥1 + 𝑥2 = 5
du
o
ng
th
an
c) Xác định các hàm quyết định dj (j = 1, 2) cho 2 lớp mẫu trên dùng phương pháp tối ưu
Bayes. Xác định đường biên quyết định Bayes cho 2 lớp mẫu trên (1,0đ).
Các hàm quyết định:
𝑑1 (𝐱) = 6𝑥1 − 2𝑥2 − 5,69
cu
u
Đường biên giữa 2 lớp:
𝑑2 (𝐱) = 4,67𝑥1 + 10,67𝑥2 − 26,02
1,33𝑥1 − 12,67𝑥2 = −20,33
Hết.
4
CuuDuongThanCong.com
/>