Tải bản đầy đủ (.pdf) (16 trang)

ĐỀ THI XỬ LÍ ẢNH VÀ XỬ LÍ TIẾNG NÓI CÓ ĐÁP ÁN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (549.43 KB, 16 trang )

Khoa Điện – Điện Tử  
 Bộ Mơn Viễn Thơng  
 
 
 
 
 
 
 
 

   
         
 
 

 
        Đề Thi Cuối Kỳ I 2013‐2014 
          Mơn Thi: Xử Lý Ảnh và Xử Lý Tiếng Nói 
   Ngày thi 30‐12‐2013, 12h30; Thời Gian: 90 phút 
 
 
   ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ 

 

.c
om

Câu hỏi 1 (3.0 điểm): Cho ảnh mức xám có kích thước 4x4. Tìm pixel của ảnh ngõ ra tại các vị trí 
trung tâm 2x2 (các pixel được đánh dấu g; và các pixel ở biên được xem như giữ ngun) khi áp 


 
 
   
dụng các bộ lọc tương ứng sau:   
                                   Ảnh vào 
                         Ảnh ra 

80  80 


80  80 

70  70  85  75 
70 


75 
75  255  75  70 
75 


70 
70  75  85  70 
70  75  85  70 
 
     
a. Median 1x3 (một hàng 3 cột).    
 
b. Max 3x3.  
c. Midpoint 3x3. 

 
 
 
 
d. Trung bình 1x3 (một hàng 3 cột). 
e. Alpha‐trimmed mean với d = 2, cửa sổ địa phương là hình chữ thập với 5 thành phần 
theo hình vẽ sau: 

ng

 

an

co

 

 



 

 
f. Nếu mục tiêu là triệt nhiễu muối tại vị trí pixel có mức xám 255, và ngõ ra đưa về mức 
xám tầm [70:85], thì những bộ lọc nào thỏa mãn điều kiện này. 

cu


u

du
o

ng

th

 
Câu hỏi 2 (1.5 điểm): Video định dạng 4K có kích thước 3840x2160 một khung hình (frame), tốc 
độ khung hình là 30 frame/s, mỗi pixel màu RGB với số bit cần biễu diễn một pixel màu là 24 
bit/pixel (3 byte/pixel). 
a. Tính số MB cần để lưu trữ một khung hình khơng nén (1MB=1024KB, 1KB=1024Byte). 
b. Tính số kB cần để lưu trữ một khung hình nén bằng JPEG suy hao với tỉ lệ nén 10 :1. 
c. Tính số TB cần để lưu trữ một video khơng nén có độ dài 1 giờ 30 phút(1TB=1024GB, 
1GB=1024MB). 
d. Tính số GB cần để lưu trữ một video nén bằng H.264 có độ dài 1 giờ 30 phút suy hao với 
tỉ lệ nén 60 :1. 
e. Nếu  cần  truyền  một  video  nén  trên  bằng  H.264  qua  kênh  truyền  theo  thời  gian  thực 
(khơng bị dừng) thì băng thơng tối thiểu cần là bao nhiêu Mbps?. 
 
Câu hỏi 3 (1.0 điểm): Tìm khung xương (skeleton) và hình lồi (convex hull) của       và       . 
G H
 
 
R/8
 
R/2
 

H
G
 
 
2R R/4
R R/4
 
 
 
 
CuuDuongThanCong.com

/>

cu

u

du
o

ng

th

an

co

ng


.c
om

Câu hỏi 4 (2.5 điểm): Cho các tập và thành phần sau. Tìm các kết quả của q trình hình thái 
R
học sau 
R
R/3
 
 
 
R/2
 
R
R
 
B
 
R/4
 
 
 
C
A
 
 
a. Tìm                    . 
 
 

b. Tìm                   .  
A B
A B
c. Tìm                    . 
 
 
d. Tìm                   . 
A B
A B
e. Tìm thành phần      và phép tốn cần thiết để kết quả tác động lên     có kết quả là tập     . 
B
A
C
 
Câu hỏi 5 (1.0 điểm): Cho vật thể         sau 
D
 
F
 
D
 
E
 
 
 
 
 
a. Với kết nối  4 ở hình      , tìm mã xích (chain code), mã vi sai (different code) và chỉ số 
E
hình dạng (shape number) của       . 

D
b. Với kết nối  8 ở hình      , tìm mã xích (chain code), mã vi sai (different code) và chỉ số 
F
D
hình dạng (shape number) của       . 
 
Câu hỏi 6 (1.0 điểm): Chọn câu trả lời đúng nhất. 
1. Mã xích (chain code) kết nối 8 có chỉ số hình dạng (shape number) gấp đơi chỉ số hình dạng 
của mã xích kết nối 4 
     a. đúng   
b. sai 
2. Bộ lọc nào sau đây khơng thích hợp để triệt nhiễu muối. 
     a. trung bình 
b. max        c. median  d. alpha trimmed mean 
3. Phép tốn nào sau làm thay đổi histogram 
d. cả a, b và c 
      a. lấy trung bình  b. âm bản (negative) 
c. lọc median  
4. Định dạng nào sau đây khơng phải cho video 
      a. avi 
 
b. jpeg  
c. mpg  
d. wmv 
5. Chữ  ký (signature) là một miêu tả một‐một, nghĩa là những vật thể khác nhau sẽ có chữ  ký 
khác nhau 
     a. đúng   
b. sai 
 
 

CuuDuongThanCong.com

/>

Đán án 

cu

u

du
o

ng

th

an

co

ng

.c
om

 
Câu hỏi 1 (3.0 điểm): Cho ảnh mức xám có kích thước 4x4. Tìm pixel của ảnh ngõ ra tại các vị trí 
trung tâm 2x2 (pixel đánh dấu x, các pixel ở biên được xem như giữ ngun) khi áp dụng các bộ 
lọc  

 
   Ảnh vào 
 
 
 
 

80 
80 

70  70 
85 
75 
75  255  75 
70 
70  75 
85 
70 
 
 
 
 
 
    Ảnh ra 

80 
80 

70 



75 
75 


70 
70  75 
85 
70 
 
a. Median 1x3 ( một hàng 3 cột). 

80 
80 

70  70 
75 
75 
75  75 
75 
70 
70  75 
85 
70 
 
b. Max 3x3. 

80 
80 


70  255  255  75 
75  255  255  70 
70  75 
85 
70 
  
c. Midpoint 3x3. 

80 
80 

70  128  128  75 
75  163  163  70 
70  75 
85 
70 
 
d. Trung bình 1x3 (một hàng 3 cột). 

80 
80 

70  75 
77 
75 
75  135  133  70 
70  75 
85 
70 
 

 
 

CuuDuongThanCong.com

/>

e. Alpha‐trimmed mean với d = 2, cửa sổ địa phương là hình chữ thập với 5 thành phần 

theo hình vẽ sau:

70 
75 
70 

80 
78 
75 
75 

80 
77 
82 
85 


75 
70 
70 


cu

u

du
o

ng

th

an

co

ng

.c
om

 
f. Nếu  mục  tiêu  là  triệt  nhiễu  muối  tại  vị  trí  pixel  có  mức  xám  255,  và  đưa  về  mức  xám 
[70,…,85], thì những bộ lọc nào thỏa mãn điều kiện này. 
Bộ lọc median 1x3 và bộ lọc alpha trimmed mean 
 
Câu hỏi 2 (1.5 điểm): Video định dạng 4K có kích thước 3840x2160 một khung hình (frame), tốc 
độ  khung  hình  30  frame/s,  mỗi  pixel  màu  RGB  với  số  bit  cần  biễu  diễn  một  pixel  màu  là  24 
bit/pixel. 
 
a. Tính số MB cần để lưu trữ một khung hình khơng nén (1MB=1024KB, 1KB=1024Byte). 

3840x2160x24/8/1024/1024=23.73MB 
b. Tính số kB cần để lưu trữ một khung hình nén bằng JPEG suy hao với tỉ lệ nén 10 :1. 
23.73MB/10 = 2.373MB 
c. Tính số TB cần để lưu trữ một video khơng nén có độ dài 1 giờ 30 phút(1TB=1024GB, 
1GB=1024MB). 
23.73MB * 30 * 90 *60/1024/1024 = 3.67TB 
d. Tính số GB cần để lưu trữ một video nén bằng H.264 có độ dài 1 giờ 30 phút suy hao với 
tỉ lệ nén 60 :1. 
3.67TB*1024/60 = 62.57GB 
e. Nếu  cần  truyền  một  video  nén  trên  bằng  H.264  qua  kênh  truyền  theo  thời  gian  thực 
(khơng bị dừng) thì băng thơng tối thiểu cần là bao nhiêu Mbps?. 
62.57GB/90/60*8*1024=94.92Mbps 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

 
CuuDuongThanCong.com

/>

Trường ĐH Bách Khoa TP. HCM
Khoa Điện – Điện Tử
Bộ mơn Viễn Thơng
Chương trình PFIEV
THI CUỐI HỌC KỲ
MƠN XỬ LÝ ẢNH
Ngày thi: 26/12/2013
Thời gian: 90 phút
(Được sử dụng tài liệu, không sử dụng laptop và điện thoại di động)

39
39
39
39

126
126
126
126

126
126
126
126


ng

39
40
40
39

.c
om

Câu 1: Nén tự điển (LZW) (2đ)
Cho ảnh gốc có các giá trị thang xám như sau:

ng

th

an

co

a) Xác định chuỗi thang xám được mã hoá, địa chỉ từ (dictionary address) và nội dung từ
(dictionary entry) của bộ mã hoá.
b) Xác định tỉ số nén giữa ảnh sau khi mã hoá và ảnh gốc.
c) Giải mã chuỗi thang xám được mã hoá ở câu a), xác định địa chỉ từ (dictionary address) và
nội dung từ (dictionary entry) của bộ giải mã.

cu

u


du
o

Câu 2: Phân tích hình thái (2d)
Cho ảnh nhị phân như Hình 1. Các hình trịn thuộc về 3 nhóm có 3 kích thước khác nhau.
a) Đề xuất phương pháp xác định số lượng hình trịn có kích thước lớn nhất.
b) Đề xuất phương pháp xác định số lượng hình trịn tương ứng với 3 nhóm kích thước khác
nhau như trong Hình 1.

Hình 1

1
CuuDuongThanCong.com

/>

Câu 3: Ma trận co-occurrence (2đ)
Cho 2 ảnh nhị phân có kích thước giống nhau gồm 60 × 60 điểm ảnh (pixel) như Hình 2. Màu đen
trong 2 ảnh là vị trí các điểm ảnh có giá trị thang xám là 0 và màu trắng là vị trí các điểm ảnh có giá
trị thang xám là 1.

Hình 2

.c
om

(b)

(a)


ng

Tìm các ma trận co-occurrence P(i, j; d, θ) cho 2 ảnh nhị phân ở Hình 2, với i và j là giá trị thang

co

xám; i = 0, 1; j = 0, 1; d = 1; và θ = 0o.

th

an

Câu 4: Nhận dạng đối tượng (4đ)
Giả sử các vector mẫu 2 chiều (2-D pattern vectors) gồm 2 đặc trưng (features) thuộc về 2 lớp mẫu
(pattern classes) ω1 và ω2 được cho như sau:

ng

• Lớp mẫu ω1 có N1 = 4 vector mẫu: {(3, 2)T, (2, 2)T, (2, 0)T, (1, 0)T}

du
o

• Lớp mẫu ω2 có N2 = 4 vector mẫu: {(4, 3)T, (6, 3)T, (2, 4)T, (4, 2)T}
với ký hiệu T là chuyển vị của vector. Giả sử các vector mẫu có phân bố Gauss, 2 lớp mẫu xảy ra với

cu

u


xác suất như nhau: P(ω1) = P(ω1) = 1/2.
a) Tìm các vector trung bình (mean vector) mj (j = 1, 2) và ma trận hiệp phương sai (covariance
matrix) Cj (j = 1..2) của các vector mẫu của 2 lớp mẫu trên.
b) Xác định các hàm quyết định dj (j = 1, 2) cho 2 lớp mẫu trên dùng phương pháp cực tiểu
khoảng cách Euclid. Xác định đường biên quyết định theo phương pháp này.
c) Xác định các hàm quyết định dj (j = 1, 2) cho 2 lớp mẫu trên dùng phương pháp tối ưu Bayes.
Xác định đường biên quyết định Bayes cho 2 lớp mẫu trên.

Hết.

2
CuuDuongThanCong.com

/>

Đán án 

cu

u

du
o

ng

th

an


co

ng

.c
om

 
Câu hỏi 1 (3.0 điểm): Cho ảnh mức xám có kích thước 4x4. Tìm pixel của ảnh ngõ ra tại các vị trí 
trung tâm 2x2 (pixel đánh dấu x, các pixel ở biên được xem như giữ ngun) khi áp dụng các bộ 
lọc  
 
   Ảnh vào 
 
 
 
 

80 
80 

70  70 
85 
75 
75  255  75 
70 
70  75 
85 
70 

 
 
 
 
 
    Ảnh ra 

80 
80 

70 


75 
75 


70 
70  75 
85 
70 
 
a. Median 1x3 ( một hàng 3 cột). 

80 
80 

70  70 
75 
75 

75  75 
75 
70 
70  75 
85 
70 
 
b. Max 3x3. 

80 
80 

70  255  255  75 
75  255  255  70 
70  75 
85 
70 
  
c. Midpoint 3x3. 

80 
80 

70  128  128  75 
75  163  163  70 
70  75 
85 
70 
 
d. Trung bình 1x3 (một hàng 3 cột). 


80 
80 

70  75 
77 
75 
75  135  133  70 
70  75 
85 
70 
 
 
 

CuuDuongThanCong.com

/>

e. Alpha‐trimmed mean với d = 2, cửa sổ địa phương là hình chữ thập với 5 thành phần 

theo hình vẽ sau:

70 
75 
70 

80 
78 
75 

75 

80 
77 
82 
85 


75 
70 
70 

cu

u

du
o

ng

th

an

co

ng

.c

om

 
f. Nếu  mục  tiêu  là  triệt  nhiễu  muối  tại  vị  trí  pixel  có  mức  xám  255,  và  đưa  về  mức  xám 
[70,…,85], thì những bộ lọc nào thỏa mãn điều kiện này. 
Bộ lọc median 1x3 và bộ lọc alpha trimmed mean 
 
Câu hỏi 2 (1.5 điểm): Video định dạng 4K có kích thước 3840x2160 một khung hình (frame), tốc 
độ  khung  hình  30  frame/s,  mỗi  pixel  màu  RGB  với  số  bit  cần  biễu  diễn  một  pixel  màu  là  24 
bit/pixel. 
 
a. Tính số MB cần để lưu trữ một khung hình khơng nén (1MB=1024KB, 1KB=1024Byte). 
3840x2160x24/8/1024/1024=23.73MB 
b. Tính số kB cần để lưu trữ một khung hình nén bằng JPEG suy hao với tỉ lệ nén 10 :1. 
23.73MB/10 = 2.373MB 
c. Tính số TB cần để lưu trữ một video khơng nén có độ dài 1 giờ 30 phút(1TB=1024GB, 
1GB=1024MB). 
23.73MB * 30 * 90 *60/1024/1024 = 3.67TB 
d. Tính số GB cần để lưu trữ một video nén bằng H.264 có độ dài 1 giờ 30 phút suy hao với 
tỉ lệ nén 60 :1. 
3.67TB*1024/60 = 62.57GB 
e. Nếu  cần  truyền  một  video  nén  trên  bằng  H.264  qua  kênh  truyền  theo  thời  gian  thực 
(khơng bị dừng) thì băng thơng tối thiểu cần là bao nhiêu Mbps?. 
62.57GB/90/60*8*1024=94.92Mbps 
 
 
 
 
 
 

 
 
 
 
 
 
 
 
 
 
 
 
 
CuuDuongThanCong.com

/>

.c
om

 
Câu hỏi 3 (1.0 điểm): Tìm khung xương (skeleton) và hình lồi (convex hull) của       và       . 
G H
 
 
R/2
R/2
 
G
G

 
  R R/4
R R/4
 
 
 
 
 
 

R/2

R/4

th

an

co

ng

R

G

R/8

H


H
2R R/4

cu

u

2R R/4

du
o

ng

R/8

R/8

H
2R R/4

 
CuuDuongThanCong.com

/>

cu

u


du
o

ng

th

an

co

ng

.c
om

 
Câu hỏi 4 (2.5 điểm): Cho các tập và thành phần sau. Tìm các kết quả của quá trình hình thái 
học sau 
R
R
 
R/3
 
 
 
R/2
 
R
R

B
 
 
R/4
 
 
A
C
 
a. Tìm các kết quả của                   . 
A B
 
4R/3
 
 
 
 
 
 
 
4R/3
 
 
 
 
 
 
A B
b. Tìm các kết quả của                   .  
 

2R/3
 
 
 
 
 
 
 
2R/3
 
 
 
 
 
 
 
 
 
 
CuuDuongThanCong.com

/>

 
 
c. Tìm các kết quả của                   . 
A B
 
 
 

 
 
 
 
 
 
 
 
 

R

.c
om

R

d. Tìm các kết quả của                   . 
A B
 
 
 
 
 
 
 
 
 
 
 

 
 

an

co

ng

R

du
o

ng

th

R

u

e. Tìm thành phần      và phép tốn cần thiết để kết quả tác động lên tập     để có kết quả là 
B
A

 

cu


tập       . Có thể chọn đáp án sau: 
C

R

R/4

A
R/2

B

R/2

R

R/4

B
B

CuuDuongThanCong.com

/>
A

B


co


ng

.c
om

Câu hỏi 5 (1.5 điểm): Cho vật thể         sau 
D
 
F
 
D
 
E
 
 
 
 
 
a. Với kết nối  4 ở hình      , tìm mã xích (chain code), mã vi sai (different code) và chỉ số 
E
hình dạng (shape number) của       . 
D
 
mã xích (chain code): 0012122303 
mã vi sai (different code): 1011310113 
chỉ số hình dạng (shape number): 0113101131 
 
b. Với kết nối  8 ở hình      , tìm mã xích (chain code), mã vi sai (different code) và chỉ số 
E

D
hình dạng (shape number) của       . 

th

an

mã xích (chain code): 0024244606 
mã vi sai (different code): 2022620226 
chỉ số hình dạng (shape number): 0226202262 

cu

u

du
o

ng

Câu hỏi 6 (1.0 điểm): Chọn câu trả lời đúng nhất. 
1. Mã xích (chain code) kết nối 8 có chỉ số hình dạng (shape number) gấp đơi chỉ số hình dạng 
của mã xích kết nối 4 
     a. đúng   
b. sai 
2. Bộ lọc nào sau đây khơng thích hợp để triệt nhiễu muối. 
     a. trung bình 
b. max        c. median  d. alpha trimmed mean 
3. Phép tốn nào sau làm thay đổi histogram 
d. cả a, b và c 

      a. lấy trung bình  b. âm bản (negative) 
c. lọc median  
4. Định dạng nào sau đây khơng phải cho video 
      a. avi 
 
b. jpeg  
c. mpg  
d. wmv 
5. Chữ  ký (signature) là một miêu tả một‐một, nghĩa là những vật thể khác nhau sẽ có chữ  ký 
khác nhau 
     a. đúng   
b. sai 

CuuDuongThanCong.com

/>

Trường ĐH Bách Khoa TP. HCM
Khoa Điện – Điện Tử
Bộ mơn Viễn Thơng
Chương trình PFIEV
ĐÁP ÁN THI CUỐI HỌC KỲ
MƠN XỬ LÝ ẢNH
Ngày thi: 26/12/2013
Thời gian: 90 phút
(Được sử dụng tài liệu, không sử dụng laptop và điện thoại di động)

39
39
39

39

126
126
126
126

126
126
126
126

ng

39
40
40
39

.c
om

Câu 1: Nén tự điển (LZW) (2đ)
Ảnh gốc có các giá trị thang xám như sau:

co

a) Xác định chuỗi thang xám được mã hố (chuỗi bit sau khi mã hóa), địa chỉ từ (dictionary
address) và nội dung từ (dictionary entry) của bộ mã hoá (0,75đ).
Chuỗi thang xám

được mã hoá
(Encoded output)

th

ng

39
39
126
126
40
257
259
261
256
258

du
o
u
cu

39
39
126
126
40
39
126

126
40
39
126
126
39
39
126
126

an

Pixel được xử lý
(Pixel processed)

Địa chỉ từ (dictionary Nội dung từ
address)
(dictionary entry)

256
257
258
259
260
261
262
263
264
-


39-39
39-126
126-126
126-40
40-39
39-126-126
126-40-39
39-126-126-39
39-39-126
-

1
CuuDuongThanCong.com

/>

b) Xác định tỉ số nén giữa ảnh sau khi mã hoá và ảnh gốc (0,5đ).
Số bit sau khi mã hóa là: 10 × 9 bits = 90 bits
Số bit ảnh gốc là: 16 × 8 bits = 128 bits
Tỉ số nén là: 128/90 = 1,42
c) Giải mã chuỗi thang xám được mã hoá ở câu a), xác định địa chỉ từ (dictionary address) và
nội dung từ (dictionary entry) của bộ giải mã (0,75đ).
Địa chỉ từ (dictionary Nội dung từ
address)
(dictionary entry)

39
39
126
126

40
39-126
126-40
39-126-126
39-39
126-126

256
257
258
259
260
261
262
263
264

an

co

ng

.c
om

Chuỗi thang xám
đã giải mã

39-39

39-126
126-126
126-40
40-39
39-126-126
126-40-39
39-126-126-39
39-39-126

th

Chuỗi thang xám
được mã hoá
(Encoded output)
39
39
126
126
40
257
259
261
256
258

du
o

ng


Câu 2: Phân tích hình thái (2đ)
Gọi r1, r2 và r3 lần lượt là bán kính của các vịng trịn có kích thước lớn nhất, trung bình và
nhỏ nhất.
a) Đề xuất phương pháp xác định số lượng hình trịn có kích thước lớn nhất (1,0đ).

cu

u

• Bước 1: Áp dụng phép tốn erosion lên ảnh gốc I1 dùng phần tử cấu trúc là hình trịn
có bán kính r1. Kết quả nhận được ảnh mới I2 với chỉ có 3 điểm pixel có mức xám là 1
(màu trắng), các pixel cịn lại có mức xám là 0 (màu đen).
• Bước 2: Qt tồn bộ ảnh I2, để tìm số lượng pixel có mức xám là 1, đây cũng chính là
số lượng hình trịn có kích thước lớn nhất. Kết quả nhận được số lượng hình trịn có
kích thước lớn nhất là 3.
b) Đề xuất phương pháp xác định số lượng hình trịn tương ứng với 3 nhóm kích thước khác
nhau như trong Hình 1 (1,0đ).
• Bước 1: Áp dụng phép tốn opening lên ảnh gốc I1 dùng phần tử cấu trúc là hình trịn
có bán kính r1. Kết quả nhận được ảnh mới I3 với chỉ gồm các hình trịn có kích thước
lớn nhất. Áp dụng phép toán erosion lên ảnh I3 dùng phần tử cấu trúc là hình trịn có
bán kính r1, sau đó áp dụng phương pháp tương tự câu a) để xác định số lượng hình
trịn có kích thước lớn nhất.
• Bước 2: Áp dụng phép tốn trừ ảnh I1 cho ảnh I3. Kết quả nhận được ảnh mới I4 với
chỉ gồm các hình trịn có kích thước trung bình và nhỏ nhất.
2
CuuDuongThanCong.com

/>

• Bước 3: Áp dụng phép toán opening lên ảnh I4 dùng phần tử cấu trúc là hình trịn có

bán kính r2. Kết quả nhận được ảnh mới I5 với chỉ gồm các hình trịn có kích thước
trung bình. Áp dụng phép toán erosion lên ảnh I5 dùng phần tử cấu trúc là hình trịn có
bán kính r2, sau đó áp dụng phương pháp tương tự câu a) để xác định số lượng hình
trịn có kích thước trung bình.

an

co

Hình 1

ng

.c
om

• Bước 4: Áp dụng phép toán trừ ảnh I4 cho ảnh I5. Kết quả nhận được ảnh mới I6 với
chỉ gồm các hình trịn có kích thước nhỏ nhất. Áp dụng phép toán erosion lên ảnh I6
dùng phần tử cấu trúc là hình trịn có bán kính r3, sau đó áp dụng phương pháp tương
tự câu a) để xác định số lượng hình trịn có kích thước nhỏ nhất.

cu

u

du
o

ng


th

Câu 3: Ma trận co-occurrence (2đ)

(b)

(a)

Hình 2
Các ma trận co-occurrence P(i, j; d, θ) ở Hình 2 (với i = 0, 1; j = 0, 1; d = 1; và θ = 0o) như sau:
Hình 2(a): (1,0đ)
59 × 2 × 30
0
3540
0
𝑃(𝑖, 𝑗, 1, 0𝑜 ) = �
�=�

0
59 × 2 × 30
0
3540
Hình 2(b): (1,0đ)
9 × 2 × 10 × 18
0
3240 150
�=�
𝑃(𝑖, 𝑗, 1, 0𝑜 ) = �

0

9 × 2 × 10 × 18
150 3240

3
CuuDuongThanCong.com

/>

Câu 4: Nhận dạng đối tượng (4đ)
a) Tìm các vector trung bình (mean vector) mj (j = 1, 2) và ma trận hiệp phương sai
(covariance matrix) Cj (j = 1..2) của các vector mẫu của 2 lớp mẫu trên (2,0đ).
2
𝐦1 = � �
1
4
𝐦2 = � �
3
0,5 0,5
4 −2


𝐂1 = �
→ 𝐂1−1 = �
0,5 1
−2 2
0,667 0,667
2
−0,5
𝐂2 = �



→ 𝐂2−1 = �
0,667 2,667
−0,5 0,5

.c
om

b) Xác định các hàm quyết định dj (j = 1, 2) cho 2 lớp mẫu trên dùng phương pháp cực tiểu
khoảng cách Euclid. Xác định đường biên quyết định theo phương pháp này (1,0đ).
Các hàm quyết định:
𝑑1 (𝐱) = 2𝑥1 + 𝑥2 − 2,5

ng

𝑑2 (𝐱) = 4𝑥1 + 3𝑥2 − 12,5

Đường biên giữa 2 lớp:

co

𝑥1 + 𝑥2 = 5

du
o

ng

th


an

c) Xác định các hàm quyết định dj (j = 1, 2) cho 2 lớp mẫu trên dùng phương pháp tối ưu
Bayes. Xác định đường biên quyết định Bayes cho 2 lớp mẫu trên (1,0đ).
Các hàm quyết định:
𝑑1 (𝐱) = 6𝑥1 − 2𝑥2 − 5,69

cu

u

Đường biên giữa 2 lớp:

𝑑2 (𝐱) = 4,67𝑥1 + 10,67𝑥2 − 26,02
1,33𝑥1 − 12,67𝑥2 = −20,33

Hết.

4
CuuDuongThanCong.com

/>


×