c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
167
Chơng
4
M
HOá
ảNH
v
Mở
đầu.
Mục
tiêu
chính
của
m
hoá
ảnh
là
làm
sao
trìng
bầy
ảnh
với
số
bít
càng
nhỏ
càng
tốt
trong
khi
vẫn
giữ
đợc
mức
chất
lợng
và
độ
dễ
hiểu
ở
mức
chất
lợng
vừa
đủ
với
một
ứng
dụng
đ
cho.
Có
hai
lĩnh
vực
ứng
dụng:
Một
là
giảm
bề
rộng
băng
tần
cần
thiết
cho
hệ
truyền
ảnh.
Ví
dụ
truyền
hình
số,
hội
nghị
video,
fax
ứng
dụng
thứ
hai
là
giảm
bớt
yêu
cầu
về
lu
trữ.
Ví
dụ
giảm
lu
trữ
số
liệu
ảnh
trong
các
chơng
trình
vũ
trụ
và
số
liệu
video
trong
máy
ghi
hình
số.
Tuỳ
theo
tính
chất
của
ứng
dụng,
mức
độ
chất
lợng
ảnh
và
độ
dễ
hiểu
có
thể
biến
đổi
trong
một
phạm
vi
rộng.
Trong
lu
trữ
ảnh
của
chơng
trình
vũ
trụ
hay
lu
trữ
ảnh
lịch
sử
(không
thể
có
lại
đợc)
phải
lu
trữ
lại
toàn
bộ
t
liệu
số
của
nguyên
bản
để
sử
dụng
về
sau.
Những
kỹ
thuật
không
làm
mất
tí
thông
tin
nào
và
cho
phép
phục
hồi
chính
xác
t
liệu
số
ban
đầu,
gọi
là
kỹ
thuật
có
tính
bảo
tồn
thông
tin.
Trong
truyền
hình
số
thì
bộ
m
hoá
không
cần
phải
là
loại
bảo
tồn
thông
tin
nh
vậy.
ở
đây
chất
lợng
cao
là
quan
trọng,
nhng
có
thể
bỏ
qua
một
số
thông
tin
từ
t
liệu
gốc,
trong
phạm
vi
mà
tín
hiệu giải
m
ra
và
hiện
lên
màn
hình
vẫn
vừa
mắt
ngời
xem.
Trong
ứng
dụng
về
điều
khiển con
tàu
từ
xa,
độ
dễ
hiểu
của
ảnh
là
quan
trọng
nhất,
nhng
có
thể
hi
sinh
một
phần
chất
lợng.
Càng
giảm
yêu
cầu
về
chất
lợng
và
độ
dễ
hiểu,
thì
tốc
độ
bit
càng
hạ.
M
hoá
ảnh
liên
quan
đến
cải
thiện
ảnh
và
phục
chế
ảnh.
nếu
ta
có
thể
cải
thiện
cảm
quan
thị
giác
của
ảnh
đợc
lập
lại
hay
nếu
ta
có
thể
giảm
sự
xuống
cấp
do
algorit
m
hoá
hình
gây
ra
(ví
dụ
nh
tạp
âm
lợng
tử
hoá
)
thì
ta
có
thể
giảm
bớt
số
lợng
bit
cần
thiết
để
biểu
diễn
một
ảnh
ở
mức
độ
chất
lợng
và
độ
dễ
hiểu
đ
cho,
hay
có
thể
giữ
nguyên
số
bit
mà
cải
thiện
chất
lợng
và
độ
dễ
hiểu
.
Môi
trờng
điển
hình
về
m
hoá
ảnh
nh
trên
hình
4.1.
ả
nh
digital
đợc
m
hoá
ảnh
m
hoá.
Bộ
m
hoá
này
gọi
là
bộ
m
hoá
nguồn.
Đầu
ra
bộ
m
hoá
này
là
một
chuỗi
bit
gọi
là
ảnh
gốc.
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
168
ả
nh
gốc
Bộ
m
hoá
ảnh
Bộ
m
hoá
kênh
ả
nh
phục
hồi
Bộ
giải
m
ảnh
Bộ
giải
m
kênh
Kênh
truyền
Hình
4.1
.
Môi
trờng
điển
hình
về
m
hoá
ảnh.
Bộ
m
hoá
kênh
biến
chuỗi
bit
này
ra
một
dạng
thích
hợp
cho
việc
truyền
qua
một
kênh
thông
tin,
thôn
g
qua
một
dạng
điều
chế
nào
đó.
Tín
hiệu
đ
điều
chế
đợc
truyền
qua
kênh
thông
tin.
Kênh
thông
tin
sẽ
đa
vào
một
ít
nhiễu
và
trong
bộ
m
hoá
kênh
phải
trữ
liệu
một
biện
pháp
sửa
lỗi
để
khắc
phục
tạp
âm
kênh
này.
ở
đầu
thu,
tín
hiệu
nhận
đợc
qua
giải
điề
u
chế
và
hoàn
nguyên
thành
chuỗi
bit
nhờ
bộ
giải
m
kênh.
Bộ
giải
m
ảnh
đem
chuỗi
bít
hoàn
nguyên
thành
ảnh
cho
hiện
lên
màn
hình
và
in
ra.
Khác
với
môi
trờng
truyền
tin
ở
hình
4.1,
trong
những
ứng
dụng
m
hoá
ảnh
để
giảm
lu
trữ,
không
có
kênh
thông
tin
.
ở
đây
chuỗi
bit
ở
đầu
ra
bộ
m
hoá
ảnh
đợc
lu
trữ
vào
môi
trờng
lu
trữ
chờ
sau
lấy
ra
dùng.
Bộ
m
hoá
ảnh
ở
hình
4.1
có
ba
phần
tử
cơ
bản
(Hình
4.2).
ả
nh
gốc
Biến
đổi
Lợng
tử
hóa
Gán
từ
m
Chuỗi
bit
Hình 4.2
.
Ba
thành
phần
chính
trong
m
hoá
ảnh.
Phần
tử
đầu
tiên
và
quan
trọng
nhất
làm
biến
đ
ổi
ảnh
vào
một
không
gian
(miền)
thích
hợp
nhất
cho
việc
lợng
tử
hoá
và
gán
từ
m.
Về
thực
chất
phần
tử
này
quyết
định
xem
cái
gì
phải
đem
m
hoá.
Algorit
m
hoá
ảnh
chia
làm
ba
loại
chính,
tuỳ
theo
đặc
trng
nào
của
ảnh
đợc
m
hoá.
Loại
thứ
nhất
gọi
là
bộ
m
hoá
dạng
sóng,
cờng
độ
ảnh
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
169
;
hay
một
biến
thiên
của
cờng
độ
ảnh,
ví
dụ
cờng
độ
của
hai
pixel
kề
nhau,
đợc
m
hoá.
Loại
thứ
hai,
gọi
là
bộ
m
hoá
hệ
số
biến
đổi
(hay
hàm
biến
đổi)
,
ảnh
đợc
biến
đổi
sang
không
gian
khác,
chẳng
hạn
biến
đổi
Fourier
hoặc
biến
đổi
Cosin,
nh
vậy
là
sang
một
miền
(domain)
khác
với
miền
cờng
độ,
và
các
hệ
số
biến
đổi
đợc
m
hoá.
Loại
thứ
ba
gọi
là
bộ
m
hoá
mô
hình
(model)
tín
hiệu,
ngời
ta
mô
hình
hoá
ảnh
hoặc một
mảnh
nào
đó
của
ảnh
và
các
thông
số
của
mô
hình
đợc
m
hoá.
Sau
đó
ảnh
đợc tổng
hợp
từ
các
thông
số
mô
hình
đ
m
hoá.
Phần
tử
thứ
hai
là
để
lợng
tử
hoá.
Để
biểu diễn
một
ảnh
với
một
số
bít
hữu
hạn,
thì
cờng
độ
ảnh,
hệ
số
biến
đổi
hay
thông
số
mô hình
phải
đợc
lợng
tử
hoá.
Việc
lợng
tử
hoá
bao
gồm
vi
ệc
gán
mức
lợng
tử
và
các biên
quyết
định.
Phần
tử
thứ
ba
để
gán
từ
m
tức
là
chuỗi
bít
biểu
diễn
các
mức
lợng
tử.
Mỗi
phần
tử
đều
nhằm
để
khai
thác
sự
d
thừa
trong
ảnh
gốc
và
những
giới
hạn
của
thiết
bị
hiện
hình
cũng
nh
của
hệ
thị
giác
con
ngời
.
Vì
vậy
ba
phần
tử
liên
quan
chặt
chẽ
với
nhau.
Chẳng
hạn
nếu
phần
tử
biến
đổi
trong
bộ
m
hoá
làm
cho
các
số
liệu
giảm
sự
tơng
quan
đủ
mức
thì
u
thế
của
lợng
tử
hóa
vectơ
so
với
lợng
tử
hoá
vô
hớng
giảm
đi.
Nếu
các
mức
lợng
tử
trong
bộ
lợng
tử
hoá
đợc
chọn
sao
cho
mỗi
mức
đợc
sử
dụng
với
xác
suất
nh
nhau
thì
u
thế
của
từ m
có
độ
dài
biến
đổi
so
với
từ
m
có
độ
dài
cố
định
giảm
đi.
1.
Lợng
tử
hoá.
1.1.
Lợng
tử
hoá
vô
hớng.
Gọi
f
là
một
lợng
vô
hớng
liên
tục,
có
thể
đại
biểu
cờng
độ
một
pixel
hoặc
một
hệ
số
biến
đổi
hay
một
thông
số
của
mô
hình
ảnh.
Để
biểu
diễn
f
bằng
một
số
lợng
bit
hữu
hạn,
ta
chỉ
dùng
một
số
lợng
hữu
hạn
mức
lợng
tử.
Giả
sử
có
L
mức
đợc
dùng
để
biễu
f.
Quá
trình
gán
một
giá
trị
f
cho
một
trong
L
mức
g
ọi
là
lợng
tử
hoá
biên
độ
hay
gọi
tắt
là
lợng
tử
hoá.
Nếu
mỗi
đại
lợng
vô
hớng
đợc
lợng
tử
hoá
một
cách
độc
lập
thì
quá
trình
gọi
là
lợng
tử
hoá
vô
hớng.
Nếu
hai
hoặc
trên
hai
đại
lợng
vô
hớng
kết
hợp
cùng
lợng
tử
hoá
thì
quá
trình
gọi
là
lợng
tử
hoá
vectơ
hay
lợng
tử
hoá
khối.
Gọi
f
là
f
đ
đợc
lợng
tử
hoá.
f
=
Q
(
f
)
=
r
i
d
i
1
<
f
<
d
i
(4.1)
Q=thuật
toán
lợng
tử
hoá.
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
170
p
p
r
i
=
với
1
i
L
là
L
mức
lợng
tử.
d
i
=
với
0
i
L
là
L
mức
quyết
định
hay
L
bờ
quyết
định.
Theo
(4.1)
thì
nếu
f
rơi
vào
giữa
d
i-1
và
d
i
thì
nó
đợc
ánh
xạ
vào
mức
lợng
tử
r
i
.
Nếu
ta
đ
xác
định
các
mức
quyết
định
và
mức
lợng
tử
thì
quá
trình
lợng
tử
hoá
f
là
một
quá
trình
xác
định.
Cũng
có
thể
biểu
diễn
:
f
= Q
(
f
)
=
f + e
Q
(4.2)
Trong
đó
e
Q
là
sai
số
lợng
tử
tính
theo
:
e
=
f
f
Q
(4.3)
Sai
số
lợng
tử
hoá
e
Q
còn
gọi
là
tạp
âm
lợng
tử
.
Đại
lợng
e
Q
2
coi
nh
trờng
hợp
đặc
biệt
của
độ
đo
độ
méo
d
(
f , f
)
là
một
độ
đo
khoảng
cách
giữa
f
và
f
.
Những
ví
dụ
khác
của
d
(
f , f
)
bao
gồm
f
f
và
f
f
.
Các
mức
lợng
tử
và
mức
quyết
định
thờng
đợc
xác
định
bằng
cách
tối
thiểu
hoá
một
tiêu
chuẩn
sa
i
số
nào
đó
dựa
trên
d
(
f , f
)
chẳng
hạn
nh
độ
méo
trung
bình
D
:
D
=
E
[
d
(
f
,
f
)
]
=
f
=
0
d
(
f
0
,
f
)
p
f
(
f
)
df
0
0
(4.4)
Phơng
pháp
lợng
tử
hoá
chân
phơng
nhất
là
lợng
tử
hoá
đều
trong
đó
các
mức
lợng
tử
(và
mức
quyết
định)
cách
đều
nhau.
d
d
i
=
i
1
1
i
L
(4.5a)
d
i
+
d
r
=
i
2
i
1
1
i
L
(4.5b)
là
kích
thớc
bớc
nhảy
bằng
khoảng
c
ách
giữa
hai
mức
lợng
tử
kề
nhau
hay
hai
mức
quyết
định
kề
nhau.
Ví
dụ
về
lợng
tử
hoá
đều
với
L=4
và
f
giả
thiết
gồm
giữa
0
và
1
đợc
trình
bày
ở
hình
4.3.
Tạp
âm
lợng
tử
e
Q
thờng
phụ
thuộc
tín
hiệu.
Chẳng
hạn
tạp
âm
lợng
tử
e
Q
của
bộ
lợng
tử
hoá
đều
(trong
hình
4.3)
đợc
biểu
diễn
ở
hình
4.4.
Từ
hình
này
thấy
rằng
e
Q
là
hàm
của
f
và
do
đó
nó
phụ
thuộc
tín
hiệu.
Có
thể
làm
cho
tạp
âm
lợng
tử
e
Q
trong
bộ
lợng
tử
hoá
đều
trở
thành
không
tơng
quan
bằng
cách
dùng
kỹ
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
171
1
thuật
giả
tạp
âm
của
Robert
.
Nh
sẽ
thấy
trong
tiết
3
phép
giải
tơng
quan
của
nhiễu
lợng
tử
hoá
sẽ
hữu
dụng
trong
việc
cải
thiện
chất
lợng
hệ
m
hoá
ảnh.
Nó
làm
thay
đổi
đặc
tính
của
sự
xuống
cấp
ảnh
m
hoá.
Ngoài
ra
có
thể
làm
giảm
tạp
âm
lợng
tử
đ
giải
tơng
quan
bằng
cách
dùng
algori
t
phục
hồi
ảnh
nh
chơng
3.
f
Bộ
lợng
tử
hoá
đều
f
f
7
r
4
8
5
r
8
3
3
r
2
8
1
r
1
8
0
(
d
0
)
1
(
d
)
4
1
(
d
)
2
2
3
(
d
)
4
3
f
1
(
d
4
)
Hình 4.3
:
Ví
dụ
về
bộ
lợng
tử
hoá
đều.
Số
mức
lợng
tử
là
4,
f
nằm
giữa
0
và
1,
f
là
f
đ
lợng
tử
hoá.
Các
mức
lợng
tử
và
bờ
quyết
định
đợc
ký
hiệu
là
r
i
và
d
i
.
Tuy
lợng
tử
hoá
đều
là
các
h
tiếp
cận
tự
nhiên
nhất,
nhng
nó
không
phải
là
tối
u.
Giả
sử
f
tập
trung
ở
một
vùng
nào
đó
nhiều
hơn
ở
các
vùng
khác.
Nh
vậy
gán
nhiều
mức
lợng
tử
cho
vùng
đó
nhiều
hơn
các
vùng
khác
là
hợp
lý.
Ta
xem
lại
ví
dụ
ở
hình
4.3.
Nếu
f
ít
khi
rơi
vào
giữa
d
0
và
d
1
thì
mức
lợng
tử
r
1
ít
dợc
sử
dụng.
Sắp
xếp
các
mức
lợng
tử
r
1
,
r
2
,
r
3
,
và
r
4
sao
cho
chúng
đều
nằm
giữa
d
1
và
d
4
sẽ
có
ý
nghĩa
hơn.
Lợng
tử
hoá
mà
các
mức
lợng
tử
và
mức
quyết
định
không
cách
đều
gọi
là
lợng
tử hoá
không
đều.
Việc
xác
định
tối
u
r
i
và
d
i
phụ
thuộc
vào
tiêu
chuẩn
sai
sốđợc
sử dụng.
Tiêu
chuẩn
thờng
dùng
nhất
là
sai
số
quân
phơng
tối
thiểu
MMSE*_
giả
thiết
f
là
một
biến
ngẫu
nhiên
có
hàm
mật
độ
xác
suất
là
p
f
(
f
0
).
Dùng
tiêu
chuẩn
MMSE
ta
xác
định
r
k
và
d
k
bằng
cách
tối
thiểu
hoá
độ
méo
trung
bình
D,
với
:
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
172
0
(
)
D
=
E
[
d
(
f
f
)
]
=
E
e
2
=
E
(
f
f
)
2
Q
(
)
f
f
2
(4.6)
=
p
f
f
f
=
0
df
0
0
Lu
ý
rằng
f
là
một
trong
L
mức
lợng
tử
tính
theo
(4.1),
ta
có
thể
đem
(4.6)
viết
ra
:
L
d
i
D
=
p
(
f
)(
r
f
)
2
df
(4.7)
f
0
i
0
0
i
=
1
f
=
d
0
i
1
Để
tìm
cực
tiểu
D
:
D
=
0
r
k
D
=
0
d
k
1
k
L
1
k
L
1
(4.8)
d
=
0
d
=
L
Từ
(4.7)
và
(4.8)
:
d
k
f
p
(
f
)
df
f
=
d
0
f
0
0
r
=
0
k
1
k
d
,
1
k
L
(4.9a)
k
f
=
d
o
p
f
k
1
f
df
0
0
r
+
r
d
=
k
k
+
1
,
2
1
k
L
1
(4.9b)
d
=
0
(4.9c)
d
L
=
(4.9d)
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
173
Q
Phơng
trình
đầu
trong
(4.9)
nói
lên
rằng
mức
lợng
tử
r
k
là
tâm
quay
(centroid)
của
p
f
(
f
0
)
trong
khoảng
d
k-1
f
d
k
.
Những
phơng
trình
còn
lại
nói
lên
rằng
mứ
c
quyết
định
d
k
(trừ
d
0
và
d
L
)
là
điểm
chính
giữa
hai
mức
lợng
tử
r
k
và
r
k+1
.
Phơng
trình
(4.9)
là
bộ phơng trình cần
cho
lời
giải
tối
u.
Với
một
số
hàm
mật
độ
xác
suất,
trong
đó
có
các
mật
độ
:
đều,
Gauss,
và
Laplace,
thì
(4.9)
cũng
là
bộ
phơng trình đủ
.
Giải
(4.9)
là
một
bài
toán
phi
tuyến.
Bài
toán
phi
tuyến
đ
đợc
giải
cho
một
số
hàm
mật
độ
xác
suất.
Các
lời
giải
khi
p
f
(
f
0
)
là
:
đều,
Gauss,
Laplace,
nh
trên
bảng
1.
Bộ
lợng
tử
hoá
dựa
trên
tiêu
chuẩn
MMSE
đợc
gọi
là
bộ
lợng
tử
hoá
Lloyd_Max.
Theo
bảng
1,
bộ
lợng
tử
hoá
đều
là
bộ
lợng
tử
hoá
MMSE
tối
u
khi
p
f
(f
0
)
là
hàm
mật
độ
xác
suất
đều.
Với
những
mật
độ
xác
suất
khác,
lời
giải
tối
u
là
một
bộ
lợng
tử
hoá
không
đều.
Hình
4.5
biểu
diễn
các
mức
lợng
tử
và
mức
quyết
định
tối
u
ứng
với
hàm
mật
độ
xác
suất
Gauss
có
phơng
sai
là
1
và
L=4.
Cần
đánh
giá
mức
độ
cải
thiện
mà
bộ
lợng
tử
hoá
MMSE
tối
u
đem
lại
so
với
bộ
lợng
tử
hoá
đều.
Chẳng
hạn
xét
một
hàm
độ
xác
suất
Gauss
có
giá
trị
trung
bình
là
0
và
phơng
sai
là
1.
e
=
==
=
f
f
1/8
1/8
1/4
1/2
f
3/4
1
Hình 4.4
:
Minh
hoạ
về
sự
phụ
thuộc
của
tạp
âm
lợng
tử
vào
tín
hiệu.
Hình
4.6
biểu
diễn
méo
trung
bình
D
theo
hàm
của
số
mức
lợng
tử,
đờng
liền
nét
ứng
với
bộ
lợng
tử
hoá
MMSE
tối
u,
đờng
vẽ
chấm
ứng
với
bộ
lợng
tử
hoá
đều,
trong
đó
các
mức
lợng
tử
r
i
đợc
chọn
đối
xứng
đối
với
gốc
toạ
độ,
các
mức
quyết
định
cực
tiểu
và
cực
đại
giả
thiết
là
-
và
,
bớc
lợng
tử
đợc
chọn
để
độ
méo
trung
bình
D
là
cực
tiểu.
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
174
0
Bảng
4.1
.
Vị
trí
của
các
mức
lợng
tử
và
quyết
định
đối
với
bộ
lợng
tử
hoá
Lloyd_Max.
Với
hàm
mật
độ
xá
c
suất
đều,
giả
thiết
p
f
(f
0
)
đều
giữa
1
và
1.
Với
hàm
mật
độ
xác
suất
Gauss
giả
thiết
trung
vị
bằng
0
và
phơng
sai
bằng
1.
Với
hàm
mật
độ
xác
suất
Laplace
2
f
2
p
f
(
f
0
)=
2
e
với
=
1
Đều
Gauss
Laplace
Bit
r
i
d
i
r
i
d
i
r
i
d
i
1
2
3
4
-0.5000
-1.0000
0.5000
0.0000
1.0000
-0.7500
-1.0000
-0.2500
-0.5000
0.2500
0.0000
0.7500
0.5000
1.0000
0.8750
-1.0000
-0.6250
-0.7500
-0.3750
-0.5000
-0.1250
-0.2500
0.1250
0.0000
0.3750
0.2500
0.6250
0.5000
0.8750
0.7500
1.0000
-0.9375
-1.0000
-0.8125
-0.8750
-0.6875
-0.7500
-0.5625
-0.6250
-0.4375
-0.5000
-0.3125
-0.3750
-0.1875
-0.2500
-0.0625
-0.1250
0.0625
0.0000
0.1875
0.1250
0.3125
0.2500
0.4375
0.3750
0.5625
0.5000
0.6875
0.6250
0.8125
0.7500
0.9375
0.8750
1.0000
-0.7979
-
0.7979
0.0000
-1.5104
-
-0.4528
-0.9816
0.4528
0.0000
1.5104
0.9816
-2.1519
-
-1.3439
-1.7479
-0.7560
-1.0500
-0.2451
-0.5005
0.2451
0.0000
0.7560
0.5005
1.3439
1.0500
2.1519
1.7479
-2.7326
-
-2.0690
-2.4008
-1.6180
-1.8435
-1.2562
-1.4371
-0.9423
-1.0993
-0.6568
-0.7995
-0.3880
-0.5224
-0.1284
-0.2582
0.1284
0.0000
0.3880
0.2582
0.6568
0.5224
0.9423
0.7995
1.2562
1.0993
1.6180
1.4371
2.0690
1.8435
2.7326
2.4008
-0.7071
-
0.7071
0.0000
-1.8304
-
-0.4198
-1.1269
0.4198
0.0000
1.8340
1.1269
-3.0867
-
-1.6725
-2.3796
-0.8330
-1.2527
-0.2334
-0.5332
0.2334
0.0000
0.8330
0.5332
1.6725
1.2527
3.0867
2.3769
-4.4311
-
-3.0169
3.7240
-2.1773
-2.5971
-1.5778
-1.8776
-1.1110
-1.3444
-0.7287
-0.9198
-0.4048
-0.5667
-0.1240
-0.2664
0.1240
0.0000
0.4048
0.2644
0.7287
0.5667
1.1110
0.9198
1.5778
1.3444
2.1773
1.8776
3.0169
2.5971
4.4311
3.7240
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
175
10
lo
g
10
D
Bộ
f
lợng
tử
hoá
f
không
đều
f
1.5104
-0.9816
0.4528
-0.4528
-1.5104
f
0.9816
Hình 4.5
.
Ví
dụ
về
bộ
lợng
tử
hoá
Lloyd_Max.
Số
mức
lợng
tử
là
4,
hàm
mật
độ
xác
suất
là
Gauss
với
trung
vị
bằng
0
và
phơng
sai
bằng
1.
0
-10
-20
-30
Lợng
tử
hoá
Lloyd_Max
Lợng
tử
hoá
đều
-40
2
4
8
16
32
64
128
L
(1bit)
(2bit)
(3bit)
(4bit)
(5bit)
(6bit)
(7bit)
Hình
4.6
.
So
sánh
độ
méo
trung
bình
D
=E[(
f
-
f
)
2
]
theo
hàm
của
số
mức
lợng
tử
L
trong
2
trờng
hợp
:
Đờng
liền
nét
:
bộ
lợng
tử
hoá
Lloyd_Max
(khi
hàm
mật
độ
xác
suất
là
Gauss,
trung
vị
bằng
0
và
phơng
sai
bằng
1).
Đờng
vẽ
chấm
:
bộ
lợng
tử
hoá
đều.
Trục
tung
tính
theo
10
log
10
D.
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
176
Trên
hình
4.6
nếu
dùng
từ
m
có
độ
dài
đều
để
biểu
diễn
các
mức
lợng
tử
t
hì
sự
tiết
kiệm
bit
là
0
~
1/2
bit
khi
L
trong
khoảng
2
(1
bit)
và
128
(7
bit).
Trong
ví
dụ
này
giả
thiết
hàm
mật
độ
xác
suất
p
f
(
f
0
)
là
Gauss.
Có
thể
tiến
hành
phân
tích
tơng
tự
với
các
hàm
mật
độ
xác
suất
khác,
hàm
mật
độ
xác
suất
càng
khác
xa
hàm
phân
b
ố
đều
thì
u
thế
của
lợng
tử
hoá
không
đều
so
với
lợng
tử
hoá
đều
càng
lớn.
Quan
niệm
:
bộ
lợng
tử
hoá
đều
là
tối
u
khi
hàm
mật
độ
xác
suất
phân
bố
đều
lại
gợi
ý
cho
ta
một
cách
tiếp
cận
khác.
Đó
là,
ta
có
thể
ánh
xạ
f
vào
g
bằng
một
phép
phi
tuyến
s
ao
cho
p
g
(g
0
)
là
đều,
ta
đem
lợng
tử
hoá
g
bằng
một
bộ
lợng
tử
hoá
đều,
sau
đó
lại
thực
hiện
phép
ánh
xạ
ngợc.
Phơng
pháp
này
đợc
minh
hoạ
trên
hình
4.7.
g
f
Phi
tuyến
Bộ
lợng
tử
hoá
đều
g
Phi
tuyến
-1
f
Hình 4.7
.
Lợng
tử
hoá
không
đều
bằng
phép
nén
-dn.
Phép
phi
tuyến
này
đợc
gọi
là
phép
nén
-dn
(companding).
Theo
lý
thuyết
xác
suất,
một
lựa
chọn
của
phép
phi
tuyến
(hay
phép
nén
-dn)
C[
]
để
tạo
ra
đợc
p
g
(g
0
)
đồng
đều
là
:
g
=
C
[
f
]
=
f
p
f
x
=
1
(
x
)
dx
2
(4.10)
p
g
(g
0
)
nhận
đợc
đồng
đều
trong
khoảng
1/2
g
1/2
.
Tuy
(1.10)
dễ
giải
hơn
hệ
phơng
trình
phi
tuyến
(1.9),
hệ
ở
hình
1.7
lại
tối
thiểu
hoá
D
:
2
D
'
=
E
(
g
g
)
mà
méo
D
ở
(4.11)
không
giống
D
ở
(4.6).
(4.11)
Trong
tiết
này
ta
đ
xét
việc
lợng
tử
hoá
một
đại
lợng
vô
hớng
f
.
Trong
m
hoá
ảnh,
phải
lợng
tử
hoá
nhiều
đại
lợng
vô
hớng.
Một
cách
tiếp
cận
là
lợng
tử
hoá
từng
cái
độc
lập
_
Cách
này
gọi
là
lợng
tử
hoá
vô
hớng
một
nguồn
vectơ.
Giả
sử
có
N
vô
hớng
f
i
với
1
i
N
và
mỗi
vô
hớng
đợc
lợng
tử
hoá
ra
L
i
mức.
Nếu
L
i
đợc
biểu
diễn
bằng
một
luỹ
thừa
của
2
và
nếu
mỗi
mức
lợng
tử
đợc
m
hoá
với
một
số
bit
nh
nhau
(nghĩa
là
với
từ
m
có
độ
dài
đều)
thì
quan
hệ
giữa
L
i
với
một
số
bit
cần
thiết
B
i
là
:
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
177
(
2
B
)
i
i
i
i
2
B
L
=
2
i
(4.12a)
B
i
=
log
2
L
i
(4.12b)
Tổng
số
bit
B
cần
thiết
để
m
hoá
N
vô
hớng
là
:
N
B
=
B
i
i
=
1
Từ
(4.12)
và
(4.13)
đợc
tổng
số
mức
lợng
tử
L
:
(4.13)
N
L
=
L
i
=
2
(4.14)
i
=
1
Xét
(4.13)
và
(4.14)
nhận
thấy
tổng
số
bit
B
là
tổng
các
B
i
còn
tổng
số
mức
lợng
tử
L
là
tích
các
L
i
.
Nếu
có
một
số
bit
cố
định
B
để
m
hoá
N
vô
hớng
bằng
phép
lợng
tử
hoá
vô
hớng
nguồn
vectơ
thì
phải
phân
phối
B
cho
N
vô
hớng.
Chiến
lợc
tối
u
để
phân
bổ
bit
phụ
thuộc
tiêu
chuẩn
sai
số
và
hàm
mật
độ
xác
suất
của
các
vô
hớng.
Chiến
lợc
tối
u
thờng
d
ùng
là
cho
vô
hớng
có
phơng
sai
lớn
nhiều
bit,
vô
hớng
có
phơng
sai
bé
ít
bit.
Ví
dụ
:
giả
sử
cần
tối
thiểu
hoá
sai
số
quân
phơng
N
E
f
i
f
2
đối
với
B
(1
i
N)
trong
đó
f
là
kết
quả
lợng
tử
hoá
f
.
Nếu
các
vô
i
=
1
hớng
có
hàm
mật
độ
xác
suất
giống
nhau
chỉ
có
phơng
sai
khác
nhau
ta
sẽ
dùng
một
phơng
pháp
lợng
tử
hoá
nh
nhau,
chẳng
hạn
dùng
bộ
lợng
tử
hoá
Lloyd_Max
cho
từng
vô
hớng.
Khi
đó
lời
giải
gần
đúng
về
phân
bổ
bit
là:
B
=
B
+
1
log
i
1
i
N
(4.15)
i
N
2
2
N
1
/
N
j
j
=
1
Trong
đó
i
2
là
phơng
sai
của
vô
hớng
f
i
.
Từ
(4.15)
suy
ra
:
L
i
=
2
B
i
=
2
B
/
N
N
i
1
/
N
1
i
N
(4.16)
j
j
=
1
Theo
(4.16)
số
mức
lợng
tử
cho
f
i
tỉ
lệ
với
i
,
là
độ
lệch
chuẩn
của
f
i
.
Tuy
(4.15)
là
một
lời
giải
gần
đúng
với
một
số
giả
thiết
nhất
định,
nó
vẫn
là
căn
cứ
tham
khảo
trong
những
bài
toán
phân
bổ
bit.
B
i
trong
(4.15)
có
thể
âm
và
nói
chung
không
phải
là
số
nguyên.
Khi
lợng
tử
hoá
vô
hớng
B
i
phải
là
một
số
nguyên
không
âm.
Đó
là
điều
kiện
ràng
buộc
khi
giải
các
bài
toán
phân
bổ
bit
trong
thực
tế.
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
178
1.2
.
Lợng
tử
hoá
vectơ.
Trong
tiết
trên,
thảo
luận
về
lợng
tử
hoá
vô
hớng
một
vô
hớng
và
một
nguồn
vectơ.
Một
cách
tiếp
cận
khác
để
m
hoá
nguồn
vectơ
là
đem
chia
các
vô
hớng
thành
những
khối,
xem
mỗi
khối
nh
một
đơn
vị
sau
đó
lợng
tử
đồng
thời
những
vô
hớng
này
trong
đơn
vị
đó.
Nh
vậy
gọi
là
lợng
tử
hoá
vectơ
hay
lợng
tử
hoá
khối
.
Gọi
f
=
[f
1
,
f
2
, ,
f
N
]
T
là
một
vectơ
M
chiều
gồm
N
vô
hớng
f
i
có
giá
trị
thực,
biên
độ
liên
tục
.
Trong
phép
lợng
tử
hoá
vectơ
f
đợc
ánh
xạ
vào
một
vectơ
M
chiều
khác
r
=
[r
1
,
r
2
, ,
r
N
]
T
.
Khác
với
f
mà
các
phần
tử
có
biên
độ
liên
tục,
vectơ
r
đợc
chọn
từ
L
mức
lợng
tử.
Gọi
f
là
f
đ
đợc
lợng
tử
hoá,
ta
biểu
diễn
nó
bằng
:
f
=VQ(
f
)=
r
i
.
f
C
i
(4.17)
VQ
là
toán
tử
lợng
tử
hoá
vectơ
r
i
với
1
i
N
chỉ
L
mức
lợng
tử
và
C
i
đợc
gọi
là
tế
bào
thứ
i
.
Nếu
f
nằm
trong
tế
bào
C
i
,
thì
f
đợc
ánh
xạ
vào
r
i
.
Hình
4.8
cho
một
ví
dụ
lợng
tử
hoá
vectơ
khi
N
=2
và
L
=
9
.
Các
chấm
trên
hình
là
những
mức
lợng
tử,
và
các
đờng
liền
nét
là
đờng
biên
tế
bào
.
Trong
lợng
tử
hoá
vectơ
tế
bào
có
thể
có
hình
dạng,
kích
thớc
bất
kỳ.
Đó
là
điều
khác
biệt
với
lợng
tử
hoá
vô
hớng,
mà
tế
bào
(miền
g
iữa
2
mức
quyết
dịnh
kề
nhau)
có
thể
có
kích
thớc
bất
kỳ
nhng
hình
dạng
cố
định
.
f
2
f
1
Hình
4.8
.
Ví
dụ
lợng
tử
hoá
vectơ.
Số
vô
hớng
trong
mỗi
vectơ
là
2,
số
mức
lợng
tử
là
9.
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
179
1
1
2
Phép
lợng
tử
hoá
vectơ
khai
thác
sự
mềm
dẻo
này.
Cũng
nh
trong
trờng
hợp
vô
hớng,
ta
định
nghĩa
độ
méo
d
(
f , f
)
là
độ
đo
sự
chênh
lệch
giữa
f
và
f
.Một
ví
dụ
của
d
(
f , f
)
là
e
Q
T
e
Q
trong
đó
tạp
âm
lợng
tử
e
Q
định
nghĩa
theo
:
e
Q
=
f
f
=
VQ
(
f
)
f
(4.18)
Các
mức
lợng
tử
r
I
và
bờ
các
tế
bào
C
I
xác
định
bằng
cách
lấy
cực
tiểu
1
tiêu
chuẩn
sai
số
nào
đó,
chẳng
hạn
độ
méo
trung
bình
D
:
D
=
E
[
d
(
f
,
f
)
]
(4.19)
Nếu
d
(
f , f
)
là
e
Q
T
e
Q
thì
từ
(4.18)
và
(4.19)
suy
ra
:
D
=
E
(
e
T
e
)
=
E
(
f
f
)
T
(
f
f
)
Q
=
Q
(
f
f
)
T
(
f
f
)
p
(
f
)
df
(4.20)
L
0
0
f
0
0
T
=
(
r
i
f
0
)
(
r
i
f
0
)
df
0
i
=
1
f
0
C
i
Độ
méo
trung
bình
ở
(4.20)
là
sai
số
quân
phơng
MSE
và
là
dạng
tổng
quát
của
(4.7)
.
Ưu
điểm
của
e
Q
T
e
Q
so
với
lợng
tử
hoá
vô
hớng
một
nguồn
vectơ
là
cải
thiện
chất
lợng.
Lợng
tử
hoá
vectơ
cho
phép
giảm
thấp
độ
méo
trung
bình
D
khi
giữ
số
mức
lợng
tử
không
đổi,
hay
cho
giảm
số
mức
lợng
tử
khi
giữ
độ
méo
trung
bình
D
không
đổi.
Lợng
tử
hoá
vectơ
cải
thiện
chất
lợng
so
với
lợng
tử
hoá
vô
hớng
bằng
nhiều
cách.
Cách
có
ý
nghĩa
nhất
là
khai
thác
mối
quan
hệ
thống
kê
giữa
các
vô
hớng
trong
cùng
khối.
Để
minh
hoạviệc
lợng
tử
hoá
vectơ
có
thể
khai
thác
mối
quan
hệ
thống
kê
ta
hy
xét
2
ví
dụ.
Trong
ví
dụ
thứ
nhất
ta
khai
thác
mối
quan
hệ
tuyến
tính
(tính
tơng
quan).
Xét
2
nguồn
ngẫu
nhiên
f
1
và
f
2
có
hàm
mật
độ
xác
suất
đồng
thời
p
f
1
f
2
(
f
'
, f
'
)
nh
trên
hình
4.9a.
Hàm
mật
độ
xác
suất
đồng
thời
có
biên
độ
đồng
đều
và
bằng
1/2a
2
trong
vùng
gạch
chéo,
bằng
không
ở
ngoài
vùng
gạch
chéo.
Hai
hàm
mật
độ
xác
suất
biên
p
f
1
(
f
'
)
và
p
(
f
'
)
cũng
đợc
vẽ
trên
hình.
Vì
E[
f
,
f
]
E[
f
]
E[
f
]
nên
f
và
f
là
tơng
quan
hay
f
2
2
1
2
1
2
1
2
phụ
thuộc
tuyến
tính.
Giả
thiết
ta
lợng
tử
hoá
riêng
rẽ
f
1
và
f
2
,
dùng
lợng
tử
hoá
vô
hớng
và
tiêu
chuẩn
MMSE.
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
180
1
-a
-a
(b)
2
f
f
f
1
f
f
f
f
f
p
f
2
'
2
a
(
f
'
)
2
a
-a
'
2
a
'
-a
a
1
-a
p
f
1
(
f
'
)
1
2
a
'
-a
a
1
(a)
' '
2 2
a
a
'
-a
a
1
'
-a
a
1
-a
-a
(b)
(c)
Hình
4.9
.
Minh
hoạ
việc
lợ
ng
tử
hoá
vectơ
khai
thác
sự
phụ
thuộc
tuyến
tính
của
các
vô
hớng
trong
vectơ
:
(a)
Hàm
mật
độ
xác
suất
p
(
f
'
, f
'
)
f
1
f
2
1 2
(b)
Các
mức
lợng
tử
hoá
(các
chấm
trên
hình)
khi
lợng
tử
hoávô
hớng.
(c)
Các
mức
lợng
tử
hoá
(các
chấm
trên
hình)
khi
lợng
tử
hoávectơ.
Vì
mỗi
vô
hớng
f
1
và
f
2
đều
có
hàm
mật
độ
xác
suất
đều
nên
bộ
lợng
tử
hoá
vô
hớng
tối
u
là
lợng
tử
hoá
đều.
Nếu
ta
cho
mỗi
vô
hớng
có
2
mức
lợng
tử
thì
các
mức
lợng
tử
của
mỗi
vô
hớ
ng
là
a/2
và
-a/2
.
Bốn
(2x2)
mức
lợng
tử
hợp
thành
4
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
181
1
1
2
1
2
chấm
trên
hình
4.9b.
Rõ
ràng
là
2
trong
số
4
mức
lợng
tử
là
lng
phí.
Với
phép
lợng
tử
hoá
vectơ
ta
chỉ
có
thể
dùng
2
mức
lợng
tử
nh
trên
hình
4.9c.
Ví
dụ
này
cho
thấy
rằng
lợng
tử
hoá
vectơ
cho
phép
giảm
số
mức
lợng
tử
mà
không
phải
hi
sinh
MSE.
Ta
có
thể
loại
bỏ
sự
phụ
thuộc
tuyến
tính
giữa
f
1
và
f
2
bằng
cách
đem
quay
hàm
mật
độ
xác
suất
đi
45
0
theo
chiều
kim
đồng
hồ,
kết
quả
của
phép
biến
đổi
toạ
độ
tuyến
tính
khả
nghịch
này
đợc
biểu
diễn
trê
n
hình
4.10.
Trong
hệ
toạ
độ
mới
g
1
và
g
2
không
tơng
quan,
vì
E[g
1
,g
2
]
=
E[g
1
]
E[g
2
].
Trong
hệ
toạ
độ
mới
này
có
thể
đặt
hai
mức
lợng
tử
vào
các
chấm
ở
trên
hình
bằng
cách
lợng
tử
hoá
vô
hớng
hai
đại
lợng
vô
hớng,
và
khi
đó
u
thế
của
lợng
tử
hoáve
ctơ
không
còn
nữa.
g
2
a
2
2a
a
-
2
2a
g
1
Hình
4.10
.
Kết
quả
loại
trừ
sự
phụ
thuộc
tuyến
tính
giữa
hai
vô
hớng
f
1
và
f
2
ở
hình
4.9
khi
thực
hiện
phép
biến
đổi
tuyến
tính
f
1
và
f
2
.
Loại
bỏ
sự
phụ
thuộc
tuyến
tính
làm
mất
u
thế
của
phép
lợng
tử
hoá
vectơ.
Nh
vậy
là
phù
hợp
với
quan
điểm
cho
rằng
lợng
tử
hoá
vectơ
có
thể
khai
thác
sự
phụ
thuộc
tuyến
tính
giữa
các
vô
hớng
trong
vectơ.
Phép
lợng
tử
hoá
vectơ
cũng
có
thể
khai
thác
sự
phụ
thuộc
phi
tuyến.
Ta
đa
ra
một
ví
dụ
minh
hoạ.
Xét
2
biến
ngẫu
nhiên
f
1
và
f
2
và
hàm
mật
độ
xác
suất
đồng
thời
p
f
1
f
2
(
f
'
, f
'
)
đợc
biểu
diễn
trên
hình
4.11a.
Hàm
mật
xác
suất
vẫn
là
đều
với
biên
độ
bằng
1/(8a
2
)
trong
vùng
gạch
chéo
và
bằng
không
ngoài
vùng
đó.
Hàm
mật
độ
xác
suất
biên
p
f
1
(
f
'
)
và
p
(
f
'
)
cũng
đợc
vẽ
trên
hình
4.11a.
Từ
hàm
mật
độ
xác
suất
đồng
thời
E[f
,f
]
=
E[f
]
f
2
2
1
2
1
E[f
2
]
và
do
đó
f
1
và
f
2
độc
lập
tuyến
tính.
Tuy
vậy
p
(
f
,
f
)
p
(
f
)
p
(
f
)
nên
f
và
f
2
phụ
thuộc
thống
kê.
'
'
f
1
f
2
'
f
1
1
'
f
2
2
1
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
182
1
(b)
f
f
2
f
1
f
f
f
f
f
1
1
1
Khi
mà
các
biến
ngẫu
nhiên
độc
lập
tuyến
tính
nhng
phụ
thuộc
thống
kê
ta
bảo
chúng
phụ
thuộc
phi
tuyến.
'
'
2
2
a
2a
p
f
2
(
f
'
)
4
a
-a
-2a
a
a
'
-a
-a
2a
-2a
p
f
1
(
f
'
)
1
4
a
-2a
'
2a
1
(a)
' '
2 2
-2a
2a
a
a
'
-a
-a
2a
-2a
2a
a
a
'
-a
-a
2a
-2a
-2a
(b)
(c)
Hình
4.11
.
Minh
hoạ
việc
lợng
tử
hoá
vectơ
khai
thác
sự
phụ
thuộc
tuyến
tính
giữa
các
vô
hớng
trong
vectơ
:
a)
Hàm
mật
độ
xác
suất
p
(
f
'
, f
'
)
.
f
1
f
2
1 2
b)
Các
mức
lợng
tử
(các
chấm)
khi
lợng
tử
hoá
vô
hớng
.
c)
Các
mức
lợng
tử
(các
chấm)
khi
lợng
tử
hoá
vectơ.
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
183
g
g
Nếu
ta
lợng
tử
hoá
f
1
và
f
2
riêng
rẽ,
dùng
tiêu
chuẩn
MSE
và
cho
mỗi
vô
hớng
2
mức
lợng
tử,
thì
các
mức
lợng
tử
tối
u
cho
mỗi
vô
hớng
là
-a
và
a.
Các
mức
lợng
tử
tổng
hợp
trong
trờng
hợp
đó
là
4
chấm
trong
hình
4.11b.
Độ
méo
trung
bình
D
=
E[e
Q
T
e
Q
]
trong
ví
dụ
này
là
5a
2
/12.
Ví
dụ
này
cho
thấy
rằng
dùng
lợng
tử
hoá
vectơ
có
thể
làm
giảm
MSE
mà
không
cần
tăng
số
mức
lợng
tử.
Ta
có
thể
loại
bỏ
phụ
thuộc
phi
tuyến
giữa
f
1
và
f
2
trong
ví
dụ
này
bằng
một
thuật
toán
phi
tuyến
khả
nghịch.
Kết
quả
của
một
thuật
toán
nh
vậy
đợc
biểu
diễn
trên
hình
4.12.
'
2
2a
'
-a
a
1
-2a
Hình
4.12
.
Kết
quả
của
việc
loại
bỏ
sự
phụ
thuộc
tuyến
tính
giữa
hai
vô
hớng
f
1
và
f
2
ở
hình
4.11.
Vì
p
(
g
'
,
g
'
)
=
p
(
g
'
)
p
(
g
'
)
nên
g
và
g
độc
lập
thống
kê.
Trong
những
g
1
g
2
1
2
g
1
1
g
2
2
1
2
trờng
hợp
này
có
thể
đặt
hai
mức
lợng
tử
vào
các
chấm
trên
hình
bằng
cách
lợng
tử
hoá
vô
hớng
hai
đại
lợng
vô
hớng,
và
u
thế
của
lợng
tử
hoá
vectơ
không
còn
nữa.
Qua
ví
dụ
này
thấy
rằng
loại
bỏ
phụ
thuộc
phi
tuyến
làm
giảm
u
thế
của
lợng
tử
hoá
vectơ.
Nh
vậy
phù
hợp
với
quan
niệm
cho
rằng
lợng
tử
hoá
vectơ
có
thể
khai
thác
sự
phụ
thuộc
phi
tuyến
giữa
các
vô
hớng
trong
vectơ.
Phép
biến
đổi
tuyến
tính
bao
giờ
cũng
có
thể
loại
bỏ
sự
phụ
thuộc
tuyến
tính.
Về
sự
phụ
thuộc
phi
tuyến
đôi
khi
ta
cũng
loại
bỏ
đợc
bằng
một
thuật
toán
phi
tuyến
khả
nghịch.
Nếu
ta
loại
bỏ
phụ
thuộc
tuyến
tính
hay
phi
tuyến
bằng
một
thuật
toán
phi
tuyến
khả
nghịch
trớc
khi
lợng
tử
hoá
thì
u
thế
của
lợng
tử
hoá
vectơ
về
khả
năng
khai
thác
phụ
thuộc
tuyến
tính
hay
phi
tuyến
sẽ
không
còn
nữa.
Nh
vậy
là
phải
hết
sức
chú
ý
đến
quan
hệ
chặt
chẽ
giữa
giai
đo
ạn
biến
đổi
và
giai
đoạn
lợng
tử
hoá
trong
m
hoá
ảnh.
Nếu
nh
giai
đoạn
biến
đổi
làm
mất
phụ
thuộc
tuyến
tính
hay
phi
tuyến
giữa
các
vô
hớng
cần
m
hoá
thì
đến
giai
đoạn
lợng
tử
hoá
mức
độ
cải
thiện
của
lợng
tử
hoá
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
184
vectơ
so
với
lợng
tử
hoá
vô
hớng
s
ẽ
giảm
sút,làm
cho
lợng
tử
hoá
vectơ
trở
lên
kém
hấp
dẫn.
Điều
đó
nói
lên
một
phần
tại
sao
trong
bộ
m
hoá
dạng
sóng
sự
cải
thiện
do
lợng
tử
hoá
vectơ
đem
lại
rõ
nét
hơn
trong
bộ
m
hoá
phép
biến
đổi.
Các
vô
hớng
dùng
trong
bộ
m
hoá
dạng
sóng,
chẳng
hạ
n
các
cờng
độ
ảnh,
có
tính
tơng
quan
cao
hơn
các
vô
hớng
trong
bộ
m
hoá
phép
biến
đổi,
chẳng
hạn
các
hệ
số
phép
biến
đổi
DCT.
Điều
này
sẽ
đợc
phân
tích
ở
các
tiết
3
và
4.
Ngoài
việc
khai
thác
sự
phụ
thuộc
thống
kê
lợng
tử
hoá
vectơ
còn
có
thể
khai
thác
sự
tăng
thứ
nguyên,
nghĩa
là
tăng
số
vô
hớng
trong
vectơ.
Để
minh
hoạ
ta
xét
2
biến
ngẫu
nhiên
f
1
và
f
2
có
hàm
mật
độ
xác
suất
đồng
thời
đều
trong
một
miền
hình
vuông
có
diện
tích
A.
Rõ
ràng
là
f
1
và
f
2
độc
lập
thống
kê.
Giả
sử
số
mức
lợng
tử
L
rất
lớn
và
do
đó
kích
thớc
tế
bào
nhỏ
hơn
hình
vuông
trong
đó
hàm
mật
độ
xác
suất
khác
0.
Trớc
hết
ta
xét
phép
lợng
tử
hoá
vô
hớng
f
1
và
f
2
.
Vì
hàm
mật
độ
xác
suất
của
f
1
và
f
2
là
đều
nên
theo
tiêu
chuẩn
MMSE,
lợng
tử
hoá
đều
là
tối
u.
Việc
lợng
tử
hoá
đều
f
1
và
f
2
riêng
rẽ
đa
tới
những
mức
lợng
tử
và
tế
bào
vẽ
ở
hình
4.13a.
Trong
trờng
hợp
lợng
tử
hoá
vô
hớng
tế
bào
có
dạng
hình
vuông
có
cạnh
a.
Nếu
đem
lợng
tử
hoá
vectơ
f
1
và
f
2
thì
các
mức
lợng
tử
và
tế
bào
nh
trên
hình
4.13b
Tế
bào
có
dạng
lục
giác.
Thông
qua
tính
toán
có
thể
chứng
minh
rằng
MSE
trong
trờng
hợp
lợng
tử
hoá
vectơ
thấp
hơn
trờng
hợp
lợng
tử
hoá
vô
hớng
4%
nếu
mức
lợng
tử
nh
nhau.
Cũng
có
thể
chứng
minh
là
số
mức
lợng
tử
mà
lợng
tử
hoá
vectơ
yêu
cầu
bé
hơn
số
mức
của
lợng
tử
hoá
vô
hớng
2%
khi
MSE
nh
nhau.
Sự
cải
thiện
này
thờng
nhỏ
hơn
nhiều
so
với
mức
cải
thiện
bằng
lợng
tử
hoá
vectơ
khi
khai
thác
sự
phụ
thuộc
thống
kê.
Tuy
vậy
sự
cải
thiện
sẽ
nét
hơn
nhiều
khi
thứ
nguyên
(nghĩa
là
số
vô
hớng
trong
vectơ)
tăng
lên.
Lu
ý
rằng
sự
cải
thiện
thêm
này
vẫn
đạt
đợc
ngay
cả
khi
các
vô
hớng
trong
khối
độc
lập
thống
kê
với
nhau.
Sự
cải
thiện
mà
lợng
tử
hoá
vectơ
đem
lại
trong
một
số
trờng
hợp
cho
phép
m
hoá
1
vô
hớng
dới
1
bit.
Nếu
ta
m
hoá
riêng
rẽ
từng
vô
hớng
và
cho
mỗi
vô
hớng
tối
thiểu
2
mức
lợng
tử
(nếu
dùng
1
mức
lợng
tử
thì
coi
nh
không
m
hoá)
thì
tỷ
lệ
bit
tối
thiểu
có
thể
là
1
bit
mỗi
vô
hớng.
Nếu
dùng
lợng
tử
hoá
vectơ,
có
thể
cho
mỗi
vô
hớng
2
hoặc
trên
2
mức
lợng
tử
nếu
xét
riêng
rẽ,
nhng
nếu
n
hìn
tổng
hợp
lại
thì
tốc
độ
bit
sẽ
thấp
hơn
một
bit
mỗi
vô
hớng.
Để
minh
hoạ
điều
này
ta
trở
lại
ví
dụ
hình
4.9.
Khi
lợng
tử
hoá
vô
hớng
(hình
4.9b)
cho
mỗi
vô
hớng
2
mức
lợng
tử
thì
tổng
lại
cần
đến
4
mức
cho
2
vô
hớng,
và
tỷ
lệ
bit
là
1
bit
cho
mỗi
vô
hớng.
Khi
lợng
tử
hoá
vectơ
(hình
4.10c)
ta
cho
mỗi
vô
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
185
hớng
2
mức
lợng
tử
khi
xét
từng
vô
hớng
riêng
rẽ
và
cũng
chỉ
có
2
mức
lợng
tử
cho
cả
hai
vô
hớng.
Trong
trờng
hợp
này
tỷ
lệ
bit
là
1
/
2
bit
cho
mỗi
vô
hớng.
Nếu
ta
định
m
hoá
cờng
độ
pixe
l
và
mỗi
cờng
độ
pixel
tối
thiểu
phải
đợc
biểu
diễn
bằng
2
mức
lợng
tử
thì
phơng
pháp
lợng
tử
hoá
vectơ
là
cách
tiếp
cận
để
cho
tỷ
lệ
bit
thấp
hơn
1
bit/pixel.
Ưu
thế
của
lợng
tử
hoá
vectơ
so
với
lợng
tử
hoá
vô
hớng
cũng
phải
trả
giá
:
giá
thành
về
tính
toán
và
lu
trữ
khi
lợng
tử
hoá
vectơ
đắt
hơn
nhiều
so
với
lợng
tử
hoá
vô
hớng
.
Phần
lớn
yêu
cầu
tính
toán
và
lu
trữ
là
để
thiết
kế
và
lu
trữ
sách
m
và
để
tra
sách
m
để
nhận
ra
mức
lợng
tử
phảI
gán
cho
một
vectơ.
Hình
4.13
.
Minh
hoạ
khả
nă
ng
khai
thác
sự
tăng
thứ
nguyên
của
phép
lợng
tử.
Trong
trờng
hợp
này
bên
lợng
tử
hoá
vectơ
ít
hơn
bên
lợng
tử
hoá
vô
hớng
4%.
a)
Lợng
tử
hoá
vô
hớng
f
1
và
f
2
.
b)
Lợng
tử
hoá
vectơ
f
1
và
f
2
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
186
1.3.
Thiết
kế
sách
m
và
algorit
K
-means
.
Khi
lợng
tử
hoá
vectơ
cần
xác
định
các
mức
lợng
tử
r
i
và
các
tế
bào
C
i
.
Bảng
liệt
kê
các
mức
lợng
tử
gọi
là
sách
m
lợng
tử
hay
gọi
tắt
là
sách
m.
Nếu
trong
sách
có
L
mức
kợng
tử
thì
ta
gọi
nó
là
sách
m
L
mức.
Sách
m
ở
đầu
máy
phát
dùng
để
lợng
tử
hoá
một
nguồn
vectơ
thành
1
trong
L
mức
lợng
tử
,
còn
ở
đầu
máy
thu
dùng
để
xác
định
mức
lợng
tử
theo
từ
m
nhận
đợc.
Theo
sự
thoả
thuận
trớc
của
bên
phát
và
bên
thu,
hai
bên
dùng
sách
m
nh
nhau.
Thiết
kế
sách
m
cho
lợng
tử
hoá
vectơ
là
một
bàI
toán
khó.
Không
giống
trờng
hợp
lợng
tử
hoá
vô
hớng,
các
mức
lợng
tử
bên
lợng
tử
hoá
vectơ
là
những
vectơ,
còn
bờ
các
tế
bào
cũng
không
còn
là
điểm
nữa.
Sự
khó
khăn
về
thiết
kế
sách
m
là
một
lý
do
để
những
năm
70
về
trớc
lợng
tử
hoá
vectơ
không
đợc
xét
đến
khi
m
hoá
ảnh
và
tiếng
nói.
Cách
xác
định
r
i
và
C
I
tối
u
phụ
thuộc
tiêu
chuẩn
sai
số
đợc
sử
dụng.
Tiêu
chuẩn
MSE
thờng
dùng
có
thể
biểu
diễn
nh
độ
méo
trung
bình
D
=
E
[
d
(
f
,
f
)]
với
d
(
f
,
f
)
=
(
f
f
)
T
(
f
f
)
.
Thiết
kế
tối
u
sách
m
là
bài
toán
phi
tuyến
cao
độ.
Muốn giải
bài
toán
đó
nên
khai
thác
2
điều
kiện
cần
cho
lời
giải
bài
toán
sau
đây
:
Điều kiện 1
.
Để
1
vectơ
f
có
thể
lợng
tử
hoá
về
1
trong
những
mức
lợng
tử,
bộ
lợng
tử
hoá
tối
u
phải
chọn
mức
lợng
tử
r
i
có
méo
nhỏ
nhất
giữa
f
và
r
i
:
VQ(
f
)
=
r
i
nếu
và
chỉ
nếu
d(
f,r
i
)
d(
f,r
j
)
,
i
j
1
j
L
(4.21)
C
i
:
Điều kiện 2
.
Mỗi
mức
lợng
tử
r
i
phải
tối
thiểu
hoá
đợc
méo
trung
bình
D
trong
Tối
thiểu
hoá
E[d(
f,r
i
)
|
f
C
i
]
đối
với
r
i
.
(4.22)
Mức
r
i
thoả
mn
(4.22)
gọi
là
tâm
quay
của
C
i
.
Nếu
(4.21)
không
tho
ả
mn,
thì
có
thể
làm
giảm
méo
trung
bình
D
bằng
cách
áp
đặt
(4.21).
Nếu
(4.22)
không
thoả
mn,
có
thể
làm
giảm
D
bằng
cách
áp
đặt
(4.22).
Hai
điều
kiện
trên
là
điều
kiện
cần
cho
lời
giải
tối
u.
Điều
kiện
1
định
ra
1
quy
tắc
để
lợng
tử
hoá
f
mà
không
sử
dụng
C
i
một
cách
tờng
minh.
Nói
cách
khác
độ
méo
d
(
f
,
f
)
cùng
với
tất
cả
mức
lợng
tử
r
i
,
với
1
i
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
187
L,
định
ra
mọi
tế
bào
C
i
cho
1
i
L.
Điều
kiện
2
chỉ
ra
một
con
đờng
để
xác
định
r
i
từ
C
i
và
d
(
f
,
f
)
.
Hai
điều
kiện
này
cho
thấy
rằng
khi
đ
cho
d
(
f
,
f
)
thì
các
mức
lợng
tử
và
tế
bào
không
độc
lập
với
nhau.
Quả
thực
là
các
mức
lợng
tử
định
ra
các
tế
bào
và
các
tế
bào
định
ra
các
mức
lợng
tử.
Do
đó
chỉ
riêng
các
mức
lợng
tử
cũng
đ
đủ
cho
sách
m,
các
tin
tức
rõ
về
các
tế
bào
không
cần
lu
trữ.
Hai
điều
kiện
cần
gợi
ý
ra
một
quy
trình
lặp
để
thiết
kế
một
sách
m
tối
u.
Giả
sử
ta
bắt
đầu
bằng
một
ớc
lợng
ban
đầu
của
r
i
.
Cho
r
i
và
độ
méo
d
(
f
,
f
)
ta
xác
định
C
i
,
ít
ra
là
bằng
lý
thuyết,
bằng
cách
xác
định
giá
trị
r
i
ứng
với
mọi
giá
trị
có
thể
của
f,
dùng
điều
kiện
1
trong
(4.21).
Cho
một
ớc
lợng
của
C
i
có
thể
xác
định
ra
r
i
bằng
cách tính
tâm
quay
của
C
i
,
dùng
điều
kiện
2
trong
(4.22).
Giá
trị
r
i
tìm
ra
là
một
ớc
lợng mới
của
các
mức
lợng
tử
và
quá
trình
cứ
thế
tiếp
tục.
Quy
trình
lặp
lại
có
hai
khó
khăn thực
tế.
Trớc
hết,
nó
yêu
cầu
xác
định
r
i
với
mọi
giá
trị
có
thể
của
f
.
Thứ
nữa,
hàm
p
r
(f
0
)
cần
để
tính
tâm
quay
của
C
i
thì
trong
thực
tế
khôn
g
cho
biết.
Thay
vào
đó
chúng
ta
có
những
vectơ
huấn
luyện
đại
biểu
cho
số
liệu
phải
m
hoá.
Một
biến
dạng
của
quy
trình
lặp
trên
đây,
có
tính
đến
hai
khó
khăn
vừa
nói,
là
algorit
K_means
đợc
Lloyd
tìm
ra
năm
1957
cho
trờng
hợp
vô
hớng
(N
=
1).
Năm
1965
Forgy
triển
khai
phơng
pháp
này
cho
trờng
hợp
vectơ.
Algorit
này
còn
gọi
là
algorit
LBG,
vì
Y.Linde,
A.Bufo
và
R.M.Gray
đ
chứng
minh
rằng
algorit
này
có
thể
dùng
với
nhiều
độ
đo
cự
ly
khác
nhau
và
đ
đợc
dùng
phổ
biến
trong
những
ứng
dụng
lợng
tử
hoá
vectơ
vào
m
hoá
tiếng
nói
và
ảnh.
Để
mô
tả
algorit
K_means
ta
giả
thiết
là
có
M
vectơ
huấn
luyện
biểu
thị
bởi
f
i
cho
1
i
M.
Bởi
vì
chúng
ta
ớc
lợng
L
mức
lợng
tử
từ
M
vectơ
huấn
luyện,
ta
giả
thiết
là
M
>>
L.
Trong
những
ứng
dụng
điển
hình
M
cỡ
10L
đến
50L
hay
hơn.
Các
mức
lợng
tử
r
i
đợc
xác
định
bằng
cách
tối
thiểu
hoá
méo
trung
bình,
định
nghĩa
theo
:
1
M
D
=
d
(
f
i
,
f
i
)
M
i
=
1
(4.23)
Trong
algorit
K_means,
chúng
ta
bắt
đầu
bằng
một
giá
trị
ớc
lợng
ban
đầu
của
r
i
khi
1
i
L.
Sau
đó
ta
xếp
lớp
M
vectơ
huấn
luyện
thành
L
nhóm
(hay
lớp),
mỗi
lớp
ứng
với
một
mức
lợng
tử
(dùng
công
thức
21).
Điều
này
có
thể
thực
hiện
đợc
bằng
cách
so
sánh
một
vectơ
huấn
luyện
với
từng
mức
lợng
tử
và
chọn
ra
mức
ứng
với
méo
bé
nhất.
Lu
ý
là
ta
chỉ
lợng
tử
hoá
những
vectơ
huấn
luyện
đ
cho
chứ
không
phải
mọi
vectơ
có
thể
có
của
f.
Từ
những
vectơ
trong
mỗi
lớp
xác
định
ra
một
mức
lợng
tử
mới.
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
188
Để
thuận
tiện
trong
kí
hiệu
giả
thiết
f
i
1
i
M
1
là
M
1
vectơ
huấn
luyện
lợng
tử
hoá
về
mức
lợng
tử
r
1
.
Ước
lợng
mới
của
r
1
nhận
đợc
bằng
cách
tối
thiểu
hoá
M
1
d
(
f
i
,
r
1
)
/
M
1
.
Nếu
nh
d
(
f
,
f
)
đợc
dùng
là
sai
số
bì
nh
phơng
(
f
f
)
T
(
f
f
)
thì
i
=
1
ớc
lợng
mới
của
r
1
vừa
đúng
là
trung
bình
của
M
1
vectơ
f
i
;
1
i
M
1
.
Các
ớc
lợng
mới
của
mọi
mức
lợng
tử
r
i
với
2
i
L
cũng
nhận
đợc
bằng
cách
tơng
tự.
Đó
là
một
biến
tớng
của
(4.22),
đợc
thực
hiện
để
phù
hợp
với
D
trong
(4.23).
Nh
vậy
là
hoàn
thành
một
bớc
lặp
trong
chu
trình,
và
đến
khi
méo
trung
bình
D
ở
bớc
sau
không
khác
bớc
trớc
mấy
thì
có
thể
ngừng
chu
trình
lặp.
Hình
4.14
biểu
diễn
algorit
K_means.
Vì
có
sự
xếp
đám
cho
nên
algorit
này
còn
gọi
là
algorit
xếp
đám,
thờng
gặp
trong
các
tài
liệu
về
nhận
dạng.
Ngời
ta
đ
chứng
minh
là
algorit
K_means
hội
tụ
về
một
cực
tiểu
tại
chỗ
của
D
trong
(4.23).
Để
xác
định
r
i
với
D
gần
cực
tiểu
tuyệt
đối
có
thể
lặp
lại
algo
rit
này
với
những
ớc
lợng
ban
đầu
khác
nhau
của
r
i
và
chọn
lấy
tập
cho
D
bé
nhất
.
Phần
tính
toán
tốn
kém
nhất
trong
algorit
K_means
là
việc
lợng
tử
hoá
các
vectơ
huấn
luyện
trong
mỗi
chu
trình
lặp.
Với
mỗi
vectơ
trong
M
vectơ
huấn
luyện
độ
méo
phải
đợc
ớc
lợng
L
lần
(cứ
1
mức
lợng
tử
1
lần).
Nh
vậy
trong
mỗi
chu
trình
lặp
phải
tính
ML
lần
độ
méo.
Nếu
giả
thiết
có
N
vô
hớng
trong
vectơ,
mỗi
vô
hớng
dùng
R
bit
và
mỗi
mức
lợng
tử
đợc
gán
một
từ
m
có
chiều
dài
nh
nhau
thì
quan
hệ
giữa
L
với
N
và
R
là
:
L
=
2
B
=
2
NR
(4.24)
B
là
tổng
số
bit
dùng
cho
mỗi
vectơ.
Nếu
giả
thiết
độ
méo
đợc
dùng
là
sai
số
T
bình
phơng
e
e
thì
mỗi
lần
tính
độ
méo
cần
đến
N
phép
tính
số
học
(
N
phép
nhân
và
N
phép
cộng).
Số
lợng
phép
tính
số
học
cần
cho
bớc
lợng
tử
hoá
vectơ
huấn
luyện
trong
mỗi
chu
trình
là
:
Số
lợng
phép
tính
số
học
=
NML
=
NM.2
NR
(4.25)
Từ
(4.25)
thấy
chi
phí
tính
toán
tăng
theo
hàm
mũ
N
(số
vô
hớng
trong
mỗi
vectơ)
và
R
(số
bit
trong
mỗi
vô
hớng).
Khi
N
=
10
và
R
=
2
và
ML
=10L
=
10.2
NR
=
10.2
20
,
số
lợng
phép
toán
số
học
theo
(.25)
là
100
nghìn
tỉ
cho
mỗi
bớc
lặp.
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
189
Vectơ
sách
m
ban
đầu
r
j
,
1
j
L
Xếp
lớp
M
vectơ
huấn
luyện
thành
L
đám
bằng
lợ
ng
tử
hoá
Ước
lợng
r
j
bằng
cách
tính
tâm
quay
của
các
vectơ
cùng
đám
D
c
ò
n
t
h
a
y
c
ó
đ
ổ
i
g
i
á
t
r
ị
n
h
i
ề
u
?
k
h
ô
n
g
S
t
o
p
Hinh 4.14
.
Thiết
kế
sách
m
bằng
algorit
K_means
cho
lợng
tử
hoá
vectơ
.
Ngoài
chi
phí
tính
toán
còn
chi
phí
lu
trữ.
Giả
sử
mỗi
vô
hớng
cần
1
đơn
vị
bộ
nhớ,
việc
lu
trữ
các
vectơ
huấn
luyện
cần
đến
MN
đơn
vị
nhớ
và
việc
lu
trữ
các
mức
lợng
tử
cần
đến
LN
đơn
vị
nhớ.
Nh
vậy
:
Tổng
số
đơn
vị
bộ
nhớ
cần
sử
dụng
=
(M+L)N
=
(M+2
NR
)N
(4.26)
Vì
M
>>
N
cho
nên
yêu
cầu
về
bộ
nhớ
chủ
yếu
để
lu
trữ
các
vectơ
huấn
luyện
khi
N
=
10,
R
=
2,
M
=
10L
=10.2
20
,
tính
theo
(4.26)
số
lợ
ng
đơn
vị
nhớ
cần
dùng
phải
cỡ
100
triệu
.
Vì
con
số
tính
theo
(4.26)
tăng
theo
hàm
mũ
N
và
R
do
đó
cả
yêu
cầu
về
tính
toán
và
lu
trữ
buộc
ta
chỉ
sử
dụng
lợng
tử
hoá
vectơ
khi
vectơ
có
số
vô
hớng
ít,
và
số
vô
hớng
có
số
bit
ít.
Trên
đây
thảo
luận
về
y
êu
cầu
về
tính
toán
và
lu
trữ
khi
thiết
kế
sách
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
190
m.
Khi
thiết
kế
xong
sách
m
phải
lu
trữ
nó
ở
cả
đầu
máy
phát
và
đầu
máy
thu.Vì
sau
khi
thiết
kế
xong
sách
m
thì
không
cần
đến
vectơ
huấn
luyện
nữa
cho
nên
chỉ
cần
lu
trữ
các
mức
lợng
tử.
Tuy
thế
số
mức
lợng
tử
phải
lu
trữ
cũng
còn
lớn.
Trong
trờng
hợp
ở
đây
:
Số
đơn
vị
bộ
nhớ
cần
cho
sách
m
=
NL
=
N2
NR
.
(4.27)
Khi
N
=
10,
R
=
2,
con
số
tính
theo
(4.27)
cỡ
10
triệu.
Để
lợng
tử
hoá
mỗi
vectơ
f
phải
tính
độ
méo
d
(
f,r
i
)
cho
từng
bớc
lợng
tử
của
L
mức
ở
máy
phát.
Vì
thế
cho
mỗi
vectơ
:
Số
phép
tính
số
học
=
NL
=
N.2
NR
(4.28)
Khi
N
=
10,
R
=
2,
con
số
tính
theo
(4.28)
cũng
cỡ
10
triệu.
Theo
(4.27)
và
(4.2
8)
cả
số
đơn
vị
trong
bộ
nhớ
sách
m
lẫn
số
thuật
toán
số
học
để
lợng
tử
hoá
1
vectơ
f
đều
tăng
theo
hàm
mũ
N
(số
vô
hớng
trong
mỗi
vectơ)
và
R
(số
bit
ở
mỗi
vô
hớng).
Số
thuật
toán
số
học
trên
chỉ
cần
ở
đầu
phát.
ở
đầu
thu
chỉ
cần
thuật
toán
tra
bảng
đ
ơn
giản.
1.4.
Sách
m
cây
và
tìm
kiếm
nhị
phân.
Khối
lợng
tính
toán
chủ
yếu
khi
thiết
kế
sách
m
bằng
algorit
K_means
nằm
ở
khâu
lợng
tử
hoá
các
vectơ
huấn
luyện.
Cũng
cần
phải
lợng
tử
hoá
vectơ
khi
sách
m
đợc
dùng
ở
đầu
phát.
Nếu
sách
m
đợc
th
iết
kế
bằng
thuật
toán
K_means
thì
việc
lợng
tử
hoá
vectơ
lúc
thiết
kế
và
việc
truyền
số
liệu
yêu
cầu
phải
ớc
lợng
độ
méo
giữa
vectơ
với
từng
mức
trong
L
mức
lợng
tử.
Quá
trình
này
gọi
là
tìm
kiếm
đầy
đủ
và dẫn
đến
số
phép
tính
tăng
theo
hàm
mũ
N
và
R
(số
vô
hớng
trong
vectơ
và
số
bit
trong mỗi
vô
hớng).
Nhiều
phơng
pháp
đ
đợc
phát
triển
để
loại
bỏ
sự
phụ
thuộc
theo
hàm
mũ
này.
Chúng
làm
giảm
số
lợng
phép
tính
bằng
cách
thay
đổi
sách
m,
bằng
sự
hi
sinh
phần
nào
chất
lợng
và
cả
sự
tăng
dung
lợng
bộ
nhớ.
Một
trong
những
phơng
pháp
gọi
là
sách
m
cây.
ý
cơ
bản
trong
sách
m
cây
là
đem
chia
không
gian
N
chiều
của
f
ra
thành
hai
miền
và
dùng
algorit
K_means
với
K
=
2,
sau
đó
lại
đem
chia
mỗi
miền
ra
làm
hai
và
lại
dùng
algorit
K_means,
cứ
thế
tiếp
t
ục.
Đặc
biệt
là
khi
L
có
thể
biểu
thị
thành
luỹ
thừa
của
2
thì
thoạt
tiên
thiết
kế
sách
m
có
2
mức
lợng
tử
r
1
và
r
2
,
c
h
ơ
n
g
4
:
m
ã
h
oá
ản
h
191
dùng
algorit
K_means.
Sau
đó
ta
xếp
lớp
tất
cả
các
vectơ
huấn
luyện
thành
hai
lớp,
một
lớp
ứng
với
r
1
và
lớp
kia
ứng
với
r
2
.
Mỗi
lớp
đợc
xử
lý
một
cách
độc
lập
và
sách
m
với
hai
mức
lợng
tử
đợc
thiết
kế
cho
từng
đám.
Quá
trình
này
cứ
thế
lặp
đi
lặp
lại
cho
đến
khi
chúng
ta
có
tất
cả
L
mức
lợng
tử
ở
giai
đoạn
chót
(tầng
chót).
Điều
này
đợc
biểu diễn
ở
hình
4.15
cho
trờng
hợp
L
=
8.
Th
eo
quy
trình
này
thiết
kế
ra
sách
m
cây. Thoạt
tiên
ta
hy
xét
về
yêu
cầu
tính
toán
và
lu
trữ
khi
thiết
kế
sách
m.
Ta
vẫn
giả
thiết rằng
mỗi
lần
tính
độ
đo
độ
méo
phải
mất
N
phép
tính
số
học.
Vì
cả
thảy
có
log
2
N
giai
đoạn
và
độ
méo
chỉ
xác
định
hai
lần
cho
mỗi
cái
trong
M
vectơ
huấn
luyện
ở
mỗi
giai
đoạn
mỗi
chu
trình
lặp
của
algorit
K_means.
Tổng
số
phép
tính
số
học/chu
trình
lặp
=
2NM
log
2
L
(4.29)
Đem
con
số
này
so
sánh
với
số
lợng
tơng
ứng
khi
tính
theo
công
thức
(4.25
)
trong
trờng
hợp
tìm
kiếm
đầy
đủ,
thấy
số
phép
tính
giảm
đi
L/(2.log
2
L)
=
2
NR
/(2NR)
lần.
Khi
N
=
10,
R
=
2
thì
giảm
đợc
26000
lần.
Nhu
cầu
lu
trữ
khi
thiết
kế
sách
m
câyđòi
hỏi
lớn
hơn
trờng
hợp
algorit
K_means
một
ít,
bởi
vì
trong
cả
hai
trờng
hợp
đều
phải
lu
trữ
toàn
bộ
vectơ
huấn
luyện
.
Bây
giờ
ta
xét
về
số
lợng
phép
tính
khi
lợng
tử
hoá
1
vectơ
f
bằng
phơng
pháp
sách
m
cây.
ở
giai
đoạn
thứ
nhất
ta
tính
độ
méo
giữa
f
và
hai
mức
lợng
tử
r
1
và
r
2
trên
hình
4.15.
Giả
sử
d(
f,r
2
)
<
d(
f,r
1
)
thì
ta
chọn
ra.
ở
g
iai
đoạn
hai
ta
tính
độ
méo
giữa
f
và
hai
mức
lợng
tử
r
5
,
r
6
trên
hình
4.15
và
chọn
ra
mức
lợng
tử
nào
cho
độ
méo
nhỏ
hơn.
Giả
sử
chọn
r
5
ở
giai
đoạn
3,
ta
lại
so
sánh
f
với
r
11
và
r
12
.
Quá
trình
này
cứ
thế
tiếp
diễn
cho
đến
giai
đoạn
ch
ót.
Mức
lợng
tử
đợc
chọn
ở
giai
đoạn
chót
chính
là
mức
lợng
tử
của
f
.
Ví
dụ
trên
nếu
L
=
8
và
r
12
đợc
chọn
ở
giai
đoạn
ba
thì
r
12
là
mức
lợng
tử
của
f
.Trong
quy
trình
này
chúng
ta
cứ
lần
đi
theo
cây
và
tiến
hành
tìm
kiếm
giữa
hai
mức
lợng
tử
ở
điểm
nút
của
cây.
Sự
tìm
kiếm
tiến
hành
giữa
hai
một
lúc
cho
nên
ta
gọi
là
tìm
kiếm
nhị
nguyên.
Vì
tất
cả
có
log
2
L
giai
đoạn
và
ở
mỗi
giai
đoạn
tính
độ
méo
hai
lần cho
nên
số
phép
tính
số
học
cần
thực
hiện
khi
lợng
tử
hoá
f
theo
phơng
pháp
sách
m
cây
là
:
Số
phép
tính
số
học
=
2N
log
2
L
=
2N
2
R
(4.30)
Theo
công
thức
(4.30)
thì
chi
phí
tính
toán
không
tăng
theo
hàm
mũ
N
và
R.
Nếu
so
kết
quả
tính
theo
(4.30)
với
kết
quả
tính
theo
(4.28)
trong
trờng
hợp
tìm
kiế
m
đầy
đủ
thì
chi
phí
cũng
giảm
2
NR
/(2NR)
lần.
Khi
N
=
10
và
R
=
2
thì
giảm
đợc
26000
lần.
Việc
giảm
bớt
số
lần
tính
toán
phải
trả
giá.
Sách
m
dùng
ở
máy
phát
phải
lu
trữ
cả
các
mức