Tải bản đầy đủ (.pdf) (176 trang)

Nghiên cứu phát triển một số giải pháp nén ảnh tiên tiến cho màn hình tinh thể lỏng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.96 MB, 176 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

NGUYỄN HỮU TÀI

NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ GIẢI PHÁP NÉN
ẢNH TIÊN TIẾN CHO MÀN HÌNH TINH THỂ LỎNG

LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN

Hà Nội – 2015


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

NGUYỄN HỮU TÀI

NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ GIẢI PHÁP NÉN
ẢNH TIÊN TIẾN CHO MÀN HÌNH TINH THỂ LỎNG

CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN
MÃ SỐ: 62480104

LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN

NGƢỜI HƢỚNG DẪN KHOA HỌC:
1. PGS. TS. NGUYỄN THỊ HOÀNG LAN
2. GS. TS. LÊ ĐÌNH CHƠN TÂM

Hà Nội − 2015




LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng
tôi. Các số liệu, kết quả nêu trong luận án là trung thực và
chưa từng được ai công bố trong bất cứ một công trình nào
khác.

TẬP THỂ HƯỚNG DẪN KHOA HỌC

PGS. TS. Nguyễn Thị Hoàng Lan

GS. TS. Lê Đình Chơn-Tâm

Tác giả luận án

Nguyễn Hữu Tài


LỜI CẢM ƠN
Tôi xin gửi lời tri ân đến PGS. TS. Nguyễn Thị Hoàng Lan – Viện Công
nghệ Thông tin và Truyền thông – Đại học Bách khoa Hà Nội và TS. Lê Đình
Chơn Tâm – Giáo sư Đại học Sherbrooke – Canada, công sức và tấm lòng
của Thầy Cô đã giúp cho tôi vượt qua những khó khăn trở ngại để có thể
hoàn thành luận án này.
Tôi cũng xin gửi lời cảm ơn tới các Thầy Cô trong Bộ môn Truyền
thông và Mạng máy tính đã tạo điều kiện giúp đỡ và đóng góp nhiều ý kiến
quý báu giúp tôi hoàn thiện luận án nghiên cứu. Cảm ơn các Thầy Cô trong
Viện Công nghệ Thông Tin và Truyền thông đã truyền thụ những kiến thức bổ
ích trong quá trình tôi học tập và nghiên cứu tại trường.

Cảm ơn các Thầy Cô cùng các Bạn đồng nghiệp trong khoa Công nghệ
Thông tin – Đại học Khoa học Huế đã luôn quan tâm và động viên tôi trong
quá trình tôi làm nghiên cứu sinh.
Cuối cùng, tôi xin gửi tấm lòng ân tình tới Gia đình tôi, đặc biệt đến
người bạn đời của tôi, người luôn sẻ chia và động viên cùng như gánh vác
nhiều khó khăn vất vả trong gia đình để tôi được toàn tâm toàn ý học tập và
nghiên cứu.
Mặc dù đã rất cố gắng nhưng do thời thời gian và kiến thức còn hạn
chế nên luận án chắc còn có nhiều thiếu sót. Tôi rất mong nhận được những ý
kiến đóng góp quý báu từ Quý Thầy Cô, các Bạn đồng nghiệp và những người
quan tâm.


MỤC LỤC
MỤC LỤC .................................................................................................................. i
DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT...................................................... iv
DANH MỤC HÌNH VẼ.......................................................................................... vii
DANH MỤC BẢNG ................................................................................................ xi
CHƢƠNG 1: MỞ ĐẦU......................................................................................... 1
1.1. Đặt vấn đề .................................................................................................................. 1
1.2. Tình hình nghiên cứu trên thế giới ......................................................................... 3
1.3. Mục tiêu và phạm vi nghiên cứu của luận án ........................................................ 5
1.4. Phƣơng pháp nghiên cứu ......................................................................................... 5
1.5. Ý nghĩa khoa học và thực tiễn của đề tài................................................................ 6
1.6. Bố cục luận án ........................................................................................................... 7

CHƢƠNG 2: TỔNG QUAN VỀ VẤN ĐỀ NÉN ẢNH CHO MÀN HÌNH
TINH THỂ LỎNG .................................................................................................... 9
2.1. Lịch sử phát triển của màn hình tinh thể lỏng và vấn đề chất lƣợng hiện thị
hình ảnh động .................................................................................................................. 9

2.1.1. Lịch sử phát triển của màn hình tinh thể lỏng ..................................................... 9
2.1.2. Vấn đề chất lượng hiển thị hình ảnh động trên màn hình tinh thể lỏng ............ 11
2.2. Overdrive – một kỹ thuật tăng tốc độ đáp ứng cho các phần tử tinh thể lỏng . 12
2.3. Mô hình hệ thống Overdrive và yêu cầu nén ảnh giảm bộ nhớ khung hình..... 14
2.3.1. Mô hình hệ thống overdrive .............................................................................. 14
2.3.2. Vấn đề yêu cầu nén ảnh khung hình cho màn hình tinh thể lỏng ...................... 15
2.3.3. Các đặc trưng của phương pháp nén ảnh áp dụng cho hệ thống Overdrive ...... 17
2.4. Mô hình hệ thống nén ảnh dùng cho hệ thống overdrive ................................... 18
2.4.1. Hệ thống nén ảnh khung hình ............................................................................ 18
2.4.2. Các độ đo hiệu năng giải pháp nén ảnh khung hình .......................................... 20
2.4.3. Mối tương quan giữa chất lượng nén và chất lượng ảnh hiển thị trên màn hình
tinh thể lỏng ................................................................................................................. 22
2.4.4. Một số yêu cầu đặc trưng và tiêu chí đánh giá hệ thống nén ảnh cho màn hình
tinh thể lỏng ................................................................................................................. 23
2.5. Một số cơ sở lý thuyết trong nén ảnh .................................................................... 26
2.5.1. Các phép biến đổi áp dụng trong nén ảnh ......................................................... 27
2.5.2. Lượng tử hoá ..................................................................................................... 33
2.5.3. Gán từ mã dạng độ dài đồng nhất ...................................................................... 37
2.5.4. Khái quát về một số phương pháp mã hóa ảnh thực hiện cho màn hình ........... 38
2.6. Tổng quan về các giải pháp nén ảnh cho màn hình tinh thể lỏng ...................... 42
2.6.1. Khái quát về các giải pháp nén ảnh cho hệ thống overdrive ............................. 42

i


2.6.2. Một số hướng tiếp cận các giải pháp nén và định hướng nghiên cứu ............... 46

CHƢƠNG 3: PHÂN TÍCH VÀ ĐỀ XUẤT MỘT SỐ GIẢI PHÁP NÉN ẢNH
DỰA TRÊN MÃ HÓA KHỐI VÀ BIẾN ĐỔI KHÔNG GIAN MÀU ............... 61
3.1. Nghiên cứu cải tiến và phát triển giải pháp nén ảnh dựa trên mã hóa khối và

biến đổi không gian màu ............................................................................................... 61
3.1.1. Tóm tắt 6 giai đoạn nghiên cứu phát triển giải pháp ......................................... 61
3.1.2. Môi trường thực nghiệm cài đặt và các bộ dữ liệu ............................................ 62
3.2. Khắc phục hiện tƣợng nhiễu khối trong AHIC với đề xuất cải tiến MAIC ...... 64
3.2.1. Nhiễu khối trong AHIC – Nguyên nhân và giải pháp khắc phục ...................... 64
3.2.2. Phát triển phương pháp lượng tử tối ưu sai số “Midrise Uniform Quantizer” .. 65
3.2.3. Đề xuất giải pháp cải tiến MAIC giúp khắc phục nhiễu khối ........................... 65
3.2.4. Đánh giá độ phức tạp của MAIC so với AHIC ................................................. 67
3.2.5. Kết quả thực nghiệm và đánh giá ...................................................................... 68
3.3. Cải thiện chất lƣợng ảnh nén với kỹ thuật trao đổi bit theo nội dung CBBET 73
3.3.1. Ưu và nhược điểm khi lượng tử hóa với sự phân phối bit đồng đều ................. 73
3.3.2. Đề xuất kỹ thuật trao đổi bit theo nội dung CBBET ......................................... 75
3.3.3. Đề xuất giải pháp cải tiến AAIC trên cơ sở tích hợp CBBET vào MAIC ........ 79
3.3.4. Đánh giá độ phức tạp của AAIC so với MAIC và AHIC .................................. 80
3.3.5. Kết quả thực nghiệm và đánh giá ...................................................................... 81
3.4. Cải thiện chất lƣợng nén với kỹ thuật phân phối bit CBBDT............................ 84
3.4.1. Ưu và nhược điểm của kỹ thuật trao đổi bit CBBET ........................................ 84
3.4.2. Đề xuất kỹ thuật phân phối bit CBBDT dựa trên giá trị bước lượng tử - giải
pháp AHAIC ................................................................................................................ 85
3.4.3. Cải tiến hiệu năng của AHAIC bằng sơ đồ nén ACAIC ................................... 91
3.5. Đề xuất giải pháp nén RAIC.................................................................................. 96
3.5.1. Cải thiện hiệu năng cho bộ lượng tử hóa với kỹ thuật mã hóa lượng tử
MMAUQC ................................................................................................................... 96
3.5.2. Tối ưu hóa kỹ thuật phân phối bit với RBBDT ................................................. 99
3.5.3. Đề xuất mô hình lượng tử đa thích nghi MAQC ............................................. 101
3.5.4. Đề xuất giải pháp nén RAIC............................................................................ 103
3.5.5. Đánh giá độ phức tạp tính toán của giải pháp nén RAIC ................................ 104
3.5.6. Kết quả thực nghiệm và đánh giá .................................................................... 104
3.6. Đề xuất ARAIC nâng cao hiệu năng nén RAIC ................................................ 108
3.6.1. Giải pháp đề xuất ARAIC ............................................................................... 108

3.6.2. Sơ đồ thuật toán mã hóa/giải mã cho MAQC.................................................. 110
3.6.3. Phân tích đánh giá khả năng nâng cao hiệu năng của giải pháp đề xuất ......... 111
3.6.4. Kết quả thực nghiệm và đánh giá .................................................................... 112
3.7. Kết luận chƣơng 3................................................................................................. 115

ii


CHƢƠNG 4: PHÂN TÍCH VÀ ĐỀ XUẤT MỘT SỐ GIẢI PHÁP NÉN ẢNH
DỰA TRÊN BIẾN ĐỔI WAVELET VÀ LỰA CHỌN THÍCH NGHI........... 117
4.1. Đề xuất cải tiến DAMS với sự tích hợp cơ chế ngƣỡng thích nghi - giải pháp
DBMAIC ...................................................................................................................... 118
4.1.1. Đề xuất kỹ thuật ngưỡng thích nghi ATT ....................................................... 119
4.1.2. Đề xuất thuật toán lượng tử thích nghi AQC .................................................. 121
4.1.3. Thực nghiệm và đánh giá cho giải pháp DBMAIC ......................................... 121
4.2. Đề xuất áp dụng biến đổi “Wavelet Lifting integer to integer” để cải thiện độ
phức tạp - giải pháp WLT-MAIC .............................................................................. 126
4.2.1. Độ phức tạp trong kiến trúc thực hiện của DAMS và DBMAIC .................... 126
4.2.2. Sơ đồ “Wavelet Lifting” .................................................................................. 127
4.2.3. Đề xuất giải pháp WLT-MAIC ....................................................................... 129
4.2.4. Sơ đồ thuật toán mã hóa và giải mã DAMS-AT. ............................................ 130
4.2.5. Phân tích đánh giá khả năng nâng cao hiệu năng của giải pháp đề xuất. ........ 131
4.2.6. Thực nghiệm và đánh giá cho giải pháp WLT-MAIC .................................... 131
4.3. So sánh và phân tích đánh giá hai giải pháp nén theo hai hƣớng tiếp cận ..... 134
4.3.1. So sánh thực nghiệm và phân tích đánh giá .................................................... 134
4.3.2. Một số kết luận và khuyến nghị....................................................................... 142
4.4. So sánh ARAIC và WLT-MAIC với những giải pháp tiên tiến nổi bật trong
thời gian gần đây ......................................................................................................... 143
4.5. Kết luận chƣơng 4................................................................................................. 145


CHƢƠNG 5:

KẾT LUẬN ................................................................................ 146

5.1. Tóm tắt nội dung nghiên cứu và kết quả mới của luận án ............................... 146
5.1.1. Những nội dung nghiên cứu chính của luận án ............................................... 146
5.1.2. Các kết quả mới của luận án ............................................................................ 147
5.2. Hƣớng phát triển .................................................................................................. 148

TÀI LIỆU THAM KHẢO ...................................................................................... 149
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ CỦA LUẬN ÁN
................................................................................................................................ 151
PHỤ LỤC 1: THỬ GIẢI PHÉP NÉN WLT-MAIC TRÊN MỘT SỐ VIDEO CLIP
CỦA QUALCOMM CANADA ............................................................................. 152
PHỤ LỤC 2: THỐNG KÊ XÁC XUẤT CỦA “ZERO MEAN SIGNAL” TRONG
MÔ HÌNH AAIC. ................................................................................................... 160

iii


DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT

Ký hiệu và chữ
viết tắt
AAIC

Giải nghĩa
Mã hóa nén ảnh tiên tiến thích nghi
Advanced Adaptive Image Coding


ACAIC

Mã hóa nén ảnh tiên tiến có tính thích nghi theo nội dung
Advanced Content-Adaptive Image Coding

AHAIC

Mã hóa nén ảnh tiên tiến có tính thích nghi cao
Advanced High-Adaptive Image Coding

AHIC
AM-BTC
AQC
ARAIC

Bộ mã hóa nén ảnh tiên tiến kết hợp (lai)
Advanced Hybrid Image Codec
Mã hóa thu gọn khối nhiều mức thích nghi
Adaptive Multi-level Block Truncation Coding
Mã hóa lượng tử tích nghi
Adaptive Quantization Coding
Mã hóa nén ảnh thích nghi mạnh mẽ tiên tiến
Advanced Robust Adaptive Image Coding

ATC

Bộ điều khiển ngưỡng thích nghi
Adaptive Threshold Controller

ATT


Kỹ thuật ngưỡng thích nghi
Adaptive-Threshold Technique

BTC

Kỹ thuật mã hóa dựa trên thu gọn khối
Block Truncation Coding

CBBDT

Kỹ thuật phân phối bit dựa trên nội dung
Content-Based Bit Distribution Technique

CBBET

Kỹ thuật trao đổi bit dựa trên nội dung
Content-based Bit Exchange Techniques

CF

Khung hình hiện tại
Current Frame

CR

Tỷ số nén
Compression Ratio

DAMS

DBMAIC

Phương pháp nén dựa trên DWT chọn lọc thích nghi.
DWT-based Adaptive Mode Selection
Mã hóa nén ảnh dựa trên phép biến đổi wavelet đa thích nghi.
DWT-Based Multi-Adaptive Image Coding

iv


DCT

Biến đổi cosine rời rạc
Discrete Cosine Transform

DSM

Phương pháp tán xạ động
Dynamic Scattering Method

DWT

Biến đổi sóng con (wavelet) rời rạc
Discrete Wavelet Transform

FFD / Overdrive

FIR
HCRIC
HD

HDTV

Kỹ thuật tăng tốc độ đáp ứng cho các phần tử tinh thể lỏng qua cơ chế
tăng điện áp
Feedforward Driving
Bộ lọc có đáp ứng xung hữu hạn
Finite Impulse Response
Mã hóa nén ảnh tỷ số nén cao
High Compression Ratio Image Coding
Chuẩn định dạng hình ảnh độ phân giải cao
High-Definition
Chuẩn truyền hình độ phân giải cao
High-Definition Television

HIC

Mã hóa nén ảnh kết hợp (lai)
Hybrid Image Coding

LC

Phần tử tinh thể lỏng
Liquid Crystal

LCD

Màn hình tinh thể lỏng
Liquid Crystal Displays

MAIC


Mã hóa nén ảnh thích nghi theo giá trị trung bình
Mean Adaptive Image Coding

MAQC

Mã hóa lượng tử đa thích nghi
Multiple Adaptive Quantization Coding

MMAUQC

Mã hóa lượng tử hóa đều thích nghi theo Min-Max
Min-Max Adaptive Uniform Quantization Coding

MSE

Sai số trung bình bình phương
Mean Squared Error

MUQ

Bộ lượng tử đều dạng Midrise
Midrise Uniform Quantizer

PCM

Mã hóa điều xung
Pulse Code Modulation

PF


Khung hình trước thời điểm hiện tại
Previous Frame

v


PSNR

Tỷ số tín hiệu mức đỉnh trên nhiễu
Peak Signal-to-Noise Ratio

RAIC

Mã hóa nén ảnh thích nghi mạnh
Robust Adaptive Image Coding

RBBDT
SBB-BTC

Kỹ thuật phân phối bit tối ưu dựa trên giá trị phạm vi
Range-based Bit Distribution Technique
Mã hóa cắt khối dựa trên mặt phẳng bit
Single Bit Plane based Block Truncation Coding

TFT

Transistor công nghệ “Thin Film” đối với một phần tử ảnh màn hình
Thin-Film Transistor


UHD

Chuẩn định dạng hình ảnh độ phân giải siêu cao
Ultra High-Definition

VQ-BTC

WLT-MAIC

Mã hóa cắt khối dựa trên lượng tử hóa vector
Vector Quantizer based Block Truncation Coding
Mã hóa nén ảnh đa thích nghi dựa trên biến đổi wavelet số nguyên
Wavelet Lifting integer to integer Transform based Multi-Adaptive
Image Codin

vi


DANH MỤC HÌNH VẼ
Hình 1.1. Minh họa hiện tượng mờ chuyển động .................................................................. 1
Hình 1.2. Mô hình một hệ thống overdrive trong màn hình tinh thể lỏng. ........................... 2
Hình 2.1. Mô tả cấu tạo màn hình TFT-LCD ...................................................................... 10
Hình 2.2. Minh họa hiện tượng Motion-Blur trên màn hình tinh thể lỏng .......................... 11
Hình 2.3. Sơ đồ khối của màn hình tinh thể lỏng 15inch XGA dùng kỹ thuật FFD. .......... 12
Hình 2.4. Đồ thị độ chói - thời gian đáp ứng mô tả cách thức xác định điện áp tăng tốc. .. 12
Hình 2.5. Minh họa giải pháp tăng tốc độ chuyển đổi mức xám thông qua cơ chế hiệu
chỉnh tăng ngưỡng điện áp. .............................................................................. 13
Hình 2.6. So sánh thời gian đáp ứng ................................................................................... 13
Hình 2.7. Mô hình một hệ thống overdrive có sử dụng kỹ thuật nén ảnh nhằm giảm yêu cầu
về dung lượng và tốc độ truy xuất dữ liệu của bộ nhớ khung hình. ................. 15

Hình 2.8. Phạm vi áp dụng của bài toán nén ảnh khung hình cho màn hình tinh thể lỏng độ
phân giải cao. .................................................................................................... 16
Hình 2.9. Mô hình với ba thành phần chính trong một hệ thống nén ảnh áp dụng trong
truyền thông. ..................................................................................................... 18
Hình 2.10. Mô hình khái quát với bốn thành phần chính trong một hệ thống nén ảnh áp
dụng cho overdrive trong màn hình tinh thể lỏng. ........................................... 19
Hình 2.11. Đồ thị biến thiên của PSNR theo MSE. ............................................................ 21
Hình 2.12. Minh họa 64 hàm cơ bản của 8×8 DCT. ........................................................... 28
Hình 2.13. Phân tích đa phân giải 3 mức và khôi phục của tín hiệu dùng cấu trúc lọc kiểu
kim tự tháp (pyramidal filter structure) ............................................................ 30
Hình 2.14. Quy trình xử lý dòng-cột của DWT hai chiều. .................................................. 31
Hình 2.15. Sơ đồ phân tích và tổng hợp tín hiệu hai chiều theo cấu trúc băng tần con. ..... 32
Hình 2.16. Kết quả biến đổi DWT trên ảnh số hai chiều theo kiến trúc kim tự tháp sử dụng
bộ lọc Wavalet Daubechies 4 - hệ số. .............................................................. 32
Hình 2.17. Ánh xạ vào – ra của một bộ lượng tử hóa dạng Midrise. .................................. 33
Hình 2.18. Xấp xỉ của hàm Px(x) bởi các hằng số phân đoạn ............................................. 35
Hình 2.19. Ánh xạ vào – ra của một bộ lượng tử hóa tối ưu và sai số lượng tử.................. 37
Hình 2.20. Mô hình khái quát cho một bộ mã hóa lượng tử thích nghi .............................. 40
Hình 2.21. Sơ đồ mã hóa ảnh sử dụng biến đổi ................................................................... 40
Hình 2.22. Sơ đồ cơ bản của chuẩn nén ảnh JPEG ............................................................. 41
Hình 2.23. Sơ đồ thuật toán bộ nén JPEG2000 ................................................................... 42
Hình 2.24. Những giải pháp nén đã được đề xuất áp dụng trong hệ thống overdrive của
màn hình tinh thể lỏng ...................................................................................... 47

vii


Hình 2.25. Sơ đồ khối của bộ mã hóa AQC ........................................................................ 49
Hình 2.26. Chất lượng ảnh nén của giải pháp AHIC được so sánh với giải pháp chỉ áp dụng
kỹ thuật BTC .................................................................................................... 49

Hình 2.27. Sơ đồ giải pháp nén AHIC. ............................................................................... 50
Hình 2.28. Hiện tượng nhiễu khối (blocking effect) trên ảnh khôi phục của AHIC. .......... 51
Hình 2.29. Hiện tượng kém chất lượng trên thành phần màu sắc (Cb và Cr) trên ảnh khôi
phục của AHIC ................................................................................................. 52
Hình 2.30 Sơ đồ khối và kiến trúc của AM-BTC ................................................................ 53
Hình 2.31. Ảnh khôi phục của AM-BTC và sai số của nó. ................................................. 54
Hình 2.32. Minh chứng cho hiện tượng rung động trong giải pháp nén AM-BTC. ............ 55
Hình 2.33. Mô hình hệ thống của DAMS và bộ mã hóa thích nghi. ................................... 57
Hình 2.34. Hiệu ứng khối (blocking) và nhiễu (noise) trên ảnh khôi phục của DAMS. ..... 59
Hình 2.35. Số bit dư thừa khi kết thúc quá trình nén của DAMS ....................................... 60
Hình 3.1. Sơ đồ mô tả sơ lược các bước nghiên cứu phát triển........................................... 61
Hình 3.2. Đồ thị hàm lượng tử Midrise Uniform Quantizer với 8 mức lượng tử................ 65
Hình 3.3. Sơ đồ khối của giải pháp nén MAIC. .................................................................. 66
Hình 3.4. Sơ đồ bộ lượng tử hóa MUQ (MUQ Encoder & Decoder). ................................ 67
Hình 3.5. So sánh hiệu năng của AHIC với MAIC trên chuỗi hình CIF Foreman. ............ 69
Hình 3.6. So sánh hiệu năng của AHIC với MAIC trên chuỗi hình CIF Bus. .................... 69
Hình 3.7. So sánh sự mất mát thông tin giữa AHIC và MAIC trên một khung hình của
chuỗi khung hình CIF Foreman........................................................................ 70
Hình 3.8. So sánh sự mất mát thông tin (hay error) giữa 2 giải pháp nén AHIC và MAIC
trên một khung hình của chuỗi khung hình CIF Bus. ...................................... 71
Hình 3.9. Minh họa ảnh độ chói Y của 8 bock 4×4 đầu vào cho quá trình lượng tử hóa. .. 74
Hình 3.10. Sai số phát sinh khi lượng tử hóa với phân phối đều bởi bộ lượng tử 4×4-AQC.
Chất lượng ảnh khôi phục đạt được PSNR=33.00 dB. .................................... 74
Hình 3.11. Sai số phát sinh khi lượng tử hóa với phân phối không đồng đều bởi bộ lượng
tử 4×4-AQC. ..................................................................................................... 75
Hình 3.12. Sơ đồ khối cho bộ mã hóa CBBET và bộ Bit Selector ...................................... 76
Hình 3.13. Sơ đồ khối cho bộ mã hóa và giải mã của AAIC. ............................................. 80
Hình 3.14. So sánh chất lượng nén và sự mất mát thông tin giữa 3 giải pháp nén AHIC,
MAIC và AAIC trên một khung hình của chuỗi khung hình CIF Foreman. ... 81
Hình 3.15. So sánh hiệu năng của AAIC với MAIC và AHIC. .......................................... 82

Hình 3.16. So sánh hiệu năng của AAIC với AHIC (chỉ trên thành phần độ chói Y). ....... 83
Hình 3.17. Sai số phát sinh khi lượng tử hóa với phân phối không đồng đều bởi bộ lượng
tử 4×4-AQC. ..................................................................................................... 84

viii


Hình 3.18. Sơ đồ bộ mã hóa và giải mã theo kỹ thuật phân phối bít (CBBDT) dựa trên giá
trị bước lượng tử. .............................................................................................. 86
Hình 3.19. Sơ đồ khối cho bộ mã hóa (encoder) và giải mã (decoder) của giải pháp nén
AHAIC (ở đây Q=2). ........................................................................................ 88
Hình 3.20. So sánh chất lượng ảnh của các giải pháp trên chuỗi khung hình CIF Hall. ..... 89
Hình 3.21. So sánh chất lượng nén và sự mất mát thông tin giữa 3 giải pháp nén AHIC,
AAIC và AHAIC trên một khung hình của chuỗi khung hình CIF Hall ......... 90
Hình 3.22. Sơ đồ bộ mã hóa và giải mã theo kỹ thuật phân phối bít (CBBDT) dựa trên giá
trị tuyệt đối lớn nhất của khối........................................................................... 93
Hình 3.23. So sánh chất lượng ảnh của các giải pháp nén trên chuỗi CIF Hall. ................. 93
Hình 3.24. So sánh chất lượng nén và sự mất mát thông tin giữa AHIC, AHAIC và ACAIC
trên một khung hình của chuỗi khung hình CIF Hall. ...................................... 95
Hình 3.25. Kỹ thuật lượng tử MUQ với 3bit/pixel - Mối liên hệ giữa bước lượng tử hóa
Qstep và sự phân bố các giá trị (hay điểm ảnh) trong một khối....................... 97
Hình 3.26. Kỹ thuật lượng tử MMAUQC với 3bit/pixel - Mối liên hệ giữa bước lượng tử
hóa Qstep và sự phân bố các giá trị trong một khối dạng “zero min signal”. .. 98
Hình 3.27. Mô tả đặc tính vào-ra của một bộ lượng tử hóa đều 3bit/pixel với đầu vào dạng
“zero min signal”. ............................................................................................. 99
Hình 3.28. Sơ đồ khối của mô hình lượng tử đa thích nghi MAQC ................................. 102
Hình 3.29. Sơ đồ khối của bộ mã hóa và giải mã RAIC. .................................................. 104
Hình 3.30. So sánh chất lượng ảnh của các giải pháp nén trên chuỗi khung hình CIF
Foreman. ......................................................................................................... 105
Hình 3.31. So sánh chất lượng ảnh nén và sai số một cách trực quan trên ảnh Foreman. 106

Hình 3.32. Sơ đồ bộ nén (Encoder) và giải nén (Decoder) của ARAIC. .......................... 108
Hình 3.33. Sơ đồ bộ nén và giải nén MAQC áp dụng trong ARAIC. ............................... 109
Hình 3.34. Sơ đồ thuật toán mã hóa và giải mã MAQC. ................................................... 111
Hình 3.35. So sánh chất lượng ảnh của các giải pháp nén trên chuỗi khung hình CIF
MobileCalendar .............................................................................................. 113
Hình 3.36. So sánh chất lượng ảnh của các giải pháp nén trên chuỗi khung hình CIF
Cheerleader ..................................................................................................... 113
Hình 3.37. So sánh chất lượng hình ảnh nén và sai số một cách trực quan trên một khung
hình của chuỗi khung hình CIF MobileCalendar. .......................................... 114
Hình 4.1. Sơ đồ quá trình các đề xuất cải tiến kế thừa và phát triển theo hướng áp dụng
biến đổi wavelet và lựa chọn thích nghi. ........................................................ 117
Hình 4.2. Sơ đồ khối của bộ mã hóa DBMAIC, được tích hợp với một bộ điều khiển
ngưỡng thích nghi........................................................................................... 118

ix


Hình 4.3. Sơ đồ khối của bộ mã hóa DAMS-AT áp dụng trong DBMAIC. ..................... 118
Hình 4.4. Mối liên hệ giữa chất lượng ảnh và các hằng số C2 & C3 của DBMAIC .......... 122
Hình 4.5. Mối liên hệ giữa chất lượng ảnh và các hằng số C1 & C2 của DBMAIC .......... 122
Hình 4.6. Mối liên hệ giữa chất lượng ảnh và các hằng số C1 & C2 của DBMAIC .......... 122
Hình 4.7. Mối liên hệ giữa chất lượng ảnh và các hằng số Min-Threshold & MaxThreshold của DBMAIC ................................................................................ 122
Hình 4.8. Sự thay đổi của ngưỡng (threshold) .................................................................. 123
Hình 4.9. So sánh hiệu năng của các giải pháp nén........................................................... 123
Hình 4.10. So sánh giá trị bit dư thừa trong hai giải pháp DBMAIC và DAMS .............. 124
Hình 4.11. Sự cải thiện hiệu ứng nhiễu khối và nhiễu đốm trên ảnh khôi phục của
DBMAIC ........................................................................................................ 124
Hình 4.12. So sánh trực quan chất lượng ảnh và sai số ..................................................... 126
Hình 4.13. Sơ đồ “Wavelet Lifting” (nguồn [26]). ........................................................... 127
Hình 4.14. Sơ đồ khối cho bộ mã hóa WLT-MAIC .......................................................... 129

Hình 4.15. Sơ đồ khối cho bộ mã hóa DAMS-AT áp dụng cho WLT-MAIC với 6 khối 4×8
đầu vào theo trật tự ưu tiên định trước. .......................................................... 129
Hình 4.16. Sơ đồ thuật toán mã hóa và giải mã DAMS-AT ............................................. 130
Hình 4.17. So sánh hiệu năng của các giải pháp nén......................................................... 132
Hình 4.18. So sánh trực quan chất lượng ảnh và sai số giữa hai giải pháp nén DBMAIC và
WLT-MAIC.................................................................................................... 133
Hình 4.19. So sánh hiệu năng của các giải pháp nén thuộc hai hướng tiếp cận ................ 135
Hình 4.20. So sánh trực quan sai số giữa một số giải pháp nén thuộc hai hướng tiếp cận.
Trị tuyệt đối sai số được khuếch đại lên 12 lần rồi biến đổi âm bản. ............. 137
Hình 4.21. So sánh hiệu năng của các giải pháp nén thuộc hai hướng tiếp cận ................ 138
Hình 4.22. Giá trị PSNR trung bình của các giải pháp nén khi đánh giá trên 25 chuỗi khung
hình với tổng số 8765 hình ảnh. ..................................................................... 138
Hình 4.23.Giá trị Entropy trung bình của mỗi chuỗi khung hình. ..................................... 140
Hình 4.24. So sánh chất lượng ảnh của các giải pháp nén trên chuỗi CIF MobileCalendar.
........................................................................................................................ 140
Hình 4.25. So sánh trực quan sai số giữa một số giải pháp nén thuộc hai hướng tiếp cận 142
Hình 4.26. So sánh hiệu năng nén của 4 giải pháp ARAIC, WLT-MAIC, LTC và SAMS
........................................................................................................................ 144
Hình 5.1. Sơ đồ quá trình đề xuất cải tiến và phát triển các giải pháp nén ảnh của luận án
trên cơ sở kế thừa hai giải pháp AHIC và DAMS cùng một số lý thuyết nền
tảng. ................................................................................................................ 147

x


DANH MỤC BẢNG
Bảng 2.1. Điện áp tăng tốc áp dụng để chuyển đổi từ mức độ chói hiện tại sang mức độ
chói tiếp theo ở mức 60cd/m2 với thời gian đáp ứng 16.7ms ........................... 13
Bảng 2.2. Yêu cầu dung lượng và tốc độ truyền tải dữ liệu của bộ nhớ khung hình trên Tivi chuẩn HD và UHD. ...................................................................................... 14
Bảng 2.3. Lượng tử hóa tối ưu MSE cho mật độ Gaussian ................................................. 35

Bảng 2.4. Một ví dụ gán từ mã dạng độ dài đồng nhất cho thông điệp với 8 trạng thái. .... 38
Bảng 2.5 Chất lượng nén trung bình của AHIC so với giải pháp chỉ áp dụng kỹ thuật lượng
tử hóa BTC [19] ............................................................................................... 49
Bảng 2.6. Chất lượng ảnh khôi phục của một số giải pháp nén .......................................... 53
Bảng 3.1. Các chuỗi khung hình định dạng CIF sử dụng trong thực nghiệm ..................... 63
Bảng 3.2. Các hình ảnh sử dụng trong thực nghiệm được lấy từ tập dữ liệu ảnh “LIVE
image quality assessment database release 2”. ................................................. 64
Bảng 3.3. Trung bình cộng kết quả chất lượng ảnh nén cho mỗi giải pháp ........................ 72
Bảng 3.4. Đánh giá mức độ cải thiện chất lượng ảnh nén của MAIC so với AHIC ........... 72
Bảng 3.5. Các lượng tử đều tối ưu cho tín hiệu có giá trị trung bình bằng không, phương
sai đơn vị và mật độ Gaussian .......................................................................... 77
Bảng 3.6. Kết quả chất lượng ảnh nén trung bình của các giải pháp .................................. 83
Bảng 3.7. Đánh giá mức độ cải thiện chất lượng ảnh nén của AAIC so với AHIC ............ 83
Bảng 3.8. Kết quả chất lượng ảnh nén trung bình cho các giải pháp .................................. 90
Bảng 3.9. Kết quả cải thiện của AHAIC so với AHIC. ....................................................... 90
Bảng 3.10. Kết quả cải thiện của AHAIC so với AAIC ...................................................... 91
Bảng 3.11. So sánh kết quả trung bình chất lượng ảnh nén khi sử dụng công thức tính phân
phối bit (3.9) hay (3.10) trong giải pháp AHAIC ............................................. 91
Bảng 3.12. Kết quả chất lượng ảnh nén trung bình cho các giải pháp ................................ 95
Bảng 3.13. Đánh giá mức độ cải thiện chất lượng ảnh nén của ACAIC so với AHIC ....... 95
Bảng 3.14. Đánh giá mức độ cải thiện chất lượng ảnh nén của ACAIC so với AHAIC .... 96
Bảng 3.15. Minh họa cho tình huống mã hóa lượng tử BTC với sai số lớn. ..................... 103
Bảng 3.16. Kết quả chất lượng ảnh nén trung bình cho các giải pháp .............................. 107
Bảng 3.17. Đánh giá mức độ cải thiện chất lượng của RAIC so với một số giải pháp ..... 107
Bảng 3.18. Kết quả chất lượng ảnh nén trung bình cho các giải pháp .............................. 114
Bảng 3.19. Đánh giá mức độ cải thiện chất lượng của ARAIC so với một số giải pháp .. 115
Bảng 4.1. Các hệ số của bộ lọc wavelet Le Gall 5/3-tap. .................................................. 128

xi



CHƢƠNG 1: MỞ ĐẦU

1.1. Đặt vấn đề
Trong những năm gần đây, chúng ta đã được chứng kiến sự thông dụng của công nghệ
màn hình tinh thể lỏng, hay thường được gọi tắt là công nghệ LCD (Liquid Crystal
Display), qua những chiếc ti-vi tinh thể lỏng (LCD và LED1) trong các hộ gia đình, cho
đến các màn hình tinh thể lỏng dùng cho máy tính cá nhân trong các văn phòng, các màn
hình quan sát và điều khiển trong công nghiệp, và nổi bật hơn cả là hàng tỷ chiếc điện
thoại di động đang nằm trong túi của hàng tỷ người trên toàn thế giới. Sự phát triển và
thành công của công nghệ tinh thể lỏng là kết quả của những nghiên cứu cải tiến không
ngừng, nhằm đưa chất lượng hình ảnh hiển thị và độ phân giải ngày một cao hơn, điện
năng tiêu thụ ngày một hiệu quả, giá thành sản phẩm ngày một hợp lý hơn với người tiêu
dùng.
Một trong số các vấn đề của công nghệ tinh thể lỏng trong thời kỳ đầu của quá trình
phát triển là tình trạng đáp ứng chậm chạp của các phần tử tinh thể lỏng, gây nên hiện
tượng mờ chuyển động (motion-blur, xem Hình 1.1). Để khắc phục, K. Nakanishi và các
đồng nghiệp đã đề xuất giải pháp tăng tốc độ đáp ứng cho các phần tử tinh thể thông qua
cơ chế tăng ngưỡng điện áp với tên gọi “overdrive” vào năm 2001 [25]. Kỹ thuật overdrive
đã tạo nên bước đột phá trong công nghệ tinh thể lỏng giúp tạo ra những sản phẩm có khả
năng hiển thị hình ảnh chuyển động với chất lượng cao.

Vùng hình ảnh chuyển
động hiện thị bị mờ

(a) Kỹ thuật điều khiển thông thường

(b) Tăng tốc với overdrive

Hình 1.1. Minh họa hiện tượng mờ chuyển động (motion-blur) khi áp dụng kỹ thuật

điều khiển (dẫn động) thông thường (a), và khả năng cải thiện chất lượng hình ảnh hiển thị
bằng kỹ thuật tăng tốc overdrive (b) trên màn hình tinh thể lỏng của hãng LG.

1

Màn hình LED (điôt phát quang) thực chất là màn hình tinh thể lỏng (LCD) nhưng được áp dụng kỹ
thuật chiếu sáng bằng đèn điôt phát quang (LED) thay cho đèn huỳnh quang lạnh (Cold cathode fluorescent
lamp - CCFL) [35].

1


Mô hình hệ thống overdrive trong màn hình tinh thể lỏng được trình bày trong Hình
1.2, gồm hai thành phần: (1) Bộ nhớ khung hình (frame memory); và (2) bộ điều khiển
tăng tốc overdrive. Trong đó, bộ nhớ khung hình có chức năng lưu trữ dữ liệu ảnh hiện thị
đủ khung hình hiện tại (Fn) và đồng thời cung cấp dữ liệu ảnh khung hình ở thời điểm
trước (Fn-1) cho hệ thống overdrive. Bộ điều khiển overdrive có chức năng cung cấp điện
áp tăng tốc cho mỗi điểm ảnh trên màn hình dựa trên thông tin ảnh khung hình hiện tại (Fn)
và ảnh khung hình ở thời điểm trước (Fn-1). Nguyên lý hoạt động của hệ thống overdrive
được mô tả chi tiết trong mục 2.2.

Dữ liệu khung hình
Dữ liệu khung hình hiện tại
Fn

Overdrive
Frame
memory

Dữ liệu khung hình

thời điểm trước, Fn-1

(LUT)

Overdriven
Frame

Hình 1.2. Mô hình một hệ thống overdrive trong màn hình tinh thể lỏng [24].
Hiện nay các nhà sản xuất đang cần áp dụng các chuẩn định dạng Ti-vi độ phân giải
cao (High-Definition Television) và siêu cao (Ultra High-Definition Television) đối với
các thiết bị màn hình tinh thể lỏng, với tốc độ hiện thị khung hình lên mức 60fps đến
120fps. Từ đó làm nảy sinh hai vấn đề sau đối với bộ nhớ khung hình:
(1) Yêu cầu dung lượng bộ nhớ tăng cao theo sự tăng trưởng số điểm ảnh trên màn
hình. Mức 640×480×24bit  7.1Mb với chuẩn VGA, 3840×2160×24bit  189.8Mb với
chuẩn UHD 2160p (4K), và 7680×4320×24bit  759.4Mb với chuẩn UHD 4320p (8K).
(2) Yêu cầu băng thông ở mức rất cao, cụ thể với UHD 2160p (4K) áp dụng tốc độ
hiện thị khung hình 120fps sẽ là 3840×2160×24bit×120×2  44.5Gbit/s, hay UHD 4320p
(8K) với 120fps sẽ là 7680×4320×24bit×120×2  178Gbit/s
Với yêu cầu cao về dung lượng và tốc độ băng thông, sẽ đẩy giá thành của bộ nhớ
khung hình lên cao, góp phần làm tăng giá thành của sản phẩm màn hình tinh thể lỏng. Từ
đó bài toán nén ảnh khung hình áp dụng vào trong hệ thống overdrive đã được đặt ra nhằm
mục đích thu nhỏ dung lượng dữ liệu ảnh khung hình trước khi nó được lưu trữ lên bộ nhớ
khung hình (frame memory), giúp giảm yêu cầu dung lượng đối với bộ nhớ khung hình,

2


đồng thời cũng giúp giảm được yêu cầu băng thông đối với bộ nhớ khung hình khi lượng
dữ liệu mà nó cần trao đổi (ghi/đọc) trở nên ít đi vì đã được nén lại. Khi yêu cầu về dung
lượng và băng thông đối với bộ nhớ khung hình được giảm xuống sẽ kéo theo sự cải thiện

về giá thành của sản phẩm màn hình tinh thể lỏng.
Xuất phát từ yêu cầu thực tiễn trên, nhiều nghiên cứu đã được triển khai nhằm tìm ra
những giải pháp nén ảnh khung hình áp dụng phù hợp và hiệu quả trên hệ thống overdrive
của màn hình tinh thể lỏng. Kết quả đã có khá nhiều các giải pháp nén ảnh khung hình cho
màn hình tinh thể lỏng được đề xuất qua các bài báo [[5], [9], [10], [11], [12], [13], [14],
[15], [17], [18], [19], [20], [21], [22], [24], [28]]. Khi xem xét trong khoảng thời gian
những năm nghiên cứu đầu tiên của luận án (cuối năm 2009 đến đầu năm 2011), một số
giải pháp nén ảnh khung hình được đề xuất trong [[5], [19], [21]] là những giải pháp mới
được đề xuất, thể hiện được hiệu năng nén cao so với những giải pháp nén được đề xuất
trước đó trên một số tiêu chí như: tỷ số nén khá cao, chất lượng ảnh khá tốt, và độ phức tạp
tính toán không cao hay ở mức chấp nhận được. Nhưng trải qua quá trình nghiên cứu phân
tích về mặt lý thuyết cũng như thực nghiệm, chúng tôi đã phát hiện ra nhiều khiếm khuyết
còn tồn tại trong các giải pháp nói trên về mặt chất lượng ảnh khôi phục cũng như độ phức
tạp tính toán. Từ thực trạng đó, đã mở ra hướng nghiên cứu cải tiến một số giải pháp nén
ảnh khung hình cho màn hình tinh thể lỏng đã được các tác giả nước ngoài đề xuất, nhằm
nâng cao hiệu quả áp dụng vào hệ thống overdrive, hoặc tiến xa hơn sẽ nghiên cứu đề xuất
các giải pháp nén tiên tiến về mặt hiệu năng, nhằm mang lại hiệu quả cao khi áp dụng vào
hệ thống overdrive trong màn hình tinh thể lỏng.

1.2. Tình hình nghiên cứu trên thế giới
Hiện nay, nhiều giải pháp nén ảnh khung hình khác nhau đã được đề xuất áp dụng cho
hệ thống overdriver trong màn hình tinh thể lỏng. Từ giải pháp đơn giản chỉ áp dụng phép
biến đổi không gian màu và kỹ thuật mã hóa lượng tử BTC (block truncation coding) trong
[13] với tỷ số nén (compression ratio) CR = 3 đến 3.42. Cho đến các giải pháp nén có kiến
trúc phức tạp hơn, sử dụng phối hợp nhiều kỹ thuật biến đổi và lượng tử hóa khác nhau
nhằm tăng chất lượng ảnh khôi phục hay tỷ số nén, đã được đề xuất trong các bài báo [[9],
[10], [12], [14], [15], [17], [18], [20], [21], [24], [28]]. Sau cùng, và cũng đáng được chú ý
hơn cả, là một số giải pháp nén có tỷ số nén cao đi cùng với chất lượng ảnh khôi phục khá
tốt, dựa trên mô hình kiến trúc khá đơn giản như đề xuất trong [19], hay không quá phức
tạp và có thể thực hiện được theo thời gian thực, như trong [5].

Nhìn chung, các giải pháp đã được đề xuất nói trên, đặc biệt là những giải pháp tiên
tiến về hiệu năng mới được đề xuất gần đây như Advanced Hybrid Image Codec (AHIC)

3


trong [19], Adaptive Multi-level Block Truncation Coding (AM-BTC) trong [21] hay
DWT-based Adaptive Mode Selection (DAMS) trong [5], đều là những giải pháp có nhiều
ưu điểm nổi trội khi so sánh với các giải pháp đã được đề xuất trước đó như: tỷ số nén cao,
chất lượng ảnh khôi phục khá tốt và độ phức tạp tính toán không cao (với AHIC và AMBTC) hay không quá cao (với DAMS). Mặc dù vậy, qua quá trình nghiên cứu và phân tích
thực nghiệm, chúng tôi nhận thấy các giải pháp này vẫn còn mắc phải một số nhược điểm
sau:


Advanced Hybrid Image Codec (AHIC): Ảnh khôi phục dễ bị mắc phải hiện tượng
nhiễu khối (hay blocking effect), kỹ thuật lượng tử hóa chưa thật sự tối ưu, mô hình
kiến trúc thực thi còn nhiều điểm chưa thật sự hợp lý, và cuối cùng là khả năng thích
nghi theo sự thay đổi của tín hiệu ảnh chưa cao dẫn đến chất lượng ảnh khôi phục còn
rất thấp trong một số tình huống.



Adaptive Multi-level Block Truncation Coding (AM-BTC): Ảnh khôi phục có sai số
lớn ở thành phần độ chói Y (luminance) là thành phần nhạy cảm với mắt người. Và hơn
thế nữa, trong một số tình huống khi quan sát trên một chuỗi các khung hình, sai số
trên ảnh khôi phục đã gây ra hiện tượng rung hình (vibrate effect) như nhìn qua một
đám lửa ở những vùng ảnh nhiều chi tiết và ít thay đổi. Chính vì hiện tượng chập chờn
tác động lên vùng ảnh có ít sự thay đổi nên khuyết điểm này dễ dàng được nhận ra qua
quan sát bằng thị giác. Nhược điểm này sẽ khiến cho giải pháp AM-BTC khó có thể
ứng dụng trên thực tiễn vì sẽ làm suy giảm chất lượng hiển thị hình ảnh trên màn hình

tinh thể lỏng, dù rằng những kết quả thực nghiệm đánh giá trên số đo PSNR của giải
pháp AM-BTC thường đạt kết quả khá cao.



DWT-based Adaptive Mode Selection (DAMS): Giải pháp này sử dụng một giá trị
ngưỡng (threshold) cố định đã làm hạn chế khả năng thích nghi của DAMS và là
nguyên nhân gây ra hiện tượng nhiễu khối ở thành phần màu (chroma) của ảnh khôi
phục và nhiều đốm trên các chi tiết đường nét. Yêu cầu khá cao về độ phức tạp tính
toán khi sử dụng phép biến đổi wavelet 2-chiều với bộ lọc Daubechies 4/4 - hệ số, đòi
hỏi phải tính toán trên trường số thực. Và cuối cùng là đa số phép lượng tử hóa trong
giải pháp này cũng yêu cầu xử lý trên trường số thực làm cho độ phức tạp tính toán
tăng cao.
Sơ lược thực trạng trên cho thấy vấn đề nghiên cứu các giải pháp nén ảnh áp dụng vào

trong công nghệ màn hình tinh thể lỏng vẫn đang cần các nghiên cứu cải tiến và phát triển,
để ngày càng có được các giải pháp hoàn thiện hơn với hiệu năng cao hơn.

4


1.3. Mục tiêu và phạm vi nghiên cứu của luận án
Mục tiêu của luận án là nghiên cứu phát triển các giải pháp tiên tiến nén dữ liệu ảnh
khung hình áp dụng cho màn hình tinh thể lỏng độ phân giải cao, trên cơ sở phân tích các
công trình đã có để đề xuất cải tiến cải thiện hiệu năng. Nghiên cứu kế thừa và phát triển
đề xuất các giải pháp nén mới nâng cao hiệu năng so với những giải pháp hiện đã được đề
xuất.
Theo một số các tiêu chí đánh giá hiệu năng nén gồm: chỉ số nén, chất lượng nén, và
độ phức tạp tính toán.
Phạm vi nghiên cứu của luận án bao gồm:

1. Nghiên cứu phát triển các giải pháp nén ảnh áp dụng cho màn hình tinh thể lỏng độ
phân giải cao nhằm tăng cường hiệu năng nén.
2. Nghiên cứu đề xuất cải tiến các giải pháp để khắc phục những nhược điểm còn tồn tại
trong một số giải pháp nén tiên tiến như AHIC, DAMS, nhằm nâng cao hiệu năng của
giải pháp nén về cải thiện chất lượng ảnh, giảm độ phức tạp tính toán.
3. Nghiên cứu phân tích các ưu và nhược điểm của các giải pháp nén ảnh đã có. Từ đó đề
xuất xây dựng các giải pháp nén mới thể hiện được nhiều ưu điểm vượt trội về chất
lượng ảnh, tỷ số nén, độ phức tạp tính toán hay sơ đồ thực hiện, có khả năng thích nghi
theo sự thay đổi của tín hiệu ảnh, tránh mắc phải các khuyết điểm về thị giác.

1.4. Phƣơng pháp nghiên cứu
-

Xác định rõ mục tiêu và phạm vi nghiên cứu.

-

Phương pháp nghiên cứu kế thừa và phát triển trên cơ sở nghiên cứu phân tích tổng
quan các giải pháp đã đề xuất, cải tiến nâng cao hiệu năng và phát triển đề xuất giải
pháp mới.

-

Phương pháp nghiên cứu kết hợp giữa lý thuyết và nghiên cứu thực nghiệm cài đặt
chương trình kiểm chứng kết quả, biện luận và giải thích.
1. Về nghiên cứu lý thuyết:


Nghiên cứu cơ sở lý thuyết về tín hiệu ảnh và các phép biến đổi tín hiệu ảnh:
Kỹ thuật thay đổi tần số lấy mẫu của tín hiệu (Downsampling, Upsampling)

dùng kỹ thuật lọc số (Filter), chuyển đổi không gian màu (RGB, YCbCr), phép
biến đổi cosin rời rạc DCT (Discrete Cosine Transform), biến đổi sóng con rời
rạc DWT (Discrete Wavelet Transform), kỹ thuật Lifting.



Nghiên cứu cơ sở lý thuyết về lượng tử hóa và một số phương pháp lượng tử
như: Phương pháp tối ưu sai số trung bình bình phương hay lượng tử hóa

5


Lloyd-Max, phương pháp lượng tử hóa tối ưu với đầu vào có phân phối đều,
các phương pháp lượng tử hóa thích nghi.


Dùng một số độ đo đánh giá chất lượng nén: Độ đo sai số trung bình bình
phương MSE (Mean Squared Error), độ đo tỷ số tín hiệu mức đỉnh /nhiễu
PSNR (Peak Signal-to-Noise Ratio).

2. Về nghiên cứu thực nghiệm:


Đã tiến hành cài đặt lập trình thực nghiệm trên môi trường máy tính PC cho hầu
hết các giải pháp nén tiên tiến được xem xét và đánh giá trong luận án



Tạo lập môi trường thực nghiệm phù hợp với môi trường thực tế của bài toán
thông qua công cụ Simulink để có những quan sát trực quan và đưa ra những

đánh giá phù hợp với bài toán.



Thực nghiệm đo lường, thống kê số liệu tạo cơ sở cho các phân tích đánh giá

1.5. Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học của luận án được thể hiện trong đề xuất hai giải pháp tiên tiến nén
ảnh khung hình, nâng cao về hiệu năng nén nhằm áp dụng cho hệ thống màn hình tinh thể
lỏng, “Advanced Robust Adaptive Image Coding” và “Wavelet Lifting Transform base
Multi-Adaptive Image Coding”, tương ứng với hai hướng tiếp cận khác nhau mà luận án đã
thực hiện. Đề xuất phát triển về kỹ thuật lượng tử hóa, kỹ thuật tối ưu hóa quá trình lượng
tử các khối ảnh thông qua giải pháp phân phối bit, những kỹ thuật mới được đề xuất này
không bị bó hẹp trong lĩnh vực nén ảnh khung hình cho màn hình tinh thể lỏng mà chúng
có khả năng áp dụng cho lĩnh vực nén ảnh nói chung.
Ý nghĩa thực tiễn của luận án được thể hiện qua các giải pháp nén đề xuất hướng áp
dụng vào công nghệ màn hình tinh thể lỏng cho phép sản xuất thế hệ màn hình tinh thể
lỏng có độ phân giải cao, chất lượng hiển thị hình ảnh tốt với một giá thành thấp hơn. Ví
dụ với chuẩn công nghệ màn hình UHD 8K (Ultra High Definition). Đến thời điểm này,
năm 2015, nhiều nhà sản xuất màn hình tinh thể lỏng trên thế giới đã cho ra đời thế hệ màn
hình chuẩn UHD 8K có độ phân giải 7680×4320 với tốc độ khung hình là 120fps (frames
per second), dẫn đến yêu cầu về tốc độ truy xuất dữ liệu bộ nhớ khung hình bị đẩy lên đến
mức 178 GB/s, một tốc độ quá cao so với nền tảng công nghệ sản xuất bộ nhớ DRAM hay
DDRAM hiện tại, khiến cho giá thành thiết kế bộ nhớ khung hình trở nên rất đắt đỏ. Từ đó
vấn đề nén ảnh khung hình càng trở nên bức thiết hơn nhằm giảm tốc độ truy xuất dữ liệu
bộ nhớ, tiến đến hạ giá thành sản phẩm. Để trong tương lai gần sản phẩm thật sự phù hợp
với túi tiền của đa số người tiêu dùng. Giúp người tiêu dùng có cơ hội bắt kịp được với sự
chuyển mình của ngành công nghiệp sản xuất nội dung truyền hình và video, khi mà phần

6



lớn các hãng truyền thông và sản xuất nội dung video lớn trên thế giới, các hãng truyền
hình lớn trên các châu lục đã và đang bắt đầu quá trình chuyển đổi sang chuẩn UHD.
Tóm lại, có thể khẳng định rằng đề tài của luận án này thật sự mang nhiều ý nghĩa
khoa học và thực tiễn.

1.6. Bố cục luận án
Bố cục của luận án gồm 5 chương, ngoài hai chương MỞ ĐẦU và KẾT LUẬN, ba
chương còn lại tập trung vào trình bày lý thuyết tổng quan cũng những kết quả nghiên cứu
mà luận án đã đạt được, cụ thể:
Chương 2: Trình bày sơ lược về lịch sử phát triển của công nghệ màn hình tinh thể
lỏng và kỹ thuật tăng tốc overdrive giúp tăng tốc độ đáp ứng của các phần tử tinh thể lỏng.
Một số cơ sở lý thuyết áp dụng trong bài toán nén ảnh khung hình. Nghiên cứu tổng quan
về lĩnh vực nén ảnh khung hình trong hệ thống overdrive. Phân tích và thực nghiệm nhằm
đánh giá ưu và nhược điểm của một số giải pháp nén ảnh tiên tiến đã được đề xuất áp dụng
cho màn hình tinh thể lỏng. Trên cơ sở đó đưa ra một số định hướng nghiên cứu cải tiến.
Chương 3: Nghiên cứu và phân tích sâu hơn các khuyết điểm trong một số giải pháp
nén ảnh tiên tiến sử dụng nền tảng cơ bản là các kỹ thuật mã hóa khối và biến đổi không
gian màu. Từ đó đề xuất các kỹ thuật khắc phục áp dụng vào trong các sơ đồ giải pháp cải
tiến nhằm nâng cao hiệu năng nén. Nghiên cứu đề xuất áp dụng lý thuyết phân phối bít vào
nén ảnh khung hình cùng một số kỹ thuật lượng tử hóa tối ưu, dựa vào đó từng bước nâng
cao chất lượng nén và giảm độ phức tạp tính toán qua từng giải pháp. Kết quả đã đạt được
một số đề xuất cải tiến có tính kế thừa từng bước một nhằm nâng cao chất lượng ảnh hay
cải thiện độ phức tạp tính toán. Sau cùng, luận án đã đi đến được một giải pháp nén ảnh
khung hình có tính tiên tiến về hiệu năng với tên gọi ARAIC, mang lại sự cải tiến vượt trội
về chất lượng ảnh, giảm độ phức tạp tính toán và sơ đồ kiến trúc thực thi có phần tinh gọn.
Tất cả các đề xuất trong chương này đều được cài đặt thực nghiệm, phân tích, so sánh và
đánh giá.
Chương 4: Nghiên cứu và phân tích các nhược điểm của giải pháp nén ảnh DAMS. Từ

đó tìm kiếm giải pháp khắc phục thông qua các đề xuất như kỹ thuật ngưỡng thích nghi, kỹ
thuật biến đổi wavelet lifting integer to integer, và một số điều chỉnh về sơ đồ giải pháp.
Trải qua hai giai đoạn nghiên cứu cải tiến và phát triển có tính kế thừa: Giai đoạn một luận
án đã đưa ra đề xuất cải tiến DAMS bằng cách tích hợp kỹ thuật ngưỡng thích nghi để hình
thành nên giải pháp DBMAIC cho khả năng thích nghi cao và mang lại chất lượng ảnh
vượt trội; Giai đoạn hai là cải thiện độ phức tạp tính toán của DBMAIC với kỹ thuật biến
đổi tín hiệu ảnh Wavelet Lifting Integer to Integer, cùng một số cải tiến về mặt lượng tử để

7


hình thành nên giải pháp WLT-MAIC. Những phân tích và đánh giá cho thấy tính tiến tiến
của WLT-MAIC thể hiện qua hiệu năng vượt trội của nó so với giải pháp gốc DAMS.
Trong chương này cũng đồng thời đưa ra các so sánh và đánh giá giữa hai hướng tiếp cận
trong luận án. Tập trung một số phân tích và đánh giá so sánh trên hai kết quả tốt nhất của
hai hướng tiếp cận là ARAIC và WLT-MAIC, các so sánh và đánh giá nhằm thể hiện rõ
những ưu - khuyết điểm và đưa ra những nhận định hay khuyến nghị đối với nhà sản xuất
khi chọn lựa giải pháp. Cuối cùng là phần so sánh đánh giá với 2 giải pháp nén tiên tiến nổi
bật nhất mới được đề xuất trên thế giới vào cuối giai đoạn nghiên cứu của luận án là LTC
[22] và SAMS [11].
Chương 5: Tóm tắt các nội dung nghiên cứu chính của luận án. Trình bày cô đọng các
kết quả mới mà luận án đã đạt được, và cuối cùng là nêu lên hướng phát triển tiếp theo của
luận án.

8


CHƢƠNG 2: TỔNG QUAN VỀ VẤN ĐỀ NÉN ẢNH CHO
MÀN HÌNH TINH THỂ LỎNG
Trong chương này luận án sẽ trình bày sơ lược về lịch sử phát triển của màn hình tinh

thể lỏng và kỹ thuật tăng tốc overdrive, vấn đề nén ảnh áp dụng cho hệ thống overdrive của
của màn hình tinh thể lỏng, mối tương quan giữa chất lượng nén và chất lượng ảnh hiển thị
trên màn hình, một số yêu cầu đặc trưng cho hệ thống nén ảnh trên màn hình tinh thể lỏng,
tổng quan về nén ảnh nhằm giảm bộ nhớ khung hình trong màn hình tinh thể lỏng. Và sau
cùng là một số cơ sở lý thuyết có liên quan. Kỹ thuật nén ảnh trình bày trong chương này
sẽ được giới hạn trong không gian hai chiều (chiều rộng và chiều cao).

2.1. Lịch sử phát triển của màn hình tinh thể lỏng và vấn đề chất
lƣợng hiện thị hình ảnh động
2.1.1. Lịch sử phát triển của màn hình tinh thể lỏng
Ngày nay, trong giai đoạn phát triển bùng nổ của các thiết bị kỹ thuật số thì màn hình
tinh thể lỏng trở nên quá gần gũi với chúng ta. Chúng ta có thể thấy màn hình tinh thể lỏng
được lắp đặt trong khá nhiều thiết bị. Từ đồng hồ kỹ thuật số, cho đến máy tính cá nhân,
điện thoại di động, ti-vi LCD và ti-vi LED trong các hộ gia đình, hay các thiết bị giải trí
đang rất thời thượng và được đông đảo giới trẻ đón nhận như máy tính bảng, máy đọc
sách,…v.v.
Để có được sự phát triển và ứng dụng mãnh mẽ như ngày nay thì màn hình tinh thể
lỏng đã có một lịch sử phát triển lâu dài qua nhiều giai đoạn. Mốc lịch sử đầu tiên phải kể
đến đó là và năm 1888, nhà thực vật học và hóa học người Áo, Friedrich Reinitzer, đã tìm
ra các phần tử tinh thể (liquid-crystal) trong chất béo được chiết xuất từ cà-rốt. Đến năm
1962, nhà nghiên cứu Richard Williams đã tạo mẫu dạng sọc (stripe-patterns) trong một
lớp mỏng của vật liệu tinh thể lỏng bằng cách ứng dụng tác động điện áp lên các tinh thể.
Hiệu ứng này được dựa trên sự tạo hình bất ổn định điện-thủy động lực (electrohydrodynamic instability forming). Năm 1958, Dr. Glenn Brown là người viết bài báo đầu
tiên nghiên cứu về màn hình tinh thể lỏng ở Mỹ. Giữa những năm 1964 và 1968, tại trung
tâm nghiên cứu RCA David Sarnoff ở Princeton, bang New Jersey của Mỹ, một nhóm các
kỹ sư và các nhà khoa học dẫn đầu bởi George Heilmeier với Louis Zanoni và Lucian
Barton, đã phát minh ra một phương pháp sử dụng điện áp để điều khiển ánh sáng phản xạ
từ các phần tử tinh thể lỏng, nó minh chứng cho màn hình tinh thể lỏng đầu tiên. Công việc

9



của họ đã mở ra một ngành công nghiệp toàn cầu sản xuất hàng triệu màn hình tinh thể
lỏng từ đó đến nay.
Màn hình tinh thể lỏng của Heilmeier sử dụng phương pháp tán xạ động mà ông gọi là
DSM (Dynamic Scattering Method), trong đó một vật mang điện được áp dụng để sắp xếp
lại các phân tử vì thế chúng có thể tán xạ ánh sáng. Thiết kế DSM làm việc kém và đã
được chứng minh là quá tốn năng lượng. Nó đã được thay thế bởi một phiên bản cải tiến,
sử dụng các tinh thể dạng xoắn hay còn gọi là các tinh thể nematic hoạt động hiệu quả hơn,
phát minh bởi James Fergason vào năm 1969. Nhà phát minh sáng chế James Fergason
nắm giữ một số bằng sáng chế cơ bản trong lĩnh vực màn hình tinh thể lỏng vào đầu những
năm 1970, bao gồm cả bằng sáng chế ở Mỹ có tính then chốt mang số hiệu US3,731,986
cho "Display Devices Utilizing Liquid Crystal Light Modulation". Năm 1972, Công ty
International Liquid Crystal (ILIXCO) thuộc sở hữu của James Fergason đã sản xuất đồng
hồ màn hình tinh thể lỏng hiện đại đầu tiên dựa trên bằng sáng chế của James Fergason.
Đến năm 1973, Hãng Sharp đã sản xuất ra chiếc máy tính di động đầu tiên sử dụng màn
hình màn hình tinh thể lỏng theo công nghệ DSM (nguồn [4], [27]).

Hình 2.1. Mô tả cấu tạo màn hình TFT-LCD
Năm 1979, Walter Spear và Peter LeComber đã tạo ra màn hình màu đầu tiên dùng
công nghệ TFT (Thin-Film Transistor). Năm 1985, Seiko-Epson công bố sản phẩm “TV
set” màu thương mại đầu tiên, nó có kích thước hiển thị là 2 inch. Năm 1992, Sharp đã
phát triển thành công sản phẩm màn hình tinh thể lỏng kích thước 16.5 inch tương thích
với việc hiển thị hình ảnh đa phương tiện (multimedia-compatible). Năm 2004, hãng
Philips đã trưng bày một màn hình tinh thể lỏng 20 inch theo công nghệ hiện thị ba chiều
(3-D) tại hội chợ thương mại CeBIT ở Hannover nước Đức. Năm 2005, hãng Sammung đã
phát triển màn hình lớn nhất thế giới lúc bấy giờ có kích thước 82 inch hiển thị theo chuẩn
định dạng có độ phân giải cao “Full HD” dùng công nghệ TFT. Cho đến thời điểm hiện
nay, năm 2014, thì hầu hết các hãng sản xuất màn hình tinh thể lỏng lớn trên thế giới đều
đã cho ra đời các sản phẩm màn hình tinh thể lỏng độ phân giải UHD 4K, mặc dù hiện tại


10


×