Tải bản đầy đủ (.pdf) (73 trang)

luạn văn nghiên cứu các thuật toán nâng cao chất lượng ảnh số và ứng dụng trong ảnh tài liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.96 MB, 73 trang )

ĐẠI HỌC THÁI NGUYÊN 
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

LÊ NHƯ TÙNG

NGHIÊN CỨU CÁC THUẬT TOÁN NÂNG CAO CHẤT LƯỢNG
ẢNH SỐ VÀ ỨNG DỤNG TRONG ẢNH TÀI LIỆU  
 
 
Chuyên ngành: Khoa học máy tính 
Mã số: 60 48 01 01 

LUẬN VĂN THẠC SĨ  KHOA HỌC MÁY TÍNH 

NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS. TS. NGÔ QUỐC TẠO

THÁI NGUYÊN, 2016


 
 
 


LỜI CAM ĐOAN
 
Tên tôi là: Lê Như Tùng 
Sinh ngày: 29/3/1980 
Học viên lớp cao học CHK13 - Trường Đại học Công nghệ thông tin và 


Truyền thông – Đại học Thái Nguyên. 
Hiện đang công tác tại: Xã Đồng Cốc, huyện Lục Ngạn, tỉnh Bắc Giang. 
Xin  cam  đoan:  Đề  tài  “Nghiên cứu các thuật toán nâng cao chất
lượng ảnh số và ứng dụng trong ảnh tài liệu” do Thầy giáo PGS.TS. Ngô
Quốc Tạo hướng dẫn là công trình nghiên cứu của riêng tôi. Tất cả tài liệu 
tham khảo đều có nguồn gốc, xuất xứ rõ ràng. 
Tác giả xin cam đoan tất cả những nội dung trong luận văn đúng như 
nội  dung  trong  đề  cương  và  yêu  cầu  của  thầy  giáo  hướng  dẫn.  Nếu  sai  tôi 
hoàn toàn chịu trách nhiệm trước hội đồng khoa học và trước pháp luật. 
Thái Nguyên, ngày 22 tháng 6 năm 2016
NGƯỜI CAM ĐOAN 
 

 

 

 
Lê Như Tùng 

 
 
 
 


 
 
 


ii 
LỜI CẢM ƠN
Sau  một  thời  gian  nghiên  cứu  và  làm  việc  nghiêm  túc,  được  sự  động 

viên, giúp đỡ và hướng dẫn tận tình của Thầy giáo hướng dẫn PGS.TS. Ngô 
Quốc  Tạo,  luận  văn  với  đề  tài  “Nghiên cứu các thuật toán nâng cao chất
lượng ảnh số và ứng dụng trong ảnh tài liệu” đã hoàn thành. 
Tôi xin bày tỏ lòng biết ơn sâu sắc đến: 
Thầy giáo hướng dẫn PGS.TS. Ngô Quốc Tạo đã tận tình chỉ dẫn, giúp 
đỡ tôi hoàn thành luận văn này. 
Đề  tài  “Hệ  thống  đeo  tay  hỗ  trợ  đọc  sách  tiếng  Việt  dành  cho  người 
khiếm thị” Mã số VAST01.07/15-16 hỗ trợ trong thực hiện luận văn. 
Khoa sau Đại học Trường Đại học Công nghệ thông tin và truyền thông 
đã giúp đỡ tôi trong quá trình học tập cũng như thực hiện luận văn. 
Tôi  xin  chân  thành  cảm  ơn  bạn  bè,  đồng  nghiệp  và  gia  đình  đã  động 
viên, khích lệ, tạo điều kiện giúp đỡ tôi trong suốt quá trình học tập, thực hiện 
và hoàn thành luận văn này. 
TÁC GIẢ LUẬN VĂN 
  
 
Lê Như Tùng


 
 
 

iii 
MỤC LỤC


LỜI CAM ĐOAN ........................................................................................... i
LỜI CẢM ƠN ................................................................................................ ii
MỤC LỤC .................................................................................................... iii
DANH MỤC CÁC HÌNH ẢNH ..................................................................... v
DANH MỤC BẢNG BIỂU ........................................................................... vi
DANH MỤC CÁC TỪ VIẾT TẮT .............................................................. vii
LỜI MỞ ĐẦU ................................................................................................ 1
1. Tính khoa học và cấp thiết của đề tài ...................................................... 1
2. Mục tiêu, đối tượng và phạm vi nghiên cứu của đề tài ............................ 2
3. Phương pháp luận nghiên cứu ................................................................. 2
4. Nội dung và bố cục của luận văn ............................................................ 2
CHƯƠNG 1. TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG ẢNH SỐ ..... 4
1.1. Tổng quan xử lý ảnh số ........................................................................ 4
1.1.1. Tổng quan về một hệ thống xử lý ảnh............................................ 4
1.1.2. Một số khái niệm cơ bản trong xử lý ảnh ....................................... 6
1.1.3. Nguyên tắc thực hiện xử lý ảnh ..................................................... 8
1.1.4. Một số thao tác cơ bản trong xử lý ảnh .......................................... 9
1.2. Nâng cao chất lượng ảnh .................................................................... 11
1.2.1. Tăng cường ảnh ........................................................................... 13
1.2.2. Khôi phục ảnh ............................................................................. 16
1.3. Một số ứng dụng của nâng cao chất lượng ảnh................................... 17
1.4. Kết luận chương ................................................................................. 19
CHƯƠNG 2. CÁC KỸ THUẬT  NÂNG CAO  CHẤT LƯỢNG ẢNH TÀI 
LIỆU ............................................................................................................ 20
2.1.1 Ảnh tài liệu ................................................................................... 20
2.2.2. Xử lý ảnh tài liệu ......................................................................... 21


 
 

 

iv 
2.2.3. Nâng cao chất lượng ảnh tài liệu ................................................. 23
2.2. Cập nhật một số kết quả nghiên cứu tiêu biểu gần đây về nâng cao chất 
lượng ảnh tài liệu ...................................................................................... 26
2.3. Phân tích một số thuật toán tiêu biểu trong nâng cao chất lượng hình ảnh 28
2.3.1. Các loại nhiễu thường gặp ........................................................... 28
2.3.2. Các thuật toán lọc nhiễu .............................................................. 33
2.3.2. Các thuật toán khử mờ ảnh .......................................................... 38
2.3.3. Các thuật toán chỉnh nghiêng ảnh tài liệu .................................... 42
2.4. Kết luận chương ................................................................................. 50

CHƯƠNG 3 CÀI ĐẶT THỬ NGHIỆM MỘT SỐ THUẬT TOÁN NÂNG 
CAO CHẤT LƯỢNG ẢNH TÀI LIỆU ........................................................ 51
3.1. Đặt vấn đề .......................................................................................... 51
3.2. Lựa chọn một số thuật toán nâng cao chất lượng ảnh tài liệu ............. 51
3.3. Xây dựng chương trình thử nghiệm ................................................... 52
3.4. Đánh giá hiệu quả của một số thuật toán nâng cao chất lượng ảnh tài 
liệu............................................................................................................ 56
3.5. Kết luận chương ................................................................................. 60
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI ............................. 62
TÀI LIỆU THAM KHẢO ............................................................................ 64


 
 
 



DANH MỤC CÁC HÌNH ẢNH

Hình 1.1. Các giai đoạn chính trong xử lý ảnh ............................................ 5 
Hình 1.2. Sơ đồ khối các bước trong quá trình xử lý ảnh .......................... 11 
Hình 1.3. Mô hình quá trình làm méo và khôi phục ảnh ........................... 16 
Hình 2.1. Một số ảnh tài liệu trong cuộc sống ........................................... 20 
Hình 2.2. Phân loại xử lý ảnh tài liệu ........................................................ 21 
Hình 2.3. Các bước cơ bản trong xử lý ảnh tài liệu ................................... 22 
Hình 2.4. Một số vấn đề đối với ảnh tài liệu ............................................. 23 
Hình 2.5. Ví dụ về nâng cao chất lượng  ảnh tài liệu ................................. 24 
Hình 2.6. Các dạng mặt nạ bộ lọc không gian trung bình .......................... 34 
Hình 2.7. Lọc trung vị ............................................................................... 36 
Hình 2.8. Lọc giả trung vị ......................................................................... 37 
Hình 2.9. Lọc ngoài .................................................................................. 37 
Hình 2.10. Mô hình hóa suy giảm do mờ ảnh ........................................... 38 
Hình 2.11. Biến đổi Hough [5] ................................................................. 44 
Hình 2.12. Phương pháp láng giềng gần nhất [5] ...................................... 47 
Hình 2.13. Phương pháp chiếu nghiêng[5] ................................................ 48 
Hình 3.1. Giao diện chương trình chính .................................................... 52 
Hình 3.2. Giao diện mô phỏng thao tác lọc nhiễu ..................................... 53 
Hình 3.3. Giao diện mô phỏng thao tác khử mờ ........................................ 54 
Hình 3.4. Giao diện mô phỏng thao tác bù nghiêng .................................. 55 
Hình 3.5. Minh họa khử mờ theo thuật toán lọc Wiener............................ 58 
Hình 3.6. Minh họa khử mờ theo thuật toán đầu thực mù ......................... 59 
 


 
 
 


vi 
DANH MỤC BẢNG BIỂU

 
Bảng 3.2. Các kết quả đối với các phương pháp lọc nhiễu ........................ 56 
Bảng 3.2. Các kết quả đối với các phương pháp khử mờ .......................... 57 
Bảng 3.3. Các kết quả đối với các phương pháp bù nghiêng ..................... 60 
 


 
 
 

vii 
DANH MỤC CÁC TỪ VIẾT TẮT

Từ hoặc

Từ tiếng Anh  

cụm từ  
COC 

Circle of Confusion  

DAS 

Document Analaysis System  Hệ thống phân tích văn bản 


DFT 

Discrete Fourier Transform 

Biến đổi Fourier rời rạc 

LTHD 

 

Lượng tử hóa đều 

MDF 

OCR 

 
 

Từ tiếng Việt  

Moving Distribution 
Function 
Optical Character 
Recognition 

Vòng tròn nhầm lẫn 

Hàm mật độ chuyển động 


Nhận dạng chữ in 

OTF 

Optical  Transfer Function 

Hàm truyền quang 

PSF 

Point Spread Function 

Hàm tán xạ điểm 


 
 
 


LỜI MỞ ĐẦU

1. Tính khoa học và cấp thiết của đề tài
Khả  năng  thị  giác  là  một  trong  những  đặc  điểm  thật  sự  vượt  trội  của 
chúng  sinh. Nó  cho  phép cảm  nhận và đồng  hóa  một  số lượng đáng  kinh ngạc 
kiến thức về thế giới xung quanh trong một khoảng thời gian ngắn. Có thể nói, 
thông tin hình ảnh là một phần không thể thiếu của xã hội thông tin hiện đại. 
Chính  vì  vậy,  việc  nâng  cao  hình  ảnh  kỹ  thuật  số  là  cần  thiết  trong 
nhiều lĩnh vực ứng dụng của hình ảnh. Nó làm cho con người có thể dễ dàng 

quan sát  và  máy  móc  có  thể  thực  thi  tốt  hơn  các  nhiệm  vụ  trích  chọn,  biên 
dịch và thực hiện các bài toán xử lý thông tin khác trên hình ảnh. 
Trên thực tế, rất nhiều tài liệu hình ảnh được chụp từ điện thoại, máy 
scan hoặc camera để phục vụ cho các nhiệm vụ lưu trữ tư liệu có chất lượng 
không tốt do nhiều nguyên nhân khác nhau như: kỹ năng của người chụp ảnh, 
giới hạn của thiết bị chụp ảnh, ánh sáng, nhiễu tác động, bản thân hiện vật bị 
mục nát… làm cho ảnh bị mờ, nhòe, mất thông tin. 
Xuất phát từ thực tế này, đã có rất nhiều công trình công bố tập trung 
vào phát triển các thuật toán xử lý ảnh số mà đặc biệt là nâng cao chất lượng 
ảnh tài liệu nhằm phục vụ cho các khâu nhận dạng, lưu trữ…Với sự đa dạng 
của  các  thuật  toán  này,  việc  phân  loại,  hiểu  rõ  nguyên  lý  và  khả  năng  ứng 
dụng của từng thuật toán là điều không dễ dàng. 
Vì những lý do trên, được sự hướng dẫn của Thầy giáo, PGS. TS. Ngô 
Quốc Tạo, tác giả lựa chọn đề tài luận văn tốt nghiệp tác giả đã chọn đề tài 
“Nghiên cứu các thuật toán nâng cao chất lượng ảnh số và ứng dụng trong
ảnh tài liệu”làm đề tài nghiên cứu luận văn tốt nghiệp thạc sĩ chuyên ngành 
Khoa học máy tính.  

 
 
 


 
 
 



2. Mục tiêu, đối tượng và phạm vi nghiên cứu của đề tài

Đề tài nhằm thực hiện hai mục tiêu sau:
-

Nghiên cứu tổng quan và đánh giá một số phương pháp tiêu biểu trong 
nâng cao chất lượng ảnh tài liệu như: Lọc nhiễu, bù nghiêng, giảm mờ. 

-

Sử  dụng  công  cụ  Matlab  cài  đặt  thử  nghiệm  mô  phỏng  một  số  thuật 
toán nâng cao chất lượng ảnh tài liệu. Đánh giá khả năng ứng dụng của 
các thuật toán trên thực tế. 
Chính vì vậy, đối tượng của luận văn là: Các thuật toán nâng cao chất

lượng ảnh tài liệu.  Luận  văn  sẽ  khảo  sát  và  đánh  giá  một  số  phương  pháp 
thường  dùng  trong  nâng  cao  chất  lượng  ảnh  số,  lựa  chọn  các  phương  pháp 
được cho là phù hợp nhất đối với việc nâng cao chất lượng ảnh tài liệu. Tập 
trung sâu vào cài đặt thử nghiệm một số phương pháp nhằm chứng minh tính 
đúng đắn và khả năng ứng dụng trong thực tế của thuật toán. 
3. Phương pháp luận nghiên cứu
-

Phương pháp nghiên cứu lý thuyết: Tổng hợp, nghiên cứu các tài liệu 
về  nâng  cao  chất  lượng  ảnh  số;  Tập  trung  sâu  vào  các  phương  pháp, 
thuật toán nâng cao chất lượng ảnh tài liệu; Tìm hiểu các kiến thức liên 
quan. 

-

Phương pháp nghiên cứu thực nghiệm: Sau khi nghiên cứu lý thuyết, 
phát  biểu  bài  toán,  đưa  ra  giải  pháp  xử  lý;  Mô  phỏng  thử  nghiệm 

chương trình trên phần mềm Matlab; Đánh giá các kết quả đạt được. 

-

Phương pháp trao đổi khoa học: Thảo luận, xemina, lấy ý kiến chuyên gia. 

4. Nội dung và bố cục của luận văn
 Chương 1: Tổng quan về nâng cao chất lượng ảnh số

 
 
 


 
 
 


-

Giới thiệu một số phương pháp nâng cao chất lượng ảnh số và các ứng 
dụng trong thực tế. 

 Chương 2: Các kỹ thuật nâng cao chất lượng ảnh tài liệu
-

Nghiên cứu về ảnh tài liệu và các phương pháp xử lý ảnh tài liệu. Bao 
gồm  các  kỹ  thuật  trên  miền  không  gian,  tần  số  như:  Lọc  nhiễu,  bù 
nghiêng, giảm mờ nhằm nâng cao chất lượng ảnh tài liệu. 


 Chương 3: Cài đặt thử nghiệm một số thuật toán nâng cao chất lượng
ảnh tài liệu
-

Cài  đặt  chương  trình  phần  mềm  thử  nghiệm  mô  phỏng  một  số  thuật 
toán  nâng  cao  chất lượng  ảnh  tài liệu như:  Giảm  nhiễu  (nhiễu  Gauss, 
nhiễu muối tiêu, nhiễu lốm đốm), lọc mờ (thuật toán Lucy-Richardson, 
thuật  toán  Blind  Deconvolution,  lọc  Wiener),  bù  nghiêng  (dùng  biến 
đổi  Hough,  dùng  phương  pháp  láng  giềng  gần  nhất,  sử  dụng  chiếu 
nghiêng). Đánh giá khả năng ứng dụng của các thuật toán trên thực tế. 

 

 
 
 


 
 
 


1

Chương 1. TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG ẢNH SỐ

 


Ảnh tài liệu cũng là một đối tượng của xử lý ảnh số. Chính vì vậy, nội 

dung chương này nhằm tổng kết lại các kiến thức nền tảng về nâng cao chất 
lượng ảnh số, tạo cơ sở cho việc phân tích các thuật toán nâng cao chất lượng 
ảnh  tài  liệu  được  lựa  chọn  trong  chương  2.  Phần  đầu  chương  sẽ  giới  thiệu 
tổng quan về xử lý ảnh số, phần tiếp theo tập trung vào các thuật toán nâng 
cao  chất  lượng  ảnh  phổ  biến  (bao  gồm  tăng  cường  ảnh  và  khôi  phục  ảnh). 
Cuối cùng là một số ứng dụng cơ bản của nâng cao chất lượng ảnh số. 
1.1. Tổng quan xử lý ảnh số
1.1.1. Tổng quan về một hệ thống xử lý ảnh
Xử  lý  ảnh  là  đối  tượng  nghiên  cứu  của  lĩnh  vực  thị  giác  máy,  là  quá 
trình biến đổi từ một ảnh ban đầu sang một ảnh mới với các đặc tính và tuân 
theo ý  muốn của người sử dụng. Xử lý ảnh có thể gồm quá trình phân tích, 
phân  lớp  các  đối  tượng,  làm  tăng  chất  lượng,  phân  đoạn  và  tách  cạnh,  gán 
nhãn cho vùng hay quá trình biên dịch các thông tin hình ảnh của ảnh.  
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của 
tin học ứng dụng. Xử lý dữ liệu bằng đồ hoạ đề cập đến những ảnh nhân tạo, 
các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các 
chương trình. Xử lý ảnh số bao gồm các phương pháp và kĩ thuật để biến đổi, 
để truyền tải hoặc mã hoá các ảnh tự nhiên. Mục đích của xử lý ảnh gồm:  
-

Biến đổi ảnh, làm tăng chất lượng ảnh.  

-

Tự động nhận dạng, đoán nhận, đánh giá các nội dung của ảnh.  
Các bước cần thiết trong xử lý ảnh được mô tả chi tiết trong Hình 1.1 

bao gồm các bước sau:  


 
 
 


 
 
 



CAMERA  

 

 

 
Lưu trữ 

 
Thu nhận  
ảnh 

 
Số hóa 

 


Phân tích  
ảnh 

Nhận dạng  
ảnh 

 
SCANNER  

 
Lưu trữ 

Hệ Q.định 

 

 

Hình 1.1. Các giai đoạn chính trong xử lý ảnh 
Đầu  tiên  là  quá  trình  thu  nhận  ảnh.  Ảnh  có  thể  thu  nhận  được  qua 
camera.  Thường  khi  thu  nhận  ảnh  qua  camera  là  tín  hiệu  tương  tự  (loại 
camera  ống  kiểu  CCIR),  nhưng  cũng  có  thể  là  tín  hiệu  số  hóa  (loại  CCD- 
Charge Coupled Device). Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm 
ứng (sensor), hay ảnh tranh được quét trên scanner. Tiếp theo là quá trình số 
hóa (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) 
và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử lý, phân tích 
hay lưu trữ lại. Trước hết là công việc tăng cường ảnh để nâng cao chất lượng 
ảnh. Do những nguyên nhân khác nhau: có thể do chất lượng thiết bị thu nhận 
ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến do vậy cần phải tăng 
cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay 

làm cho ảnh gần giống nhất với trạng thái gốc – trạng thái trước khi bị biến 
dạng. Giai đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh, 
trích chọn các đặc tính...v.v...  
Cuối cùng tùy theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng, 
phân lớp hay các quyết định khác.   

 
 
 


 
 
 



1.1.2. Một số khái niệm cơ bản trong xử lý ảnh
 Ảnh số 
Ảnh trắng đen thực chất là một hàm hai chiều của cường độ sángf(x,y), 
trong đó x và y là các toạ độ không gian và giá trị của hàm f tại một điểm (x,y) 
tỷ lệ với cường độ sáng của ảnh tại điểm đó. Nếu chúng ta có một ảnh mầu thì 
flà một vector mà mỗi thành phần của vector đó chỉ ra cường độ sáng của ảnh 
tại điểm (x,y) đó tương ứng với dải mầu. 
Để đơn giản ở đây ta chỉ xét đến ảnh số. Một ảnh số là một ảnh mà hàm 
f(x,y) của nó đã được rời rạc hoá theo cả toạ độ không gian và cường độ sáng 
của nó. Ảnh trắng đen thì nó được biểu diễn theo một mảng hai chiều còn ảnh 
mầu  được  biểu  diễn  theo  một  chuỗi  các  mảng  hai  chiều  mà  mỗi  mảng  hai 
chiều đó tương ứng với một dải mầu. Giá trị cường độ sáng đã được số hoá 
được gọi là giá trị mức xám[2]. 

Mỗi  thành  phần  của  mảng  được  gọi  là  một  điểm  ảnh  (pixel:  picture 
element) và là phần tử nhỏ nhất cấu tạo nên ảnh. Điểm ảnh được hiểu như 1 
dấu hiệu hay cường độ sáng tại một tọa độ xác định trong không gian. Hình 
ảnh được xem như là 1 tập hợp các điểm. Với cùng kích thước nếu sử dụng 
càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và càng thể hiện rõ hơn 
chi tiết của ảnh người ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ 
phân giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và đặc trưng của mỗi ảnh 
cụ thể, trên cơ sở đó các ảnh thường được biểu diễn theo 2 mô hình cơ bản là 
raster và vector.  
Mô hình Raster cách biểu diễn ảnh thông dụng nhất hiện nay, ảnh được 
biểu  diễn  dưới  dạng  ma  trận  các  điểm  ảnh  thu  nhận  qua  các  thiết  bị  như 
camera, scanner. Tuỳ theo yêu cầu thực thế mà mỗi điểm ảnh được biểu diễn 
qua 1 hay nhiều bit. Mô hình Raster thuận lợi cho hiển thị và in ấn. Ngày nay 

 
 
 


 
 
 



công nghệ phần cứng  cung cấp  những thiết  bị thu nhận ảnh Raster phù hợp 
với tốc độ nhanh và chất lượng cao cho cả đầu vào và đầu ra.  
Mô hình Vector là kiểu biểu diễn ảnh ngoài mục đích tiết kiệm không 
gian lưu trữ dễ dàng cho hiển thị và in ấn còn đảm bảo dễ dàng trong lựa chọn 
sao  chép  di  chuyển  tìm  kiếm…  Trong  mô  hình  Vector  người  ta  sử  dụng 

hướng giữa các Vector  của  điểm ảnh  lân cận  để  mã  hoá và tái  tạo hình ảnh 
ban  đầu  ảnh  Vector  được  thu  nhận  trực  tiếp  từ  các  thiết  bị  số  hoặc  được 
chuyển đổi từ ảnh Raster thông qua các thuật toán.  
 Cường độ sáng của một ảnh tại một ví trí điểm ảnh 
Mỗi điểm ảnh của một ảnh tương ứng với một phần của một đối tượng 
vật lý  tồn tại  trong thế giới  thực. Đối tượng vật  lý  này được chiếu sáng bởi 
một vài tia sáng mà tia sáng này bị phản xạ một phần hay hấp thụ một phần 
khi chiếu lên đối tượng vật lý đó. Phần ánh sáng phản xạ lại đi tới các bộ cảm 
biến được sử dụng để tạo ảnh cảm nhậnvà tạo ra các giá trị ghi nhận được đối 
tượng  đối với  từng điểm  ảnh.  Giá  trị thu nhận  được phụ thuộc vào  phổ  ánh 
sáng  phản  xạ.  Giá  trị  cường  độ  sáng  của  các  điểm  ảnh  khác  nhau  chỉ  có  ý 
nghĩa tương đối mà không có ý nghĩa trong các toán hạng tuyệt đối[12]. 
 Số bits cần thiết để lưu trữ một ảnh 
Ở đây chúng ta chỉ quan tâm tới ảnh xám, nếu ảnh được lưu trữ dưới 
dạng một mảng hai chiều với kích thước NxN và có 2m mức xám thì số bits 
cần thiết để lưu trữ ảnh là: 
b  N  x  N  x  2 m  

(1.1) 

Ví dụ như, một ảnh cỡ 512 x 512 với 256 (tức m=8) mức xám thì cần 
số bits lưu trữ là: 512 x 512 x 256=2.097.152 bits. 
 Độ phân giải ảnh 

 
 
 


 

 
 


Độ phân giải ảnh biểu diễn mức độ chi tiết của ảnh mà chúng ta có thể 

nhìn rõ đối tượng. Khi thay đổi các giá trị m và N trong phương trình (1.1)thì 
sẽ có các hiện tượng thay đổi khác nhau. Xong thực nghiệm cho thấy khi giữ 
nguyên kích thước ảnhN và tăng số mức xám mlên thì sẽ thể hiện rõ hơn mức 
độ chi tiết trong ảnh. 
1.1.3. Nguyên tắc thực hiện xử lý ảnh
Chúng ta biết thực hiện xử lý ảnh thông qua việc sử dụng hàm biến đổi 
ảnh. Biến đổi ảnh là quá trình thực hiện thông qua các toán tử. Một toán tử 
thực hiện lấy một ảnh vào đầu vào của hệ thống và tạo ra một ảnh khác theo 
yêu cầu xử lý. Để thực hiện quá trình biến đổi ảnh chúng ta chủ yếu quan tâm 
tới các toán tử tuyến tính. 
Giả sử O(f) là toán tử O của một ảnh f thì toán tử O được gọi là tuyến 
tính nếu ta có[3]: 
O  af  bg    aO  f   bO  g   

(1.2) 

Với mọi f, g và a, b. 
Trong xử lý ảnh thì các toán tử được định nghĩa là hàm trải điểm. Một 
hàm trải điểm của một toán tử là kết quả mà chúng ta thu nhận được sau khi 
thực  hiện  cung  cấp  luật  của  toán  đó  cho  nguồn  điểm:O[nguồn điểm]= hàm
trải điểm 
Hay chúng ta có: 
O   x   , y         h  x,  , y,    


(1.3) 

Trong  đó  δ(x-α,y-β)  là  nguồn  điểm  có  cường  độ  sáng  bằng  1  đặt  tại 
điểm (α,β). 
 Và nếu toán tử là tuyến tính thì ta có: 
 
 
 


 
 
 



O  a  x   , y         ah  x,  , y,    

(1.4) 

Tức nếu tăng cường độ sáng lên a lần thì kết quả thu được cũng tăng 
lên a lần. 
1.1.4. Một số thao tác cơ bản trong xử lý ảnh


Biểu diễn ảnh
Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của 

ảnh là pixel. Nhìn chung có thể một hàm hai biến chứa các thông tin như biểu 
diễn  của  một  ảnh.  Các  mô  hình  biểu  diễn  cho  ta  một  mô  tả  logic  hay  định 

lượng  các  tính  chất  của  hàm  này.  Trong  biểu  diễn  ảnh  cần  chú  ý  đến  tính 
trung thực hoặc các tiêu chuẩn “thông minh” để đo chất lượng ảnh hoặc tính 
hiệu quả của các kĩ thuật xử lý.  
Một  số  mô  hình  thường  được  dùng  trong  biểu  diễn  ảnh:  mô  hình  bài 
toán, mô hình thống kê. Trong mô hình bài toán, ảnh hai chiều được biểu diễn 
nhờ các hàm hai biến trực giao gọi là các hàm cơ sở. Còn mô hình thống kê, 
một  ảnh  được  coi  như  một  phần  tử  của  một  tập  hợp  đặc  trưng  bởi  các  đại 
lượng như: kỳ vọng toán học, hiệp biến, phương sai, moment.  


Biến đổi ảnh (Image Transform)
Thuật ngữ biến đổi ảnh thường dùng để nói tới một lớp các ma trận đơn 

vị và các kĩ thuật dùng để biến đổi ảnh.  
Biến  đổi  ảnh  nhằm  làm  giảm  các  nguyên  nhân  của  ảnh để việc  xử lý 
hiệu quả hơn. Như làm rõ hơn các thông tin mà ngời dùng quan tâm nhưng 
người dùng phải chấp nhận mất đi một số thông tin cần thiết.   


Phân tích ảnh
Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của 1 

ảnh để đưa ra một mô tả đầy đủ về ảnh.  
 
 
 


 
 

 

10 
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước 

hết là  công việc  tăng cường ảnh để nâng cao chất lượng ảnh, giai đoạn tiếp 
theo là phát hiện các đặc tính như phát hiện biên, phân vùng ảnh, trích chọn 
các đặc tính..v.v..  


Tăng cường ảnh – khôi phục ảnh
Tăng cường ảnh là một bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó 

gồm các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu…  
Khôi phục ảnh là nhằm loại bỏ các suy giảm trong ảnh.  


Xử lý biên ảnh
Biên là vấn đề chủ yếu trong phân tích ảnh vì các điểm trích chọn trong 

quá trình phân tích ảnh đều dựa vào biên. Mỗi điểm ảnh có thể là biên nếu ở 
đó có sự thay đổi đột ngột về mức xám. Tập hợp các điểm biên tạo thành biên 
hay đường bao quanh của ảnh.  


Phân vùng ảnh
Phân vùng là bước then chốt trong xử lý ảnh. Giai đoạn này nhằm phân 

tích ảnh thành những thành phần có tính chất nào đó dựa theo biên hay các 
vùng  liên  thông.  Tiêu chuẩn để xác định các vùng liên thông có  thể là  mức 

xám, cùng màu hay độ tương phản.  


Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người 

ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các 
đặc tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:   
Mô tả tham số (nhận dạng theo tham số).  
Mô tả theo cấu trúc (nhận dạng theo cấu trúc).  

 
 
 


 
 
 

11 
Trên  thực  tế người  ta  đã  áp  dụng kỹ  thuật nhận dạng  khá  thành  công 

với  nhiều  đối tượng khác  nhau  như: nhận dạng ảnh  vân tay, nhận dạng chữ 
viết.  


Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi 


trên mạng mà lượng thông tin để biểu diễn cho một ảnh là rất lớn. Do đó làm 
giảm lượng thông tin hay nén dữ liệu là một nhu cầu cần thiết.   
Nén dữ liệu là quá trình làm giảm lượng thông tin “ dư thừa”  trong dữ 
liệu gốc và do vậy lượng thông tin thu được sau khi nén thường nhỏ hơn dữ 
liệu gốc rất nhiều.   
1.2. Nâng cao chất lượng ảnh
Thực chất của quá trình xử lý ảnh có thể thực hiện theo sơ đồ khối sau 
(Hình 1.2) 

Thu 
nhận ảnh 

Số 
hoá 

Nâng
cao chất
lượng
ảnh

Phân 
tích ảnh 

Nhận 
dạng 
ảnh 

 

Hình 1.2. Sơ đồ khối các bước trong quá trình xử lý ảnh

Nâng cao chất lượng ảnh là một bước quan trọng, nó là tiền đề cho xử 
lý ảnh. Mục đích chính là nhằm làm nổi bật một số đặc tính ảnh như độ tương 
phản, lọc nhiễu, nổi mầu, làm trơn ảnh, khuếch đại ảnh...[2], [3]. 
Có  2  phương  pháp  chính  đó  là:  nâng  cao  chất  lượng  ảnh  trong  miền 
không gian và tần số.  
 Nâng cao chất lượng ảnh trong miền không gian
Ta  tác  động  trực  tiếp  lên  các  điểm  ảnh.  Cường  độ  của  các  điểm  ảnh 
được tính một các đơn giản qua công thức sau:  
 
 
 


 
 
 

12 
g  x , y   T  f  x , y    

(1.5) 

Trong đó f(x,y) là ảnh đầu vào, g(x,y) là ảnh đầu ra và T là thuật toán 
tác động lên f(x,y). 
 Nâng cao chất lượng hình ảnh trong miền tần số:
Ta dựa trên việc tác động biến đổi Fourier của hình ảnh. Trước tiên ảnh 
sẽ  được  biến  đổi  về  miền  tần  số,  sau  đó  thông  qua  các  thuật  toán  ta  sẽ  tác 
động  đến  hàm  truyền  F  của  hình  ảnh.  Cuối  cùng,  ta  sẽ  dùng  biến  đổi 
Fourierngược để biến hàm truyền thành hình ảnh đầu ra.   
Các  thuật  toán  nâng  cao  chất  lượng  hình  ảnh  được  thực  hiện  để  điều 

chỉnh độ sáng hình ảnh, độ tương phản hoặc phân phối các mức xám. Trong 
miền tần số thì khái niệm về lọc thì dễ dàng hơn để hình dung. Vì vậy, nâng 
cao chất lượng hình ảnh của f(x,y) có thể được thực hiện trong  miền tần số, 
dựa trên DFT của F(u, v). Trong miền tần số nâng cao hình ảnh có thể được 
thực hiện như sau:  
-

Tính toán F(u, v), DFT của hình ảnh đầu vào.  

-

Nhân F(u, v) với một hàm lọc H(u, v) 

-

G(u, v) = H(u,v) F(u, v).

-

Tính ngược DFT của kết quả bằng cách áp dụng Fourier biến đổi ngược.  

-

Tìm được phần thực của biến đổi ngượcDFT. 

Trong  đó  G(u,v)  là  ảnh  đầu  ra,  F(u,v)  là  ảnh  đầu  vào  và  H(u,v)  là  hàm 
truyền.  
Việc  nâng  cao  chất  lượng  ảnh  có  thể  là  tăng cường ảnh  hoặc  là  khôi
phục ảnh tùy theo mục đích. Phần tiếp sau đây sẽ giới thiệu một số kỹ thuật 
tăng cường ảnh và khôi phục ảnh. 


 
 
 


 
 
 

13 

1.2.1. Tăng cường ảnh
Tăng cường ảnh là việc cải tiến ảnh sao cho nó thể hiện rõ được các đặc 
trưng  của  ảnh,  như  là  điều  khiển  mức  xám,  độ  tương  phản  ảnh,  giảm 
nhiễu…tùy vào yêu cầu mong muốn. Song có thể chỉ ra một số vấn đề quan 
trọng đó là: biến đổi mức xám của ảnh, lọc nhiễu và biến đổi độ chói[6], [8]. 
1.2.1.1. Tăng cường ảnh sử dụng biến đổi mức xám đồ
 Mức xám đồ
Mức xám đồ của một ảnh xám là lược đồ biểu diễn tần suất xuất hiện 
của mỗi mức xám tức mức xám đồ của một hình ảnh là một hàm rời rạc. Lược 
đồ này được biểu diễn theo trục tọa độ (x,y). Trục hoành biểu diễn các  mức 
xám từ 0-255, còn trụctungbiểu diễn số lượng điểm ảnh tương ứng với  mức 
xám trên trục hoành. 
Như vậy ta có mối quan hệ:y = f(x) = số điểm ảnh có cùng mức xám x 
Khi hàm được chuẩn hóa mà tổng của các mức xám là 1 thì hàm có thể 
được coi là một hàm mật độ. Đưa ra giá trị mức xám được tìm thấy trong ảnh. 
Theo đó thì giá trị mức xám là một giá trị ngẫu nhiên.  
y       p ( x)       


h( x)

     L thông thường bằng 256 

L 1

 h (i )

(1.6) 

i0

Như  vậy  mức xám  đồ cung cấp thông  tin về  mức xám  của ảnh, nó  là 
một công cụ hữu hiệu trong nhiều giai đoạn của quá trình xử lý ảnh. 
 Biến đổi mức xám đồ
Mức xám đồ biểu diễn cho một ảnh càng rộng càng tốt. Nếu coi x là giá 
trị mức xám của ảnh gốc và giá trị mức xám ảnh mới là s: 
s    T  x   

 
 
 

(1.7) 


 
 
 


14 
T: được gọi là hàm biến đổi mức xám. 

 Một số biện pháp tăng cường ảnh bằng biến đổi mức xám đồ
­ San bằng mức xám đồ:
 u

v       LTHD     f (u )        LTHD         p( x)          x  0,1,...,  u  
 x 0


(1.8) 

Với  p(x)  là  hàm  mức  xám  đồ  kiểu  tỷ  lệ,  còn  LTHD  là  phép  lượng  tử 
hóa đềugiá trị của f(u) sang các giá trị mức xám từ 0 – L-1. Sử dụng hàm lấy 
mẫu phần nguyên Int có thể có LTHD như sau: 
 x - xmin

LTHD     x         Int 
( L  1)  0, 5     với  x     f (u )  
 1- xmin


(1.9) 

­ Biến đổi phi tuyến mức xám:
  Trước khi thực hiện LTHD người ta sử dụng phi tuyến hàm f(u) biến 
đổi mức xám u. Có thể có các dạng hàm f(u) như sau: 
1.2.1.2. Giảm nhiễu sử dụng các loại bộ lọc
 Nhiễu

Nhiễu  có  nhiều  loại  nhưng  có  thể  chia  thành  hai  loại  nhiễu  chính  là 
nhiễu cộng và nhiễu nhân.Ví dụ, nhiễu nhân như là biến số độ rọi, còn nhiễu 
cộng thường là nhiễu xung, nhiễu Gaussian.                  
Nhiễu  xung  thay  đổi  ngẫu  nhiên  giá  trị  của  một  vài  điểm  ảnh.  Nhiễu 
Gaussian zero-mean là giá trị zero-mean Gauss có thể được thêm vào giá trị 
thực của mọi điểm ảnh. 
Hoặc ta có thể phân ra các loại nhiễu sau đây: 
 Nhiễu do thiết bị thu nhận ảnh 
 Nhiễu ngẫu nhiên độc lập 
 
 
 


 
 
 

15 
 Nhiễu do vật quan sát 
Thường người ta xấp xỉ các loại nhiễu bằng các quá trình tuyến tính bất 

biến  vì có  nhiều  công  cụ  tuyến  tính  có thể giải quyết  vấn  đề  phôi  phục  ảnh 
cũng như tăng cường ảnh hơn so với phi tuyến và hơn nữa còn cho phép xử lý 
dễ dàng hơn trên máy tính.  
Từ các vấn đề trên ta có thể xây dựng các loại bộ lọc triệt nhiễu sau: 
 Triệt nhiễu bằng phương pháp lọc không gian
Trường hợp khi ảnh chỉ chịu tác động của nhiễu cộng, các phương pháp 
lọc nhiễu trong không gian thường cho kết quả khôi phục ảnh tốt nhất. Một số 
phương pháp lọc trong không gian cụ thể sẽ được đề cập đến trong chương 2 

như là các biện pháp nâng cao chất lượng ảnh tài liệu.  
 Triệt nhiễu trong miền tần số
Các bộ lọc trong miền không gian đề cập tới ở các phần trên là các bộ 
lọc thông thấp hoặc thông cao. Lọc không gian có thể được sử dụng để khôi 
phục ảnh có nhiễu hoặc để làm tăng chất lượng ảnh. Tuy nhiên, để khôi phục 
ảnh có nhiễu tuần hoàn này chúng ta phải xử lý ảnh trong miền tần số: đó là 
sử dụng một số bộ lọc dải, bộ lọc chặn dải. 
1.2.1.3. Tăng cường ảnh kém chất lượng về biến độ chói
Đây  là  vấn  đề  có  thể  được  giải  quyết  nếu  chúng  ta  thấy  rõ  hàm  ảnh 
f(x,y) là  tích  của  hai  thừa  số: hàm  độ chói  i(x,y)  và  hàm  phản xạ r(x,y),  bản 
chất là bề mặt ảnh: 
f  x, y      i  x, y  r  x, y         

(1.10) 

Độ chói thông thường tự nhiên từ thành phần tần số thấp trong biến đổi 
Fourier của hình ảnh. Việc thay đổi độ sắc nét được liên kết với thành phần 
tần số cao. Chúng ta có thể cố gắng phân tán hai nhân tố bằng việc lấy loga 
 
 
 


 
 
 

16 

hai vế của phương trình 

hai vế của phương trình (1.10)trên. Khi đó nhiễu trở thành nhiễu cộng và  ta 
Khi đó nhiễu trở thành nhiễu cộng và  ta 
sẽ được một hàm đơn giản hơn
sẽ được một hàm đơn giản hơn: 
ln  f  x, y       ln i  x, y       ln  r ( x, y)    

(1.11) 

Chúng ta sẽ lọc hàm 
húng ta sẽ  lọc  hàm ln[] của hình ảnh này 
của hình  ảnh này  sử dụng bộ lọc đồng hình 
sử  dụng bộ lọc đồng hình 
(homomorphic). Bộ lọc này sẽ tăng cường miền tần số cao và triệt tiêu miền 
Bộ lọc này sẽ tăng cường miền tần số cao và triệt tiêu miền 
tần số thấp để sự biến thiên của độ chói đư
tần số thấp để sự biến thiên của độ chói được giảm trong khi đường biên là sắc 
ợc giảm trong khi đường biên là sắc 
nét hơn. Tiếp đó, sử dụng các bộ lọc 
sử dụng các bộ lọc (lọc trung bình, lọc thông thấp
lọc thông thấp) để loại bỏ 
nhiễu cộng, cuối cùng sử dụng dạng e mũ để đưa 
sử dụng dạng e mũ để đưa ảnh về dạng thông thường
về dạng thông thường.  
Sử dụng hàm chuyển đổi:
Sử dụng hàm chuyển đổi  
1

H  x,   y    
1 e


 s ( x2  y2 0 )

 A 

(1.12) 

Trong  đó:  s=
= 1, ω0 = 128, A=10
A=10.  Các  thông  số  của  bộ  lọc  liên  quan 
đến các thông số ГH và 
và ГL. 
ГH = 1+A
1.2.2. Khôi phục ảnh

ГL   

 

  
f  ( x,  y )

f ( x,  y )

 

1
A
1  e s0

 

 
 

  

 

Hình 1.3. Mô hình quá trình làm méo và khôi phục
ph ảnh
 

 

Khôi phục ảnh là quá trình lo
à quá trình loại bỏ hay tối thiểu hóa các ảnh h
ại bỏ hay tối thiểu hóa các ảnh hưởng của 
môi  trường  bên 
ên  ngoài  đến 
đ ảnh  thu  nhận  được.  Các  nguyên 
ên  nhân  dẫn 
d tới  sự 
biến dạng (méo) ảnh có thể l
ến dạng (méo) ảnh có thể là: nhiễu tại bộ biến đổi quang-điện, 
ện, méo do hệ 
méo do hệ 
 


 
 

 

17 

thống  ống  kính  quang  học  gây  ra,  nhiễu  không  gian  ảnh  hưởng  tới  tín  hiệu 
trong quá trình truyền qua đường truyền, nhiễu công nghiệp tác động trực tiếp 
tới tín hiệu hình ảnh v.v. Hình 1.3mô tả quá trình làmméo và khôi phục ảnh. 
Trong  mô  hình  này,  ảnh  gốc  f (x, y)  chịu  tác  động  của  toán  tử  làm  méo  H, 
được đặc trưng bởi hàm đáp ứng xung h(x, y) và nhiễu cộng η(x, y). Dựa trên 
h(x, y)và  η(x, y),  chúng ta  phải  tìm  ra  phương  pháp  khôi  phục  ảnh,  sao  cho 
ảnh ra f(x, y) giống với ảnh vào nhất[6].  
Nếu H là toán tử tuyến tính và bất biến, thì ảnh bị nhiễu g(x, y) có dạng 
như sau:  
g  x ,   y     H f    x ,  y     x ,  y     h  x ,   y   f    x ,  y     x ,   y   

(1.13) 

h(x, y) - hàm đáp ứng đặc trưng cho toán tử H trong không gian.  
Trong miền tần số, dựa trên tính chất của biến đổi Fourier ta có:  
G  u, v      H  u, v   F  u, v    N  u, v    

(1.14) 

với G(u,v),H (u,v),F(u,v),N(u,v) là kết quả biến đổi Fourie của các hàm 
tương ứng. 
Để khôi phục ảnh ta phải sử dụng một số phương pháp như: khôi phục 
hình học, lọc ảnh bằng bộ lọc không gian, khử nhiễu bằng các bộ lọc tần số 
thích nghi với nguồn nhiễu v.v. 
1.3. Một số ứng dụng của nâng cao chất lượng ảnh
Trong pháp y, nâng cao chất lượng hình ảnh được sử dụng để xác định, 

thu thập chứng cứ và giám định. Hình ảnh thu được từ phát hiện dấu vân tay, 
video  an  ninh  phân  tích  và  điều  tra  hiện  trường  vụ  án  được  tăng  cường  để 
giúp đỡ trong việc xác định thủ phạm và bảo vệ nạn nhân [13]. 

 
 
 


×