ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
LÊ NHƯ TÙNG
NGHIÊN CỨU CÁC THUẬT TOÁN NÂNG CAO CHẤT LƯỢNG
ẢNH SỐ VÀ ỨNG DỤNG TRONG ẢNH TÀI LIỆU
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS. TS. NGÔ QUỐC TẠO
THÁI NGUYÊN, 2016
i
LỜI CAM ĐOAN
Tên tôi là: Lê Như Tùng
Sinh ngày: 29/3/1980
Học viên lớp cao học CHK13 - Trường Đại học Công nghệ thông tin và
Truyền thông – Đại học Thái Nguyên.
Hiện đang công tác tại: Xã Đồng Cốc, huyện Lục Ngạn, tỉnh Bắc Giang.
Xin cam đoan: Đề tài “Nghiên cứu các thuật toán nâng cao chất
lượng ảnh số và ứng dụng trong ảnh tài liệu” do Thầy giáo PGS.TS. Ngô
Quốc Tạo hướng dẫn là công trình nghiên cứu của riêng tôi. Tất cả tài liệu
tham khảo đều có nguồn gốc, xuất xứ rõ ràng.
Tác giả xin cam đoan tất cả những nội dung trong luận văn đúng như
nội dung trong đề cương và yêu cầu của thầy giáo hướng dẫn. Nếu sai tôi
hoàn toàn chịu trách nhiệm trước hội đồng khoa học và trước pháp luật.
Thái Nguyên, ngày 22 tháng 6 năm 2016
NGƯỜI CAM ĐOAN
Lê Như Tùng
ii
LỜI CẢM ƠN
Sau một thời gian nghiên cứu và làm việc nghiêm túc, được sự động
viên, giúp đỡ và hướng dẫn tận tình của Thầy giáo hướng dẫn PGS.TS. Ngô
Quốc Tạo, luận văn với đề tài “Nghiên cứu các thuật toán nâng cao chất
lượng ảnh số và ứng dụng trong ảnh tài liệu” đã hoàn thành.
Tôi xin bày tỏ lòng biết ơn sâu sắc đến:
Thầy giáo hướng dẫn PGS.TS. Ngô Quốc Tạo đã tận tình chỉ dẫn, giúp
đỡ tôi hoàn thành luận văn này.
Đề tài “Hệ thống đeo tay hỗ trợ đọc sách tiếng Việt dành cho người
khiếm thị” Mã số VAST01.07/15-16 hỗ trợ trong thực hiện luận văn.
Khoa sau Đại học Trường Đại học Công nghệ thông tin và truyền thông
đã giúp đỡ tôi trong quá trình học tập cũng như thực hiện luận văn.
Tôi xin chân thành cảm ơn bạn bè, đồng nghiệp và gia đình đã động
viên, khích lệ, tạo điều kiện giúp đỡ tôi trong suốt quá trình học tập, thực hiện
và hoàn thành luận văn này.
TÁC GIẢ LUẬN VĂN
Lê Như Tùng
iii
MỤC LỤC
LỜI CAM ĐOAN ........................................................................................... i
LỜI CẢM ƠN ................................................................................................ ii
MỤC LỤC .................................................................................................... iii
DANH MỤC CÁC HÌNH ẢNH ..................................................................... v
DANH MỤC BẢNG BIỂU ........................................................................... vi
DANH MỤC CÁC TỪ VIẾT TẮT .............................................................. vii
LỜI MỞ ĐẦU ................................................................................................ 1
1. Tính khoa học và cấp thiết của đề tài ...................................................... 1
2. Mục tiêu, đối tượng và phạm vi nghiên cứu của đề tài ............................ 2
3. Phương pháp luận nghiên cứu ................................................................. 2
4. Nội dung và bố cục của luận văn ............................................................ 2
CHƯƠNG 1. TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG ẢNH SỐ ..... 4
1.1. Tổng quan xử lý ảnh số ........................................................................ 4
1.1.1. Tổng quan về một hệ thống xử lý ảnh............................................ 4
1.1.2. Một số khái niệm cơ bản trong xử lý ảnh ....................................... 6
1.1.3. Nguyên tắc thực hiện xử lý ảnh ..................................................... 8
1.1.4. Một số thao tác cơ bản trong xử lý ảnh .......................................... 9
1.2. Nâng cao chất lượng ảnh .................................................................... 11
1.2.1. Tăng cường ảnh ........................................................................... 13
1.2.2. Khôi phục ảnh ............................................................................. 16
1.3. Một số ứng dụng của nâng cao chất lượng ảnh................................... 17
1.4. Kết luận chương ................................................................................. 19
CHƯƠNG 2. CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG ẢNH TÀI
LIỆU ............................................................................................................ 20
2.1.1 Ảnh tài liệu ................................................................................... 20
2.2.2. Xử lý ảnh tài liệu ......................................................................... 21
iv
2.2.3. Nâng cao chất lượng ảnh tài liệu ................................................. 23
2.2. Cập nhật một số kết quả nghiên cứu tiêu biểu gần đây về nâng cao chất
lượng ảnh tài liệu ...................................................................................... 26
2.3. Phân tích một số thuật toán tiêu biểu trong nâng cao chất lượng hình ảnh 28
2.3.1. Các loại nhiễu thường gặp ........................................................... 28
2.3.2. Các thuật toán lọc nhiễu .............................................................. 33
2.3.2. Các thuật toán khử mờ ảnh .......................................................... 38
2.3.3. Các thuật toán chỉnh nghiêng ảnh tài liệu .................................... 42
2.4. Kết luận chương ................................................................................. 50
CHƯƠNG 3 CÀI ĐẶT THỬ NGHIỆM MỘT SỐ THUẬT TOÁN NÂNG
CAO CHẤT LƯỢNG ẢNH TÀI LIỆU ........................................................ 51
3.1. Đặt vấn đề .......................................................................................... 51
3.2. Lựa chọn một số thuật toán nâng cao chất lượng ảnh tài liệu ............. 51
3.3. Xây dựng chương trình thử nghiệm ................................................... 52
3.4. Đánh giá hiệu quả của một số thuật toán nâng cao chất lượng ảnh tài
liệu............................................................................................................ 56
3.5. Kết luận chương ................................................................................. 60
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI ............................. 62
TÀI LIỆU THAM KHẢO ............................................................................ 64
v
DANH MỤC CÁC HÌNH ẢNH
Hình 1.1. Các giai đoạn chính trong xử lý ảnh ............................................ 5
Hình 1.2. Sơ đồ khối các bước trong quá trình xử lý ảnh .......................... 11
Hình 1.3. Mô hình quá trình làm méo và khôi phục ảnh ........................... 16
Hình 2.1. Một số ảnh tài liệu trong cuộc sống ........................................... 20
Hình 2.2. Phân loại xử lý ảnh tài liệu ........................................................ 21
Hình 2.3. Các bước cơ bản trong xử lý ảnh tài liệu ................................... 22
Hình 2.4. Một số vấn đề đối với ảnh tài liệu ............................................. 23
Hình 2.5. Ví dụ về nâng cao chất lượng ảnh tài liệu ................................. 24
Hình 2.6. Các dạng mặt nạ bộ lọc không gian trung bình .......................... 34
Hình 2.7. Lọc trung vị ............................................................................... 36
Hình 2.8. Lọc giả trung vị ......................................................................... 37
Hình 2.9. Lọc ngoài .................................................................................. 37
Hình 2.10. Mô hình hóa suy giảm do mờ ảnh ........................................... 38
Hình 2.11. Biến đổi Hough [5] ................................................................. 44
Hình 2.12. Phương pháp láng giềng gần nhất [5] ...................................... 47
Hình 2.13. Phương pháp chiếu nghiêng[5] ................................................ 48
Hình 3.1. Giao diện chương trình chính .................................................... 52
Hình 3.2. Giao diện mô phỏng thao tác lọc nhiễu ..................................... 53
Hình 3.3. Giao diện mô phỏng thao tác khử mờ ........................................ 54
Hình 3.4. Giao diện mô phỏng thao tác bù nghiêng .................................. 55
Hình 3.5. Minh họa khử mờ theo thuật toán lọc Wiener............................ 58
Hình 3.6. Minh họa khử mờ theo thuật toán đầu thực mù ......................... 59
vi
DANH MỤC BẢNG BIỂU
Bảng 3.2. Các kết quả đối với các phương pháp lọc nhiễu ........................ 56
Bảng 3.2. Các kết quả đối với các phương pháp khử mờ .......................... 57
Bảng 3.3. Các kết quả đối với các phương pháp bù nghiêng ..................... 60
vii
DANH MỤC CÁC TỪ VIẾT TẮT
Từ hoặc
Từ tiếng Anh
cụm từ
COC
Circle of Confusion
DAS
Document Analaysis System Hệ thống phân tích văn bản
DFT
Discrete Fourier Transform
Biến đổi Fourier rời rạc
LTHD
Lượng tử hóa đều
MDF
OCR
Từ tiếng Việt
Moving Distribution
Function
Optical Character
Recognition
Vòng tròn nhầm lẫn
Hàm mật độ chuyển động
Nhận dạng chữ in
OTF
Optical Transfer Function
Hàm truyền quang
PSF
Point Spread Function
Hàm tán xạ điểm
1
LỜI MỞ ĐẦU
1. Tính khoa học và cấp thiết của đề tài
Khả năng thị giác là một trong những đặc điểm thật sự vượt trội của
chúng sinh. Nó cho phép cảm nhận và đồng hóa một số lượng đáng kinh ngạc
kiến thức về thế giới xung quanh trong một khoảng thời gian ngắn. Có thể nói,
thông tin hình ảnh là một phần không thể thiếu của xã hội thông tin hiện đại.
Chính vì vậy, việc nâng cao hình ảnh kỹ thuật số là cần thiết trong
nhiều lĩnh vực ứng dụng của hình ảnh. Nó làm cho con người có thể dễ dàng
quan sát và máy móc có thể thực thi tốt hơn các nhiệm vụ trích chọn, biên
dịch và thực hiện các bài toán xử lý thông tin khác trên hình ảnh.
Trên thực tế, rất nhiều tài liệu hình ảnh được chụp từ điện thoại, máy
scan hoặc camera để phục vụ cho các nhiệm vụ lưu trữ tư liệu có chất lượng
không tốt do nhiều nguyên nhân khác nhau như: kỹ năng của người chụp ảnh,
giới hạn của thiết bị chụp ảnh, ánh sáng, nhiễu tác động, bản thân hiện vật bị
mục nát… làm cho ảnh bị mờ, nhòe, mất thông tin.
Xuất phát từ thực tế này, đã có rất nhiều công trình công bố tập trung
vào phát triển các thuật toán xử lý ảnh số mà đặc biệt là nâng cao chất lượng
ảnh tài liệu nhằm phục vụ cho các khâu nhận dạng, lưu trữ…Với sự đa dạng
của các thuật toán này, việc phân loại, hiểu rõ nguyên lý và khả năng ứng
dụng của từng thuật toán là điều không dễ dàng.
Vì những lý do trên, được sự hướng dẫn của Thầy giáo, PGS. TS. Ngô
Quốc Tạo, tác giả lựa chọn đề tài luận văn tốt nghiệp tác giả đã chọn đề tài
“Nghiên cứu các thuật toán nâng cao chất lượng ảnh số và ứng dụng trong
ảnh tài liệu”làm đề tài nghiên cứu luận văn tốt nghiệp thạc sĩ chuyên ngành
Khoa học máy tính.
2
2. Mục tiêu, đối tượng và phạm vi nghiên cứu của đề tài
Đề tài nhằm thực hiện hai mục tiêu sau:
-
Nghiên cứu tổng quan và đánh giá một số phương pháp tiêu biểu trong
nâng cao chất lượng ảnh tài liệu như: Lọc nhiễu, bù nghiêng, giảm mờ.
-
Sử dụng công cụ Matlab cài đặt thử nghiệm mô phỏng một số thuật
toán nâng cao chất lượng ảnh tài liệu. Đánh giá khả năng ứng dụng của
các thuật toán trên thực tế.
Chính vì vậy, đối tượng của luận văn là: Các thuật toán nâng cao chất
lượng ảnh tài liệu. Luận văn sẽ khảo sát và đánh giá một số phương pháp
thường dùng trong nâng cao chất lượng ảnh số, lựa chọn các phương pháp
được cho là phù hợp nhất đối với việc nâng cao chất lượng ảnh tài liệu. Tập
trung sâu vào cài đặt thử nghiệm một số phương pháp nhằm chứng minh tính
đúng đắn và khả năng ứng dụng trong thực tế của thuật toán.
3. Phương pháp luận nghiên cứu
-
Phương pháp nghiên cứu lý thuyết: Tổng hợp, nghiên cứu các tài liệu
về nâng cao chất lượng ảnh số; Tập trung sâu vào các phương pháp,
thuật toán nâng cao chất lượng ảnh tài liệu; Tìm hiểu các kiến thức liên
quan.
-
Phương pháp nghiên cứu thực nghiệm: Sau khi nghiên cứu lý thuyết,
phát biểu bài toán, đưa ra giải pháp xử lý; Mô phỏng thử nghiệm
chương trình trên phần mềm Matlab; Đánh giá các kết quả đạt được.
-
Phương pháp trao đổi khoa học: Thảo luận, xemina, lấy ý kiến chuyên gia.
4. Nội dung và bố cục của luận văn
Chương 1: Tổng quan về nâng cao chất lượng ảnh số
3
-
Giới thiệu một số phương pháp nâng cao chất lượng ảnh số và các ứng
dụng trong thực tế.
Chương 2: Các kỹ thuật nâng cao chất lượng ảnh tài liệu
-
Nghiên cứu về ảnh tài liệu và các phương pháp xử lý ảnh tài liệu. Bao
gồm các kỹ thuật trên miền không gian, tần số như: Lọc nhiễu, bù
nghiêng, giảm mờ nhằm nâng cao chất lượng ảnh tài liệu.
Chương 3: Cài đặt thử nghiệm một số thuật toán nâng cao chất lượng
ảnh tài liệu
-
Cài đặt chương trình phần mềm thử nghiệm mô phỏng một số thuật
toán nâng cao chất lượng ảnh tài liệu như: Giảm nhiễu (nhiễu Gauss,
nhiễu muối tiêu, nhiễu lốm đốm), lọc mờ (thuật toán Lucy-Richardson,
thuật toán Blind Deconvolution, lọc Wiener), bù nghiêng (dùng biến
đổi Hough, dùng phương pháp láng giềng gần nhất, sử dụng chiếu
nghiêng). Đánh giá khả năng ứng dụng của các thuật toán trên thực tế.
4
1
Chương 1. TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG ẢNH SỐ
Ảnh tài liệu cũng là một đối tượng của xử lý ảnh số. Chính vì vậy, nội
dung chương này nhằm tổng kết lại các kiến thức nền tảng về nâng cao chất
lượng ảnh số, tạo cơ sở cho việc phân tích các thuật toán nâng cao chất lượng
ảnh tài liệu được lựa chọn trong chương 2. Phần đầu chương sẽ giới thiệu
tổng quan về xử lý ảnh số, phần tiếp theo tập trung vào các thuật toán nâng
cao chất lượng ảnh phổ biến (bao gồm tăng cường ảnh và khôi phục ảnh).
Cuối cùng là một số ứng dụng cơ bản của nâng cao chất lượng ảnh số.
1.1. Tổng quan xử lý ảnh số
1.1.1. Tổng quan về một hệ thống xử lý ảnh
Xử lý ảnh là đối tượng nghiên cứu của lĩnh vực thị giác máy, là quá
trình biến đổi từ một ảnh ban đầu sang một ảnh mới với các đặc tính và tuân
theo ý muốn của người sử dụng. Xử lý ảnh có thể gồm quá trình phân tích,
phân lớp các đối tượng, làm tăng chất lượng, phân đoạn và tách cạnh, gán
nhãn cho vùng hay quá trình biên dịch các thông tin hình ảnh của ảnh.
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của
tin học ứng dụng. Xử lý dữ liệu bằng đồ hoạ đề cập đến những ảnh nhân tạo,
các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các
chương trình. Xử lý ảnh số bao gồm các phương pháp và kĩ thuật để biến đổi,
để truyền tải hoặc mã hoá các ảnh tự nhiên. Mục đích của xử lý ảnh gồm:
-
Biến đổi ảnh, làm tăng chất lượng ảnh.
-
Tự động nhận dạng, đoán nhận, đánh giá các nội dung của ảnh.
Các bước cần thiết trong xử lý ảnh được mô tả chi tiết trong Hình 1.1
bao gồm các bước sau:
5
CAMERA
Lưu trữ
Thu nhận
ảnh
Số hóa
Phân tích
ảnh
Nhận dạng
ảnh
SCANNER
Lưu trữ
Hệ Q.định
Hình 1.1. Các giai đoạn chính trong xử lý ảnh
Đầu tiên là quá trình thu nhận ảnh. Ảnh có thể thu nhận được qua
camera. Thường khi thu nhận ảnh qua camera là tín hiệu tương tự (loại
camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hóa (loại CCD-
Charge Coupled Device). Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm
ứng (sensor), hay ảnh tranh được quét trên scanner. Tiếp theo là quá trình số
hóa (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu)
và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử lý, phân tích
hay lưu trữ lại. Trước hết là công việc tăng cường ảnh để nâng cao chất lượng
ảnh. Do những nguyên nhân khác nhau: có thể do chất lượng thiết bị thu nhận
ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến do vậy cần phải tăng
cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay
làm cho ảnh gần giống nhất với trạng thái gốc – trạng thái trước khi bị biến
dạng. Giai đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh,
trích chọn các đặc tính...v.v...
Cuối cùng tùy theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng,
phân lớp hay các quyết định khác.
6
1.1.2. Một số khái niệm cơ bản trong xử lý ảnh
Ảnh số
Ảnh trắng đen thực chất là một hàm hai chiều của cường độ sángf(x,y),
trong đó x và y là các toạ độ không gian và giá trị của hàm f tại một điểm (x,y)
tỷ lệ với cường độ sáng của ảnh tại điểm đó. Nếu chúng ta có một ảnh mầu thì
flà một vector mà mỗi thành phần của vector đó chỉ ra cường độ sáng của ảnh
tại điểm (x,y) đó tương ứng với dải mầu.
Để đơn giản ở đây ta chỉ xét đến ảnh số. Một ảnh số là một ảnh mà hàm
f(x,y) của nó đã được rời rạc hoá theo cả toạ độ không gian và cường độ sáng
của nó. Ảnh trắng đen thì nó được biểu diễn theo một mảng hai chiều còn ảnh
mầu được biểu diễn theo một chuỗi các mảng hai chiều mà mỗi mảng hai
chiều đó tương ứng với một dải mầu. Giá trị cường độ sáng đã được số hoá
được gọi là giá trị mức xám[2].
Mỗi thành phần của mảng được gọi là một điểm ảnh (pixel: picture
element) và là phần tử nhỏ nhất cấu tạo nên ảnh. Điểm ảnh được hiểu như 1
dấu hiệu hay cường độ sáng tại một tọa độ xác định trong không gian. Hình
ảnh được xem như là 1 tập hợp các điểm. Với cùng kích thước nếu sử dụng
càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và càng thể hiện rõ hơn
chi tiết của ảnh người ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ
phân giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và đặc trưng của mỗi ảnh
cụ thể, trên cơ sở đó các ảnh thường được biểu diễn theo 2 mô hình cơ bản là
raster và vector.
Mô hình Raster cách biểu diễn ảnh thông dụng nhất hiện nay, ảnh được
biểu diễn dưới dạng ma trận các điểm ảnh thu nhận qua các thiết bị như
camera, scanner. Tuỳ theo yêu cầu thực thế mà mỗi điểm ảnh được biểu diễn
qua 1 hay nhiều bit. Mô hình Raster thuận lợi cho hiển thị và in ấn. Ngày nay
7
công nghệ phần cứng cung cấp những thiết bị thu nhận ảnh Raster phù hợp
với tốc độ nhanh và chất lượng cao cho cả đầu vào và đầu ra.
Mô hình Vector là kiểu biểu diễn ảnh ngoài mục đích tiết kiệm không
gian lưu trữ dễ dàng cho hiển thị và in ấn còn đảm bảo dễ dàng trong lựa chọn
sao chép di chuyển tìm kiếm… Trong mô hình Vector người ta sử dụng
hướng giữa các Vector của điểm ảnh lân cận để mã hoá và tái tạo hình ảnh
ban đầu ảnh Vector được thu nhận trực tiếp từ các thiết bị số hoặc được
chuyển đổi từ ảnh Raster thông qua các thuật toán.
Cường độ sáng của một ảnh tại một ví trí điểm ảnh
Mỗi điểm ảnh của một ảnh tương ứng với một phần của một đối tượng
vật lý tồn tại trong thế giới thực. Đối tượng vật lý này được chiếu sáng bởi
một vài tia sáng mà tia sáng này bị phản xạ một phần hay hấp thụ một phần
khi chiếu lên đối tượng vật lý đó. Phần ánh sáng phản xạ lại đi tới các bộ cảm
biến được sử dụng để tạo ảnh cảm nhậnvà tạo ra các giá trị ghi nhận được đối
tượng đối với từng điểm ảnh. Giá trị thu nhận được phụ thuộc vào phổ ánh
sáng phản xạ. Giá trị cường độ sáng của các điểm ảnh khác nhau chỉ có ý
nghĩa tương đối mà không có ý nghĩa trong các toán hạng tuyệt đối[12].
Số bits cần thiết để lưu trữ một ảnh
Ở đây chúng ta chỉ quan tâm tới ảnh xám, nếu ảnh được lưu trữ dưới
dạng một mảng hai chiều với kích thước NxN và có 2m mức xám thì số bits
cần thiết để lưu trữ ảnh là:
b N x N x 2 m
(1.1)
Ví dụ như, một ảnh cỡ 512 x 512 với 256 (tức m=8) mức xám thì cần
số bits lưu trữ là: 512 x 512 x 256=2.097.152 bits.
Độ phân giải ảnh
8
Độ phân giải ảnh biểu diễn mức độ chi tiết của ảnh mà chúng ta có thể
nhìn rõ đối tượng. Khi thay đổi các giá trị m và N trong phương trình (1.1)thì
sẽ có các hiện tượng thay đổi khác nhau. Xong thực nghiệm cho thấy khi giữ
nguyên kích thước ảnhN và tăng số mức xám mlên thì sẽ thể hiện rõ hơn mức
độ chi tiết trong ảnh.
1.1.3. Nguyên tắc thực hiện xử lý ảnh
Chúng ta biết thực hiện xử lý ảnh thông qua việc sử dụng hàm biến đổi
ảnh. Biến đổi ảnh là quá trình thực hiện thông qua các toán tử. Một toán tử
thực hiện lấy một ảnh vào đầu vào của hệ thống và tạo ra một ảnh khác theo
yêu cầu xử lý. Để thực hiện quá trình biến đổi ảnh chúng ta chủ yếu quan tâm
tới các toán tử tuyến tính.
Giả sử O(f) là toán tử O của một ảnh f thì toán tử O được gọi là tuyến
tính nếu ta có[3]:
O af bg aO f bO g
(1.2)
Với mọi f, g và a, b.
Trong xử lý ảnh thì các toán tử được định nghĩa là hàm trải điểm. Một
hàm trải điểm của một toán tử là kết quả mà chúng ta thu nhận được sau khi
thực hiện cung cấp luật của toán đó cho nguồn điểm:O[nguồn điểm]= hàm
trải điểm
Hay chúng ta có:
O x , y h x, , y,
(1.3)
Trong đó δ(x-α,y-β) là nguồn điểm có cường độ sáng bằng 1 đặt tại
điểm (α,β).
Và nếu toán tử là tuyến tính thì ta có:
9
O a x , y ah x, , y,
(1.4)
Tức nếu tăng cường độ sáng lên a lần thì kết quả thu được cũng tăng
lên a lần.
1.1.4. Một số thao tác cơ bản trong xử lý ảnh
Biểu diễn ảnh
Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của
ảnh là pixel. Nhìn chung có thể một hàm hai biến chứa các thông tin như biểu
diễn của một ảnh. Các mô hình biểu diễn cho ta một mô tả logic hay định
lượng các tính chất của hàm này. Trong biểu diễn ảnh cần chú ý đến tính
trung thực hoặc các tiêu chuẩn “thông minh” để đo chất lượng ảnh hoặc tính
hiệu quả của các kĩ thuật xử lý.
Một số mô hình thường được dùng trong biểu diễn ảnh: mô hình bài
toán, mô hình thống kê. Trong mô hình bài toán, ảnh hai chiều được biểu diễn
nhờ các hàm hai biến trực giao gọi là các hàm cơ sở. Còn mô hình thống kê,
một ảnh được coi như một phần tử của một tập hợp đặc trưng bởi các đại
lượng như: kỳ vọng toán học, hiệp biến, phương sai, moment.
Biến đổi ảnh (Image Transform)
Thuật ngữ biến đổi ảnh thường dùng để nói tới một lớp các ma trận đơn
vị và các kĩ thuật dùng để biến đổi ảnh.
Biến đổi ảnh nhằm làm giảm các nguyên nhân của ảnh để việc xử lý
hiệu quả hơn. Như làm rõ hơn các thông tin mà ngời dùng quan tâm nhưng
người dùng phải chấp nhận mất đi một số thông tin cần thiết.
Phân tích ảnh
Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của 1
ảnh để đưa ra một mô tả đầy đủ về ảnh.
10
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước
hết là công việc tăng cường ảnh để nâng cao chất lượng ảnh, giai đoạn tiếp
theo là phát hiện các đặc tính như phát hiện biên, phân vùng ảnh, trích chọn
các đặc tính..v.v..
Tăng cường ảnh – khôi phục ảnh
Tăng cường ảnh là một bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó
gồm các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu…
Khôi phục ảnh là nhằm loại bỏ các suy giảm trong ảnh.
Xử lý biên ảnh
Biên là vấn đề chủ yếu trong phân tích ảnh vì các điểm trích chọn trong
quá trình phân tích ảnh đều dựa vào biên. Mỗi điểm ảnh có thể là biên nếu ở
đó có sự thay đổi đột ngột về mức xám. Tập hợp các điểm biên tạo thành biên
hay đường bao quanh của ảnh.
Phân vùng ảnh
Phân vùng là bước then chốt trong xử lý ảnh. Giai đoạn này nhằm phân
tích ảnh thành những thành phần có tính chất nào đó dựa theo biên hay các
vùng liên thông. Tiêu chuẩn để xác định các vùng liên thông có thể là mức
xám, cùng màu hay độ tương phản.
Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người
ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các
đặc tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
Mô tả tham số (nhận dạng theo tham số).
Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
11
Trên thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công
với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ
viết.
Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi
trên mạng mà lượng thông tin để biểu diễn cho một ảnh là rất lớn. Do đó làm
giảm lượng thông tin hay nén dữ liệu là một nhu cầu cần thiết.
Nén dữ liệu là quá trình làm giảm lượng thông tin “ dư thừa” trong dữ
liệu gốc và do vậy lượng thông tin thu được sau khi nén thường nhỏ hơn dữ
liệu gốc rất nhiều.
1.2. Nâng cao chất lượng ảnh
Thực chất của quá trình xử lý ảnh có thể thực hiện theo sơ đồ khối sau
(Hình 1.2)
Thu
nhận ảnh
Số
hoá
Nâng
cao chất
lượng
ảnh
Phân
tích ảnh
Nhận
dạng
ảnh
Hình 1.2. Sơ đồ khối các bước trong quá trình xử lý ảnh
Nâng cao chất lượng ảnh là một bước quan trọng, nó là tiền đề cho xử
lý ảnh. Mục đích chính là nhằm làm nổi bật một số đặc tính ảnh như độ tương
phản, lọc nhiễu, nổi mầu, làm trơn ảnh, khuếch đại ảnh...[2], [3].
Có 2 phương pháp chính đó là: nâng cao chất lượng ảnh trong miền
không gian và tần số.
Nâng cao chất lượng ảnh trong miền không gian
Ta tác động trực tiếp lên các điểm ảnh. Cường độ của các điểm ảnh
được tính một các đơn giản qua công thức sau:
12
g x , y T f x , y
(1.5)
Trong đó f(x,y) là ảnh đầu vào, g(x,y) là ảnh đầu ra và T là thuật toán
tác động lên f(x,y).
Nâng cao chất lượng hình ảnh trong miền tần số:
Ta dựa trên việc tác động biến đổi Fourier của hình ảnh. Trước tiên ảnh
sẽ được biến đổi về miền tần số, sau đó thông qua các thuật toán ta sẽ tác
động đến hàm truyền F của hình ảnh. Cuối cùng, ta sẽ dùng biến đổi
Fourierngược để biến hàm truyền thành hình ảnh đầu ra.
Các thuật toán nâng cao chất lượng hình ảnh được thực hiện để điều
chỉnh độ sáng hình ảnh, độ tương phản hoặc phân phối các mức xám. Trong
miền tần số thì khái niệm về lọc thì dễ dàng hơn để hình dung. Vì vậy, nâng
cao chất lượng hình ảnh của f(x,y) có thể được thực hiện trong miền tần số,
dựa trên DFT của F(u, v). Trong miền tần số nâng cao hình ảnh có thể được
thực hiện như sau:
-
Tính toán F(u, v), DFT của hình ảnh đầu vào.
-
Nhân F(u, v) với một hàm lọc H(u, v)
-
G(u, v) = H(u,v) F(u, v).
-
Tính ngược DFT của kết quả bằng cách áp dụng Fourier biến đổi ngược.
-
Tìm được phần thực của biến đổi ngượcDFT.
Trong đó G(u,v) là ảnh đầu ra, F(u,v) là ảnh đầu vào và H(u,v) là hàm
truyền.
Việc nâng cao chất lượng ảnh có thể là tăng cường ảnh hoặc là khôi
phục ảnh tùy theo mục đích. Phần tiếp sau đây sẽ giới thiệu một số kỹ thuật
tăng cường ảnh và khôi phục ảnh.
13
1.2.1. Tăng cường ảnh
Tăng cường ảnh là việc cải tiến ảnh sao cho nó thể hiện rõ được các đặc
trưng của ảnh, như là điều khiển mức xám, độ tương phản ảnh, giảm
nhiễu…tùy vào yêu cầu mong muốn. Song có thể chỉ ra một số vấn đề quan
trọng đó là: biến đổi mức xám của ảnh, lọc nhiễu và biến đổi độ chói[6], [8].
1.2.1.1. Tăng cường ảnh sử dụng biến đổi mức xám đồ
Mức xám đồ
Mức xám đồ của một ảnh xám là lược đồ biểu diễn tần suất xuất hiện
của mỗi mức xám tức mức xám đồ của một hình ảnh là một hàm rời rạc. Lược
đồ này được biểu diễn theo trục tọa độ (x,y). Trục hoành biểu diễn các mức
xám từ 0-255, còn trụctungbiểu diễn số lượng điểm ảnh tương ứng với mức
xám trên trục hoành.
Như vậy ta có mối quan hệ:y = f(x) = số điểm ảnh có cùng mức xám x
Khi hàm được chuẩn hóa mà tổng của các mức xám là 1 thì hàm có thể
được coi là một hàm mật độ. Đưa ra giá trị mức xám được tìm thấy trong ảnh.
Theo đó thì giá trị mức xám là một giá trị ngẫu nhiên.
y p ( x)
h( x)
L thông thường bằng 256
L 1
h (i )
(1.6)
i0
Như vậy mức xám đồ cung cấp thông tin về mức xám của ảnh, nó là
một công cụ hữu hiệu trong nhiều giai đoạn của quá trình xử lý ảnh.
Biến đổi mức xám đồ
Mức xám đồ biểu diễn cho một ảnh càng rộng càng tốt. Nếu coi x là giá
trị mức xám của ảnh gốc và giá trị mức xám ảnh mới là s:
s T x
(1.7)
14
T: được gọi là hàm biến đổi mức xám.
Một số biện pháp tăng cường ảnh bằng biến đổi mức xám đồ
San bằng mức xám đồ:
u
v LTHD f (u ) LTHD p( x) x 0,1,..., u
x 0
(1.8)
Với p(x) là hàm mức xám đồ kiểu tỷ lệ, còn LTHD là phép lượng tử
hóa đềugiá trị của f(u) sang các giá trị mức xám từ 0 – L-1. Sử dụng hàm lấy
mẫu phần nguyên Int có thể có LTHD như sau:
x - xmin
LTHD x Int
( L 1) 0, 5 với x f (u )
1- xmin
(1.9)
Biến đổi phi tuyến mức xám:
Trước khi thực hiện LTHD người ta sử dụng phi tuyến hàm f(u) biến
đổi mức xám u. Có thể có các dạng hàm f(u) như sau:
1.2.1.2. Giảm nhiễu sử dụng các loại bộ lọc
Nhiễu
Nhiễu có nhiều loại nhưng có thể chia thành hai loại nhiễu chính là
nhiễu cộng và nhiễu nhân.Ví dụ, nhiễu nhân như là biến số độ rọi, còn nhiễu
cộng thường là nhiễu xung, nhiễu Gaussian.
Nhiễu xung thay đổi ngẫu nhiên giá trị của một vài điểm ảnh. Nhiễu
Gaussian zero-mean là giá trị zero-mean Gauss có thể được thêm vào giá trị
thực của mọi điểm ảnh.
Hoặc ta có thể phân ra các loại nhiễu sau đây:
Nhiễu do thiết bị thu nhận ảnh
Nhiễu ngẫu nhiên độc lập
15
Nhiễu do vật quan sát
Thường người ta xấp xỉ các loại nhiễu bằng các quá trình tuyến tính bất
biến vì có nhiều công cụ tuyến tính có thể giải quyết vấn đề phôi phục ảnh
cũng như tăng cường ảnh hơn so với phi tuyến và hơn nữa còn cho phép xử lý
dễ dàng hơn trên máy tính.
Từ các vấn đề trên ta có thể xây dựng các loại bộ lọc triệt nhiễu sau:
Triệt nhiễu bằng phương pháp lọc không gian
Trường hợp khi ảnh chỉ chịu tác động của nhiễu cộng, các phương pháp
lọc nhiễu trong không gian thường cho kết quả khôi phục ảnh tốt nhất. Một số
phương pháp lọc trong không gian cụ thể sẽ được đề cập đến trong chương 2
như là các biện pháp nâng cao chất lượng ảnh tài liệu.
Triệt nhiễu trong miền tần số
Các bộ lọc trong miền không gian đề cập tới ở các phần trên là các bộ
lọc thông thấp hoặc thông cao. Lọc không gian có thể được sử dụng để khôi
phục ảnh có nhiễu hoặc để làm tăng chất lượng ảnh. Tuy nhiên, để khôi phục
ảnh có nhiễu tuần hoàn này chúng ta phải xử lý ảnh trong miền tần số: đó là
sử dụng một số bộ lọc dải, bộ lọc chặn dải.
1.2.1.3. Tăng cường ảnh kém chất lượng về biến độ chói
Đây là vấn đề có thể được giải quyết nếu chúng ta thấy rõ hàm ảnh
f(x,y) là tích của hai thừa số: hàm độ chói i(x,y) và hàm phản xạ r(x,y), bản
chất là bề mặt ảnh:
f x, y i x, y r x, y
(1.10)
Độ chói thông thường tự nhiên từ thành phần tần số thấp trong biến đổi
Fourier của hình ảnh. Việc thay đổi độ sắc nét được liên kết với thành phần
tần số cao. Chúng ta có thể cố gắng phân tán hai nhân tố bằng việc lấy loga
16
hai vế của phương trình
hai vế của phương trình (1.10)trên. Khi đó nhiễu trở thành nhiễu cộng và ta
Khi đó nhiễu trở thành nhiễu cộng và ta
sẽ được một hàm đơn giản hơn
sẽ được một hàm đơn giản hơn:
ln f x, y ln i x, y ln r ( x, y)
(1.11)
Chúng ta sẽ lọc hàm
húng ta sẽ lọc hàm ln[] của hình ảnh này
của hình ảnh này sử dụng bộ lọc đồng hình
sử dụng bộ lọc đồng hình
(homomorphic). Bộ lọc này sẽ tăng cường miền tần số cao và triệt tiêu miền
Bộ lọc này sẽ tăng cường miền tần số cao và triệt tiêu miền
tần số thấp để sự biến thiên của độ chói đư
tần số thấp để sự biến thiên của độ chói được giảm trong khi đường biên là sắc
ợc giảm trong khi đường biên là sắc
nét hơn. Tiếp đó, sử dụng các bộ lọc
sử dụng các bộ lọc (lọc trung bình, lọc thông thấp
lọc thông thấp) để loại bỏ
nhiễu cộng, cuối cùng sử dụng dạng e mũ để đưa
sử dụng dạng e mũ để đưa ảnh về dạng thông thường
về dạng thông thường.
Sử dụng hàm chuyển đổi:
Sử dụng hàm chuyển đổi
1
H x, y
1 e
s ( x2 y2 0 )
A
(1.12)
Trong đó: s=
= 1, ω0 = 128, A=10
A=10. Các thông số của bộ lọc liên quan
đến các thông số ГH và
và ГL.
ГH = 1+A
1.2.2. Khôi phục ảnh
ГL
f ( x, y )
f ( x, y )
1
A
1 e s0
Hình 1.3. Mô hình quá trình làm méo và khôi phục
ph ảnh
Khôi phục ảnh là quá trình lo
à quá trình loại bỏ hay tối thiểu hóa các ảnh h
ại bỏ hay tối thiểu hóa các ảnh hưởng của
môi trường bên
ên ngoài đến
đ ảnh thu nhận được. Các nguyên
ên nhân dẫn
d tới sự
biến dạng (méo) ảnh có thể l
ến dạng (méo) ảnh có thể là: nhiễu tại bộ biến đổi quang-điện,
ện, méo do hệ
méo do hệ
17
thống ống kính quang học gây ra, nhiễu không gian ảnh hưởng tới tín hiệu
trong quá trình truyền qua đường truyền, nhiễu công nghiệp tác động trực tiếp
tới tín hiệu hình ảnh v.v. Hình 1.3mô tả quá trình làmméo và khôi phục ảnh.
Trong mô hình này, ảnh gốc f (x, y) chịu tác động của toán tử làm méo H,
được đặc trưng bởi hàm đáp ứng xung h(x, y) và nhiễu cộng η(x, y). Dựa trên
h(x, y)và η(x, y), chúng ta phải tìm ra phương pháp khôi phục ảnh, sao cho
ảnh ra f(x, y) giống với ảnh vào nhất[6].
Nếu H là toán tử tuyến tính và bất biến, thì ảnh bị nhiễu g(x, y) có dạng
như sau:
g x , y H f x , y x , y h x , y f x , y x , y
(1.13)
h(x, y) - hàm đáp ứng đặc trưng cho toán tử H trong không gian.
Trong miền tần số, dựa trên tính chất của biến đổi Fourier ta có:
G u, v H u, v F u, v N u, v
(1.14)
với G(u,v),H (u,v),F(u,v),N(u,v) là kết quả biến đổi Fourie của các hàm
tương ứng.
Để khôi phục ảnh ta phải sử dụng một số phương pháp như: khôi phục
hình học, lọc ảnh bằng bộ lọc không gian, khử nhiễu bằng các bộ lọc tần số
thích nghi với nguồn nhiễu v.v.
1.3. Một số ứng dụng của nâng cao chất lượng ảnh
Trong pháp y, nâng cao chất lượng hình ảnh được sử dụng để xác định,
thu thập chứng cứ và giám định. Hình ảnh thu được từ phát hiện dấu vân tay,
video an ninh phân tích và điều tra hiện trường vụ án được tăng cường để
giúp đỡ trong việc xác định thủ phạm và bảo vệ nạn nhân [13].