Tải bản đầy đủ (.doc) (79 trang)

Các phép toán hình thái trong xử lý ảnh và xây dựng ứng dụng (2014)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.13 MB, 79 trang )

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN
--------***---------

TẠ TIẾN THÀNH

CÁC PHÉP TOÁN HÌNH THÁI TRONG
XỬ LÝ ẢNH VÀ XÂY DỰNG ỨNG DỤNG

KHÓA LUẬN TỐT NGHIỆP
Chuyên ngành: Tin học

Người hướng dẫn khoa học
ThS. LƯU THỊ BÍCH HƯƠNG

HÀ NỘI, 2014


LỜI CẢM ƠN
Lời đầu tiên em xin chân thành cảm ơn sự hướng dẫn tận tình của cô
giáo ThS. Lưu Thị Bích Hương, khoa Công nghệ thông tin, trường Đại học sư
phạm Hà Nội 2.
Em cũng xin chân thành cảm ơn các thầy, cô giáo trong khoa Công nghệ
thông tin, cũng như các thầy, cô giáo trong trường đã giảng dạy và giúp đỡ
em trong các năm học vừa qua. Chính các thầy, cô giáo đã xây dựng cho
chúng em những kiến thức nền tảng và kiến thức chuyên môn để em có thể
hoàn thành khóa luận tốt nghiệp và chuẩn bị cho những công việc của mình
sau này.
Cuối cùng em xin bày tỏ lòng biết ơn tới gia đình và bạn bè đã giúp đỡ
động viên em rất nhiều trong suốt quá trình học tập để em có thể thực hiện tốt
khóa luận này.


Do kiến thức và thời gian còn hạn chế nên khóa luận không tránh khỏi
những thiếu sót. Kính mong nhận được sự đóng góp ý kiến của các thầy cô
và các bạn để khóa luận được hoàn thiện hơn.
Hà Nội, tháng 05 năm 2014
Sinh viên

Tạ Tiến Thành


LỜI CAM ĐOAN
Tên em là: TẠ TIẾN THÀNH
Sinh viên lớp: K36 – Tin học, khoa Công nghệ thông tin, trường Đại học
sư phạm Hà Nội 2.
Em xin cam đoan:
1. Đề tài “Các phép toán hình thái trong xử lý ảnh và xây dựng ứng
dụng” là sự nghiên cứu của riêng em, dưới sự hướng dẫn của cô giáo ThS.
Lưu Thị Bích Hương.
2. Khóa luận hoàn toàn không sao chép của tác giả nào khác.
Nếu sai em xin hoàn toàn chiu trách nhiệm.
Hà Nội, tháng 05 năm 2014
Người cam đoan

Tạ Tiến Thành


MỤC LỤC
MỞ ĐẦU.............................................................................................................. 1
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT.................................................................... 4
1.1. Xử lý ảnh là gì ...................................................................................... 4
1.2. Các ứng dụng của xử lý ảnh ................................................................. 5

1.3. Các bước cơ bản trong xử lý ảnh.......................................................... 6
1.4. Các định dạng ảnh cơ bản................................................................... 10
CHƯƠNG 2: CÁC PHÉP TOÁN HÌNH THÁI................................................ 16
2.1. Thao tác trên ảnh nhị phân ................................................................. 16
2.1.1.

Phép dãn nhị phân (Dilation) ....................................................... 16

2.1.2.

Phép co nhị phân (Erosion) .......................................................... 21

2.1.3.

Phép mở nhị phân (Opening) ....................................................... 24

2.1.4.

Phép đóng nhị phân (Closing)...................................................... 25

2.1.5.

Kĩ thuật đánh trúng và đánh trượt ................................................ 30

2.1.6.

Kĩ thuật đếm vùng ........................................................................ 32

2.2. Thao tác trên ảnh đa mức xám ........................................................... 33
2.2.1.


Phép co và phép dãn (Erosion and Dilation)................................ 33

2.2.2.

Các phép toán đóng, mở (Closing and Opening)......................... 34

2.2.3.

Làm trơn ....................................................................................... 36

2.2.4.

Gradient ........................................................................................ 37

2.2.5.

Phân vùng theo cấu trúc ............................................................... 38

2.2.6.

Phân loại cỡ đối tượng ................................................................. 39

CHƯ ƠNG 3: ỨNG DỤNG CÁC PHÉP TOÁN HÌNH THÁ I ........ 42


3.1. Ứng dụng thực tiễn ............................................................................. 42
3.2. Xương và làm mảnh ........................................................................... 43
3.3. Các phương pháp lặp hình thái........................................................... 45
3.4. Nhận dạng biên................................................................................... 53

CHƯ ƠNG 4: XÂY D ỰNG CHƯ ƠNG TRÌNH ỨNG DỤNG ......... 54
4.1. Phát biểu bài toán ............................................................................... 54
4.2. Thiết kế chương trình ......................................................................... 54
KẾT LUẬN VÀ HƯ ỚNG PHÁT TRI ỂN .............................................. 63
1.

Kết luận............................................................................................... 63

2.

Hướng phát triển................................................................................. 63

TÀI LIỆU THAM KHẢO.................................................................................. 65


CÁC KÝ HIỆU VIẾT TẮT
Viết tắt

Viết đầy đủ

Ý nghĩa

KL

Karhumen Loeve

Biến đổi Karhumen Loeve

CCIR


Consultative Committee for Tiêu chuẩn điều chế tần số CCIR
International Radio

CCD

Change Coupled Device

Công nghệ sử dụng cho camera

IMG

Image

Định dạng ảnh IMG

PCX

Personal Computer Exchange

Định dạng ảnh PCX

RLE

Run Length Encoded

Phương pháp mã loạt dài

TIFF

Targed Image File Format


Định dạng ảnh TIFF

BMP

Windows bitmap

Định dạng ảnh BMP

DIB

Device Independent Bitmap

Một định dạng của ảnh bitmap

GIF

Graphics Interchanger Format

Định dạng ảnh GIF

LZW

Lempel Ziv Welch

Thuật toán nén LZW

JPEG

Joint


Photographic

Experts Nén ảnh JPEG

Group
PNG

Portable Network Graphics

LIBPNG Library

Portable

Nén dữ liệu PNG

Network Thư viện ảnh PNG

Graphics
TIFF

Tagged Image File Format

MIME

Multipurpose
Extensions

OCR


Internet

Ảnh định dạng TIFF

Mail Chuẩn Internet về định dạng cho
thư điện tử

Optical Character Recognition Hệ thống nhận dạng chữ viết bằng
thiết bị quang học OCR

AFIS

Automated
Identification
System

fingerprint Hệ thống nhận dạng vân tay AFIS


DANH MỤC HÌNH VẼ
Hình 1.2: Các bước cơ bản trong một hệ thống xử lý ảnh................................ 5
Hình 1.3: Các bước cơ bản trong xử lý ảnh ...................................................... 6
Hình 1.4: Sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối .... 10
Hình 1.5: Định dạng ảnh BMP........................................................................ 13
Hình 2.1: Thao tác nhị phân đơn giản trên một ảnh nhỏ. (a) Ảnh ban đầu; (b)
Ảnh dãn 1 điểm ảnh; (c) Ảnh dãn 2 điểm ảnh ................................................ 16
Hình 2.2: Dãn A bởi B. (a) Ảnh A, B ban đầu; (b) Ảnh A cộng phần tử (0,0);
(c) Tập A cộng phần tử (0,1); (d) Hợp của (b) và (c) hay kết quả phép dãn ..
18
Hình 2.4: Dãn ảnh sử dụng phần tử cấu trúc .................................................. 20

Hình 2.5: Phép co nhị phân ............................................................................. 22
Hình 2.6: Xoá hình thái những dòng ngang của khuông nhạc ....................... 24
Hình 2.7: Sử dụng phép toán mở .................................................................... 25
Hình 2.8: Phép đóng........................................................................................ 26
Hình 2.9: Phép đóng với độ sâu lớn................................................................ 27
Hình 2.10: Phép co sử dụng một bản đồ khoảng cách.................................... 29
Hình 2.11: Phép mở tổng thể của đối tượng dạng đĩa .................................... 30
Hình 2.12: Minh hoạ thao tác đánh trúng và đánh trượt................................. 31
Hình 2.13 Đếm vùng. (a), (b), (c), (d) Các cấu trúc; (e) Ví dụ của ảnh có 8
vùng
......................................................................................................................... 32
Hình 2.14: Phép dãn đa cấp xám..................................................................... 36
Hình 2.15: Làm trơn đa cấp xám .................................................................... 37
Hình 2.16: Đường dốc hình thái...................................................................... 38
Hình 2.17: Phân đoạn cấu trúc ........................................................................ 39
Hình 2.18: Phân lớp những đồng xu ............................................................... 40
Hình 3.1: Mô hình tổng quát của hệ thống nhận dạng ảnh ............................. 42


Hình 3.2: Các mẫu dùng cho việc nhận dạng những điểm ảnh có thể bị
xoá trong thuật toán làm mảnh Stienford. (a) Mẫu M1; (b) Mẫu M2;
(c) Mẫu M3; (d) Mẫu M4. ........................................................................... 46
Hình 3.3: Một minh hoạ về số liên kết............................................................ 47
Hình 3.4: Bốn phần của mỗi phép lặp trong phương pháp làm mảnh Stentiford.
(a) Sau khi áp dụng mẫu M1; (b) Sau mẫu M2; (c) Sau M3; (d) Sau M4..........
48
Hình 3.5: Tất cả các phép lặp của thuật toán làm mảnh Stienford được áp dụng
cho chữ T.......................................................................................................... 49
Hình 3.6: Những thao tác của phép làm mảnh cổ điển. (a) Cổ cột; (b) Đuôi cột;
(c) Đường tạo thành vẫn có sợi......................................................................... 50

Hình 3.7: Các mẫu được dùng cho bước xử lý phân giác góc nhọn............... 51
Hình 3.8: Những kí tự được làm mảnh cuối cùng, sau hai bước xử lý và làm
mảnh. ............................................................................................................... 51
Hình 3.9: Kết quả làm mảnh. (a) Ảnh ban đầu; (b) Áp dụng Erosion; (c) Ảnh
ban đầu đã biến đổi ......................................................................................... 53
Hình 4.1: Form giao diện ................................................................................ 55
Hình 4.2: Kết quả phép giãn ảnh A................................................................. 55
Hình 4.3: Kết quả phép co ảnh A.................................................................... 56
Hình 4.4: Kết quả phép mở ảnh A .................................................................. 56
Hình 4.5: Kết quả phép đóng ảnh A................................................................ 57
Hình 4.6: Kết quả nhận dạng biên ảnh A........................................................ 57
Hình 4.8: Kết quả phép giãn ảnh B ................................................................. 58
Hình 4.9: Kết quả phép co ảnh B .................................................................... 58
Hình 4.10: Kết quả phép mở ảnh B................................................................. 59
Hình 4.11: Kết quả phép đóng ảnh B.............................................................. 59
Hình 4.12: Kết quả nhận dạng biên ảnh B ...................................................... 60
Hình 4.14: Kết quả phép co ảnh C .................................................................. 61
Hình 4.15: Kết quả phép mở ảnh C................................................................. 61


Hình 4.16: Kết quả phép đóng ảnh C.............................................................. 62
Hình 4.17: Kết quả nhận dạng biên ảnh C ...................................................... 62


MỞ ĐẦU
1. Lý do chọn đề tài
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là
một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc
độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng
dụng. Trong các trường đại học, cao đẳng xử lý ảnh đã trở thành một môn

học chuyên ngành của sinh viên các ngành công nghệ thông tin, viễn
thông.
Xử lý nâng cao chất lượng ảnh là một vấn đề trọng tâm của môn học
xử lý ảnh đồng thời nó cũng là bước tiền xử lý cho việc nhận dạng, trích
chọn thông tin trong xử lý ảnh số. Điều này cũng có ý nghĩa quan trọng
trong nhiều ứng dụng thực tế như nhận dạng các đối tượng địa lý, các biểu
tượng trên bản đồ, phần mềm phát hiện và đếm các đối tượng chuyển động …
Đặt biệt trong hầu hết các một số ngành công nghiệp như: Cơ khí chế
tạo, chế biến, sản xuất, việc đọc hình ảnh có thể nói là thường xuyên và cực
kỳ quan trọng. Bản vẽ kỹ thuật (một dạng của hình ảnh) chính là kết quả ngôn
ngữ kỹ thuật, mà qua nó, một quy trình công nghệ phải được xây dựng trong
quá trình sản xuất, cũng như nó chính là cơ sở cho việc nghiệm thu cho bất
kỳ sản phẩm nào. Để lưu ảnh của các tài liệu, các bản vẽ hoặc sửa đổi chúng
và chuyển chúng sang các dạng đồ họa khác tiện cho việc nhận dạng, đối sánh
mẫu để sử dụng sau này là điều cần thiết. Do vậy tiền xử lý ảnh là việc cần
làm. Có nhiều phương pháp, nhiều công cụ, nhiều phần mềm xử lý ảnh đã ra
đời. Tăng cường chất lượng ảnh, mà công đoạn đầu tiên là một bước tiền xử
lý nhằm loại bỏ nhiễu, khắc phục những khiếm khuyết do bước thu nhận ảnh
không tốt là việc làm quan trọng. Có nhiều phương pháp cho việc nâng cao
chất lượng ảnh nói chung và tiền xử lý nói riêng. Để giải quyết các bài toán
đó thì việc tách hoặc làm rõ những điểm, đường biên quan trọng của ảnh là
1


những bước đầu quan trọng cho việc nhận dạng, trích dẫn thông tin sau này.
Chính vì vậy em đã lựa chọn đề tài: “Các phép toán hình thái trong xử lý
ảnh và xây dựng ứng dụng” để làm khóa luận.
2. Mục đích nghiên cứu
Nghiên cứu các phép toán hình thái: Phép co, phép giãn, phép đóng,
phép mở đối với ảnh nhị phân và ảnh đa mức xám.

Xây dựng những ứng dụng thực tiễn của phép toán hình thái.
3. Nhiệm vụ nghiên cứu
Tìm hiểu các phép toán hình thái: Phép co, phép giãn, phép đóng, phép
mở.
Xây dựng ứng dụng phép toán hình thái.
4. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của khóa luận là các phép toán hình thái trên ảnh
nhị phân và ảnh đa mức xám.
Phạm vi nghiên cứu: Nói đến các phép toán hình thái là nói đến một lĩnh
vực vô cùng rộng lớn và quan trọng trong xử lý ảnh. Trong khóa luận chỉ tìm
hiểu đến một phần của các phép toán hình thái. Đó là các phép toán hình thái
trên ảnh nhị phân và ảnh đa mức xám.
5. Ý nghĩa khoa học và thực tiễn
Khóa luận phân tích, làm rõ các phép toán hình thái. Từ đó ta có thể hiểu
thêm về tính chất, đặc điểm, ứng dụng của các phép toán hình thái. Nghiên
cứu góp phần chứng minh thêm tính đúng đắn của các phép toán hình thái.
Hiện nay các phép toán hình thái là một lĩnh vực đang được các chuyên gia
nghiên cứu và phát triển.
Xây dựng chương trình thử nghiệm các phép toán hình thái nếu thành
công sẽ góp một phần nhỏ trong việc lựa chọn, chọn lọc ảnh số và trích chọn
biên ảnh.

2


6. Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý luận
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây
dựng cơ sở lý thuyết của khóa luận và các biện pháp cần thiết để giải quyết
các vấn đề của khóa luận.

- Phương pháp chuyên gia
Tham khảo ý kiến của các chuyên gia để có thể thiết kế chương trình phù
hợp với yêu cầu thực tiễn. Nội dung xử lý nhanh đáp ứng được yêu cầu ngày
càng cao của người sử dụng.
- Phương pháp thực nghiệm
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được
nghiên cứu và kết quả đạt được qua những phương pháp trên.
7. Cấu trúc khóa luận
Ngoài phần lời cảm ơn, mở đầu, kết luận và hướng phát triển, tài liệu
tham khảo, khóa luận có những nội dung sau:
Chương 1: Cơ sở lý thuyết - Chương này trình bày một số kiến thức cơ bản
về xử lý ảnh: Khái niệm xử lý ảnh, các ứng dụng, các bước cơ bản trong xử lý
ảnh và trình bày một số định dạng ảnh cơ bản.
Chương 2: Các phép toán hình thái - Trong chương này, khóa luận trình
bày khái niệm, đặc điểm của ảnh nhị phân và ảnh đa mức xám. Phân tích và
làm rõ các phép toán hình thái: Phép co, phép giãn, phép đóng, phép mở đối
với ảnh nhị phân và ảnh đa mức xám. Trình bày một số kỹ thuật trong xử lý
ảnh: Kỹ thuật đánh trúng và đánh trượt, kỹ thuật đếm vùng, làm trơn,
gradient, phân vùng theo cấu trúc và cỡ đối tượng. Trong đó, các phép toán
hình thái là nội dung chính được trình bày trong khóa luận.
Chương 3: Xây dựng chương trình ứng dụng - Từ những kiến thức đã
nghiên cứu, khóa luận xây dựng một chương trình thử nghiệm các phép toán
hình thái đối với ảnh nhị phân và ảnh đa mức xám.

3


CHƯƠNG 1: CƠ SỞ LÝ THUYẾT
1.1. Xử lý ảnh là gì
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một

ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát
triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng …
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng
vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần
cứng máy tính, xử lý ảnh và đồ họa đó phát triển một cách mạnh mẽ và có
nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ họa đóng một vai trò quan
trọng trong tương tác người máy.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận.
Ảnh tốt hơn
Ảnh

Xử lý ảnh
Kết luận
Hình 1.1: Quá trình xử lý ảnh

Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như
là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của
đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2,...,
cn). Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều.

4


Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Hệ quyết định


Thu

nhận
ảnh

Tiền
xử lý

Trích chọn
đặc điểm

Hậu
xử lý

Đối sánh
rút ra
kết luận

Lưu trữ
Hình 1.2: Các bước cơ bản trong một hệ thống xử lý ảnh
1.2. Các ứng dụng của xử lý ảnh
1.2.1. Biến đổi ảnh (Image Transform)
Trong xử lý ảnh do số điểm ảnh lớn các tính toán nhiều (độ phức tạp tính
toán cao) đòi hỏi dung lượng bộ nhớ lớn, thời gian tính toán lâu. Các phương
pháp khoa học kinh điển áp dụng cho xử lý ảnh hầu hết khó khả thi. Người ta
sử dụng các phép toán tương đương hoặc biến đổi sang miền xử lý khác để dễ
tính toán. Sau khi xử lý dễ dàng hơn được thực hiện, dùng biến đổi ngược để
đưa về miền xác định ban đầu, các biến đổi thường gặp trong xử lý ảnh gồm:
- Biến đổi Fourier, Cosin, Sin
- Biến đổi ảnh bằng tích chập, tích Kronecker
- Các biến đổi khác như KL (Karhumen Loeve), Hadamard
1.2.2. Nén ảnh

Ảnh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn. Khi mô tả ảnh
người ta đã đưa kỹ thuật nén ảnh vào. Các giai đoạn nén ảnh có thể chia ra thế
hệ 1, thế hệ 2. Hiện nay, các chuẩn MPEG được dùng với ảnh đang phát huy
hiệu quả.


1.3. Các bước cơ bản trong xử lý ảnh
Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị
thu (như Camera, máy chụp ảnh). Trước đây, ảnh thu qua Camera là các ảnh
tương tự (loại Camera ống kiểu CCIR). Gần đây, với sự phát triển của công
nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau đó nó được chuyển
trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. Mặt khác, ảnh cũng có
thể tiếp nhận từ vệ tinh, có thể quét từ ảnh chụp bằng máy quét ảnh. Hình 1.3
dưới đây mô tả các bước cơ bản trong xử lý ảnh:
Thu
nhận
ảnh

Tiền xử
lý ảnh

Phân
đoạn
ảnh

Biểu
diễn và
mô tả

Nhận

dạng và
nội suy

Cơ sở tri thức
Hình 1.3: Các bước cơ bản trong xử lý ảnh
1.3.1. Phần thu nhận ảnh (Image Acquisition)
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua
camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh
25 dòng), cũng có loại camera đã số hoá (như loại CCD – Change Coupled
Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh. Camera thường
dùng là loại quét dòng, ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu
nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh).
1.3.2. Tiền xử lý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào
bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc
nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn.


1.3.3. Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để
biểu diễn phân tích, nhận dạng ảnh. Ví dụ: Để nhận dạng chữ (hoặc mã vạch)
trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về
địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt
để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ
gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất
nhiều vào công đoạn này.
1.3.4. Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân
đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này
thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn

các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng gắn với việc tách các
đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân
biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được. Ví
dụ: Trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng
của từng ký tự giúp phân biệt ký tự này với ký tự khác.
1.3.5. Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được
bằng cách so sánh với mẫu chuẩn đã được lưu từ trước. Nội suy là phán đoán
theo ý nghĩa trên cơ sở nhận dạng. Các mô hình toán học về ảnh được phân
theo hai loại nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số
- Nhận dạng theo cấu trúc
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là: Nhận dạng ký tự (chữ in, chữ viết tay, chữ ký
điện tử), nhận dạng văn bản, nhận dạng vân tay, nhận dạng mã vạch, nhận
dạng mặt người…


1.3.6. Cơ sở tri thức (Knowledge Base)
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung
lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong
nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp
toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình
tiếp nhận và xử lý ảnh theo cách của con người. Trong các bước xử lý đó,
nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người. Vì vậy,
ở đây các cơ sở tri thức được phát huy.
1.3.7. Mô tả (biểu diễn ảnh)
Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu
tiếp theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung
lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công

nghệ. Thông thường, các ảnh thô đó được biểu diễn lại (hay đơn giản là mã
hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image
Features) như: Biên ảnh (Boundary), vùng ảnh (Region). Một số phương pháp
biểu diễn thường dùng:
• Biểu diễn bằng mã chạy (Run Length Code)
• Biểu diễn bằng mã xích (Chaine Code)
• Biểu diễn bằng mã tứ phân (Quad Tree Code)
1.3.8. Biểu diễn bằng mã chạy
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị
phân. Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:
- U(m, n) = 1 nếu (m, n) thuộc R
- U(m, n) = 0 nếu (m, n) không thuộc R
Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n). Với cách
biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1.
Giả sử chúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo tọa


độ (x, y) theo các chiều và đặc tả chỉ đối với giá trị “1” khi đó dạng mô tả có
thể là: (x, y)r; trong đó (x, y) là tọa độ, r là số lượng các bit có giá trị “1” liên
tục theo chiều ngang hoặc dọc.
Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh. Một đường
bất kỳ được chia thành các đoạn nhỏ. Nối các điểm chia, ta có các đoạn thẳng
kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các
đoạn. Các hướng có thể chọn 4, 8, 12, 24, … mỗi hướng được mã hoá theo số
thập phân hoặc số nhị phân thành mã của hướng.
Biểu diễn bằng mã tứ phân
Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh. Vùng ảnh
đầu tiên được chia làm bốn phần thường là bằng nhau. Nếu mỗi vùng đã đồng
nhất (chứa toàn điểm đen “1” hay trắng “0”) thì gán cho vùng đó một mã và

không chia tiếp. Các vùng không đồng nhất được chia tiếp làm bốn phần theo
thủ tục trên cho đến khi tất cả các vùng đều đồng nhất. Các mã phân chia
thành các vùng con tạo thành một cây phân chia các vùng đồng nhất.
Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh. Trong thực
tế, các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu đó tùy
theo đặc điểm ứng dụng. Hình 1.4 cho sơ đồ phân tích và xử lý ảnh và lưu đồ
thông tin giữa các khối một cách khá đầy đủ. Ảnh sau khi được số hóa được
nén, lưu lại để truyền cho các hệ thống khác sử dụng hoặc để xử lý tiếp theo.
Mặt khác, ảnh sau khi số hóa có thể bỏ qua công đoạn nâng cao chất lượng
(khi ảnh đủ chất lượng theo một yêu cầu nào đó) để chuyển tới khâu phân
đoạn hoặc bỏ tiếp khâu phân đoạn chuyển trực tiếp tới khâu trích chọn đặc
trưng. Hình 1.4 cũng chia các nhánh song song, nâng cao chất lượng ảnh có hai
nhánh phân biệt: Nâng cao chất lượng ảnh (tăng độ sáng, độ tương phản, lọc
nhiễu) hoặc khôi phục ảnh (hồi phục lại ảnh thật khi ảnh nhận được bị méo) …


Cảnh
quan

Nén
ảnh

Lưu
ảnh

Truyền
ảnh

Ảnh
được

cải
thiện

Trích
chọn
đặc
trưng


Nâng chất
lượng ảnh
ảnh

Phân
tích
thống

cấu
trúc

Phân
đoạn

hóa
Ảnh
số

Ảnh tƣơng tự

Khôi phục

ảnh

Thu nhận ảnh

Mô tả
và nội
suy

Trích
chọn
quan
hệ

Hình 1.4: Sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối
1.4. Các định dạng ảnh cơ bản
1.4.1. Định dạng ảnh IMG
Ảnh IMG là ảnh đen trắng. Phần đầu của ảnh IMG có 16 byte chứa các
thông tin cần thiết:
+ 6 byte đầu: Dùng để đánh dấu định dạng ảnh IMG. Giá trị của 6 byte
này viết dới dạng Hexa: 0x0001 0x0008 0x0001.
+ 2 byte tiếp theo: Chứa độ dài mẫu tin. Đó là độ dài của dãy các byte
kề liền nhau mà dãy này sẽ được lặp lại một số lần nào đó. Số lần lặp này sẽ
được lưu trong byte đếm. Nhiều dãy giống nhau được lưu trong một byte.
+ 4 byte tiếp: Mô tả kích cỡ pixel
+ 2 byte tiếp: Số pixel trên một dòng ảnh
+ 2 byte cuối: Số dòng ảnh trong ảnh
Ảnh IMG được nén theo từng dòng. Mỗi dòng bao gồm các gói (pack).
Các dòng giống nhau cũng được nén thành một gói. Có 4 loại gói sau:
Loại 1: Gói các dòng giống nhau



Quy cách gói tin này như sau: 0x00 0x00 0xFF Count. Ba byte đầu cho
biết số các dãy giống nhau, byte cuối cho biết số các dòng giống nhau.
Loại 2: Gói các dãy giống nhau
Quy cách gói tin này như sau: 0x00 Count. Byte thứ hai cho biết số các
dãy giống nhau được nén trong gói. Độ dài của dãy ghi ở đầu tệp.
Loại 3: Dãy các pixel không giống nhau, không lặp lại và không nén được
Qui cách như sau: 0x80 Count. Byte thứ hai cho biết độ dài dãy các pixel
không giống nhau không nén được.
Loại 4: Dãy các pixel giống nhau
Tuỳ theo các bit cao của byte đầu được bật hay tắt. Nếu bit cao được bật
(giá trị 1) thì đây là gói nén các byte chỉ gồm bit 0, số các byte được nén được
tính bởi 7 bit thấp còn lại. Nếu bit cao tắt (giá trị 0) thì đây là gói nén các byte
gồm toàn bit 1. Số các byte được nén được tính bởi 7 bit thấp còn lại.
Các gói tin của file IMG phong phú như vậy là do ảnh IMG là ảnh đen
trắng, do vậy chỉ cần 1 bit cho 1 pixel thay vì 4 hoặc 8 như đã nói ở trên.
Toàn bộ ảnh chỉ có những điểm sáng và tối tương ứng với giá trị 1 hoặc giá trị
0. Tỷ lệ nén của kiểu định dạng này là khá cao.
1.4.2. Định dạng ảnh PCX
Định dạng ảnh PCX là một trong những định dạng ảnh cổ điển nhất. Nó
sử dụng phương pháp mã loạt dài RLE (Run Length Encoded) để nén dữ liệu
ảnh. Quá trình nén và giải nén được thực hiện trên từng dòng ảnh. Thực tế,
phương pháp giải nén PCX kém hiệu quả hơn so với kiểu IMG. Tệp PCX
gồm 3 phần: Đầu tệp (header), dữ liệu ảnh (image data) và bảng màu mở rộng
Header của tệp PCX có kích thước cố định gồm 128 byte và được phân bố
như sau:
+ 1 byte: Chỉ ra kiểu định dạng. Nếu là kiểu PCX / PCC nó luôn có giá
trị là 0Ah.
+ 1 byte: Chỉ ra version sử dụng để nén ảnh, có thể có các giá trị sau:



0: Version 2.5
2: Version 2.8 với bảng màu
3: Version 2.8 hay 3.0 không có bảng màu
5: Version 3.0 có bảng màu
+ 1 byte: Chỉ ra phương pháp mã hoá. Nếu là 0 thì mã hoá theo phương
pháp BYTE PACKED, nếu không là phương pháp RLE.
+ 1 byte: Số bit cho một điểm ảnh plane
+ 1 word: Tọa độ góc trái trên của ảnh. Với kiểu PCX có giá trị là (0, 0),
còn PCC thì khác (0, 0).
+ 1 word: Tọa độ góc phải dưới
+ 1 word: Kích thước bề rộng và bề cao ảnh
+ 1 word: Số điểm ảnh
+ 1 word: Độ phân giải màn hình
+ 48 byte: Chia thành 16 nhóm, mỗi nhóm 3 byte. Mỗi nhóm này chứa
thông tin về một thanh ghi màu. Như vậy ta có 16 thanh ghi màu.
+ 1 byte: Không dùng đến và luôn đặt là 0
+1 byte: Số bit plane mà ảnh sử dụng. Với ảnh 16 màu, giá trị này là 4,
với ảnh 256 màu (1 pixel / 8 bit) thì số bit plane lại là 1.
+ 1 byte: Số byte cho một dòng quét ảnh
+ 1 word: Kiểu bảng màu
+ 58 byte: Không dùng
Định dạng ảnh PCX thường được dùng để lưu trữ ảnh vì thao tác đơn
giản, cho phép nén và giải nén nhanh. Tuy nhiên vì cấu trúc của nó cố định,
nên trong một số trường hợp nó làm tăng kích thước lưu trữ. Và cũng vì


nhược điểm này mà một số ứng dụng lại sử dụng một kiểu định dạng khác
mềm dẻo hơn: Định dạng TIFF (Targed Image File Format).
1.4.3. Định dạng ảnh BMP

Trong đồ họa máy vi tính BMP (Windows bitmap), là một định dạng tập
tin hình ảnh khá phổ biến. Các tập tin đồ họa lưu dưới dạng BMP thường có
đuôi là “.BMP” hoặc “.DIB” (Device Independent Bitmap). Nếu ta hình dung
trong một tệp ảnh xếp liên tiếp các byte từ đầu đến cuối và dồn chúng vào
trong một hộp chữ nhật, thì có thể hình dung tệp ảnh BMP như hình vẽ sau:


Header

54 bytes

Color Palette

Số màu x 4 (byte)

Data of image

256 màu: 1 byte / 1 điểm ảnh
16 màu: 1 byte / 2 điểm ảnh
2 màu: 1 byte / 8 điểm ảnh
Hình 1.5: Định dạng ảnh BMP

1.4.4. Định dạng ảnh GIF
Cách lưu trữ kiểu PCX có lợi về không gian lưu trữ: Với ảnh đen trắng
kích thước tệp có thể nhỏ hơn bản gốc từ 5 đến 7 lần. Với ảnh 16 màu, kích
thước ảnh nhỏ hơn ảnh gốc 2  3 lần, có trường hợp có thể xấp xỉ ảnh gốc.
Tuy nhiên, với ảnh 256 màu thì nó bộc lộ rõ khả năng nén rất kém. Điều này
có thể lý giải như sau: Khi số màu tăng lên, các loạt dài xuất hiện ít hơn và vì
thế, lưu trữ theo kiểu PCX không còn lợi nữa. Hơn nữa, nếu ta muốn lưu trữ
nhiều đối tượng trên một tệp ảnh như kiểu định dạng TIFF, đòi hỏi có một

định dạng khác thích hợp.
Định dạng ảnh GIF do hãng ComputServer Incorporated (Mỹ) đề xuất
lần đầu tiên vào năm 1990. Với định dạng GIF, những vướng mắc mà các
định dạng khác gặp phải khi số màu trong ảnh tăng lên không còn nữa. Khi số


×