Tải bản đầy đủ (.pdf) (63 trang)

Một số kỹ thuật xử lý ảnh và xây dựng chương trình mô phỏng với ảnh JPG,

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.08 MB, 63 trang )

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN
--------------------------

PHẠM THỊ NGỌC THƯ

MỘT SỐ KỸ THUẬT XỬ LÝ ẢNH VÀ
XÂY DỰNG CHƯƠNG TRÌNH MƠ PHỎNG
VỚI ẢNH .JPG, .BMP

KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Khoa học máy tính

Hà Nội - 2015


TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
-------------------------KHOA CÔNG NGHỆ THÔNG TIN
--------------------------

PHẠM THỊ NGỌC THƯ
PHẠM THỊ NGỌC THƯ

MỘT SỐ KỸ THUẬT XỬ LÝ ẢNH VÀ
MỘT SỐ KỸ THUẬT XỬ LÝ ẢNH VÀ
XÂY DỰNG CHƯƠNG TRÌNH MƠ PHỎNG
XÂY DỰNG CHƯƠNG TRÌNH MƠ PHỎNG
VỚI ẢNH .JPG, .BMP
VỚI ẢNH .JPG, .BMP



KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Khoa học máy tính
Chuyên ngành: Khoa học máy tính

Người hướng dẫn khoa học
Người hướng dẫn khoa học
PGS. TS. LÊ HUY THẬP
PGS. TS. LÊ HUY THẬP

Hà Nội - 2015


LỜI CẢM ƠN
Lời đầu tiên em xin chân thành cảm ơn sự hướng dẫn tận tình của thầy
giáo PGS. TS. Lê Huy Thập đã trực tiếp hướng dẫn và chỉ bảo tận tình cho
em hồn thành khóa luận này.
Em cũng xin chân thành cảm ơn các thầy, cô giáo trong khoa Công
nghệ Thông tin, cũng như các thầy cô giáo trong trường đã giảng dạy và giúp
đỡ em trong các năm học vừa qua. Chính các thầy, cơ giáo đã xây dựng cho
chúng em những kiến thức nền tảng và kiến thức chun mơn để em có thể
hồn thành khóa luận tốt nghiệp và chuẩn bị cho những công việc của mình
sau này.
Cuối cùng em xin bày tỏ lịng biết ơn tới gia đình và bạn bè đã giúp đỡ
động viên em rất nhiều trong suốt quá trình học tập để em có thể thực hiện tốt
khóa luận này.
Do kiến thức và thời gian cịn hạn chế nên khóa luận khơng tránh khỏi
những thiếu sót. Kính mong nhận được sự đóng góp ý kiến của các thầy cơ và
các bạn để khóa luận được hồn thiện hơn.

Hà Nội, tháng 05 năm 2015
Sinh viên

Phạm Thị Ngọc Thư


LỜI CAM ĐOAN
Tên em là: PHẠM THỊ NGỌC THƯ
Sinh viên lớp: K37 – CNTT, khoa Công nghệ Thông tin, trường Đại học sư
phạm Hà Nội 2.
Em xin cam đoan:
1. Đề tài: “Một số kỹ thuật xử lý ảnh và xây dựng chương trình mơ phỏng
với ảnh .JPG, .BMP” là nghiên cứu của riêng em, dưới sự hướng dẫn
của thầy giáo PGS. TS. Lê Huy Thập.
2. Khóa luận hồn tồn khơng sao chép của tác giả nào khác.
Nếu sai em xin hoàn toàn chịu trách nhiệm.
Hà Nội, tháng 05 năm 2014
Người cam đoan

Phạm Thị Ngọc Thư


MỤC LỤC
MỞ ĐẦU ........................................................................................................... 1
CHƯƠNG 1 TỔNG QUAN VỀ XỬ LÝ ẢNH ................................................ 4
1.1. Xử lý ảnh .............................................................................................. 4
1.2. Những vấn đề cơ bản trong xử lý ảnh .................................................. 6
1.2.1. Khái niệm ....................................................................................... 6
1.2.2. Biểu diễn ảnh ................................................................................ 10
1.2.3. Tăng cường ảnh............................................................................ 12

1.2.4. Phân vùng ảnh .............................................................................. 12
1.2.5. Phân tích ảnh ............................................................................... 12
1.2.6. Nhận dạng ảnh ............................................................................. 13
1.2.7. Nén ảnh......................................................................................... 14
1.3. Các định dạng ảnh cơ bản................................................................... 14
1.3.1. Ảnh BMP (Bitmap) ....................................................................... 15
1.3.2. Ảnh JPEG (Joint Photographic Experts Group) ......................... 16
1.3.3. Ảnh PCX (Personal Computer Exchange) ................................... 16
1.3.4. Ảnh PNG (Portable Network Graphics) ...................................... 18
CHƯƠNG 2 MỘT SỐ KỸ THUẬT XỬ LÝ ẢNH ........................................ 19
2.1. Kỹ thuật sử dụng toán tử điểm ........................................................... 19
2.1.1. Tăng giảm độ sáng ....................................................................... 20
2.1.2. Tăng độ tương phản ..................................................................... 20
2.1.3. Biến đổi âm bản............................................................................ 21
2.1.4. Biến đổi ảnh đen trắng ................................................................. 22
2.2. Kỹ thuật lọc nhiễu ảnh ........................................................................ 22
2.2.1. Phép cuộn và mẫu ........................................................................ 23
2.2.2. Kỹ thuật làm trơn nhiễu bằng lọc tuyến tính ............................... 24
2.2.3. Kỹ Thuật làm trơn nhiễu bằng lọc phi tuyến ............................... 27
2.3. Kỹ thuật phát hiện biên ảnh ................................................................ 29
2.3.1. Khái niệm ..................................................................................... 29
2.3.2. Kỹ thuật phát hiện biên Gradient ................................................. 30


2.3.3. Kỹ thuật Laplace .......................................................................... 35
2.3.4. Kỹ thuật dò biên gián tiếp ............................................................ 36
CHƯƠNG 3 CÀI ĐẶT CHƯƠNG TRÌNH MƠ PHỎNG ............................. 38
3.1. Phát biểu bài toán .................................................................................. 38
3.2. Thiết kế chương trình ............................................................................ 38
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ...................................................... 46

TÀI LIỆU THAM KHẢO ............................................................................... 47
PHỤ LỤC ........................................................................................................ 48


DANH MỤC HÌNH
Hình 1.1. Q trình xử lý ảnh ........................................................................... 4
Hình 1.2. Các giai đoạn chính trong xử lý ảnh ................................................. 5
Hình 1.3. Ví dụ về ảnh đen trắng ...................................................................... 7
Hình 1.4. Ví dụ về ảnh màu .............................................................................. 8
Hình 1.5. Lân cận của 1 điểm ảnh..................................................................... 9
Hình 1.6. Minh họa ảnh biểu diễn bằng mã loạt dài: (1,1) 1; (1,3) 2; (2,0) 4;
(3,1) 2 .............................................................................................................. 11
Hình 1.7. Minh họa biểu diễn bằng Mã xích. ................................................. 11
Hình 1.8. Định dạng ảnh BMP. ....................................................................... 16
Hình 2.1. Biểu đồ dãn sự tương phản ............................................................. 21
Hình 2.2. Tâm mặt nạ và các điểm lân cận ..................................................... 25
Hình 3.1. Form giao diện chính của chương trình .......................................... 38
Hình 3.2. Form chức năng con thao tác với file ảnh ....................................... 39
Hình 3.3. Form chức năng con trong chỉnh sửa ảnh ....................................... 39
Hình 3.4. Form chức năng đổi màu ảnh .......................................................... 40
Hình 3.5. Form tạo ảnh âm bản ....................................................................... 40
Hình 3.6. Form tạo ảnh đen trắng ................................................................... 41
Hình 3.7. Form thay đổi độ sáng ..................................................................... 41
Hình 3.8. Form thay đổi độ tương phản .......................................................... 41
Hình 3.9. Form thay đổi màu sắc .................................................................... 42
Hình 3.10. Form chức năng làm mịn ảnh ....................................................... 42
Hình 3.11. Form chức năng tìm biên ảnh theo Sobell, Prewitt, Kirsh............ 43
Hình 3.12. Form chức năng tìm biên ảnh theo horizontal và vertical ............ 43
Hình 3.13. Form chức năng zoom ảnh ............................................................ 44
Hình 3.14. Form chức năng xoay ảnh ............................................................. 44

Hình 3.15. Form chức năng xoay ảnh theo hình trịn ..................................... 45
Hình 3.16. Form chức năng biến dạng ảnh theo hình cầu lồi ......................... 45
Hình 3.17. Form chức năng biến dạng ảnh theo hình sóng nước ................... 45


MỞ ĐẦU
1. Lý do chọn đề tài
Xử lý ảnh là một lĩnh vực mang tính khoa học và cơng nghệ. Nó là một
ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát
triển của nó rất nhanh. Hiện nay, trong các trường đại học, cao đẳng xử lý ảnh
đã trở thành một môn học chuyên ngành của sinh viên các ngành công nghệ
thông tin, viễn thông.
Xử lý nâng cao chất lượng ảnh là một vấn đề trọng tâm của môn học xử lý
ảnh đồng thời nó cũng là bước tiền xử lý cho việc nhận dạng, trích chọn thơng
tin trong xử lý ảnh số. Điều này cũng có ý nghĩa quan trọng trong nhiều ứng
dụng thực tế như tăng độ nét của một bức ảnh, làm biến dạng bức ảnh đó…
Trên thế giới đã có rất nhiều cơng trình nghiên cứu tại nhiều quốc gia
từ năm 1920 đến nay về xử lý ảnh đã góp phần thúc đẩy tiến bộ trong lĩnh vực
này lớn mạnh không ngừng. Xử lý ảnh là một trong những mảng quan trọng
nhất trong kỹ thuật thị giác máy tính là tiền đề cho nhiều nghiên cứu thuộc
lĩnh vực này. Hai nhiệm vụ cơ bản của quá trình xử lý ảnh là nâng cao chất
lượng hình ảnh và xử lý số liệu, cung cấp cho các q trình khác trong đó có
việc ứng dụng thị giác và điều khiển.
Q trình bắt đầu từ việc thu nhận ảnh nguồn (từ các thiết bị thu nhận ảnh
dạng số hoặc tương tự) gửi đến máy tính. Dữ liệu ảnh được lưu trữ ở định
dạng phù hợp với quá trình xử lý. Người lập trình sẽ tác động các thuật toán
tương ứng lên dữ liệu ảnh nhằm thay đổi cấu trúc ảnh phù hợp với các ứng
dụng khác nhau. Chính vì vậy em đã lựa chọn đề tài: “Một số kỹ thuật xử lý
ảnh và xây dựng chương trình mơ phỏng với ảnh JPG, BMP” để làm khóa
luận.

2. Mục đích nghiên cứu
- Nghiên cứu tổng quan về lý thuyết xử lý ảnh (các thành phần của hệ
thống xử lý ảnh, các khái niệm và vấn đề liên quan, bộ lọc ảnh, biên
ảnh...).
1


- Tìm hiểu một số kỹ thuật cơ bản trong xử lý ảnh.
- Xây dựng chương trình mơ phỏng với ảnh JPG, BMP.
3. Nhiệm vụ nghiên cứu
- Tìm hiểu về các kỹ thuật trong xử lý ảnh như xử lý điểm ảnh, làm mịn
ảnh, tìm biên ảnh, biến dạng ảnh….
- Xây dựng chương trình mơ phỏng bằng ngơn ngữ C# về một số kỹ
thuật xử lý ảnh với ảnh định dạng JPG và BMP.
4. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: Các kỹ thuật xử lý ảnh như: kỹ thuật sử dụng
toán tử điểm, kỹ thuật lọc nhiễu, kỹ thuật phát hiện biên ảnh.
- Phạm vi nghiên cứu: Khóa luận tìm hiểu một số kỹ thuật xử lý ảnh như:
Kỹ thuật tăng giảm độ sáng, tăng độ tương phản, biến đổi thành ảnh âm
bản, ảnh đen trắng, kỹ thuật lọc nhiễu và phát hiện biên ảnh. Các kỹ
thuật xử lý ảnh cơ bản trên ảnh định dạng .JPG và .BMP.
5. Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học: Xử lý ảnh ra đời, phát triển và có cơ sở khoa học
vững chắc. Nghiên cứu sẽ góp phần chứng minh thêm tính đúng đắn của lý
thuyết xử lý ảnh số. Hiện nay, xử lý ảnh là một lĩnh vực đang được các
chuyên gia nghiên cứu và phát triển.
Ý nghĩa thực tiễn: Xây dựng chương trình thử nghiệm một số kỹ thuật
xử lý ảnh nếu thành cơng sẽ góp một phần nhỏ trong việc xử lý hình ảnh với
những thao tác cơ bản như làm biến đổi màu ảnh, làm mịn ảnh, tìm biên ảnh
và biến dạng hình ảnh.

6. Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý luận
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây
dựng cơ sở lý thuyết của khóa luận và các biện pháp cần thiết để giải quyết
các vấn đề của khóa luận.

2


- Phương pháp chuyên gia
Tham khảo ý kiến của các chun gia để có thể thiết kế chương trình
phù hợp với yêu cầu thực tiễn. Nội dung xử lý nhanh đáp ứng được yêu cầu
ngày càng cao của người sử dụng.
- Phương pháp thực nghiệm
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được
nghiên cứu và kết quả đạt được qua những phương pháp trên.
7. Cấu trúc khóa luận
Ngồi phần lời cảm ơn, mở đầu, kết luận và hướng phát triển, tài liệu
tham khảo, khóa luận có những nội dung sau:
Chương 1: Tổng quan về xử lý ảnh - Chương này trình bày một số kiến
thức cơ bản về xử lý ảnh: Khái niệm xử lý ảnh, các ứng dụng, các bước cơ
bản trong xử lý ảnh và trình bày một số định dạng ảnh cơ bản.
Chương 2: Một số kỹ thuật xử lý ảnh - Trong chương này, khóa luận
trình bày một số kỹ thuật xử lý ảnh.
Chương 3: Cài đặt chương trình mơ phỏng - Từ những kiến thức đã
nghiên cứu, khóa luận xây dựng một chương trình mơ phỏng các kỹ thuật xử
lý ảnh đối với ảnh .JPG và .BMP.

3



CHƯƠNG 1
TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1.

Xử lý ảnh
Con người thu nhận thơng tin qua các giác quan, trong đó thị giác đóng

vai trị quan trọng nhất. Những năm trở lại đây với sự phát triển của phần
cứng máy tính, xử lý ảnh và đồ họa phát triển một cách mạnh mẽ và có nhiều
ứng dụng trong cuộc sống. Xử lý ảnh và đồ họa đóng một vai trị quan trọng
trong tương tác người máy.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một q trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận.
Ảnh
Ảnh

Xử lý ảnh

“tốt hơn”
Kết luận

Hình 1.1. Q trình xử lý ảnh
Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay
một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta
xem xét các bước cần thiết trong xử lý ảnh.

4



Lưu
trữ
Camera
Thu nhận
ảnh

Số
hóa

Phân tích
ảnh

Nhận
dạng

Sensor
Lưu
trữ

Hệ quyết
định

Hình 1.2. Các giai đoạn chính trong xử lý ảnh
Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera.
Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu
CCIR), nhưng cũng có thể là tín hiệu số hóa (loại CCD – Charge Coupled
Device).
Ngồi ra, ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng
(sensor) hay ảnh, tranh được quét trên scanner.

Tiếp theo là quá trình số hóa (digitalize) để biến đổi tín hiệu tương tự
sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển
sang giai đoạn xử lý, phân tích hay lưu trữ lại.
Q trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ.
Trước hết là công việc tăng cường ảnh. Do những nguyên nhân khác nhau: có
thể do chất lượng thiết bị thu nhận hình ảnh, do nguồn sáng hay do nhiễu mà
ảnh có thể bị suy biến. Do vậy cần phải tăng cường và khơi phục ảnh để làm
nổi bật một số đặc tính của ảnh hay làm cho ảnh gần giống với trạng thái gốc
– trạng thái trước khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện các
đặc tính như: biên, phân vùng ảnh, trích chọn các đặc tính v.v…
Cuối cùng, tùy theo mục đích của ứng dụng mà sẽ là giai đoạn nhận
dạng, phân lớp hay các quyết định khác.
5


1.2.

Những vấn đề cơ bản trong xử lý ảnh

1.2.1. Khái niệm
a) Điểm ảnh (pixel element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng.
Để xử lý bằng máy tính (số), ảnh cần phải được số hóa. Số hóa ảnh là sự biến
đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị
trí (khơng gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó
được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng.
Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là
Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y).
b) Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định

trên một ảnh số được hiển thị.
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao
cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách
thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân
bố theo trục x và y trong không gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic
Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc *
200 điểm ảnh (320*200). Rõ ràng, cùng màn hình CGA 12 “ta nhận thấy mịn
hơn màn hình CGA 17’’ độ phân giải 320*200. Lý do: cùng một mật độ (độ
phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các
điểm) kém hơn.
c) Mức xám của ảnh (Gray level)
Là kết quả của sự biến đổi tương ứng một giá trị độ sáng của một điểm
ảnh với một giá trị nguyên dương. Thơng thường nó xác định trong khoảng
[0…255]. Tùy thuộc vào giá trị xám mà mỗi điểm ảnh được biểu diễn trên 1,
4, 8, 24 hay 32 bit.

6


Chỉnh số mức xám là nhằm khắc phục tính khơng đồng đều của hệ
thống xử lý ảnh, thơng thường có 2 hướng tiếp cận:
Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau
thành một bó. Trường hợp giảm xuống 2 mức xám thì chính là chuyển về ảnh
đen trắng.
Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng
kỹ thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
d) Ảnh số
Là tập hợp hữu hạn các điểm ảnh, thường được biểu diễn bằng một
mảng hai chiều I(m,n) với m là số hàng, n là số cột. Ký hiệu P(x,y) là một

điểm ảnh tại vị trí (x,y). Số lượng điểm ảnh trên mỗi hàng hoặc các hàng xác
định độ phân giải của ảnh. Ảnh số được chia làm 3 loại:
+ Ảnh nhị phân
Giá trị xám của tất cả các điểm ảnh chỉ nhận giá trị 1 hoặc 0. Như vậy
mỗi điểm ảnh trong ảnh nhị phân được biểu diễn bởi 1 bit.

Hình 1.3. Ví dụ về ảnh đen trắng
+ Ảnh xám
Giá trị xám nằm trong khoảng 0,…, 255. Như vậy mỗi điểm ảnh trong
ảnh xám được biểu diễn bởi 1 byte.

7


+ Ảnh màu
Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: đỏ
(R), lục (G), lơ (B) và thường thu nhận trên các dải băng tần khác nhau. Với
ảnh màu, cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các
số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red),
lục (green), lam (blue). Để biểu diễn cho một điểm ảnh màu cần 24 bit, 24 bit
này được chia thành ba khoảng 8 bit. Mỗi màu cũng phân thành L cấp màu
khác nhau (thường L=256). Mỗi khoảng này biểu diễn cho cường độ sáng của
một trong các màu chính.
Mỗi pixel ảnh màu ký hiệu Px, được viết:
=[

,

,


]

(1.1)

Hình 1.4. Ví dụ về ảnh màu
e) Các mối quan hệ cơ bản giữa các điểm ảnh
+ Lân cận của một điểm ảnh
Một điểm ảnh p tại tọa độ (x,y) có các lân cận theo chiều ngang và
chiều dọc là: (x+1,y), (x-1,y), (x,y+1), (x,y-1).
Tập hợp các điểm ảnh trên được gọi là lân cận 4 của p, kí hiệu N4(p).
Mỗi điểm ảnh có khoảng cách đơn vị đến (x,y), và nếu (x,y) nằm trên biên
của ảnh thì lân cận của nó có thể nằm ngồi ảnh
Các lân cận chéo của p có tọa độ: (x+1,y+1), (x+1,y-1), (x-1,y+1), (x1,y-1)
8


Tập lân cận chéo được ký hiệu ND(p).
Tập lân cận chéo cùng với lân cận 4 tạo thành lân cân 8 của p, ký hiệu
N8(p).

Hình 1.5. Lân cận của 1 điểm ảnh
+ Liên kết giữa các điểm ảnh
Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của
đối tượng vật thể hoặc xác định vùng trong một ảnh. Một liên kết được đặc
trưng bởi tính liền kề giữa các điểm và mức xám của chúng.
Giả sử V là tập các giá trị mức xám. Một ảnh có các giá trị cường độ
sáng từ thang mức xám từ 32 đến 64 được mô tả như sau:
= {32, 33, … ,63,64}
Có 3 loại liên kết:
+ Liên kết 4: Hai điểm ảnh p và q với các giá trị cường độ sáng V được

nói là lien kết 4 nếu q nằm trong tập

( ).

+ Liên kết 8: Hai điểm ảnh p và q với các giá trị cường độ sáng V được
gọi là lien kết 8 nếu q nằm trong tập

( ).

+ Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị
cường độ sáng V được nói là liên kết m nếu: q thuộc

( )

hoặc q thuộc

( ).

f) Lược đồ mức xám (Histogram)
Lược đồ mức xám của ảnh là một hàm cung cấp tần suất xuất hiện của
mỗi mức xám trong ảnh. Lược đồ mức xám được biểu diễn trong hệ tọa độ
Decac xOy, trong đó Ox biểu diễn các mức xám của ảnh (256 mức trong

9


trường hợp chúng ta xét), Oy biểu diễn số điểm ảnh cho một mức xám (số
điểm ảnh có cùng mức xám).
Lược đồ mức xám cung cấp rất nhiều thông tin về sự phân bố mức xám
của ảnh. Theo thuật ngữ của xử lý ảnh gọi là tính động của ảnh, tính động của

ảnh cho phép phân tích một khoảng nào đó phân bố phần lớn các mức xám
của ảnh: ảnh rất sáng hay rất đậm. Nếu ảnh sáng, lược đồ xám nằm bên phải
(mức xám cao), cịn ảnh đậm thì lược đồ xám nằm bên trái (mức xám thấp).
1.2.2. Biểu diễn ảnh
Ảnh sau khi số hóa sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu
tiếp theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thơ, địi hỏi dung
lượng bộ nhớ cực lớn và khơng hiệu quả theo quan điểm ứng dụng và công
nghệ. Thông thường, các ảnh thơ đó được đặc tả (biểu diễn) lại (hay đơn giản
là mã hóa) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image
Features) như: biên ảnh (Bouundary), vùng ảnh (Region). Một số phương
pháp biểu diễn thường dùng.
+ Biểu diễn bằng mã chạy (Run-Length Code).
+ Biểu diễn bằng mã xích (Chanine-Code).
+ Biểu diễn bằng mã tứ phân (Quad-Tree Code).
a) Biểu diễn bằng mã chạy
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh
nhị phân. Một vùng ảnh R có thể mã hóa đơn giản nhờ một ma trận nhị phân:
( , )=

1
0

ê ( , ) ℎ ộ
ê ( , ) ℎơ
ℎ ộ

(1.2)

Trong đó: U(m,n) là hàm mơ tả mức xám ảnh tại tọa độ (m,n). Với cách
biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1.

Giả sử mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo tọa độ (x,y)
theo các chiều và đặc tả chỉ đối với giá trị “1”. Khi đó dạng mơ tả có thể là:
(x,y)r; trong đó (x,y) là tọa độ, r là số lượng các bit có giá trị “1” liên tục theo
chiều ngang hoặc dọc.
10


Hình 1.6. Minh họa ảnh biểu diễn bằng mã loạt dài: (1,1) 1; (1,3) 2; (2,0) 4; (3,1) 2
b) Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh. Một
đường bất kỳ được chia thành các đoạn nhỏ. Nối các điểm chia, ta có các
đoạn thẳng kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích
gồm các đoạn. Các hướng có thể chọn 4, 8, 12, 24,… mỗi hướng được mã hóa
theo số thập phân hoặc số nhị phân thành mã của hướng.

Hình 1.7. Minh họa biểu diễn bằng Mã xích.
Theo hình 1.7 thấy được hướng các điểm biên và mã tương ứng là:
A11070110764545432
c) Biểu diễn bằng mã tứ phân
Theo phương pháp mã tứ phân, một vùng của ảnh coi như bao kín bởi
một hình chữ nhật. Vùng này được chia làm 4 vùng con. Nếu vùng con gồm
toàn điểm đen (1) hay tồn điểm trắng (0) thì khơng cần chia tiếp. Trong
trường hợp ngược lại, vùng con gồm cả đen và trắng gọi là vùng xám lại tiếp
tục được chia làm 4 vùng con tiếp. Quá trình chia dừng lại khi khơng thể chia
tiếp được nữa, có nghĩa là vùng con chỉ chứa thuần nhất điểm đen hay trắng.
Như vậy, cây biểu diễn gồm một chuỗi các kí hiệu b (black), w (white) và g
11


(grey) kèm theo ký hiệu mã hóa 4 vùng con. Biểu diễn theo phương pháp này

ưu việt hơn so với các phương pháp trên, nhất là so với mã loạt dài. Tuy
nhiên, để tính tốn số đo các hình như chu vi, momen là khá khó.
1.2.3. Tăng cường ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Tăng
cường ảnh nhằm hồn thiện các đặc tính của ảnh như:
+ Lọc nhiễu, hay làm trơn ảnh.
+ Tăng độ tương phản, điều chỉnh mức xám của ảnh.
+ Làm nổi biên ảnh.
Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên
các kỹ thuật trong miền điểm, không gian và tần số.
1.2.4. Phân vùng ảnh
Để phân tích các đối tượng trong ảnh, cần phải phân biệt được các đối
tượng cần quan tâm với phần còn lại của ảnh. Những đối tượng này có thể tìm
ra được nhờ các kỹ thuật phân vùng ảnh.
Vùng ảnh là một chi tiết, một thực thể trong tồn cảnh. Nói đến vùng
ảnh là nói đến tính chất bề mặt của ảnh. Nó là một tập hợp các điểm có cùng
hoặc gần cùng một tính chất nào đó: Mức xám, màu sắc… Đường bao quanh
một vùng ảnh (Boundary) là biên ảnh. Các điểm trong một vùng ảnh có độ
biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng.
Một phương pháp phân vùng ảnh là sử dụng một ngưỡng giá trị xám để
phân tách ảnh thành đối tượng và nền (những điểm dưới ngưỡng xám thuộc
về nền, ngược lại thuộc về đối tượng).
1.2.5. Phân tích ảnh
Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh.
Trong phân tích ảnh việc trích chọn đặc điểm là một bước quan trọng. Các
đặc điểm của đối tượng được trích chọn tùy theo mục đích nhận dạng trong
q trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:

12



+ Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn…
+ Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc
thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc
điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ
nhật, tam giác, cung tròn…)
+ Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối
tượng và do vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến được
dùng khi nhận dạng đối tượng (Ví dụ các điểm góc, cạnh…). Các đặc điểm
này có thể được trích chọn thơng qua ảnh biên. Để thu được ảnh biên ta có thể
sử dụng toán tử gradient, toán tử la bàn, toán tử Laplace….
Việc trích chọn thơng qua các đặc điểm giúp cho việc nhận dạng các
đối tượng ảnh chính xác, với tốc độ tính tốn cao và giảm thiểu dung lượng
lưu trữ.
1.2.6. Nhận dạng ảnh
Nhận dạng là quá trình phân loại các đối tượng được biểu diễn theo
một mơ hình nào đó và gán chúng một tên (gán cho đối tượng một tên gọi, tức
là một dạng) dựa theo những quy luật và mẫu chuẩn.
Theo lý thuyết về nhận dạng, các mơ hình tốn học về ảnh được phân
theo hai loại nhận dạng ảnh cơ bản:
+ Nhận dạng theo tham số.
+ Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký
điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch,
nhận dạng mặt người…
Ngoài ra, hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng
nơron đang được áp dụng và cho kết quả khả quan.
13



1.2.7. Nén ảnh
Nén ảnh là kỹ thuật nhằm giảm thiểu không gian lưu trữ của ảnh, nén
ảnh thường được tiến hành theo cả hai khuynh hướng là nén có bảo tồn và
khơng bảo tồn thơng tin.
Nén khơng bảo tồn thì thường có khả năng nén cao hơn nhưng khả
năng phục hồi thì kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận
cơ bản trong nén ảnh:
+ Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất
xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa
thích hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
+ Nén ảnh khơng gian: Kỹ thuật này dựa vào vị trí khơng gian của các
điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm
ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là nén *.PCX
+ Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng
nén khơng bảo tồn và do vậy, kỹ thuật hướng đến hiệu quả hơn.*.JPG chính
là tiếp cận theo kỹ thuật nén này.
+ Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh,
thể hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính tốn để chỉ cần lưu trữ
phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
1.3.

Các định dạng ảnh cơ bản
Ảnh thu được sau quá trình số hóa thường được lưu lại cho các q

trình xử lý tiếp theo hay trình đi. Trong quá trình phát triển của kỹ thuật xử lý
ảnh, tồn tại nhiều định dạng ảnh khác nhau từ ảnh đen trắng (với định dạng
IMG), ảnh đa cấp xám cho đến ảnh màu: (BMP, GIF, JPE…). Tuy các định
dạng này khác nhau, song chúng đều tuân thủ theo một cấu trúc chung nhất.

Nhìn chung, một tệp ảnh bất kỳ thường bao gồm 3 phần:
+ Mào đầu tệp (Header).
+ Dữ liệu nén (Data Compression).
+ Bảng màu (Palette Color).
14


Bảng 1.1. Cấu trúc một tệp ảnh
Là chứa các thông tin về kiểu ảnh, kích thước, độ phân
Mào đầu tệp

giải, số bit dùng cho 1 pixel, cách mã hóa, vị trí bảng
màu…
Số liệu ảnh được mã hóa bởi kiểu mã hóa chỉ ra trong

Dữ kiệu nén

phần Header
Bảng màu khơng nhất thiết phải có, ví dụ khi ảnh là đen
trắng.

Bảng màu

Nếu có, bảng màu cho biết số màu dùng trong ảnh và
bảng màu được sử dụng để hiển thị màu của ảnh.

Trong quá trình xử lý ảnh, đầu tiên phải tiến hành đọc tệp ảnh và
chuyển vào bộ nhớ của máy tính dưới dạng ma trận số liệu ảnh. Khi lưu trữ
dưới dạng tệp, ảnh là một khối gồm một số các byte. Để đọc đúng tệp ảnh ta
cần hiểu ý nghĩa các phần trong cấu trúc của tệp ảnh như đã nêu trên. Trước

tiên, ta cần đọc phần mào đầu để lấy các thông tin chung và thông tin điều
khiển. Việc đọc này sẽ dừng ngay khi ta không gặp được chữ ký (Chữ ký ở
đây thường được hiểu là một mã chỉ ra định dạng ảnh và đời (version) của nó)
mong muốn. Dựa vào thơng tin điều khiển, ta xác đinh được vị trí bảng màu
và đọc nó vào bộ nhớ. Cuối cùng, ta đọc phần dữ liệu nén.
Sau khi đọc xong các khối dữ liệu ảnh vào bộ nhớ ta tiến hành nén dữ
liệu ảnh. Căn cứ vào phương pháp nén chỉ ra trong phần Header ta giải mã
được ảnh. Cuối cùng là khâu hiện ảnh. Dựa vào số liệu ảnh đã giải nén, vị trí
và kích thước ảnh, cùng sự trợ giúp của bảng màu ảnh được hiện lên trên màn
hình.
1.3.1. Ảnh BMP (Bitmap)
Trong đồ họa máy vi tính BMP là một định dạng tập tin hình ảnh khá
phổ biến. Các tập tin đồ họa lưu dưới dạng BMP thường có đi là .BMP
hoặc .DIB (Device Independent Bitmap). Nếu ta hình dung trong một tệp ảnh
15


xếp liên tiếp các byte từ đầu đến cuối và dồn chúng vào trong một hộp chữ
nhật, thì có thể hình dung tệp ảnh BMP như hình vẽ sau:
Header

54 bytes

Color Palette

Số màu x 4 (byte)

Data of image

256 màu: 1 byte / 1 điểm ảnh

16 màu: 1 byte / 2 điểm ảnh
2 màu: 1 byte / 8 điểm ảnh

Hình 1.8. Định dạng ảnh BMP
Ưu điểm của ảnh Bitmap là tốc độ vẽ và tốc độ xử lý nhanh. Nhược
điểm của nó là kích thước rất lớn.
1.3.2. Ảnh JPEG (Joint Photographic Experts Group)
Phương pháp nén ảnh JPEG (Joint Photographic – Experts Group) là
một trong những phương pháp nén ảnh hiệu quả, có tỷ lệ nén ảnh tới vài chục
lần. Tuy nhiên ảnh sau khi giải nén sẽ khác với ảnh ban đầu. Chất lượng ảnh
bị suy giảm sau khi giải nén. Sự suy giảm này tăng dần theo hệ số nén. Tuy
nhiên sự mất mát thơng tin này là có thể chấp nhận được và việc loại bỏ
những thông tin không cần thiết được dựa trên những nghiên cứu về hệ nhãn
thị của mắt người. Phần mở rộng của các file JPEG thường có dạng “.JPEG”,
“.JFIF”, “.JPG”. “JPG” là định dạng được dùng phổ biến nhất.
1.3.3. Ảnh PCX (Personal Computer Exchange)
Định dạng ảnh PCX là một trong những định dạng ảnh cổ điển nhất. Nó
sử dụng phương pháp mã loạt dài RLE (RunLengthEncoded) để nén dữ liệu
ảnh. Quá trình nén và giải nén được thực hiện trên từng dòng ảnh. Thực tế,
phương pháp giải nén PCX kém hiệu quả hơn so với kiểu IMG. Tệp PCX
gồm 3 phần: Đầu tệp (header), dữ liệuảnh (image data) và bảng màu mở rộng

16


Header của tệp PCX có kích thước cố định gồm 128 byte và được phân bố
như sau:
+ 1 byte: Chỉ ra kiểu định dạng, nếu là kiểu PCX/PCC nó ln có giá trị là
0Ah.
+ 1 byte: Chỉ ra version sử dụng để nén ảnh, có thể có các giá trị sau:

0: Version 2.5
2: Version 2.8 với bảng màu
3: Version 2.8 hay 3.0 khơng có bảng màu
5: Version 3.0 có bảng màu
+ 1 byte: Chỉ ra phương pháp mã hoá. Nếu là 0 thì mã hố theo phương
pháp BYTE PACKED ngược lại là phương pháp RLE.
+ 1 byte: Số bit cho một điểm ảnh plane
+ 1 word: Tọa độ góc trái trên của ảnh. Với kiểu PCX nó có giá trị là
(0,0); cịn PCC thì khác (0,0).
+ 1 word: Toạ độ góc phải dưới
+ 1 word: Kích thước bề rộng và bề cao ảnh
+ 1 word: Số điểm ảnh
+ 1 word: Độ phân giải màn hình
+ 48 byte: Chia thành 16 nhóm, mỗi nhóm 3 byte. Mỗi nhóm này chứa
thơng tin về một thanh ghi màu. Như vậy ta có 16 thanh ghi màu.
+ 1 byte: Không dùng đến và luôn đặt là 0
+1 byte: Số bit plane mà ảnh sử dụng. Với ảnh 16 màu, giá trị này là 4,
với ảnh 256 màu (1 pixel/8 bit) thì số bit plane lại là 1.
+ 1 byte: Số byte cho một dòng quét ảnh
+ 1 word: Kiểu bảng màu
17


+ 58 byte: Không dùng
Định dạng ảnh PCX thườngđược dùng để lưu trữ ảnh vì thao tác đơn giản,
cho phép nén và giải nén nhanh. Tuy nhiên vì cấu trúc của nó cố định, nên
trong một số trường hợp nó làm tăng kích thước lưu trữ. Và cũng vì nhược
điểm này mà một số ứng dụng lại sử dụng một kiểu định dạng khác mềm dẻo
hơn: Định dạng TIFF (Targed Image File Format).
1.3.4. Ảnh PNG (Portable Network Graphics)

PNG (Portable Network Graphics) là một dạng hình ảnh sử dụng
phương pháp nén dữ liệu mới, không làm mất đi dữ liệu gốc. PNG được tạo ra
nhằm cải thiện và thay thế định dạng ảnh GIF với một định dạng hình ảnh
khơng địi hỏi phải có giấy phép sáng chế khi sử dụng. PNG được hỗ trợ bởi
thư viện tham chiếu LIBPNG (Library Portable Network Graphics), một thư
viện nền tảng độc lập bao gồm các hàm của C để quản lý các hình ảnh PNG.
Những tập tin PNG thường có phần mở rộng là PNG và đã được gán
kiểu chuẩn MIME là image/png (được công nhận vào ngày 14 tháng 10 năm
1996).
.

18


×