Tải bản đầy đủ (.doc) (64 trang)

Nâng cao chất lượng hình ảnh bằng các phép toán số học (2014)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.28 MB, 64 trang )

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN
--------***---------

NGUYỄN NGỌC LỄ

NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH
BẰNG CÁC PHÉP TOÁN SỐ HỌC

KHÓA LUẬN TỐT NGHIỆP
Chuyên ngành: Tin học

HÀ NỘI – 2014


TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN
--------***---------

NGUYỄN NGỌC LỄ

NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH
BẰNG CÁC PHÉP TOÁN SỐ HỌC

KHÓA LUẬN TỐT NGHIỆP
Chuyên ngành: Tin học

Người hướng dẫn khoa học
PGS. TS. LÊ HUY THẬP

HÀ NỘI – 2014




LỜI CẢM

N

Lời đầu tiên, em xin chân thành cảm ơn PGS. TS Lê Huy Thập đã trực
tiếp hướng dẫn em hoàn thành khóa luận. Với những lời chỉ dẫn, sự tận tình
hướng dẫn của thầy đã giúp em vượt qua nhiều khó khăn trong quá trình hoàn
thành khóa luận này.
Em cũng xin cảm ơn Th.S Lưu Thị Bích Hương về những góp ý và
hướng dẫn rất hữu ích trong quá trình thực hiện khóa luận.
Em cũng xin gửi lời cảm ơn tới các thầy, cô giáo trong khoa Công nghệ
Thông tin trường Đại học Sư phạm Hà Nội 2 những người đã giúp đỡ cho em
trong suốt quá trình học tập và nghiên cứu.
Cuối cùng, em xin bày tỏ lòng biết ơn tới gia đình và các bạn bè đã
giúp đỡ, động viên em rất nhiều trong suốt quá trình học tập để em có thể
thực hiện tốt khóa luận này.
Hà Nội, tháng 5 năm 2014
Sinh viên thực hiện

Nguyễn Ngọc Lễ


LỜI CAM ĐOAN
Tên em là: NGUY N NG C L
Sinh viên lớp: K36 – Tin học, khoa Công nghệ Thông tin, trường Đại
học Sư phạm Hà Nội 2.
Em xin cam đoan:
1. Đề tài:“


hình



là sự nghiên cứu của riêng em, dưới sự hướng dẫn của PGS. TS Lê Huy Thập.
2. Khóa luận hoàn toàn không sao chép của tác giả nào khác.
Nếu sai em xin hoàn toàn chịu trách nhiệm.
Hà Nội, tháng 5 năm 2014
Sinh viên thực hiện

Nguyễn Ngọc Lễ


M CL C
MỞ ĐẦU...............................................................................................................1
CHƯ NG 1. TỔNG QUAN VỀ XỬ LÝ ẢNH................................................4
1.1. Xử lý ảnh là gì .............................................................................................4
1.2. Một số khái niệm liên quan.........................................................................5
1.2.1. Điểm ảnh ......................................................................................... 5
1.2.2. Độ phân giải của ảnh....................................................................... 5
1.2.3. Mức xám của ảnh (Gray level) ....................................................... 6
1.2.4. Ảnh số ............................................................................................. 6
1.2.5. Các mối quan hệ cơ bản giữa các điểm ảnh.................................... 7
1.2.6. Lược đồ mức xám (Histogram)....................................................... 9
1.2.7. Phân vùng ảnh ............................................................................... 10
1.2.8. Trích chọn đặc tính ....................................................................... 10
1.3. Các ứng dụng của xử lý ảnh......................................................................11
1.4. Các bước cơ bản trong xử lý ảnh
...............................................................12

1.5. Các thành phần của một hệ thống xử lý ảnh ...........................................18
1.6. Các định dạng ảnh cơ
bản..........................................................................19
CHƯ NG 2. CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH
..............................................................................................................................23
2.1. Các phương pháp......................................................................................23
2.2. Phép tăng giảm độ sáng............................................................................24
2.3. Phép toán tăng độ tương phản (Stretching Contrast) ..............................25
2.4. Biến đổi ảnh âm bản.................................................................................28
2.5. Biến đổi ảnh màu về ảnh xám..................................................................29
2.6. Biến đổi ảnh nhị phân ..............................................................................30
2.7. Nâng cao chất lượng ảnh sử dụng các toán tử số học/logic....................31
2.8. Các phép toán trên lược đồ xám (Histogram) .........................................37


2.9. Các phép lọc .............................................................................................41
2.9.1. Lọc trung bình .............................................................................. 41
2.9.2. Lọc trung vị ................................................................................... 43
CHƯ NG 3. XÂY DỰNG VÀ CÀI ĐẶT CHƯ NG TRÌNH....................46
3.1. Phát biểu bài toán .....................................................................................46
3.2. Một số hàm thủ tục...................................................................................46
3.2.1. Hàm quay ảnh về ban đầu.............................................................. 46
3.2.2. Hàm thực hiện zoom ảnh ............................................................... 47
3.2.3. Xử lý trực tiếp trên ảnh ................................................................. 47
3.2.4. Xử lý bằng con trỏ và bộ đệm ....................................................... 48
3.3. Thiết kế chương trình ...............................................................................49
K T LUẬN VÀ HƯ NG PHÁT TRIỂN ......................................................53
TÀI LIỆU THAM KHẢO ................................................................................54



BẢNG KÝ HIỆU VI T TẮT
K
ý V
đủ
h
C
A A h
D n u
C al yể
B B Ả
M it n
C
C o Ti
C ns êu
I ul ch
C C C
G ol ar
G G Ả
I ra n
I I Đ
M m ịn
J Jo Ả
P in n
K K P
L ar hé
L L P
Z e h
MMC
P o h
P P M

C er áy
P Pi Đ
E ct iể
P P Ả
N or n
S S C
V u ar
T T Ả
I a n
V V C
G id ar
WWẢ
M in n


DANH M C HÌNH ẢNH
Hình 1.1. Quá trình xử lý ảnh ........................................................................... 4
Hình 1.2. Lân cận các điểm ảnh của tọa độ (x,y).............................................. 7
Hình 1.3. Lân cận của một điểm ảnh ................................................................ 8
Hình 1.4. Lược đồ mức xám ........................................................................... 10
Hình 1.5. Các bước cơ bản trong một hệ thống xử lý ảnh .............................. 12
Hình 1.6. Sơ đồ phân tích xử lý ảnh và lưu đồ thông tin giữa các khối ......... 17
Hình 1.7. Sơ đồ các thành phần chính của hệ thống xử lý ảnh....................... 18
Hình 1.8. Một hệ thống xử lý ảnh ................................................................... 19
Hình 2.1. Các k thuật cải thiện ảnh sử dụng toán tử điểm ............................ 23
Hình 2.2. Các k thuật cải thiện ảnh sử dụng toán tử không gian .................. 24
Hình 2.3. Ảnh gốc và ảnh kết quả sau tăng độ sáng ....................................... 25
Hình 2.4. Dãn độ tương phản .......................................................................... 26
Hình 2.5. Ảnh gốc và ảnh kết quả sau khi tăng độ tương phản ...................... 28
Hình 2.6. Biển đổi âm bản .............................................................................. 28

Hình 2.7. a. Ảnh gốc và b. Ảnh kết quả sau khi biến đổi âm bản................... 29
Hình 2.8. Ảnh gốc và ảnh kết quả sau khi biến đổi ảnh xám ......................... 30
Hình 2.9. Ảnh gốc và ảnh kết quả sau phép biến đổi ảnh nhị phân................ 31
Hình 2.10. Ảnh gốc và ảnh kết quả sau khi thực hiện phép cộng................... 32
Hình 2.11. Ảnh gốc và ảnh kết quả sau khi thực hiện phép tr ...................... 32
Hình 2.12. Phép ND tổ hợp thông tin hai ảnh.............................................. 33
Hình 2.13. Phép OR tổ hợp thông tin hai ảnh................................................. 34
Hình 2.14. Toán tử NOT tạo ảnh bù ............................................................... 34
Hình 2.15. Các phép toán thực hiện trên t ng điểm ảnh ................................ 35
Hình 2.16. Đưa các giá trị mức xám về đơn vị bit.......................................... 36
Hình 2.17. Một số ví dụ biến đổi ảnh phép toán số học và logic.................... 37
Hình 2.18. Đồ thị mối quan hệ mức xám và số điểm ảnh............................... 37


Hình 2.19. Trượt giá trị mức xám ................................................................... 38
Hình 2.20. Căng tổ chức đồ ............................................................................ 39
Hình 2.21. San lấp tổ chức đồ ......................................................................... 39
Hình 2.22. Lấy trung bình ............................................................................... 41
Hình 2.23. Phần tử trung vị trước và sau khi s p xếp..................................... 45
Hình 3.1. Form giao diện chính ...................................................................... 50
Hình 3.2. Form chức năng thao tác với file ảnh.............................................. 50
Hình 3.3. Form chức năng chuyển ảnh ........................................................... 50
Hình 3.4. Form chức năng zoom ảnh.............................................................. 51
Hình 3.5. Form chức năng các bộ lọc – xử lý ................................................. 51
Hình 3.6. Form chức năng các phép toán số học, logic .................................. 51
Hình 3.7. Thực hiện chức năng SUM (cộng) hai ảnh ..................................... 52
Hình 3.8. Thực hiện chức năng chuyển ảnh sang ảnh âm bản........................ 52


MỞ ĐẦU

1. Lý do chọn đề tài
Cùng với các thành tựu về khoa học của nhân loại, ngành Công nghệ
Thông tin ngày càng phát triển mạnh mẽ. Ở các nước phát triển, các hệ thống
lưu trữ và xử lý thông tin đã được xây dựng và sử dụng rất hiệu quả. Một
trong những ứng dụng của công nghệ thông tin là xử lý ảnh được dùng để hỗ
trợ trong nhiều lĩnh vực khác nhau.
Hơn một thập k qua có rất nhiều công trình nghiên cứu về bài toán xử
lý ảnh t ảnh đen tr ng đến ảnh màu như ngày hôm nay.
Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được
truyền qua cáp t Luân Đôn đến New York t những năm 1920. Vấn đề nâng
cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của
ảnh. Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm
1955. Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát
triển nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận lợi. Năm 1964,
máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh t mặt trăng và vệ
tinh Ranger
7 của M bao gồm: làm nổi đường biên, lưu ảnh. T năm 1964 đến nay, các
phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển
không ng ng. Các phương pháp tri thức nhân tạo như mạng nơ-ron nhân
tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng
được áp dụng rộng rãi và thu nhiều kết quả khả quan.
Với mong muốn tiếp cận các công nghệ mới, đồng thời bổ sung kiến
thức về khoa học k thuật hiện đại, cũng như tổng kết những k năng, kiến
thức trong suốt quá trình học tập tại trường, em xin chọn đề tài “N ng cao
chất ư ng hình ảnh ằng c c ph p to n số học”.

1


2. Mục tiêu nghiên cứu

Mục tiêu của khóa luận “N ng cao chất ư ng h nh ảnh ằng c c
ph p to n số học” là tìm hiểu, nghiên cứu về các k thuật nâng cao chất
lượng hình ảnh. Đồng thời xây dựng chương trình thử nghiệm ứng dụng các
phép toán vào việc nâng cao chất lượng, xử lý một bức ảnh bằng ngôn ngữ
Visual C#.
3. Nhiệm vụ nghiên cứu
Nhiệm vụ cơ bản của khóa luận là tìm hiểu tổng quan về xử lý ảnh, các
k thuật nâng cao chất lượng hình ảnh như các phép lọc, phép biến đổi ảnh và
các phép toán số học, logic. Đọc và tìm hiểu về ngôn ngữ Visual C#. T đó,
xây dựng một chương trình thử nghiệm để xử lý một file ảnh. Thông qua
chương trình các hình ảnh phải được biến đổi, xử lý một cách nhanh chóng.
4. Đối tư ng nghiên cứu
Đối tượng nghiên cứu ở đây là các k thuật nâng cao chất lượng ảnh.
5. Phạm vi nghiên cứu
Vấn đề nâng cao chất lượng ảnh là một vấn đề rộng lớn. Vì vậy trong
phạm vi khóa luận này em chỉ đi tìm hiểu những phép toán, phép biến đổi,
phép lọc điển hình để nâng cao chất lượng hình ảnh, sau đó đưa vào xây dựng
chương trình thử nghiệm.
6. Phương ph p nghiên cứu
a. Phương ph p nghiên cứu ý uận
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây
dựng cơ sở lý thuyết của khóa luận và các biện pháp cần thiết để giải quyết
các vấn đề của khóa luận.
. Phương ph p chuyên gia
Tham khảo ý kiến của các chuyên gia để có thể thiết kế chương trình phù
hợp với yêu cầu thực tiễn. Nội dung xử lý nhanh đáp ứng được yêu cầu ngày
càng cao của người sử dụng.
2



c. Phương ph p thực nghiệm
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được
nghiên cứu và kết quả đạt được qua những phương pháp trên.
7. Ý nghĩa khoa học và thực tiễn
Ý

ĩ k

: Các k thuật nâng cao chất lượng ảnh ra đời, phát

triển và có cơ sở khoa học vững ch c, nội dung nghiên cứu của khóa luận sẽ
góp phần làm rõ hơn lý thuyết nâng cao chất lượng hình ảnh và tính ứng dụng
của nó. Hiện nay nâng cao chất lượng ảnh là một lĩnh vực đang được các
chuyên gia nghiên cứu và phát triển.
Ý

ĩ



iễ : Chương trình thử nghiệm nếu thành công sẽ góp một

phần nhỏ trong việc xử lý nâng cao chất lượng hình ảnh.
8. Bố cục của khóa uận
Với mục tiêu chính là tìm hiểu các k thuật nâng cao chất lượng ảnh
khóa luận được trình bày trong ba chương với bố cục như sau:
Chương 1: Tổng quan về xử lý ảnh
Chương 2: Các k thuật nâng cao chất lượng hình ảnh
Chương 3: Xây dựng và cài đặt chương trình


3


CHƯ NG 1. TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1. Xử ý ảnh là gì
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng
vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần
cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có
nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan
trọng trong tương tác người máy.
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một
ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát
triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc
biệt là máy tính chuyên dụng riêng cho nó.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận.
Ảnh tốt hơn
Ảnh

Xử lý ảnh
Kết luận

nh

Qu tr nh

l ảnh

Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem

như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó
của đối tượng trong không gian và nó có thể xem như một hàm n biến P
(c1, c2,…, cn). Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều.

4


1.2. M t số kh i niệm iên quan
1.2.1. Điểm ảnh
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng.
Để xử lý bằng máy tính (số), ảnh cần phải được số hóa. Số hóa ảnh là sự biến
đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị
trí (không gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó
được thiết lập sao cho m t người không phân biệt được ranh giới giữa chúng.
Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi t t là
Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x,y).
Kh i niệm về to n tử điểm:
Xử lý điểm ảnh thực chất là biến đổi giá trị một điểm ảnh dựa vào giá
trị của chính nó mà không hề dựa vào các điểm ảnh khác. Có hai cách tiệm
cận với phương pháp này. Cách thứ nhất dùng một hàm biến đổi thích hợp với
mục đích hoặc yêu cầu đặt ra để biến đổi giá trị mức xám của điểm ảnh sang
một giá trị mức xám khác. Cách thứ hai là dùng lược đồ mức xám (Gray
Histogram). Về mặt toán học, toán tử điểm là một ánh xạ t giá trị cường độ
ánh sáng u(m, n) tại toạ độ (m, n) sang giá trị cường độ ánh sáng khác v(m, n)
thông qua hàm f(.), tức là:
v(m,n) = f(u(m,n))
Nói một cách khác, toán tử điểm là toán tử không bộ nhớ, ở đó một
mức xám u

[0, N] được ánh xạ sang một mức xám v


[0, N] với v = f (u).

Ứng dụng chính của các toán tử điểm là biến đổi độ tương phản của ảnh. Ánh
xạ f khác nhau tùy theo các ứng dụng.
1.2.2. Đ ph n giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định
trên một ảnh số được hiển thị.
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao
cho m t người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách


thích hợp tạo nên một mật độ phân bố, đó chính là độ phân giải và được phân
bố theo trục x và y trong không gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CG

(Color Graphic

daptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc *
200 điểm ảnh (320*200). Rõ ràng, cùng màn hình CG
hơn màn hình CG

12’’ ta nhận thấy mịn

17” độ phân giải 320*200. Lý do: cùng một mật độ (độ

phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các
điểm) kém hơn.
1.2.3. Mức x m của ảnh (Gray level)
Là kết quả của sự biến đổi tương ứng một giá trị độ sáng của một điểm

ảnh với một giá trị nguyên dương. Thông thường nó xác định trong khoảng
(0, 255). Tùy thuộc vào giá trị xám mà mỗi điểm ảnh được biểu diễn trên 1, 4,
8, 24 hay 32 bit.
1.2.4. Ảnh số
Là tập hợp hữu hạn các điểm ảnh, thường được biểu diễn bằng một
mảng hai chiều I(m,n) với m là số hàng, n là số cột. Ta ký hiệu P(x, y) là một
điểm ảnh tại vị trí (x,y). Số lượng điểm ảnh trên mỗi hàng hoặc các hàng xác
định độ phân giải của ảnh. Ảnh số được chia là 3 loại:
- Ảnh nhị ph n:
Giá trị xám của tất cả các điểm ảnh chỉ nhận được giá trị 1 hoặc 0. Như
vậy mỗi điểm ảnh trong ảnh nhị phân được biểu diễn bởi 1 bit.
- Ảnh x m:
Giá trị xám nằm trong khoảng (0, 255). Như vậy mỗi điểm ảnh trong
ảnh xám được biểu diễn bởi 1 byte.
- Ảnh màu:
Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp t 3 màu cơ bản: đỏ
(R), xanh lục (G), xanh lam (B) và thường thu nhận trên các dải băng tần khác
nhau. Với ảnh màu, cách biểu diễn cũng tương tự như với ảnh đen tr ng, chỉ


khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm:
đỏ (red), lục (green), lam (blue). Để biểu diễn cho mỗi điểm ảnh màu 24 bit.
24 bit này được chia thành 3 khoảng 8 bit. Mỗi màu cũng phân thành L cấp
màu khác nhau (thường L=256). Mỗi khoảng này biểu diễn cho cường độ
sáng của một trong các màu chính.
Mỗi pixel ảnh màu ký hiệu Px, được viết: Px=[red, green, blue]T
1.2.5. C c mối quan hệ cơ ản giữa c c điểm ảnh
Một ảnh số giả sử được biểu diễn bằng hàm f(x,y). Tập con các điểm
ảnh là S, cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q.
a. L n cận của m t điểm ảnh (Image Neighbors)

Giả sử có điểm ảnh p tại tọa độ (x, y), p có 4 điểm lân cận gần nhất
theo chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây,
Nam, B c).
{(x-1, y); (x, y-1); (x, y+1); (x+1, y)}= N4(p)
Trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p.
x
Tây
Đông
Nam
y
B c

(x, y-1)

(x+1, y-1)

(x-1, y)

(x,y)

(x+1, y)

(x-1, y+1)

(x, y+1)

(x+1, y+1)

(x-1, y-1)


nh 2 Lân cận c c điểm ảnh của tọa độ ( ,y)
- Các lân cận chéo: Các điểm lân cận chéo ND(p) (có thể coi lân cận chéo
là 4 hướng: Đông – Nam, Đông – B c, Tây – Nam, Tây – B c).
ND(p)={(x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}
- Tập kết hợp: N8(p) = N4(p) + ND(p) là tập hợp 8 lân cận của điểm
ảnh p.
- Nếu (x,y) nằm ở biên (mép) ảnh, một số điểm ảnh sẽ nằm ra ngoài.


N4(p)

ND(p)
nh

N8(p)

3 Lân cận của một điểm ảnh

b. Liên kết giữa c c điểm ảnh
Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của
đối tượng vật thể hoặc xác định vùng trong một ảnh. Một liên kết được đặc
trưng bởi tính liền kề giữa các điểm và mức xám của chúng.
Giả sử V là tập các giá trị mức xám. Một ảnh có các giá trị cường độ
sáng với thang mức xám t 32 đến 64 được mô tả như sau:
V={32, 33,…, 63, 64}
Có 3 loại liên kết:
+ Liên kết 4: Hai điểm ảnh p và q được nói là liên kết 4 với các giá trị
cường độ sáng V nếu q nằm trong một các lân cận của p, tức q thuộc
N4(p).
+ Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p,

tức q thuộc N8(p).
+ Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị
cường độ sáng V được nói là liên kết m nếu: q thuộc N 4(p) hoặc q
thuộc ND(p).
c. Đo khoảng c ch giữa c c điểm ảnh
Định nghĩa: Khoảng cách D(p,q) giữa hai điểm ảnh p tọa độ (x,y), q
tọa độ (s,t) là hàm khoảng cách (Distance) hoặc Metric nếu:
+ D(p,q) ≥ 0 (Với D(p,q) = 0 nếu và chỉ nếu p = q)
+ D(p,q) = D(q,p)
+ D(p,z) ≤ D(p,q) + D(q,z); z là một điểm ảnh khác.


Khoảng c ch Euc ide: Khoảng cách Euclide giữa hai điểm ảnh p(x,y)
và q(s,t) được định nghĩa như sau:
2

2 1/2

De(p,q) = [(x-s) + (y-t) ]
Khoảng c ch khối:

- Khoảng cách D4(p,q) được gọi là khoảng cách khối đồ thị (City –
Block Distance) và được xác định như sau:
D4(p,q) = |x - s| + |y - t|
Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa điểm
ảnh t tâm điểm ảnh đến tâm điểm ảnh q khác.
- Khoảng cách D8(p,q) còn gọi là khoảng cách bàn cờ (Chess – Board
Distance) giữa điểm ảnh p, q được xác định như sau:
D8(p,q) = max(|x - s| + |y - t|)
1.2.6. Lư c đồ mức x m (Histogram)

Định nghĩa Histogram hay lược đồ mức xám của ảnh là một hàm cung
cấp tần suất xuất hiện của mỗi mức xám trong ảnh. Lược đồ mức xám được
biểu diễn trong hệ tọa độ Decac xOy. Trong đó Ox biểu diễn mức xám của
ảnh (256 mức trong trường hợp chúng ta xét), Oy biểu diễn số điểm ảnh cho
một mức xám (số điểm ảnh có cùng mức xám).
Lược đồ mức xám cung cấp rất nhiều thông tin về sự phân bố mức xám
của ảnh. Theo thuật ngữ của xử lý ảnh gọi là tính động của ảnh, tính động của
ảnh cho phép phân tích một khoảng nào đó phân bố phần lớn các mức xám
của ảnh: ảnh rất sáng hay rất đậm. Nếu ảnh nhạt, lược đồ xám nằm bên phải
(mức xám cao), còn ảnh đậm thì lược đồ xám nằm bên trái (mức xám thấp).


Ảnh đậm

Ảnh nhạt
nh

L

cđ m c

m

1.2.7. Ph n vùng ảnh
Để phân tích các đối tượng trong ảnh, chúng ta cần phải phân biệt được
các đối tượng cần quan tâm với phần còn lại của ảnh. Những đối tượng này có
thể làm ra được nhờ các k thuật phân vùng ảnh.
Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh. Nói đến vùng
ảnh là nói đến tính chất bề mặt của ảnh. Nó là một tập hợp các điểm có cùng
hoặc gần cùng một tính chất nào đó: mức xám, màu s c…. Đường bao quanh

một vùng ảnh (Boundary) là biên ảnh. Các điểm trong một vùng ảnh có độ
biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng.
Một phương pháp phân vùng ảnh là sử dụng một ngưỡng giá trị xám để
phân tách ảnh thành đối tượng và nền (những điểm dưới ngưỡng xám thuộc
về nền, ngược lại thuộc về đối tượng).
1.2.8. Trích chọn đặc tính
Dựa trên các thông tin thu nhận được qua quá trình phân vùng, kết hợp
với các k thuật xử lý để đưa ra các đặc trưng, đối tượng ảnh cũng như các
thông tin cần thiết trong quá trình xử lý.
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm
xuống.


1.3. C c ứng dụng của xử ý ảnh
Biến đổi ảnh (Image Transform):
Trong xử lý ảnh do số điểm ảnh lớn các tính toán nhiều (độ phức tạp
tính toán cao) đòi hỏi dung lượng bộ nhớ lớn, thời gian tính toán lâu. Các
phương pháp khoa học kinh điển áp dụng cho xử lý ảnh hầu hết khó khả thi.
Người ta sử dụng các phép toán tương đương hoặc biến đổi sang miền xử lý
khác để dễ tính toán. Sau khi xử lý dễ dàng hơn được thực hiện, dùng biến
đổi ngược để đưa về miền xác định ban đầu, các biến đổi thường gặp trong xử
lý ảnh gồm:
- Biến đổi Fourier, Cosin, Sin.
- Biến đổi (mô tả) ảnh bằng tích chập, tích Kronecker (theo xử lý số
tín hiệu).
- Các biến đổi khác như KL (Karhumen Loeve), Hadamard.
Một số các công cụ xác suất thống kê cũng được sử dụng trong xử lý
ảnh.
N n ảnh:

Ảnh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn. Khi mô tả ảnh
người ta đã đưa k thuật nén ảnh vào. Các giai đoạn nén ảnh có thể chia ra thế
hệ 1, thế hệ 2. Hiện nay, các chuẩn MPEG được dùng với ảnh đang phát huy
hiệu quả.
Nhằm giảm thiểu không gian lưu trữ của ảnh, nén ảnh thường được tiến
hành theo cả hai khuynh hướng là nén có bảo toàn và không bảo toàn thông
tin.
Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả
năng phục hồi thì kém hơn. Trên cơ sở hai khuynh hướng có 4 cách tiếp cận
cơ bản trong nén ảnh:
 Nén ảnh thống kê: K thuật nén này dựa vào việc thống kê tần suất xuất
hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa
thích hợp. Một ví dụ điển hình cho k thuật mã hóa này là *.TIF.


 Nén ảnh không gian: K thuật này dựa vào vị trí không gian của các
điểm ảnh để tiến hành mã hóa. K thuật lợi dụng sự giống nhau của các
điểm ảnh trong các vùng gần nhau. Ví dụ cho k thuật này là mã nén
*.PCX
 Nén ảnh sử dụng phép biến đổi: Đây là k thuật tiếp cận theo hướng
nén không bảo toàn và do vậy, k thuật thường nén hiệu quả hơn *.JPG
chính là tiếp cận theo k thuật nén này.
 Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể
hiện sự lặp lại của các chi tiết. K thuật nén sẽ tính toán để chỉ cần lưu
trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
1.4. C c ước cơ ản trong xử ý ảnh
Các phương pháp xử lý ảnh b t đầu t

các ứng dụng chính: nâng cao


chất lượng ảnh và phân tích ảnh.
Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh. Đầu tiên,
ảnh tự nhiên t

thế giới ngoài được thu nhận qua các thiết bị thu (như

Camera, máy chụp ảnh). Trước đây, ảnh thu qua Camera là các ảnh tương tự
(loại Camera ống kiểu CCIR). Gần đây, với sự phát triển của công nghệ, ảnh
màu hoặc đen tr ng được lấy ra t Camera, sau đó nó được chuyển trực tiếp
thành ảnh số tạo thuận lợi cho xử lý tiếp theo (máy ảnh số hiện nay là một thí
dụ gần gũi). Mặt khác, ảnh cũng có thể tiếp nhận t

vệ tinh, có thể quét t

ảnh
chụp bằng máy quét ảnh.
Thu
nhận
ảnh

Tiền
xử lý
ảnh

Phân
đoạn
ảnh

Biểu
diễn

và mô
tả

Nhận
dạng
và nội
suy

Cơ sở tri thức
Hình 1.5 C c b ớc cơ bản trong một h th ng

l ảnh


Sơ đồ này ao gồm c c thành phần sau:
a) Phần thu nhận ảnh (Image Acquisition)
Đây là bước đầu tiên trong quá trình xử lý ảnh. Để thực hiện điều này,
ta cần có bộ thu ảnh và khả năng số hóa những tín hiệu liên tục được sinh ra
bởi bộ thu ảnh đó. Bộ thu ảnh ở đây có thể là máy chụp ảnh đơn s c hay màu,
máy quét ảnh, máy quay…. Trong trường hợp bộ thu ảnh cung cấp chưa phải
là dạng số hóa ta còn phải chuyển đổi hay số hóa ảnh. Qúa trình chuyển đổi
DC ( nalog to Digital Converter) để thu nhận dạng số hóa của ảnh. Mặc dù
đây chỉ là công đoạn đầu tiên song kết quả của nó có ảnh hưởng rất nhiều đến
công đoạn kế tiếp.
) Tiền xử ý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào
bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là
lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn.
Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu, khôi
phục cảnh, n n chỉnh hình học…. Với mục đích làm cho chất lượng ảnh trở

nên tốt hơn nữa, chuẩn bị cho các bước xử lý phức tạp kế tiếp sau đó.
+K ử

iễu: Nhiễu được chia thành hai loại: nhiễu hệ thống và nhiễu

ngẫu nhiên. Đặc trưng của nhiễu hệ thống là tính tuần hoàn. Do vậy, có thể
khử nhiễu này bằng việc sử dụng phép biến đổi Fourier và loại bỏ các đỉnh
điểm. Đối với nhiễu ngẫu nhiên, trường hợp đơn giản là các vết bẩn tương
ứng với các điểm sáng hay tối, có thể khử bằng phương pháp nội suy, lọc
trung vị và lọc trung bình.
+C ỉ

mứ x m: Đây là k thuật nhằm chỉnh sửa tính không đồng

đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh.
+C ỉ

xạ: Ảnh thu nhận được t các thiết bị quang học hay điện

tử có thể bị mờ, nhòe. Phương pháp biến đổi Fourier dựa trên tính chập
của ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này.


+





ì


: Những biến dạng hình học thường do các thiết

bị điện tử và quang học gây ra. Do đó, phương pháp hiệu chỉnh ảnh dựa
trên mô hình được mô tả dưới dạng phương trình biến đổi ảnh biến dạng
f(x,y) thành ảnh lý tưởng f( ’,y’) như sau:
f(x, y)

f( ’, y’)

x ' hx , y)
(x
y ' hy (x, y)
Trong đó hx, hy là các phương trình tuyến tính (biến dạng do phối cảnh)
hay bậc hai (biến dạng do ống kính camera).
c) Ph n đoạn (Segmentation) hay ph n vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để
biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch)
trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về
địa chỉ hoặc tên người thành các t , các chữ, các số (hoặc các vạch) riêng biệt
để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng
dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc
rất nhiều vào công đoạn này.
d) Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã
phân đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số
liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính.
Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature
Selection) g n với việc tách các đặc tính của ảnh dưới dạng các thông tin
định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác

trong phạm vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì
thư, chúng ta miêu tả các đặc trưng của t ng ký tự giúp phân biệt ký tự này
với ký tự khác.
e) Nhận dạng và n i suy ảnh (Image Recognition and Interpretation)


Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu


được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) t trước. Nội
suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và
nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại. Có
nhiều cách phân loại ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các
mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số.
- Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ
ký điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã
vạch, nhận dạng mặt người.
f) Cơ sở tri thức (Know edge Base)
Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ
sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo
nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các
phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn b t
chước quy trình tiếp nhận và xử lý ảnh theo cách của con người. Trong các
bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con
người. Vì vậy, ở đây các cơ sở tri thức được phát huy.
g) Mô tả ( iểu diễn ảnh)
T hình 1.5 ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển

sang các khâu tiếp theo để phân tích. Nếu lưu trữ ảnh trực tiếp t các ảnh thô,
đòi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng
dụng và công nghệ. Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại
(hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng
ảnh (Image Features) như: biên ảnh (Boundary), vùng ảnh (Region).


×