Tải bản đầy đủ (.pdf) (16 trang)

lý thuyết xử lý ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (649.5 KB, 16 trang )



MỤC LỤC
Z  Y

CHƯƠNG 1. TỔNG QUAN VỀ XỬ LÝ ẢNH 1-3
1.1. Giới thiệu về xử lý ảnh 1-3
1.1.1. Xử lý ảnh số là gì? 1-3
1.1.2. Lịch sử của xử lý ảnh 1-3
1.2. Các ứng dụng của xử lý ảnh 1-5
1.2.1. Ảnh gamma 1-6
1.2.2. Ảnh X quang 1-6
1.2.3. Ảnh trong dải nhìn thấy được và ảnh hồng ngoại 1-7
1.2.4. Ảnh trong dải sóng radio 1-7
1.3. Các bước cơ bản trong xử
lý ảnh 1-8
1.4. Một số khái niệm cơ bản về xử lý ảnh 1-9
1.4.1. Điểm ảnh (Pixel) 1-9
1.4.2. Mức xám (Gray level) 1-9
1.4.3. Ảnh (Image) 1-9
1.4.4. Biểu diễn ảnh (Image Representation) 1-9
1.4.5. Tăng cường ảnh (Image Enhancement) 1-9
1.4.6. Khôi phục ảnh (Image Restoration) 1-10
1.4.7. Biến đổi ảnh (Image Transform) 1-10
1.4.8. Phân tích ảnh (Image Analyze) 1-10
1.4.9. Nhận dạng ảnh (Image Recognition) 1-10
1.4.10. Tra cứu ảnh (Image Retrieval) 1-10
1.4.11. Nén ảnh (Image Compression) 1-10
1.5. Một số quan hệ cơ bản giữa các
điểm ảnh 1-11
1.5.1. Lân cận của điểm ảnh 1-11


1.5.2. Tính liền kề, tính liên thông, vùng và biên 1-11
1.5.3. Thuật toán tìm các thành phần liên thông 1-13
1.5.4. Độ đo khoảng cách 1-14



DANH MỤC HÌNH ẢNH
Z  Y

Hình 1.1. Ảnh số được tạo ra vào năm 1921 từ băng mã hóa của một máy in điện tín. 1-4
Hình 1.2. Ảnh số được tạo năm 1922 từ card đục lỗ sau 2 lần truyền qua ĐTây Dương. 1-4
Hình 1.3. Ảnh 15 cấp độ xám được truyền từ Luân Đôn đến New York năm 1929 1-4
Hình 1.4. Ảnh đầu tiên của mặt trăng được chụp bởi tàu vũ trụ Ranger 7 của Mỹ 1-5
Hình 1.5. Ví dụ về
ảnh Gamma 1-6
Hình 1.6. Chụp CT 1-7
Hình 1.7. Ảnh hồng ngoại của một cơn bão 1-7
Hình 1.8. Ảnh cộng hưởng từ 1-7
Hình 1.9. Tổng quan các giai đoạn cơ bản trong xử lý ảnh 1-8
Hình 1.10. Ví dụ về m-liền-kề 1-12


Chương 1. Tổng quan về xử lý ảnh
1-3



CHƯƠNG 1. TỔNG QUAN VỀ XỬ LÝ ẢNH



1.1. Giới thiệu về xử lý ảnh
Cùng với ngôn ngữ tự nhiên, hình ảnh đã đóng một vai trò hết sức quan trọng trong việc
trao đổi thông tin. Tính trực quan của hình ảnh đã giúp cho con người hiểu rõ và sâu sắc hơn
các thông tin cần thu thập. Người ta đã chứng minh được rằng, trong tất cả các kênh thu nhận
thông tin của con người thì lượng thông tin thu nhận qua kênh thị giác chiếm khoảng 70%.
Hình ảnh là kết quả của việc thu nhậ
n và biểu diễn của năng lượng ánh sáng trải dài từ tia
gamma (có bước sóng nhỏ) đến sóng radio (có bước sóng lớn). Tuy nhiên, mắt người chỉ cảm
nhận được một vùng giới hạn rất nhỏ trong phổ điện từ. Ngược lại, máy tính có thể đọc được
một vùng rất rộng trong phổ điện từ, từ tia gamma đến sóng radio. Nó có thể biểu diễn và xử lý
những bức ảnh
được sinh ra bởi những nguồn mà con người không thể nhận biết được, như ảnh
siêu âm, ảnh hồng ngoại, ảnh trong vùng tia X, …. Do đó xử lý ảnh có một phạm vi ứng dụng
tương đối rộng.
Xử lý ảnh là một trong những cách tiếp cận phân tích, tổng hợp hình ảnh theo ý tưởng và
mục đích của người sử dụng. Tuy xử lý ảnh là một trong những khoa học còn tương đối mớ
i so
với nhiều ngành khoa học khác, song những năm gần đây, xử lý ảnh và đồ hoạ đã phát triển
một cách mạnh mẽ và đã gặt hái được khá nhiều thành công góp phần vào sự phát triển chung
của ngành công nghệ thông tin.
1.1.1. Xử lý ảnh số là gì?
Xử lý ảnh số là quá trình thao tác với ảnh trên máy tính nhằm tăng cường chất lượng
thông tin hình ảnh đối với quá trình biểu diễn hình ảnh trên máy tính và tri giác của con người.
Từ đó giúp cho con người có được cách nhìn trực quan hơn và sinh động hơn về hình ảnh.
Xử lý ảnh số còn là việc sử dụng các thuật toán máy tính để xử lý các ảnh số dưới sự trợ
giúp của máy tính.
1.1.2. Lịch sử của xử lý ảnh
Ngành công nghiệp báo chí có thể được xem là ngành có ứng dụng đầu tiên của xử lý ảnh
khi những bức ảnh lần đầu tiên được gửi đi giữa hai thành phố London và New York thông qua
cáp Bartlane vào đầu những năm 1920. Trước đó, việc truyền dữ liệu ảnh giữa hai thành phố

này mất khoảng một tuần bằng đường biển. Từ khi có cáp Bartlane, thời gian truyền dữ liệu
ảnh xuyên qua Đại Tây Dương được giảm đ
i rất nhiều - xuống chỉ còn chưa đầy 3 tiếng. Một
thiết bị chuyên dụng đã mã hóa dữ liệu ảnh trước khi truyền qua cáp, và sau đó, khi dữ liệu đến
nơi sẽ được giải mã để tái tạo lại bức ảnh ban đầu.
Giáo trình xử lý ảnh số

1-4

Hình 1.1. Ảnh số được tạo ra vào năm 1921 từ băng mã
hóa của một máy in điện tín. (Nguồn: McFarlane)


Hình 1.2. Ảnh số được tạo năm 1922 từ card đục lỗ sau
2 lần truyền qua Đại Tây Dương. (Nguồn: McFarlane)
Ảnh trong hình 1.1 và hình 1.2 được tạo ra từ các băng được đục lỗ bởi máy điện tín (ở
nơi nhận).
Vấn đề đầu tiên trong việc cải thiện chất lượng hiển thị ảnh trong những bức ảnh đầu tiên
này là
phương thức in ảnh và số cấp độ xám hiển thị.
Các hệ thống cáp Bartlane đầu tiên chỉ có khả năng mã hóa ảnh với 5 cấp độ xám, khả
năng này tăng lên 15 cấp độ xám vào năm 1929.

Hình 1.3. Ảnh 15 cấp độ xám được truyền từ Luân
Đôn đến New York năm 1929. (Nguồn: McFarlane)
Chương 1. Tổng quan về xử lý ảnh
1-5
Trong khoảng thời gian này, người ta chỉ nói đến ảnh số, chứ chưa đề cập đến xử lý ảnh
số, vì một lý do đơn giản là chưa có máy tính để xử lý nó. Do đó, có thể nói rằng lịch sử của xử
lý ảnh gắn liền với lịch sử phát triển của máy tính điện tử. Khả năng lưu trữ, năng lực xử lý và

hiể
n thị của máy tính là những nhân tố quan trọng trong quá trình xử lý ảnh. Việc nâng cao
chất lượng ảnh bằng các phương pháp xử lý để truyền ảnh được liên tục nghiên cứu trong suốt
35 năm sau đó. Với sự phát triển của kỹ thuật máy tính, việc xử lý hình ảnh ngày càng hoàn
thiện hơn. Máy tính đầu tiên đủ mạnh cho việc xử lý ảnh xuất hiện vào đầu những năm 1960.
Năm 1964, tàu thăm dò vũ tr
ụ Ranger 7 của Jet Propulsion Laboratory (Pasadena,
California, USA) đã chụp được một bức ảnh của bề mặt mặt trăng:

Hình 1.4. Ảnh đầu tiên của mặt trăng được chụp bởi tàu vũ trụ Ranger
7 của Mỹ, vào 9 giờ 09 phút sáng ngày 31/7/1964 (Nguồn: NASA)
Từ năm 1964 đến nay, phạm vi xử lý ảnh số lớn mạnh không ngừng. Trong y học, các
thuật toán nâng cao chất lượng hình ảnh, độ tương phản, hoặc mã hóa các mức xám đã được áp
dụng để nội suy ảnh X-quang và các hình ảnh y học giúp cho việc chuẩn đoán và đi
ều trị của
các bác sĩ được thực hiện một cách dễ dàng và hiệu quả hơn. Việc phát minh ra kỹ thuật CAT
(Computerized Axial Tomography: chụp cắt lớp điện toán theo trục) hay chụp CT
(Computerized Tomography: chụp cắt lớp điện toán) là một trong những sự kiện quan trọng
trong ứng dụng của xử lý ảnh trong việc chẩn đoán y học. Song song đó, các nhà địa vật lý,
thiên văn học cũng sử d
ụng kỹ thuật tương tự để nghiên cứu các mẫu vật chất từ ảnh vệ tinh,
theo dõi tài nguyên trái đất và thiên văn học
1.2. Các ứng dụng của xử lý ảnh
Ngày nay, hầu hết các thông tin ảnh đều được chuyển sang dạng ảnh số. Vì vậy, trong gần
như tất cả các lĩnh vực của các ngành kỹ thuật đều có ít nhiều liên quan đến ảnh số và sử dụng
kỹ thuật xử lý ảnh số.

Giáo trình xử lý ảnh số

1-6

1.2.1. Ảnh gamma
(a)

(b)
Hình 1.5. Ví dụ về ảnh Gamma (a) Ảnh bộ xương người (b) Ảnh PET (Positron
Emission Tomography) (Nguồn: G.E. Medical Systems, Tiến sĩ Michael E. Casey)
Ảnh gamma được sử dụng nhiều trong y học hạt nhân và thiên văn học. Trong y học hạt
nhân, người ta tiêm vào người bệnh nhân một đồng vị phóng xạ có thể phát ra tia gamma (đồng
vị phóng xạ này trong quá trình phát tin gamma sẽ tự phân hủy). Một máy dò tia gamma đặt ở
ngoài sẽ thu những tia phóng xạ này
để tạo ra ảnh gamma. Ảnh ở hình 1.5(a) thường được
dùng trong việc xác định nhiễm trùng hay khối u trong cơ thể người. Hình 1.5(b) được tạo ra
bởi kỹ thuật chụp PET (Positrion Emission Tomography: Quét cắt lớp phóng xạ ion dương).
Nguyên tắc của kỹ thuật này tương tự như trong chụp CT nhưng thay vì sử dụng nguồn tia X
ngoài cơ thể, bệnh nhân sẽ được tiêm vào một đồng vị phóng xạ có thể
phóng các positron (ion
dương) trong quá trình tự phân hủy. Khi một positron sau khi bay khoảng 3-5mm sẽ gặp một
electron ở trong môi trường xung quanh, cả hai sẽ bị phân hủy và phát ra 2 tia gamma. Các tia
này sẽ được hấp thụ bởi bộ dò tìm và ảnh 3D của bệnh nhân sẽ được tạo ra theo cơ chế như
chụp cắt lớp CT.
1.2.2. Ảnh X quang
Kỹ thuật chụp bằng tia X sử dụng một ống phóng tia X (ống chân không) có cathode và
anode. Khi Cathode được làm nóng sẽ phóng ra các electron ở trạng thái tự do, các electron
này di chuyển với vận tốc cực lớn về phía anode (phía anode có rất nhiều positron). Khi các
electron đánh vào một nguyên tử thì năng lượng sẽ được phát ra dưới dạng bức xạ tia X.
Kỹ thuật chụp CT: có một máy dò hình khung tròn bao quanh đối tượng (bệnh
nhân,…), một nguồn tia X được phóng ra và đi xuyên qua đối tượng. Tại mỗi vị trí
của đối tượng, khung này sẽ quay. Các tia X này sẽ được thu lại tại đầu bên kia
của khung. Khi đối tượng được di chuyển theo phương vuông góc với mặt phẳng
của khung, máy sẽ vẽ được các lớp của đối tượng. Các lớp này sẽ được tổ hợp lại

và để tạo nên hình ảnh không gian 3 chiều của đối tượng.
Chương 1. Tổng quan về xử lý ảnh
1-7

Hình 1.6. Chụp CT (Nguồn: Vietnamnet)
1.2.3. Ảnh trong dải nhìn thấy được và ảnh hồng ngoại

Hình 1.7. Ảnh hồng ngoại của một cơn bão (Nguồn: Encarta)
Các nhà khí tượng học sử dụng các ảnh vệ tinh trong vùng tia hồng ngoại để xác định độ
nóng của các vùng của khí quyển. Dữ liệu được chuyển thành một ảnh nhìn thấy được bằng
mắt thường, sau khi đã được nâng cao chất lượng và phối màu để thể hiện các nhiệt độ khác
nhau. Trong các ảnh đã được nâng cao chất l
ượng, màu đỏ thường biểu diễn nhiệt độ cao
(nóng), ngược lại màu tím thường biểu diễn nhiệt độ thấp (lạnh).
1.2.4. Ảnh trong dải sóng radio

Hình 1.8. Ảnh cộng hưởng từ (MRI: Magnetic Resonance Imaging, Nguồn: Encarta)
Giáo trình xử lý ảnh số

1-8
Hình 1.8 là ảnh chụp phần đầu của một người trưởng thành bình thường (không có bệnh
tật). Ta thấy rõ não, các đường và các mô mềm; tiểu não nằm ở giữa phía bên trái, màu đỏ.
Ảnh MRI: Sở dĩ có thể sử dụng kỹ thuật MRI cho con người vì trong cơ thể người
chứa rất nhiều “nam châm” sinh học (lưỡng cực điện: thay vì từ tính, ở đây là điện
tích). MRI tận dụng phân bố ngẫu nhiên của các proton, có từ tính cơ bản. Khi
bệnh nhân được đặt vào khung tròn từ tính, quá trình phân tích diễn ra theo 3
bước. Đầu tiên, MRI tạo một trạng thái bình thường (steady state) trong cơ thể
người bệnh bằng cách đưa người bệnh vào một từ trường đều mạnh khoảng 30.000
lần so với từ trường trái đất. Sau đó MRI kích thích cơ thể người bệnh bởi sóng
radio để thay đổi hướng của các photon đang ở trong trạng thái bình thường

(steady-state orientation of photons). Sau một thời gian nó sẽ ngừng phát sóng
radio và bắt đầu “lắng nghe” sự phát sóng điện từ của cơ thể người bệnh tại một
tần số nào đó (được chọn trước). Tín hiện phát ra này được sử dụng để tạo ra hình
ảnh của cơ thể người theo nguyên lý tương tự như chụp cắt lớp CT.
1.3. Các bước cơ bản trong xử lý ảnh
Thu nhận ảnh: Ảnh có thể được thu nhận trong thế giới thực qua máy chụp hình, từ tranh
ảnh thông qua máy quét hoặc từ vệ tinh qua các bộ cảm biến bằng tín hiệu số hoặc tín hiệu
tương tự.
Số hoá ảnh: Tất cả các thông tin được lưu trong máy tính đều ở dạng số. Vì vậy, ảnh sau
khi thu nhận được từ các thiết bị khác c
ần phải được số hoá để lưu trữ hoặc có thể dùng để xử
lý tiếp.
Phân tích ảnh: Phân tích ảnh là một quá trình gồm nhiều giai đoạn nhỏ hơn: tăng cường
ảnh để nâng cao chất lượng ảnh và khắc phục những thiếu sót trong quá trình thu nhận ảnh và
số hoá ảnh như nhiễu, méo làm nổi bật các đặc trưng chính của ảnh đảm bảo cho ảnh gần
gi
ống với hình ảnh thật nhất. Tiếp theo là phát hiện và trích chọn các đặc trưng như biên, màu,
kết cấu, Sau quá trình này ảnh được lưu trữ hoặc sử dụng cho việc nhận dạng hoặc cho hệ hỗ
trợ quyết định.
Đối sánh, nhận dạng ảnh: Là quá trình đối sánh, phân lớp ảnh phục vụ cho các mục đích
khác nhau.
Hình 1.9. Tổng quan các giai đoạn cơ bản trong xử lý ảnh
(Nguồn: L.M. Bá, N.T. Thủy)
Camera
Sensor
Thu nhận ảnh
Số hoá Phân tích ảnh
Đối sánh,
Nhận dạng
Lưu

trữ
Lưu
trữ
Hệ quyết định
Chương 1. Tổng quan về xử lý ảnh
1-9
1.4. Một số khái niệm cơ bản về xử lý ảnh
Trong phần này, chúng ta xem xét một số khái niệm cơ bản của xử lí ảnh. Đây là những
khái niệm thường được đề cập đến trong các quá trình xử lí ảnh.
Trong phần này, chúng ta xem xét một số khái niệm cơ bản của xử lí ảnh. Đây là những
khái niệm thường được đề cập đến trong các quá trình xử lí ảnh.
1.4.1. Điểm ảnh (Pixel)
Để xử lí được ảnh bằng máy tính điện tử thì chúng ta cần phải số hoá nó hay nói cách
khác là biến đổi các ảnh từ tín hiệu liên tục sang tín hiệu rời rạc thông qua việc lấy mẫu và
lượng tử hoá. Trong quá trình này người ta sử dụng khái niệm điểm ảnh để biểu diễn độ sáng,
màu sắc của các vị trí trên ảnh. Mỗi điểm ảnh gồm có một cặp toạ độ
(x,y) và giá trị biểu diễn
độ sáng (cấp xám) cụ thể.
Các cặp tọa độ (x, y) tạo nên độ phân giải (resolution). Chẳng hạn như màn hình máy tính
có độ phân giải là 480×640 nghĩa là trên màn hình có 480×640 điểm ảnh (x, y), chiều rộng 480
điểm ảnh, chiều dài 640 điểm ảnh.
1.4.2. Mức xám (Gray level)
Mức xám là kết quả của việc mã hoá ứng với một cường độ sáng của mỗi điểm ảnh với
một giá trị số. Thông thường ảnh được mã hoá dưới dạng 16, 32, 64 hay 256 mức.
1.4.3. Ảnh (Image)
Là một tập hợp các điểm ảnh được biểu diễn thông qua một mảng hai chiều I(n,p): n dòng
và p cột, với ảnh này thì số lượng điểm ảnh sẽ là n×p. Ta kí hiệu I(x,y) để chỉ giá trị mức xám
của điểm ảnh tại vị trí toạ độ (x,y).
Ảnh là một hàm hai biến f(x, y), trong đó (x, y) là tọa độ trong không gian hai chiều và độ
lớn f

tại tọa độ (x, y) được gọi là mức xám của ảnh tại điểm đó. Khi mỗi điểm (x, y) trong
không gian hai chiêu biễu diễn ảnh có độ lớn f hữu hạn, xác định và được lượng hóa rời rạc ta
gọi đó là ảnh số.
1.4.4. Biểu diễn ảnh (Image Representation)
Trong biểu diễn ảnh người ta thường dùng các phần tử đặc trưng của ảnh là điểm ảnh.
Chúng ta có thể xem một hàm hai biến chứa các thông tin như một biểu diễn ảnh. Các mô hình
thường được sử dụng trong biểu diễn ảnh đó là: mô hình toán (biểu diễn ảnh thông qua các
hàm hai biến trực giao gọi là các hàm cơ sở), mô hình thống kê (ảnh được xem như một phần
tử c
ủa một tập hợp đặc trưng của các đại lượng như: kì vọng toán học, hiệp biến, phương sai,
moment…).
1.4.5. Tăng cường ảnh (Image Enhancement)
Đây là một bước quan trọng tạo tiền đề cho xử lí ảnh. Nhiệm vụ của nó là làm nổi bật các
đặc trưng đã chọn để làm sao đó có thể phát hiện tốt hơn các đặc trưng này. Tăng cường ảnh
Giáo trình xử lý ảnh số

1-10
bao gồm một loạt các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu, nổi biên, giản độ
tương phản,…
1.4.6. Khôi phục ảnh (Image Restoration)
Khôi phục ảnh là quá trình loại bỏ hay tối thiểu hoá các ảnh hưởng của môi trường bên
ngoài hoặc do các hệ thống thu nhận ảnh gây ra. Về nguyên tắc, khôi phục ảnh nhằm xác định
mô hình toán học của quá trình đã gây ra biến dạng, tiếp theo là dùng ánh xạ ngược để xác định
lại ảnh.
1.4.7. Biến đổi ảnh (Image Transform)
Biến đổi ảnh là việc sử dụng một lớp các ma trận đơn vị và các kỹ thuật thường dùng để
biến đổi ảnh như: Biến đổi Fourier, Sin, Cosin, tích Kronecker, biến đổi Karhumen Loeve…
1.4.8. Phân tích ảnh (Image Analyze)
Liên quan đến việc xác định các độ đo định lượng của một ảnh để đưa ra một mô tả đầy đủ
về ảnh. Có nhiều kỹ thuật khác nhau hỗ trợ phân tích ảnh như: các kỹ thuật lọc, các kỹ thuật

tách, hợp dựa trên các tiêu chuẩn đánh giá về màu sắc, cường độ, kết cấu… và các kỹ thuật
phân lớp dựa theo cấu trúc.
1.4.9. Nhận dạng ảnh (Image Recognition)
Là quá trình phân loại các đối tượng được biểu diễn theo một mô hình nào đó và gán cho
chúng vào một lớp dựa theo những quy luật và các mẫu chuẩn. Các kỹ thuật thường dùng trong
nhận dạng là: nhận dạng dựa vào phân hoạch không gian, nhận dạng cấu trúc. Ngoài ra, một kỹ
thuật mới phát triển và có khả năng đem lại kết quả tốt là nhận dạng dựa vào kỹ thuật mạng
nơron.
1.4.10. Tra cứu ảnh (Image Retrieval)
Để có thể tra cứu được ảnh chúng ta cũng cần mô tả được ảnh như trong quá trình nhận
dạng ảnh. Tra cứu ảnh có nhiệm vụ tìm được ảnh theo yêu cầu của người sử dụng. Có hai kỹ
thuật tra cứu ảnh thường được sử dụng đó là: tra cứu ảnh dựa trên từ khoá và tra cứu ảnh dựa
trên nội dung. Trong những năm gần đây đã có nhiều hệ th
ống tra cứu ảnh được nghiên cứu
thành công và triển khai thành các hệ thống tả cứu ảnh thương mại như: tra cứu địa lý, ra cứu
tem thư, tra cứu ảnh y học
1.4.11. Nén ảnh (Image Compression)
Nén ảnh nhằm mục đích loại bỏ đi những thông tin dư thừa trong dữ liệu gốc làm giảm
dung lượng bộ nhớ dùng để lưu trữ. Có hai phương pháp nén ảnh đó là: nén ảnh không mất mát
thông tin và nén ảnh có mất mát thông tin.
Chương 1. Tổng quan về xử lý ảnh
1-11
1.5. Một số quan hệ cơ bản giữa các điểm ảnh
Trong phần này, chúng ta sẽ xem xét các mối quan hệ cơ bản giữa các điểm ảnh trong ảnh
số. Để dễ dàng trong quá trình xử lý, một ảnh số được ký hiệu bởi
),( yxf và các điểm ảnh
được ký hiệu bởi các chữ cái thường chẳng hạn như p, q.
1.5.1. Lân cận của điểm ảnh
Một điểm ảnh p tại tọa độ (x, y) có:
 Tập 4-lân-cận-ngang-dọc:


)(
4
pN = )}1,(),1,(),,1(),,1{(

+

+
yxyxyxyx
 Tập 4-lân-cận-chéo:

)( pN
D
= )}1,1(),1,1(),1,1(),1,1{( −−
+


+
+
+
yxyxyxyx
 Tập 8-lân-cận:

)(
8
pN = )()(
4
pNpN
D


Một số lân cận (4-lân-cận-ngang-dọc, 4-lân-cận-chéo, 8-lân-cận) của p sẽ nằm ngoài ảnh
số nếu p nằm trên biên của ảnh.
1.5.2. Tính liền kề, tính liên thông, vùng và biên
Tính liên thông giữa các điểm ảnh là một khái niệm cơ sở để đơn giản hóa định nghĩa một
số khái niệm trong ảnh số, chẳng hạn như vùng và biên của các đối tượng. Để xác định tính
liên thông của hai điểm ảnh, thì chúng cần thỏa mãn một số tiêu chuẩn nào đó. Ở đây, chúng
phải là các lân cận và các cấp xám phải thỏa mãn tiêu chuẩn đề ra về tính tương tự. Ví dụ
,
trong ảnh nhị phân với các giá trị là 0 và 1, hai điểm ảnh có thể là 4-lân-cận, nhưng chúng chỉ
được gọi là liên thông nếu và chỉ nếu chúng có các giá trị bằng nhau.
Tính liền kề
Cho V là một tập các giá trị cấp xám dùng để xác định tính liền kề. Trong ảnh nhị phân ta
có }1{
=V, nghĩa là liên kết giữa các điểm ảnh có giá trị bằng 1.
Trong ảnh đa cấp xám, tập
V có thể chứa nhiều giá trị hơn. Ví dụ, tính liền kề của các
điểm ảnh với một khoảng giá trị cấp xám có thể từ 0 đến 255, tập
V có thể là một tập con của
256 giá trị này. Chúng ta có ba loại liền kề sau:
a) 4-liền-kề: Hai điểm ảnh p và q với giá trị từ V là 4-liền-kề nếu q thuộc tập )(
4
pN .
b) 8-liền-kề: Hai điểm ảnh p và q với giá trị từ V là 8-liền-kề nếu q thuộc tập )(
8
pN .
c) m-liền-kề (liền kề hỗn hợp): Hai điểm p và q với giá trị từ V là m-liền-kề nếu thỏa một
trong hai điều kiện sau:
(i)
q thuộc )(
4

pN hoặc
(ii)
q thuộc
)( pN
D
và tập
)(
4
pN

)(
4
qN
không có điểm ảnh nào có giá trị từ V .
m-liền-kề dùng để ước lượng tính nhập nhằng của 8-liền-kề (xem ví dụ ở hình 1.10).
Giáo trình xử lý ảnh số

1-12

(a) (b) (c)
Hình 1.10. Ví dụ về m-liền-kề (Nguồn: R.C. Gonzalez, R.E. Woods)

Xét điểm ảnh được cho trong hình 1.10(a) với
}1{
=
V
. Ba điểm ảnh trong hình 1.10(b)
cho ta nhiều 8-liền-kề (mỗi cặp điểm ảnh là 8-liền-kề với nhau được chỉ ra bởi một đường
gạch đứt). Tính nhập nhằng này sẽ bị mất đi khi sử dụng m-liền-kề như trong hình 1.10(c).
Hai tập con ảnh S

1
và S
2
là liền kề (4-, 8-, hoặc m-liền kề) nếu tồn tại một điểm ảnh trong
S
1
liền kề (4-, 8-, hoặc m-liền kề) với một điểm ảnh trong S
2
.
Đường đi
Một đường đi từ điểm p có tọa độ là (x, y) đến điểm q có tọa độ là (s, t) là một chuỗi tuần
tự các điểm phân biệt có các tọa độ:
),(), ,,(),,(
1100 nn
yxyxyx

trong đó ),(),(
00
yxyx = , ),(),( tsyx
nn
= và điểm ảnh ),(
11 −− ii
yx và ),(
ii
yx là liền kề với
ni ,1= . Trong trường hợp này, n là độ dài của đường đi. Nếu
),(
00
yx
=

),(
nn
yx
thì đường đi
được gọi là một đường đi đóng hay một chu trình. Chúng ta có thể định nghĩa 4-, 8-, hoặc m-
đường-đi phụ thuộc vào loại của định nghĩa liền kề. Ví dụ, các đường đi chỉ ra trong hình
1.10(c) là một m-đường-đi.
Tính Liên thông
Cho S biểu diễn một tập con của các điểm trong ảnh. Hai điểm ảnh p và q được gọi là liên
thông trong S nếu tồn tại một đường đi giữa chúng bao gồm tất cả các điểm ảnh nằm trong S.
Với điểm ảnh p bất kỳ thuộc S, tập các điểm ảnh liên thông với nó trong S được g
ọi là thành
phần liên thông của S. Nếu S chỉ có một thành phần liên thông thì tập S được gọi là một tập
liên thông.
Vùng
Cho R là một tập con các điểm trong một ảnh. Chúng ta gọi R là một vùng của ảnh nếu R
là một tập liên thông. Biên của vùng R là tập các điểm ảnh trong vùng mà có một hoặc nhiều
lân cận không thuộc R. Nếu R phủ toàn ảnh thì biên của nó được xác định là dòng và cột đầu
tiên và cuối cùng của ảnh.
Chương 1. Tổng quan về xử lý ảnh
1-13

1.5.3. Thuật toán tìm các thành phần liên thông
Sau đây chúng ta xét một thuật toán gán nhãn cho các thành phần liên thông trong ảnh. Ý
tưởng của thuật toán là quét theo từng điểm ảnh theo thứ tự từ trái sang phải và từ trên xuống
dưới. Thuật toán này sử dụng định nghĩa 4-liền-kề. Gọi p là điểm ảnh ở một bước tùy ý nào đó
trong quá trình quét, r và t tương ứng là lân cận trên và lân cận trái của p. Quá trình quét từng
điểm ảnh này luôn đảm b
ảo r và t đã được xét và gán nhãn trước nếu nó có giá trị bằng 1. Ta
tiến hành gán nhãn cho p dựa vào nhãn của r và t cũng như quan hệ giữa p, r và t tại thời điểm

đang xét.

Thuật toán tìm các thành phần liên thông theo quan hệ 4-liền kề:
Vào:
Ảnh I có kích thước m×n, Tập V các giá trị cấp xám.
Ra: Các thành phần liên thông đã được gán nhãn.
Phương pháp:

Bước 1. (Lần quét thứ nhất) Lần lượt xét các điểm ảnh theo thứ tự từ trái sang
phải và từ trên xuống dưới. Với mỗi điểm ảnh p:
 Nếu Vpf

)( thì bỏ qua.
 Nếu
Vpf

)(
thì xét r (lân cận trên của p) và t (lân cận trái của p):
• Nếu cả Vrf

)( và Vtf

)( thì gán cho p một nhãn mới.
• Nếu Vrf

)( và Vtf

)( thì gán nhãn của p là nhãn của r
• Nếu Vrf


)( và Vtf

)( thì gán nhãn của p là nhãn của t
• Nếu Vrf

)( và Vtf

)( thì:
- Nếu r và t có cùng nhãn thì gán nhãn đó cho p.
- Nếu r và t khác nhãn, gán một trong hai nhãn đó cho p và ghi
nhận hai nhãn này bây giờ là tương đương nhau (r và t liên
thông với nhau thông qua p).
Bước 2. (Lần quét thứ 2) Nếu tồn tại thành phần liên thông có hai hay nhiều
nhãn khác nhau thì lần lượt xét các điểm ảnh theo thứ tự như trên và
gán một nhãn mới cho các thành phần liên thông có nhãn khác nhau.

r
tp
Giáo trình xử lý ảnh số

1-14
Đối với định nghĩa 8-liền-kề, chúng ta cũng làm tương tự. Thay vì xét hai lân cận trên và
trái, chúng ta phải xét 4 lân cận bao gồm trên trái, trên, trên phải và trái.

Thuật toán tìm các thành phần liên thông theo quan hệ 8-liền kề:
Vào:
Ảnh I có kích thước m×n, Tập V các giá trị cấp xám.
Ra: Các thành phần liên thống đã được gán nhãn
Phương pháp:


Bước 1. (Lần quét thứ nhất) Lần lượt xét các điểm ảnh theo thứ tự từ trái sang
phải và từ trên xuống dưới. Với mỗi điểm ảnh p:
 Nếu Vpf ∉)( thì bỏ qua.
 Nếu Vpf ∈)( thì xét q (lân cận trên trái của p), r (lân cận trên của
p), s (lân cận trên phải của p) và t (lân cận trái của p):
• Nếu cả Vqf ∉)( , Vrf

)( , Vsf

)( và Vtf

)( thì gán cho p
một nhãn mới.
• Nếu chỉ một trong bốn lân cận thuộc V thì gán nhãn của p là
nhãn của điểm ảnh có giá trị thuộc V .
• Nếu có hai lân cận trở lên thuộc V thì gán nhãn của p là nhãn
của một trong các lân cận đó và ghi nhận các nhãn này bây giờ là
tương đương nhau (liên thông với nhau thông qua p).
Bước 2. (Lần quét thứ 2) Nếu tồn tại thành phần liên thông có hai hay nhiều
nhãn khác nhau thì lần lượt xét các điểm ảnh theo thứ tự như trên và
gán một nhãn mới cho các thành phần liên thông có nhãn khác nhau.
1.5.4. Độ đo khoảng cách
Hàm khoảng cách
Cho các điểm ảnh p, q và z với các tọa độ tương ứng là ),( yx , ),( ts và ),( vu , lúc đó D
được gọi là hàm khoảng cách hay metric nếu:
a)
0),( ≥qpD ( 0),( =qpD nếu và chỉ nếu p = q)
b)
),(),( pqDqpD =
c)

),(),(),( zqDqpDzpD +≤
qr s
t p
Chương 1. Tổng quan về xử lý ảnh
1-15
Khoảng cách Euclide
Khoảng cách Euclide giữa hai điểm p và q được định nghĩa là:
22
)()(),( tysxqpD
e
−+−= (1.5-1)
Đối với độ đo khoảng cách này, các điểm ảnh có khoảng cách nhỏ hơn hoặc bằng giá trị r
tính từ
),( yx
là các điểm được chứa trong đĩa có tâm
),( yx
có bán kính r.
Khoảng cách
4
D
Khoảng cách
4
D
giữa p và q được định nghĩa là:
tysxqpD −+−=),(
4
(1.5-2)
trong trường hợp này, cách điểm ảnh có khoảng cách
4
D

từ
),( yx
nhỏ hơn hoặc bằng giá
trị r là một hình thoi tâm ),( yx . Ví dụ, các điểm ảnh với khoảng cách
4
D ≤ 2 từ ),( yx có
dạng:

Các điểm ảnh với
4
D =1 là 4-lân-cận của ),( yx .
Khoảng cách
8
D

Khoảng cách
8
D giữa hai điểm p và q được định nghĩa là:
),(
8
qpD = ),max( tysx −− (1.5-3)
trong trường hợp này, các điểm ảnh với khoảng cách
8
D từ ),( yx nhỏ hơn hoặc bằng giá
trị r là hình vuông tâm
),( yx
. Ví dụ, các điểm ảnh với khoảng cách
8
D ≤ 2 từ
),( yx

có dạng
như sau:

Các điểm ảnh với
8
D = 1 là 8-lân-cận của
),( yx
.
Khoảng cách
m
D
Chú ý rằng các khoảng cách
4
D và
8
D không phụ thuộc vào đường đi giữa các điểm ảnh
vì các khoảng cách này chỉ liên quan đến tọa độ của các điểm ảnh. Tuy nhiên, với khoảng cách
m
D , được định nghĩa là độ dài của m-đường-đi ngắn nhất giữa 2 điểm ảnh, đường đi giữa các
Giáo trình xử lý ảnh số

1-16
điểm ảnh hay giá trị của các điểm ảnh là rất quan trọng. Xét ví dụ trong hình dưới đây với p, p
2,
p
4
có giá trị 1, còn p
1
và p
3

có thể có giá trị 0 hoặc 1:


Nếu cả p
1
và p
3
đều có giá trị 0 thì giữa p và p
4
có duy nhất đường đi p - p
2
- p
4
, do đó
khoảng cách giữa p và p
4
lúc này là 2.

Nếu p
1
(tương ứng p
3
) có giá trị 1 còn p
3
(tương ứng p
1
) có giá trị 0 thì đường đi lúc này
giữa p và p
4
là p – p

1
- p
2
- p
4
(tương ứng p - p
2
- p
3
- p
4
), do đó khoảng cách giữa p và
p
4
lúc này là 3.

Và nếu cả p
1
và p
3
đều có giá trị 1 thì giữa p và p
4
có duy nhất đường đi p - p
1
- p
2
- p
3
-
p

4
, do đó khoảng cách giữa p và p
4
lúc này là 4.


p
3
p
4
p
1
p
2

p


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×