Tải bản đầy đủ (.pdf) (72 trang)

Nắn chỉnh biến dạng hình học và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (872.17 KB, 72 trang )

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


§¹i häc Th¸i Nguyªn
khoa c«ng nghÖ th«ng tin








PHẠM ĐỨC HẬU




NẮN CHỈNH BIẾN DẠNG
HÌNH HỌC VÀ ỨNG DỤNG







LuËn v¨n th¹c sÜ : CÔNG NGHỆ THÔNG TIN













Th¸i Nguyªn - 2009
S húa bi Trung tõm Hc liu i hc Thỏi Nguyờn



Đại học Thái Nguyên
khoa công nghệ thông tin





PHM C HU




NN CHNH BIN DNG
HèNH HC V NG DNG






Chuyờn ngnh: KHOA HC MY TNH
Mó s: 60 48 01





Luận văn thạc sĩ : CễNG NGH THễNG TIN



NGI HNG DN KHOA HC
PGS.TS NNG TON




Thái Nguyên - 2009

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1
MỞ ĐẦU
Xử lý ảnh là một trong những ngành khoa học đã đem lại cho con người
những bước tiến vượt bậc mang tính cách mạng, nó đã đưa con người tiến sang
một kỉ nguyên mới. Một vài năm trở lại đây công nghệ thông tin cùng với sự
phát triển của nó đã kéo theo sự phát triển của hàng loạt các ngành khoa học

trong nhiều lĩnh vực khác nhau như sinh học, kinh tế, viễn thông, quân sự, giải
trí… có những bước tiến nhanh hơn so với đúng quy trình mà đáng ra phải trải
qua. Với sự phát triển ngày càng hoàn thiện của công nghệ phần cứng, công
nghệ phần mềm cũng đang có những bước tiến quan trọng đóng góp một phần
không nhỏ cho sự phát triển của xã hội loài người đặc biệt là lĩnh vực xử lý ảnh.
Trong thực tế đối tượng khi được thu nhận bởi các thiết bị điện tử và
quang học thường không thể hiện được bản chất thực (nguyên thủy) của mình
hay nói cách khác là bị biến dạng đi. Ví dụ: ảnh chụp cuốn sách thường có
một đầu to đầu nhỏ do cách đặt máy ảnh, ảnh chụp bề mặt trái đất từ vệ tinh
bị méo do bề mặt cong của trái đất v.v.. Nói đến xử lý ảnh người ta sẽ hiểu
ngay đây là quá trình hiệu chỉnh hay bằng cách nào đó để làm cho đối tượng
được thu nhận thể hiện được đúng bản chất của mình trên ảnh. Thông thường
khâu đầu tiên của quá trình xử lý ảnh được gọi là khâu tiền xử lý với mục
đích nắn chỉnh các điểm sai lệch trên ảnh sao cho kết quả được giống nhất so
với đối tượng được thu nhận. Nắn chỉnh biến dạng nhằm hiệu chỉnh các
khuyết điểm của đối tượng là khâu tiền xử lý quan trọng trong xử lý ảnh.
Khi sử dụng các thiết bị để thu nhận hình ảnh người ta đã phát hiện ra yếu
tố sai lệch ở kết quả của hình ảnh thu được và để khắc phục điều này người ta
đã tìm cách sửa chữa, nắn chỉnh nhằm có được kết quả tốt hơn. Như vậy nắn
chỉnh biến dạng ban đầu chỉ đơn thuần mang mục đích khắc phục các nhược
điểm của ảnh do thiết bị thu nhận gây ra. Sau đó nhờ chính những kết quả từ
khâu nắn chỉnh đã đem lại những hướng phát triển mới quan trọng trong nhận
dạng và đối sánh. Chẳng hạn nhận dạng tội phạm tự động trong ngành công an

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

2
thay vì phải cầm ảnh của họ để đối chiếu với hàng trăm đối tượng đáng nghi
khác có trong máy tính, hoặc xác định độ trùng khớp của một đối tượng với tập
đối tượng cho trước trong khảo cổ học để nghiên cứu quá trình tiến hóa của sự

vật, hiện tượng v.v.. Ngày nay, người ta còn dùng nắn chỉnh biến dạng để “cố
tình” tạo ra các hình dạng theo ý muốn chủ quan. Điển hình là các nhà làm
phim, họ tạo ra các thước phim miêu tả sự thay đổi của một đối tượng theo thời
gian, hoặc quá trình biến đổi từ đối tượng này đến đối tượng khác v.v.. nhờ các
kỹ thuật nắn chỉnh biến dạng với chất lượng không thua kém gì các thước phim
sử dụng thiết bị thu nhận. Việc nghiên cứu các kỹ thuật nắn chỉnh biến dạng
hình học là một việc làm không chỉ có ý nghĩa khoa học và còn mang đậm tính
thực tiễn nhất là trong hoàn cảnh Việt Nam chưa có nhiều hệ thống xử lý ảnh
trong khi thực tế đang đặt ra những yêu cầu đòi hỏi.
Với mong muốn tìm hiểu và nghiên cứu về chủ đề này em đã mạnh dạn
lựa chọn đề tài: "Nắn chỉnh biến dạng hình học và ứng dụng".
Bố cục của luận văn bao gồm phần mở đầu, ba chương chính, phần kết
luận, tài liệu tham khảo và phụ lục. Nội dung các chương được tổ chức như sau:
Chương 1: Khái quát về xử lý ảnh và nắn chỉnh biến dạng. Chương này trình
bày một số khái niệm trong xử lý ảnh, các vấn đề cơ bản của xử lý ảnh. Trình bày
khái niệm, cách phân loại và các ứng dụng cơ bản của nắn chỉnh biến dạng.
Chương 2: Một số kỹ thuật nắn chỉnh biến dạng hình học. Các kỹ thuật
được trình bày dựa vào đặc trưng được xác định để phục vụ cho công việc nắn
chỉnh. Đặc trưng đó có thể dựa trên phân vùng ảnh, trên cơ sở tập các điểm
đặc trưng, dựa trên cơ sở vector, dựa trên kỹ thuật nắn chỉnh khung lưới, v.v..
Chương 3: Ứng dụng nắn chỉnh biến dạng. Phần này trình bầy ứng dụng
nắn chỉnh sách dựa trên các điểm đặc trưng. Kèm theo là một số kết quả.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

3
Chương 1
KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NẮN CHỈNH BIẾN DẠNG

1.1. Khái quát về xử lý ảnh

Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một
ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát
triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc
biệt là máy tính chuyên dụng riêng cho nó.
Xử lý ảnh được đưa vào giảng dạy ở bậc đại học ở nước ta khoảng chục
năm nay. Nó là môn học liên quan đến nhiều lĩnh vực và cần nhiều kiến thức
cơ sở khác. Đầu tiên phải kể đến Xử lý tín hiệu số là một môn học hết sức cơ
bản cho xử lý tín hiệu chung, các khái niệm về tích chập, các biến đổi
Fourier, biến đổi Laplace, các bộ lọc hữu hạn…Thứ hai, các công cụ toán
như Đại số tuyến tính, Xác suất, thống kê. Một số kiến thức cần thiết như Trí
tuệ nhân tạo, Mạng nơ ron nhân tạo cũng được đề cập trong quá trình phân
tích và nhận dạng ảnh.
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: Nâng cao
chất lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao
chất lượng ảnh báo được truyền qua cáp từ Luân Đôn đến New York từ
những năm 20 của thế kỉ XX. Vấn đề nâng cao chất lượng ảnh có liên quan
tới phân bố mức sáng và độ phân giải của ảnh. Việc nâng cao chất lượng ảnh
được phát triển vào khoảng những năm 50 của thế kỉ XX. Điều này có thể giải
thích được, vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện
cho quá trình xử lý ảnh số thuận lợi. Năm 1964, máy tính đã có khả năng xử
lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao
gồm: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện xử
lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng. Các phương

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

4
pháp tri thức nhân tạo như mạng nơron nhân tạo, các thuật toán xử lý hiện đại
và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều
kết quả khả quan.

1.2. Một số khái niệm cơ bản trong xử lý ảnh
1.2.1. Ảnh số
Ảnh số được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất
nhỏ - được coi là những thành tố của bức ảnh và thường được biết dưới tên
gọi là pixels.
1.2.2. Điểm ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng.
Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong
quá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông
qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần
giá trị mà về nguyên tắc bằng mắt thường không phân biệt được 2 điểm kề
nhau. Trong quá trình này người ta sử dụng khái niệm điểm ảnh được gọi từ
picture element. Như vậy, một ảnh là một tập hợp các pixel.
Điểm ảnh hay còn gọi là pixel (picture element, pels, image elements)
được xem như là dấu hiệu hay cường độ sáng tại một toạ độ trong không gian
của đối tượng.
Ảnh được xem như là một tập hợp các điểm ảnh. Khi được số hoá nó
thường được biểu diễn là ma trận 2 chiều a[i][j] mà mỗi phần tử có một giá trị
nguyên hoặc là một véc tơ cấu trúc màu.
1.2.3. Mức xám (gray level)
Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗi
điểm ảnh với một giá trị số - kết quả của quá trình lượng hoá.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

5
Cách mã hoá thường dùng là 16, 32 hay 64 mức. Mã hoá 256 mức là phổ
biến nhất do lý do kỹ thuật. Vì, 28=256 (0,…,255) nên với 256 mức, mỗi
pixel sẽ được mã hoá bởi 8 bit.
1.2.4. Xử lý ảnh số là gì và tại sao chúng ta cần phải xử lý ảnh số

Trong các dạng truyền thông cơ bản: lời nói, văn bản, hình ảnh, âm
thanh thì hình ảnh là dạng truyền thông truyền tải thông tin mạnh mẽ nhất.
Bằng thị giác, con người có thể nhận biết và hiểu về thế giới xung
quanh chúng ta. Ví dụ: Những hình ảnh về trái đất, những hình ảnh trong
dự báo thời tiết…
Có tới 99% lượng thông tin đã biết về thế giới xung quanh được nhận
biết thông qua thị giác.
Việc trang bị cho máy tính có khả năng thị giác như con người không
phải là việc dễ dàng. Chúng ta đang sống trong một không gian 3D, khi máy
tính cố gắng phân tích đối tượng trong không gian 3D thì những bộ cảm biến
có sẵn (camera) lại thường cho ảnh 2D. Như vậy, việc mất mát thông tin của
hình ảnh sẽ xảy ra. Với những cảnh động thì sự di chuyển của đối tượng hay
sự di chuyển của camera, tất cả những việc đó làm cho việc mất mát và sai
lệch thông tin rất lớn.
Ngày nay, cùng với sự phát triển của ngành CNTT, chúng ta mong muốn
đưa được những hình ảnh mà con người có thể nhìn thấy được vào máy tính
để thực hiện các mục đích khác nhau như: phân tích ảnh, phục hồi ảnh...
Để máy tính có thể hiểu và phân tích ảnh thì ảnh cần được mã hoá và
biểu diễn dưới dạng số gọi là ảnh số. Việc xử lý ảnh trên máy tính nhằm mục
đích phân tích ảnh và phục hồi các thông tin bị sai lệch của ảnh trong quá
trình thu nhận.
Như vậy, xử lý ảnh số là thực hiện các phép xử lý đối với ảnh số trên
máy tính. Việc hiểu ảnh, phân tích ảnh và thị giác máy nhằm mục đích nhân

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

6
bản hiệu quả của thị lực con người, giúp chúng ta nhận biết tốt hơn về thế giới
xung quanh.
1.3. Các vấn đề chung liên quan đến xử lý ảnh số

Người ta chia xử lý ảnh thành 2 mức: Xử lý ảnh mức thấp và xử lý ảnh
mức cao (thị giác máy).
Phương pháp xử lý ảnh mức thấp thường sử dụng rất ít kiến thức
(knowledge) về nội dung hay ngữ nghĩa ảnh.
Xử lý ảnh mức cao dựa trên kiến thức, mục tiêu và kế hoạch trong việc
làm thế nào để hoàn thành những mục tiêu đó. Thị giác máy ở mức cao luôn
cố gắng mô phỏng nhận thức của con người và có thể đưa ra những quyết
định dựa vào những thông tin đã biết về ảnh.
Xử lý ảnh mức thấp và thị giác máy ở mức cao khác nhau trong việc sử
dụng dữ liệu ảnh. Dữ liệu ảnh mức thấp bao gồm các ảnh gốc được biểu diễn
dưới dạng ma trận ảnh, các phần tử của ma trận biểu diễn giá trị độ sáng của
điểm ảnh. Trong khi đó dữ liệu ảnh mức cao khởi đầu từ những ảnh tốt,
nhưng chỉ những dữ liệu có liên quan đến các mục đích ở mức cao mới được
đưa ra, việc giảm số lượng dữ liệu là đáng kể. Dữ liệu ở mức cao diễn tả các
thông tin về nội dung ảnh.
1.3.1. Xử lý ảnh mức thấp
Các kỹ thuật xử lý ảnh mức thấp được thực hiện với việc thao tác trên
các ảnh số. Các phương pháp xử lý ảnh mức thấp được đưa ra vào những năm
1970 của thế kỉ XX. Gần đây, các nhà nghiên cứu đang cố gắng tìm ra những
giải thuật có hiệu quả hơn và thực hiện các giải thuật đó trên nhiều thiết bị
tinh vi mang tính kỹ thuật cao. Ví dụ, các máy tương tự (Parallel machines)
đang được sử dụng giúp cho việc tính toán một khối lượng phép tính khổng lồ
của quá trình hoạt động trên tập hợp dữ liệu ảnh trở nên dễ dàng hơn.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

7
Một vấn đề phức tạp và chưa giải quyết được là thứ tự các bước trong
xử lý ảnh mức thấp như thế nào để giải quyết công việc được cụ thể và mục
tiêu tự động hoá vấn đề đó vẫn chưa được thực hiện. Những năm 1980 của

thế kỉ XX, nhiều đề án tập trung cho vấn đề này sử dụng các hệ thống
chuyên gia (expert systems), nhưng các hệ thống chuyên gia vẫn không giải
quyết được vấn đề của chính họ.
Trình tự các bước xử lý như sau đã được công nhận và phổ biến:
(1) Thu nhận ảnh: Một ảnh được thu vào bởi một bộ cảm biến (như TV
camera), từ vệ tinh qua các bộ cảm ứng (sensor) hay ảnh, tranh được quét trên
scanner. Ảnh có thể được thu nhận từ nhiều thiết bị và bằng nhiều cách. Sau
đó ảnh được số hoá để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy
mẫu) và số hoá bằng lượng hoá.
(2) Quá trình xử lý: Là quá trình xây dựng lại ảnh, phục hồi ảnh, khử
nhiễu và tăng cường ảnh.
(3) Mã hoá và nén ảnh: Là bước quan trọng trong việc truyền ảnh.
(4) Phân đoạn ảnh: Máy tính cố gắng tách các đối tượng ảnh riêng biệt ra
khỏi ảnh nền.
Mô tả và phân loại đối tượng trong một tổng thể ảnh đã được phân đoạn
cũng được hiểu là một phần của quá trình xử lý ảnh mức thấp.
1.3.2. Những khó khăn khi xử lý ảnh số
a. Sự hiểu biết về hệ thống thị giác của con người còn hạn chế
Chúng ta không có một sự hiểu biết rõ về vấn đề khi con người quan sát,
xử lý và lưu trữ thông tin trực quan như thế nào. Chúng ta thậm trí không biết
con người đo chất lượng ảnh trực quan và phân loại ảnh như thế nào. Với
cùng một bức ảnh thì sự quan sát ở mỗi người là khác nhau.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

8
Sự chú ý của bạn đến các vùng hay các đường viền khác nhau cũng có
xu hướng làm thay đổi cảm nhận của bạn về bức ảnh.
Thậm chí một ảnh được nhìn với một con mắt không thay đổi thì sự cảm
nhận về bức ảnh đó của con người vẫn thay đổi cho dù là rất ít. Các nhà

nghiên cứu đã làm ổn định hình ảnh trực tiếp trên võng mạc để loại trừ bất kỳ
một hiệu ứng nào xuất hiện từ sự di chuyển của mắt. Và ngay cả trong những
điều kiện đó, giác quan của con người cũng vẫn có thể thay đổi.
b. Sự diễn tả về bản chất của ảnh không thể hiểu được ngay lập tức
Ảnh tương tự được biểu diễn bằng một hàm 2 biến. Sau khi số hoá, ảnh
được biểu diễn dưới dạng ma trận ảnh 2 chiều và được gọi là ảnh số. Máy tính
có thể hiểu và xử lý ảnh số nhưng sự biểu diễn đó không thích hợp cho máy
móc có thể hiểu được. Những kiến thức về ảnh và những thông tin được rút
ra từ ảnh là cần thiết trong việc cố gắng để hiểu được những mảng số đó.
Ví dụ:
Đọc và hiển thị ảnh như một hàm 2 chiều (dùng matlab script)
Hiển thị ảnh dưới dạng ma trận ảnh (dùng matlab)
Hiển thị ảnh với các chương trình hiển thị ảnh (ACDsee trên hệ thống Windows)
Cả hai sự biểu diễn hình ảnh đều chứa những thông tin chính xác như
nhau, nhưng khi quan sát hình ảnh dưới 2 dạng biểu diễn đó thì rất khó để có
thể tìm ra sự tương đồng.
1.4. Ứng dụng của hệ thống xử lý ảnh
- Văn phòng: hệ thống nhận dạng chữ, nhận dạng tiếng Anh, tiếng Việt
nhận dạng được cả chữ, ảnh, bảng:
- Nhận dạng chữ OCR (Optical charater Recognition),
- Nhận dạng nhãn OMR (Optical Mark Recognition)

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

9
- Nhận dạng tiếng Anh
- Nhận dạng tiếng việt
- Kiểm tra sản phẩm
- So sánh mầu của sản phẩm mẫu với sản phẩm mới
- Kiểm tra độ tròn của chai/lọ

- Nhận dạng công nghiệp, y học, thương mại, điều tra khoáng sản
- Địa lý: véc tơ hoá bản đồ.
- Các phần mềm chuyển đổi ảnh Raster sang
ảnh vector: MapScan của Viện CNTT,
TrixSystem R2V và V2R.
- Hoạt hình: biến đổi hình học, bóp méo
hình học.
- Quân sự.
- Dự báo thời tiết, cháy rừng, lũ lụt, sâu
bệnh, khoáng sản.
- Thiên văn học, vật lý, sinh học.
- An ninh:
+ Nhận dạng vân tay, Water Marking.
+ Nhận dạng khuôn mặt người, Nhận dạng tội phạm.
+ Dấu thông tin trong ảnh.
+ Chống bạo lực: dùng camera để phát hiện ra sự an toàn ở nơi
công cộng, Siêu thị…
- Bar code: nhận dạng mã vạch.
- Các robot tự động phục vụ.
- Thư viện: Dùng camera để điều khiển robot.
Hình 1.1 Mô phỏng quá
trình biến đổi hình học

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

10
Ngoài ra có ứng dụng trong y học làm nổi các ảnh, trong thiên văn học
để khôi phục lại ảnh do tác động của khí quyển hay nén ảnh trong truyền đi xa
hoặc lưu trữ.
1.5. Quá trình xử lý ảnh số

a. Phần thu nhận ảnh (Image Acquisition)
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua
camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh
25 dòng), cũng có loại camera đã số hoá (như loại CCD - Change Coupled
Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh. Camera thường
dùng là loại quét dòng; ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu
nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh).
b. Tiền xử lý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào
bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc
nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn.
c. Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để
biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch)
trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về
địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt
để nhận dạng.
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi,
làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào
công đoạn này.
Nếu thực hiện tách quá chi tiết thì bài toán nhận dạng các thành phần được
tách ra trở nên phức tạp, còn ngược lại nếu quá trình phân đoạn được thực hiện
quá thô hoặc phân đoạn sai thì kết quả nhận được cuối cùng sẽ không chính xác.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

11
d. Biểu diễn ảnh (Image Representation)
Biểu diễn ảnh là quá trình xử lý tiếp sau khâu phân đoạn hình ảnh. Các vật
thể sau khi phân đoạn có thể được mô tả dưới dạng chuỗi các điểm ảnh tạo nên

ranh giới một vùng, hoặc tập hợp tất cả các điểm ảnh nằm trong vùng đó.
Phương pháp mô tả thông qua ranh giới vùng thường được sử dụng khi cần tập
trung sự chú ý vào hình dạng bên ngoài của chi tiết ảnh như độ cong, các góc
cạnh v.v. Biểu diễn vùng thường được sử dụng khi chúng ta quan tâm tới đặc
tính bên trong của vùng ảnh như đường vân (texture) hay hình dạng (skeletal).
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân
đoạn) cộng với mã liên kết với các vùng lân cận. Việc biến đổi các số liệu này
thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn
các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection)
gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng
hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm
vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta
miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác.
e. Nhận dạng và nắn chỉnh bằng nội suy ảnh
Nhận dạng là quá trình phân loại vật thể dựa trên cơ sở các chi tiết mô tả
vật thể đó (ví dụ các phương tiện giao thông có trong ảnh). Nhận dạng ảnh
còn là quá trình xác định ảnh, quá trình này thường thu được bằng cách so
sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nắn chỉnh bằng nội suy
là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét
gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại. Có
nhiều cách phân loại ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các
mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số.
- Nhận dạng theo cấu trúc.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

12
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký

điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch,
nhận dạng mặt người…
f. Cơ sở tri thức (Knowledge Base)
Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ
sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo
nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các
phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt
chước quy trình tiếp nhận và xử lý ảnh theo cách của con người. Trong các
bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con
người. Vì vậy, ở đây các cơ sở tri thức được phát huy.
Các quá trình xử lý liệt kê ở trên đều được thực hiện dưới sự giám sát và
điều khiển dựa trên cơ sở các kiến thức về lĩnh vực xử lý ảnh. Các kiến thức
cơ bản có thể đơn giản như vị trí vùng ảnh nơi có những thông tin cần quan
tâm, như vậy có thể thu nhỏ vùng tìm kiếm.
Trường hợp phức tạp hơn, cơ sở kiến thức có thể chứa danh sách tất cả
những hư hỏng có thể gặp trong quá trình kiểm soát chất lượng thành phẩm
hoặc các ảnh vệ tinh có độ chi tiết cao trong các hệ thống theo dõi sự thay đổi
môi trường trong một vùng.
g. Mô tả (biểu diễn ảnh)
Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp
theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ
nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ. Thông
thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các
đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh
(Boundary), vùng ảnh (Region). Một số phương pháp biểu diễn thường dùng:

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

13
Biểu diễn bằng mã chạy (Run-Length Code)

Biểu diễn bằng mã xích (Chaine-Code)
Biểu diễn bằng mã tứ phân (Quad-Tree Code)
* Biểu diễn bằng mã chạy
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị
phân. Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:
U(m, n) = 1 nếu (m, n) thuộc R
U( m, n) = 0 nếu (m, n) không thuộc R
Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n). Với cách
biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1.
Giả sử chúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ
độ (x, y) theo các chiều và đặc tả chỉ đối với giá trị “1” khi đó dạng mô tả có
thể là: (x, y)r; trong đó (x, y) là toạ độ, r là số lượng các bit có giá trị “1” liên
tục theo chiều ngang hoặc dọc.
* Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh. Một đường
bất kỳ được chia thành các đoạn nhỏ. Nối các điểm chia, ta có các đoạn thẳng
kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các
đoạn. Các hướng có thể chọn 4, 8, 12, 24,… mỗi hướng được mã hoá theo số
thập phân hoặc số nhị phân thành mã của hướng.
* Biểu diễn bằng mã tứ phân
Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh. Vùng ảnh
đầu tiên được chia làm bốn phần thường là bằng nhau. Nếu mỗi vùng đã đồng
nhất (chứa toàn điểm đen (1) hay trắng (0)), thì gán cho vùng đó một mã và
không chia tiếp. Các vùng không đồng nhất được chia tiếp làm bốn phần theo

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

14
thủ tục trên cho đến khi tất cả các vùng đều đồng nhất. Các mã phân chia
thành các vùng con tạo thành một cây phân chia các vùng đồng nhất.

Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh. Trong thực
tế, các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu đó tùy
theo đặc điểm ứng dụng. Ảnh sau khi được số hóa được nén, lưu lại để truyền
cho các hệ thống khác sử dụng hoặc để xử lý tiếp theo. Mặt khác, ảnh sau khi
số hóa có thể bỏ qua công đoạn nâng cao chất lượng (khi ảnh đủ chất lượng
theo một yêu cầu nào đó) để chuyển tới khâu phân đoạn hoặc bỏ tiếp khâu
phân đoạn chuyển trực tiếp tới khâu trích chọn đặc trưng sau đó thực hiện
nâng cao chất lượng ảnh (tăng độ sáng, độ tương phản, lọc nhiễu) hoặc khôi
phục ảnh (hồi phục lại ảnh thật khi ảnh nhận được bị méo) v.v…
1.6. Các thành phần cơ bản của hệ thống xử lý ảnh







Hình 1.2 Các thành phần chính của hệ thống xử lý ảnh
- Thiết bị thu nhận hình ảnh: Là thiết bị biến đổi quang-điện, cho phép
biến đổi hình ảnh quang học thành tín hiệu điện dưới dạng analog hay trực
tiếp dưới dạng số. Có nhiều dạng cảm biến cho phép làm việc với ánh sáng
nhìn thấy hoặc hồng ngoại. Hai loại thiết bị biến đổi quang - điện chủ yếu
thường được sử dụng là đèn ghi hình điện tử và chip CCD (Charge Couple
Device - linh kiện ghép điện tích).

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

15
- Bộ nhớ trong và ngoài: Trong các hệ thống xử lý ảnh số thường có dung
lượng rất lớn dùng để lưu trữ ảnh tĩnh và động dưới dạng số. Ví dụ, để lưu một

ảnh số đen trắng kích thước 1024x1024 điểm, mỗi điểm được mã hóa bằng 8 bits
cần bộ nhớ ~ 1MB. Để lưu một ảnh màu không nén, dung lượng bộ nhớ phải
tăng lên gấp 3. Bộ nhớ số trong hệ thống xử lý ảnh có thể chia làm 3 loại:
1- Bộ nhớ đệm trong máy tính để lưu ảnh trong quá trình xử lý. Bộ nhớ
này phải có khả năng ghi/đọc rất nhanh (ví dụ: 25 hình/s);
2- Bộ nhớ ngoài có tốc độ truy cập tương đối nhanh, dùng để lưu thông
tin thường dùng. Các bộ nhớ ngoài có thể là ổ cứng, thẻ nhớ flash v.v..
3- Bộ nhớ dùng để lưu trữ dữ liệu. Loại bộ nhớ này thường có dung
lượng lớn, tốc độ truy cập không cao. Thông dụng nhất là đĩa quang ghi 1 lần
(ROM) hoặc nhiều lần (ROM) như đĩa DVD có dung lượng 4.7GB (một mặt).
Ngoài ra trong hệ thống xử lý ảnh còn sử dụng các thiết bị cho phép lưu
ảnh trên vật liệu khác như giấy in, giấy in nhiệt, giấy trong, đó có thể là máy
in phun, in laser, in trên giấy ảnh đặc biệt bằng công nghệ nung nóng v.v.
- Bộ xử lý ảnh chuyên dụng: Sử dụng chip xử lý ảnh chuyên dụng, có
khả năng thực hiện nhanh các lệnh chuyên dùng trong xử lý ảnh. Cho phép
thực hiện các quá trình xử lý ảnh như lọc, làm nổi đường bao, nén và giải nén
video số v.v.. Trong bộ xử lý ảnh thường tích hợp bộ nhớ đệm có tốc độ cao.
- Màn hình hiển thị: Hệ thống biến đổi điện - quang hay đèn hình (đen
trắng cũng như màu) có nhiệm vụ biến đổi tín hiệu điện có chứa thông tin của
ảnh (tín hiệu video) thành hình ảnh trên màn hình. Có hai dạng display được
sử dụng rộng rãi là đèn hình CRT (Cathode-Ray Tube) và màn hình tinh thể
lỏng LCD (Liquid Crystal Display). Đèn hình CRT thường có khả năng hiển
thị màu sắc tốt hơn màn hình LCD nên được dùng phổ biến trong các hệ
thống xử lý ảnh chuyên nghiệp.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

16
- Máy tính: Có thể là máy tính để bàn cũng như siêu máy tính có chức
năng điều khiển tất cả các bộ phận chức năng trong hệ thống xử lý ảnh số.

Một hệ thống xử lý ảnh cơ bản có thể gồm: Máy tính cá nhân kèm theo
vỉ mạch chuyển đổi đồ hoạ VGA hoặc SVGA, đĩa chứa các ảnh dùng để kiểm
tra các thuật toán và một màn hình có hỗ trợ VGA hoặc SVGA. Nếu điều kiện
cho phép, nên có một hệ thống như Hình 1.2 bao gồm một máy tính PC kèm
theo thiết bị xử lý ảnh. Nối với cổng vào của thiết bị thu nhận ảnh là một
video camera, và cổng ra nối với một màn hình. Thực tế, phần lớn các nghiên
cứu của chúng ta được đưa ra trên ảnh mức xám (ảnh đen trắng). Bởi vậy, hệ
thống sẽ bao gồm một thiết bị xử lý ảnh đen trắng và một màn hình đen trắng.
Ảnh mức xám được áp dụng trong nhiều lĩnh vực như sinh vật học hoặc
trong công nghiệp. Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh mức xám
cũng ứng dụng được trên ảnh màu. Với lý do đó, hệ thống ban đầu nên chỉ
bao gồm các thiết bị thu nhận và hiển thị ảnh đen trắng. Với ảnh màu, nên sử
dụng một hệ thống mới trừ trường hợp bạn cần một camera, TV màu và một
màn hình đa tần số (ví dụ như: NEC MultiSync, Sony Multiscan, hoặc
Mitsubishi Diamond Scan) để hiển thị ảnh màu. Nếu khả năng hạn chế, có thể
dùng PC kèm theo, vỉ mạch VGA và màn hình VGA, để dựng ảnh được.
1.7. Nắn chỉnh biến dạng
1.7.1. Khái niệm nắn chỉnh biến dạng
Nắn chỉnh biến dạng thực hiện việc biến đổi hình học giữa hai ảnh: ảnh
nguồn và ảnh đích. Sự biến đổi hình học định nghĩa mối quan hệ giữa các điểm
ảnh nguồn và điểm ảnh đích. Mối quan hệ này có thể được xác định bằng các
hàm toán học được áp dụng trên toàn bộ ảnh hoặc chỉ trên một vùng ảnh nào
đó. Trong nhiều trường hợp ngoài việc xác định các hàm toán học để nắn chỉnh
ảnh, còn phải xác định thêm các đặc trưng sử dụng trong quá trình nắn chỉnh.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

17
Xét về mặt tác động của thuật toán nắn chỉnh thì có hai khuynh hướng:
tác động toàn cục và tác động cục bộ. Để tạo ra tác động toàn cục ta áp dụng

thuật toán, tiêu chí như nhau đối với mọi điểm ảnh. Còn tác động cục bộ thì
việc nắn chỉnh chỉ áp dụng trên một số vùng ảnh, các vùng khác giữ nguyên.
Các thuật toán nắn chỉnh toàn cục có tốc độ xử lý tương đối nhanh. Tuy
nhiên chỉ áp dụng được đối với các yêu cầu đơn giản như co, giãn ảnh, bóp
méo cả ảnh thành tứ giác hay một số hiệu ứng khác như mắt cá, kính núp v.v..
Thuật toán nắn chỉnh cục bộ cho kết quả ấn tượng hơn. Tuy nhiên để có thể
nắn chỉnh theo từng vùng, phải xác định thêm tập các đặc trưng. Ngoài ra việc
xây dựng thuật toán cũng tương đối phức tạp.







Nắn chỉnh biến dạng bằng hình học thực chất là một khâu trong xử lý
ảnh. Với mỗi một dạng ảnh tuỳ theo mức độ, hiện trạng và chủng loại ảnh mà
người ta sử dụng ứng dụng nào phù hợp nhất để xử lý.
1.7.2. Một số kỹ thuật xử lý ảnh sử dụng trong nắn chỉnh biến dạng
Thông thường người ta phân kỹ thuật nắn chỉnh thành 4 loại cơ bản:
- Kỹ thuật nắn chỉnh dựa trên phân vùng ảnh.
- Kỹ thuật nắn chỉnh dựa trên các điểm đặc trưng.
- Kỹ thuật nắn chỉnh dựa trên vector.
- Kỹ thuật nắn chỉnh dựa trên khung lưới.
Hình 1.3 Ví dụ về nắn chỉnh biến dạng
a) Ảnh gốc
b) Ảnh qua xử lý

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


18
a. Kỹ thuật dựa trên việc phân vùng ảnh: trước tiên miền không gian của
ảnh nguồn được chia thành một tập các vùng nhỏ. Tương tự như vậy, ảnh đích
cũng được chia thành tập các vùng nhỏ tương ứng. Sau đó ảnh được nắn
chỉnh bằng cách chuyển đổi tương ứng mỗi vùng của ảnh nguồn thành mảnh
của ảnh đích. Một trong những phương thức đầu tiên của kỹ thuật dựa trên
phân mảnh là thuật toán nắn chỉnh 2-pass mesh. Với phương thức này, mỗi
chuyển đổi 2-pass sẽ thay thế một chuyển đổi 2-D thành một dãy các chuyển
đổi 1-D trực giao. Ngoài ra còn có các phương thức nắn chỉnh dựa trên phân
vùng khác như phân vùng dựa trên phân hình tam giác v.v..
b. Kỹ thuật nắn chỉnh dựa trên các điểm đặc trưng: người ta dùng các
điểm quan trọng làm ánh xạ cơ sở, tức là đã xác định được trước ánh xạ của
các điểm đặc trưng. Từ các cặp điểm đặc trưng tương ứng ở trên ảnh nguồn
và ảnh đích ta xác định được ánh xạ của các điểm còn lại xuất phát từ vị trí
của nó trên ảnh gốc. Một số phương thức dựa trên điểm đặc trưng coi nắn
chỉnh như là một hàm nội suy dữ liệu thưa. Sử dụng hàm nội suy để nội suy
tất cả các điểm còn lại.
c. Kỹ thuật nắn chỉnh dựa trên vector: kỹ thuật này sử dụng các cặp
vector làm cơ sở để biến đổi ảnh. Beier và Neely là những người đầu tiên đề
xuất kỹ thuật này. Mỗi cặp vector định nghĩa một ánh xạ tọa độ giữa chúng.
Độ dịch chuyển của bất kỳ điểm nào trong ảnh sẽ bằng tổng trọng số của các
ánh xạ do tất cả các cặp vector đã được xác định.
d. Kỹ thuật nắn chỉnh dựa trên khung lưới: Sử dụng các hàm biến đổi
nhằm đưa ra cách thức xác định tất cả các điểm tương ứng với từng điểm ảnh
thuộc ảnh A có khung lưới là Ma trong ảnh N có khung lưới là Mb. Đây là
công việc cần thiết khi thực hiện nắn chỉnh một ảnh hay đối tượng ảnh bất kỳ.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

19

1.7.3. Các điểm đặc trưng để nắn chỉnh
Trước hết phải xác định các đặc trưng tương ứng giữa ảnh nguồn và ảnh
đích. Đặc trưng có thể là vector, điểm điều khiển, hoặc phân ảnh thành các
mảnh khác nhau v.v.. Đây là bước đầu tiên và cũng là bước rất quan trọng
trong nắn chỉnh biến dạng vì hiệu quả của quá trình nắn chỉnh phụ thuộc rất
nhiều vào việc xác định sự tương ứng giữa hai ảnh. Việc xác định các đặc
trưng của ảnh nhằm cung cấp các thông tin về đối tượng giúp cho sự việc nắn
chỉnh được thực hiện thuận lợi. Các công thức nắn chỉnh bao giờ cũng được
đưa ra dựa trên các đặc trưng và xây dựng các công thức nắn chỉnh là đại diện
cho một thuật toán nắn chỉnh biến dạng.
Để đạt được chất lượng nắn chỉnh hình tốt, chúng ta phải nội suy từng
phần của ảnh gốc sang các phần tương ứng bên ảnh đích. Điều này có nghĩa là
ta đã biểu diễn được thông tin của đối tượng và ánh xạ từng phần của chúng
cho nhau. Đây cũng chính là mục đích của giai đoạn xác định các đặc trưng.
1.8. Phép toán hình thái (Morphology) trong nắn chỉnh biến dạng
- Hình thái là thuật ngữ chỉ cấu trúc của một đối tượng ảnh trong đó có
phạm vi và mối quan hệ giữa các phần của đối tượng.
- Với ảnh nhị phân I
MxN
, điểm ảnh tại vị trí (x,y) là I(x,y) được xác định:
= 0 nếu đó là điểm nền
= 1 nếu đó là điểm ảnh
Gọi A là tập hợp các điểm ảnh, ta ký hiệu: A={(x
i
,y
i
) | I(x
i
,y
i

) = 1}
A
c
là tập hợp các điểm nền:

 
|
c
AA




Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

20
Ví dụ:
0 0 1 1 0
1 0 0 1 0
0 1 0 0 0
A = {(0,2), (0,3), (1,0), (1,3), (2,1)}
+ Phép dịch:
Cho một vector x và tập hợp các điểm A, phép dịch A + x được xác
định bởi:
 
|A x x A

   

+ Các phép toán tập hợp Minkowski:

Cho A, B là các tập hợp điểm:
Phép cộng Minkowski:
 
B
A B A



  


Phép trừ Minkowski:
 
B
A B A



  


+ Phép giãn ảnh và co ảnh
Từ hai phép toán Minkowski, ta có phép toán hình thái cơ bản là phép
giãn ảnh và co ảnh :
Phép giãn ảnh (Dilation):
   
,
b
D A B A B A




   


Phép co ảnh (Erosion):
     
,
B
E A B A B A



    


Trong đó:
 
|BB

   


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

21
+ Một số tính chất:
Giao hoán:
   
,,D A B A B B A D B A    


Không giao hoán :
   
,,E A B E B A

Kết hợp:
   
A B C A B C    

Dịch chuyển bất biến:
   
A B x A B x    


+ Ví dụ minh họa:





(a) Giãn ảnh D(A,B) (b) Co ảnh E(A,B)
Hình 1.4 Phép co và giãn ảnh
A và B có thể được xem là các đối tượng ảnh và B được gọi là phần tử
cấu trúc.
Thông thường, phép giãn ảnh làm tăng kích thước đối tượng ảnh trong
khi phép co ảnh làm giảm kích thước. Điều này tùy thuộc vào việc chọn phần
tử cấu trúc. Có hai phần tử cấu trúc phổ biến thường được dùng là tập hợp kề-
4 và tập hợp kề-8 trong hệ tọa độ Đềcác:
Ý nghĩa:
- Phép giãn ảnh biến đổi giá trị của các điểm nền kề-4 (hoặc kề-8) với

điểm ảnh thành các điểm ảnh, do vậy, nó làm tăng kích thước các điểm ảnh.
- Phép co ảnh biến đổi giá trị của các điểm ảnh kề-4 (hoặc kề-8) với
điểm nền thành các điểm nền, do vậy, nó làm giảm kích thước các điểm ảnh.



Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

22
Ví dụ:

(a) B = N
4
(b) B= N
8

Hình 1.5 Minh họa phép co và giãn ảnh
Các điểm ảnh gốc là các điểm màu xám, các điểm thêm vào là các điểm
có màu đen.
* Phép mở và đóng ảnh
Chúng ta có thể kết hợp phép giãn ảnh và co ảnh để tạo nên hai toán tử quan trọng hơn:
Mở ảnh:
   
 
, , ,O A B A B D E A B B

Đóng ảnh:
   
 
, , ,C A B A B E D A B B    


+ Một số tính chất:
- Đối ngẫu:
 
 
 
 
,,
,,
CC
CC
C A B O A B
O A B C A B



- Dịch chuyển:
   
   
,,
,,
O A x B O A B x
C A x B C A B x
  
  

Ý nghĩa:
- Phép mở ảnh sẽ mở rộng những khoảng trống giữa các phần tiếp xúc
trong đối tượng ảnh, làm cho ảnh bớt gai hơn.


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

23
- Phép đóng ảnh sẽ làm mất đi những khoảng trống nhỏ trong ảnh, làm
mất đi nhiễu trong ảnh.
* Một số kết quả
Các toán tử cấu trúc thường được áp dụng:

8
1 1 1
1 1 1
1 1 1
BN







1
- - -
- 1 -
- - -
B








2
- 1 -
1 - 1
- 1 -
B








(a) (b) (c)

a) Ảnh A b) Giãn ảnh với 2B c) Co ảnh với 2B
Hình 1.6 Kết quả phép co và giãn ảnh

d) Mở ảnh với 2B e) Đóng ảnh với 2B f) it-and-Miss với B
1
và B
2

Hình 1.7 Kết quả phép mở và đóng ảnh
* Phép toán HitAndMiss
Cho một ảnh A và hai phần tử cấu trúc B
1
và B

2
, ta có:

×