NẮN CHỈNH BIẾN DẠNG HÌNH HỌC VÀ ỨNG DỤNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (868.57 KB, 36 trang )

Đại học Thái Nguyên
khoa công nghệ thông tin

Đại học Thái Nguyên
khoa công nghệ thông tin

PHM C HU

PHM C HU

NN CHNH BIN DNG
HèNH HC V NG DNG
NN CHNH BIN DNG
HèNH HC V NG DNG
Chuyờn ngnh: KHOA HC MY TNH
Mó s: 60 48 01

Luận văn thạc sĩ : CễNG NGH THễNG TIN
Luận văn thạc sĩ : CễNG NGH THễNG TIN

NGI HNG DN KHOA HC
PGS.TS NNG TON

Thái Nguyên - 2009

Thái Nguyên - 2009

S húa bi Trung tõm Hc liu i hc Thỏi Nguyờn

S húa bi Trung tõm Hc liu i hc Thỏi Nguyờn

1

2

MỞ ĐẦU

thay vì phải cầm ảnh của họ để đối chiếu với hàng trăm đối tượng đáng nghi

Xử lý ảnh là một trong những ngành khoa học đã đem lại cho con người
những bước tiến vượt bậc mang tính cách mạng, nó đã đưa con người tiến sang
một kỉ nguyên mới. Một vài năm trở lại đây công nghệ thông tin cùng với sự
phát triển của nó đã kéo theo sự phát triển của hàng loạt các ngành khoa học
trong nhiều lĩnh vực khác nhau như sinh học, kinh tế, viễn thông, quân sự, giải
trí… có những bước tiến nhanh hơn so với đúng quy trình mà đáng ra phải trải
qua. Với sự phát triển ngày càng hoàn thiện của công nghệ phần cứng, công
nghệ phần mềm cũng đang có những bước tiến quan trọng đóng góp một phần
không nhỏ cho sự phát triển của xã hội loài người đặc biệt là lĩnh vực xử lý ảnh.
Trong thực tế đối tượng khi được thu nhận bởi các thiết bị điện tử và
quang học thường không thể hiện được bản chất thực (nguyên thủy) của mình
hay nói cách khác là bị biến dạng đi. Ví dụ: ảnh chụp cuốn sách thường có
một đầu to đầu nhỏ do cách đặt máy ảnh, ảnh chụp bề mặt trái đất từ vệ tinh
bị méo do bề mặt cong của trái đất v.v.. Nói đến xử lý ảnh người ta sẽ hiểu
ngay đây là quá trình hiệu chỉnh hay bằng cách nào đó để làm cho đối tượng

khác có trong máy tính, hoặc xác định độ trùng khớp của một đối tượng với tập

đối tượng cho trước trong khảo cổ học để nghiên cứu quá trình tiến hóa của sự
vật, hiện tượng v.v.. Ngày nay, người ta còn dùng nắn chỉnh biến dạng để “cố
tình” tạo ra các hình dạng theo ý muốn chủ quan. Điển hình là các nhà làm
phim, họ tạo ra các thước phim miêu tả sự thay đổi của một đối tượng theo thời
gian, hoặc quá trình biến đổi từ đối tượng này đến đối tượng khác v.v.. nhờ các
kỹ thuật nắn chỉnh biến dạng với chất lượng không thua kém gì các thước phim
sử dụng thiết bị thu nhận. Việc nghiên cứu các kỹ thuật nắn chỉnh biến dạng
hình học là một việc làm không chỉ có ý nghĩa khoa học và còn mang đậm tính
thực tiễn nhất là trong hoàn cảnh Việt Nam chưa có nhiều hệ thống xử lý ảnh
trong khi thực tế đang đặt ra những yêu cầu đòi hỏi.
Với mong muốn tìm hiểu và nghiên cứu về chủ đề này em đã mạnh dạn
lựa chọn đề tài: "Nắn chỉnh biến dạng hình học và ứng dụng".
Bố cục của luận văn bao gồm phần mở đầu, ba chương chính, phần kết
luận, tài liệu tham khảo và phụ lục. Nội dung các chương được tổ chức như sau:

được thu nhận thể hiện được đúng bản chất của mình trên ảnh. Thông thường

Chương 1: Khái quát về xử lý ảnh và nắn chỉnh biến dạng. Chương này trình

khâu đầu tiên của quá trình xử lý ảnh được gọi là khâu tiền xử lý với mục

bày một số khái niệm trong xử lý ảnh, các vấn đề cơ bản của xử lý ảnh. Trình bày

đích nắn chỉnh các điểm sai lệch trên ảnh sao cho kết quả được giống nhất so

khái niệm, cách phân loại và các ứng dụng cơ bản của nắn chỉnh biến dạng.

với đối tượng được thu nhận. Nắn chỉnh biến dạng nhằm hiệu chỉnh các
khuyết điểm của đối tượng là khâu tiền xử lý quan trọng trong xử lý ảnh.
Khi sử dụng các thiết bị để thu nhận hình ảnh người ta đã phát hiện ra yếu

tố sai lệch ở kết quả của hình ảnh thu được và để khắc phục điều này người ta
đã tìm cách sửa chữa, nắn chỉnh nhằm có được kết quả tốt hơn. Như vậy nắn
chỉnh biến dạng ban đầu chỉ đơn thuần mang mục đích khắc phục các nhược

Chương 2: Một số kỹ thuật nắn chỉnh biến dạng hình học. Các kỹ thuật
được trình bày dựa vào đặc trưng được xác định để phục vụ cho công việc nắn
chỉnh. Đặc trưng đó có thể dựa trên phân vùng ảnh, trên cơ sở tập các điểm
đặc trưng, dựa trên cơ sở vector, dựa trên kỹ thuật nắn chỉnh khung lưới, v.v..
Chương 3: Ứng dụng nắn chỉnh biến dạng. Phần này trình bầy ứng dụng
nắn chỉnh sách dựa trên các điểm đặc trưng. Kèm theo là một số kết quả.

điểm của ảnh do thiết bị thu nhận gây ra. Sau đó nhờ chính những kết quả từ
khâu nắn chỉnh đã đem lại những hướng phát triển mới quan trọng trong nhận
dạng và đối sánh. Chẳng hạn nhận dạng tội phạm tự động trong ngành công an
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

3

4

Chương 1

pháp tri thức nhân tạo như mạng nơron nhân tạo, các thuật toán xử lý hiện đại

KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NẮN CHỈNH BIẾN DẠNG

và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều
kết quả khả quan.
1.2. Một số khái niệm cơ bản trong xử lý ảnh

1.1. Khái quát về xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một

1.2.1. Ảnh số

ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát

Ảnh số được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất

triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc

nhỏ - được coi là những thành tố của bức ảnh và thường được biết dưới tên

biệt là máy tính chuyên dụng riêng cho nó.

gọi là pixels.

Xử lý ảnh được đưa vào giảng dạy ở bậc đại học ở nước ta khoảng chục

1.2.2. Điểm ảnh

năm nay. Nó là môn học liên quan đến nhiều lĩnh vực và cần nhiều kiến thức

Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng.

cơ sở khác. Đầu tiên phải kể đến Xử lý tín hiệu số là một môn học hết sức cơ

Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong

bản cho xử lý tín hiệu chung, các khái niệm về tích chập, các biến đổi

quá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông

Fourier, biến đổi Laplace, các bộ lọc hữu hạn…Thứ hai, các công cụ toán

qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần

như Đại số tuyến tính, Xác suất, thống kê. Một số kiến thức cần thiết như Trí

giá trị mà về nguyên tắc bằng mắt thường không phân biệt được 2 điểm kề

tuệ nhân tạo, Mạng nơ ron nhân tạo cũng được đề cập trong quá trình phân

nhau. Trong quá trình này người ta sử dụng khái niệm điểm ảnh được gọi từ

tích và nhận dạng ảnh.

picture element. Như vậy, một ảnh là một tập hợp các pixel.

Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: Nâng cao

Điểm ảnh hay còn gọi là pixel (picture element, pels, image elements)

chất lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao

được xem như là dấu hiệu hay cường độ sáng tại một toạ độ trong không gian

chất lượng ảnh báo được truyền qua cáp từ Luân Đôn đến New York từ

của đối tượng.

những năm 20 của thế kỉ XX. Vấn đề nâng cao chất lượng ảnh có liên quan
tới phân bố mức sáng và độ phân giải của ảnh. Việc nâng cao chất lượng ảnh
được phát triển vào khoảng những năm 50 của thế kỉ XX. Điều này có thể giải
thích được, vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện
cho quá trình xử lý ảnh số thuận lợi. Năm 1964, máy tính đã có khả năng xử
lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao
gồm: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện xử

Ảnh được xem như là một tập hợp các điểm ảnh. Khi được số hoá nó
thường được biểu diễn là ma trận 2 chiều a[i][j] mà mỗi phần tử có một giá trị
nguyên hoặc là một véc tơ cấu trúc màu.
1.2.3. Mức xám (gray level)
Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗi
điểm ảnh với một giá trị số - kết quả của quá trình lượng hoá.

lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng. Các phương

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

5

6

Cách mã hoá thường dùng là 16, 32 hay 64 mức. Mã hoá 256 mức là phổ
biến nhất do lý do kỹ thuật. Vì, 28=256 (0,…,255) nên với 256 mức, mỗi
pixel sẽ được mã hoá bởi 8 bit.
1.2.4. Xử lý ảnh số là gì và tại sao chúng ta cần phải xử lý ảnh số
Trong các dạng truyền thông cơ bản: lời nói, văn bản, hình ảnh, âm
thanh thì hình ảnh là dạng truyền thông truyền tải thông tin mạnh mẽ nhất.
Bằng thị giác, con người có thể nhận biết và hiểu về thế giới xung
quanh chúng ta. Ví dụ: Những hình ảnh về trái đất, những hình ảnh trong

bản hiệu quả của thị lực con người, giúp chúng ta nhận biết tốt hơn về thế giới
xung quanh.
1.3. Các vấn đề chung liên quan đến xử lý ảnh số
Người ta chia xử lý ảnh thành 2 mức: Xử lý ảnh mức thấp và xử lý ảnh
mức cao (thị giác máy).
Phương pháp xử lý ảnh mức thấp thường sử dụng rất ít kiến thức
(knowledge) về nội dung hay ngữ nghĩa ảnh.
Xử lý ảnh mức cao dựa trên kiến thức, mục tiêu và kế hoạch trong việc

dự báo thời tiết…
Có tới 99% lượng thông tin đã biết về thế giới xung quanh được nhận
biết thông qua thị giác.

làm thế nào để hoàn thành những mục tiêu đó. Thị giác máy ở mức cao luôn
cố gắng mô phỏng nhận thức của con người và có thể đưa ra những quyết
định dựa vào những thông tin đã biết về ảnh.

Việc trang bị cho máy tính có khả năng thị giác như con người không
phải là việc dễ dàng. Chúng ta đang sống trong một không gian 3D, khi máy
tính cố gắng phân tích đối tượng trong không gian 3D thì những bộ cảm biến
có sẵn (camera) lại thường cho ảnh 2D. Như vậy, việc mất mát thông tin của
hình ảnh sẽ xảy ra. Với những cảnh động thì sự di chuyển của đối tượng hay
sự di chuyển của camera, tất cả những việc đó làm cho việc mất mát và sai
lệch thông tin rất lớn.

Xử lý ảnh mức thấp và thị giác máy ở mức cao khác nhau trong việc sử
dụng dữ liệu ảnh. Dữ liệu ảnh mức thấp bao gồm các ảnh gốc được biểu diễn
dưới dạng ma trận ảnh, các phần tử của ma trận biểu diễn giá trị độ sáng của
điểm ảnh. Trong khi đó dữ liệu ảnh mức cao khởi đầu từ những ảnh tốt,
nhưng chỉ những dữ liệu có liên quan đến các mục đích ở mức cao mới được
đưa ra, việc giảm số lượng dữ liệu là đáng kể. Dữ liệu ở mức cao diễn tả các
thông tin về nội dung ảnh.

Ngày nay, cùng với sự phát triển của ngành CNTT, chúng ta mong muốn
đưa được những hình ảnh mà con người có thể nhìn thấy được vào máy tính
để thực hiện các mục đích khác nhau như: phân tích ảnh, phục hồi ảnh...
Để máy tính có thể hiểu và phân tích ảnh thì ảnh cần được mã hoá và
biểu diễn dưới dạng số gọi là ảnh số. Việc xử lý ảnh trên máy tính nhằm mục
đích phân tích ảnh và phục hồi các thông tin bị sai lệch của ảnh trong quá
trình thu nhận.

1.3.1. Xử lý ảnh mức thấp
Các kỹ thuật xử lý ảnh mức thấp được thực hiện với việc thao tác trên

các ảnh số. Các phương pháp xử lý ảnh mức thấp được đưa ra vào những năm
1970 của thế kỉ XX. Gần đây, các nhà nghiên cứu đang cố gắng tìm ra những
giải thuật có hiệu quả hơn và thực hiện các giải thuật đó trên nhiều thiết bị
tinh vi mang tính kỹ thuật cao. Ví dụ, các máy tương tự (Parallel machines)
đang được sử dụng giúp cho việc tính toán một khối lượng phép tính khổng lồ

Như vậy, xử lý ảnh số là thực hiện các phép xử lý đối với ảnh số trên

của quá trình hoạt động trên tập hợp dữ liệu ảnh trở nên dễ dàng hơn.

máy tính. Việc hiểu ảnh, phân tích ảnh và thị giác máy nhằm mục đích nhân
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

7

8

Một vấn đề phức tạp và chưa giải quyết được là thứ tự các bước trong
xử lý ảnh mức thấp như thế nào để giải quyết công việc được cụ thể và mục

Sự chú ý của bạn đến các vùng hay các đường viền khác nhau cũng có
xu hướng làm thay đổi cảm nhận của bạn về bức ảnh.

tiêu tự động hoá vấn đề đó vẫn chưa được thực hiện. Những năm 1980 của

Thậm chí một ảnh được nhìn với một con mắt không thay đổi thì sự cảm

thế kỉ XX, nhiều đề án tập trung cho vấn đề này sử dụng các hệ thống

nhận về bức ảnh đó của con người vẫn thay đổi cho dù là rất ít. Các nhà

chuyên gia (expert systems), nhưng các hệ thống chuyên gia vẫn không giải

nghiên cứu đã làm ổn định hình ảnh trực tiếp trên võng mạc để loại trừ bất kỳ

quyết được vấn đề của chính họ.

một hiệu ứng nào xuất hiện từ sự di chuyển của mắt. Và ngay cả trong những

Trình tự các bước xử lý như sau đã được công nhận và phổ biến:

điều kiện đó, giác quan của con người cũng vẫn có thể thay đổi.

(1) Thu nhận ảnh: Một ảnh được thu vào bởi một bộ cảm biến (như TV

b. Sự diễn tả về bản chất của ảnh không thể hiểu được ngay lập tức

camera), từ vệ tinh qua các bộ cảm ứng (sensor) hay ảnh, tranh được quét trên

Ảnh tương tự được biểu diễn bằng một hàm 2 biến. Sau khi số hoá, ảnh

scanner. Ảnh có thể được thu nhận từ nhiều thiết bị và bằng nhiều cách. Sau

được biểu diễn dưới dạng ma trận ảnh 2 chiều và được gọi là ảnh số. Máy tính

đó ảnh được số hoá để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy

có thể hiểu và xử lý ảnh số nhưng sự biểu diễn đó không thích hợp cho máy

mẫu) và số hoá bằng lượng hoá.

móc có thể hiểu được. Những kiến thức về ảnh và những thông tin được rút

(2) Quá trình xử lý: Là quá trình xây dựng lại ảnh, phục hồi ảnh, khử
nhiễu và tăng cường ảnh.

ra từ ảnh là cần thiết trong việc cố gắng để hiểu được những mảng số đó.
Ví dụ:

(3) Mã hoá và nén ảnh: Là bước quan trọng trong việc truyền ảnh.

Đọc và hiển thị ảnh như một hàm 2 chiều (dùng matlab script)

(4) Phân đoạn ảnh: Máy tính cố gắng tách các đối tượng ảnh riêng biệt ra

Hiển thị ảnh dưới dạng ma trận ảnh (dùng matlab)

khỏi ảnh nền.

Hiển thị ảnh với các chương trình hiển thị ảnh (ACDsee trên hệ thống Windows)

Mô tả và phân loại đối tượng trong một tổng thể ảnh đã được phân đoạn
cũng được hiểu là một phần của quá trình xử lý ảnh mức thấp.

Cả hai sự biểu diễn hình ảnh đều chứa những thông tin chính xác như
nhau, nhưng khi quan sát hình ảnh dưới 2 dạng biểu diễn đó thì rất khó để có

1.3.2. Những khó khăn khi xử lý ảnh số

thể tìm ra sự tương đồng.

a. Sự hiểu biết về hệ thống thị giác của con người còn hạn chế

1.4. Ứng dụng của hệ thống xử lý ảnh

Chúng ta không có một sự hiểu biết rõ về vấn đề khi con người quan sát,
xử lý và lưu trữ thông tin trực quan như thế nào. Chúng ta thậm trí không biết
con người đo chất lượng ảnh trực quan và phân loại ảnh như thế nào. Với
cùng một bức ảnh thì sự quan sát ở mỗi người là khác nhau.

- Văn phòng: hệ thống nhận dạng chữ, nhận dạng tiếng Anh, tiếng Việt
nhận dạng được cả chữ, ảnh, bảng:
- Nhận dạng chữ OCR (Optical charater Recognition),
- Nhận dạng nhãn OMR (Optical Mark Recognition)

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

9

10

- Nhận dạng tiếng Anh

Ngoài ra có ứng dụng trong y học làm nổi các ảnh, trong thiên văn học

- Nhận dạng tiếng việt

để khôi phục lại ảnh do tác động của khí quyển hay nén ảnh trong truyền đi xa
hoặc lưu trữ.

- Kiểm tra sản phẩm

1.5. Quá trình xử lý ảnh số

- So sánh mầu của sản phẩm mẫu với sản phẩm mới

a. Phần thu nhận ảnh (Image Acquisition)

- Kiểm tra độ tròn của chai/lọ
- Nhận dạng công nghiệp, y học, thương mại, điều tra khoáng sản

ảnh

Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua
camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh

- Địa lý: véc tơ hoá bản đồ.

25 dòng), cũng có loại camera đã số hoá (như loại CCD - Change Coupled

- Các phần mềm chuyển đổi ảnh Raster sang

Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh. Camera thường

vector:

MapScan

của

Viện

dùng là loại quét dòng; ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu

CNTT,

nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh).

TrixSystem R2V và V2R.

b. Tiền xử lý (Image Processing)

- Hoạt hình: biến đổi hình học, bóp méo
hình học.

Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào

- Quân sự.
- Dự báo thời tiết, cháy rừng, lũ lụt, sâu

Hình 1.1 Mô phỏng quá
trình biến đổi hình học

nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn.
c. Phân đoạn (Segmentation) hay phân vùng ảnh

bệnh, khoáng sản.

Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để

- Thiên văn học, vật lý, sinh học.

biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch)

- An ninh:

trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về

+ Nhận dạng vân tay, Water Marking.
+ Nhận dạng khuôn mặt người, Nhận dạng tội phạm.
+ Dấu thông tin trong ảnh.
+ Chống bạo lực: dùng camera để phát hiện ra sự an toàn ở nơi
công cộng, Siêu thị…
- Bar code: nhận dạng mã vạch.

địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt

để nhận dạng.
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi,
làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào
công đoạn này.
Nếu thực hiện tách quá chi tiết thì bài toán nhận dạng các thành phần được

- Các robot tự động phục vụ.

tách ra trở nên phức tạp, còn ngược lại nếu quá trình phân đoạn được thực hiện

- Thư viện: Dùng camera để điều khiển robot.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc

quá thô hoặc phân đoạn sai thì kết quả nhận được cuối cùng sẽ không chính xác.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

11

12

Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng

d. Biểu diễn ảnh (Image Representation)

Biểu diễn ảnh là quá trình xử lý tiếp sau khâu phân đoạn hình ảnh. Các vật

trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký

thể sau khi phân đoạn có thể được mô tả dưới dạng chuỗi các điểm ảnh tạo nên

điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch,

ranh giới một vùng, hoặc tập hợp tất cả các điểm ảnh nằm trong vùng đó.

nhận dạng mặt người…

Phương pháp mô tả thông qua ranh giới vùng thường được sử dụng khi cần tập

f. Cơ sở tri thức (Knowledge Base)

trung sự chú ý vào hình dạng bên ngoài của chi tiết ảnh như độ cong, các góc

Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ

cạnh v.v. Biểu diễn vùng thường được sử dụng khi chúng ta quan tâm tới đặc

sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo

tính bên trong của vùng ảnh như đường vân (texture) hay hình dạng (skeletal).

nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các

Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân

phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt

đoạn) cộng với mã liên kết với các vùng lân cận. Việc biến đổi các số liệu này

chước quy trình tiếp nhận và xử lý ảnh theo cách của con người. Trong các

thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn

bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con

các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection)

người. Vì vậy, ở đây các cơ sở tri thức được phát huy.

gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng

Các quá trình xử lý liệt kê ở trên đều được thực hiện dưới sự giám sát và

hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm

điều khiển dựa trên cơ sở các kiến thức về lĩnh vực xử lý ảnh. Các kiến thức

vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta

cơ bản có thể đơn giản như vị trí vùng ảnh nơi có những thông tin cần quan

miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác.

tâm, như vậy có thể thu nhỏ vùng tìm kiếm.

e. Nhận dạng và nắn chỉnh bằng nội suy ảnh

Trường hợp phức tạp hơn, cơ sở kiến thức có thể chứa danh sách tất cả

Nhận dạng là quá trình phân loại vật thể dựa trên cơ sở các chi tiết mô tả

những hư hỏng có thể gặp trong quá trình kiểm soát chất lượng thành phẩm

vật thể đó (ví dụ các phương tiện giao thông có trong ảnh). Nhận dạng ảnh

hoặc các ảnh vệ tinh có độ chi tiết cao trong các hệ thống theo dõi sự thay đổi

còn là quá trình xác định ảnh, quá trình này thường thu được bằng cách so

môi trường trong một vùng.

sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nắn chỉnh bằng nội suy

g. Mô tả (biểu diễn ảnh)

là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét
gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại. Có
nhiều cách phân loại ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các
mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:

Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp
theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ
nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ. Thông
thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các

- Nhận dạng theo tham số.

đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh

- Nhận dạng theo cấu trúc.

(Boundary), vùng ảnh (Region). Một số phương pháp biểu diễn thường dùng:

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

13

14

Biểu diễn bằng mã chạy (Run-Length Code)

thủ tục trên cho đến khi tất cả các vùng đều đồng nhất. Các mã phân chia

Biểu diễn bằng mã xích (Chaine-Code)

thành các vùng con tạo thành một cây phân chia các vùng đồng nhất.
Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh. Trong thực

Biểu diễn bằng mã tứ phân (Quad-Tree Code)

tế, các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu đó tùy

* Biểu diễn bằng mã chạy

theo đặc điểm ứng dụng. Ảnh sau khi được số hóa được nén, lưu lại để truyền

Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị

cho các hệ thống khác sử dụng hoặc để xử lý tiếp theo. Mặt khác, ảnh sau khi

phân. Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:

số hóa có thể bỏ qua công đoạn nâng cao chất lượng (khi ảnh đủ chất lượng

U(m, n) = 1 nếu (m, n) thuộc R

theo một yêu cầu nào đó) để chuyển tới khâu phân đoạn hoặc bỏ tiếp khâu

U( m, n) = 0 nếu (m, n) không thuộc R
Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n). Với cách
biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1.
Giả sử chúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ

phân đoạn chuyển trực tiếp tới khâu trích chọn đặc trưng sau đó thực hiện
nâng cao chất lượng ảnh (tăng độ sáng, độ tương phản, lọc nhiễu) hoặc khôi
phục ảnh (hồi phục lại ảnh thật khi ảnh nhận được bị méo) v.v…
1.6. Các thành phần cơ bản của hệ thống xử lý ảnh

độ (x, y) theo các chiều và đặc tả chỉ đối với giá trị “1” khi đó dạng mô tả có
thể là: (x, y)r; trong đó (x, y) là toạ độ, r là số lượng các bit có giá trị “1” liên
tục theo chiều ngang hoặc dọc.
* Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh. Một đường
bất kỳ được chia thành các đoạn nhỏ. Nối các điểm chia, ta có các đoạn thẳng
kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các
đoạn. Các hướng có thể chọn 4, 8, 12, 24,… mỗi hướng được mã hoá theo số
thập phân hoặc số nhị phân thành mã của hướng.

Hình 1.2 Các thành phần chính của hệ thống xử lý ảnh

* Biểu diễn bằng mã tứ phân

- Thiết bị thu nhận hình ảnh: Là thiết bị biến đổi quang-điện, cho phép

Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh. Vùng ảnh

biến đổi hình ảnh quang học thành tín hiệu điện dưới dạng analog hay trực

đầu tiên được chia làm bốn phần thường là bằng nhau. Nếu mỗi vùng đã đồng

tiếp dưới dạng số. Có nhiều dạng cảm biến cho phép làm việc với ánh sáng

nhất (chứa toàn điểm đen (1) hay trắng (0)), thì gán cho vùng đó một mã và

nhìn thấy hoặc hồng ngoại. Hai loại thiết bị biến đổi quang - điện chủ yếu

không chia tiếp. Các vùng không đồng nhất được chia tiếp làm bốn phần theo

thường được sử dụng là đèn ghi hình điện tử và chip CCD (Charge Couple
Device - linh kiện ghép điện tích).

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

15

16

- Bộ nhớ trong và ngoài: Trong các hệ thống xử lý ảnh số thường có dung
lượng rất lớn dùng để lưu trữ ảnh tĩnh và động dưới dạng số. Ví dụ, để lưu một

- Máy tính: Có thể là máy tính để bàn cũng như siêu máy tính có chức
năng điều khiển tất cả các bộ phận chức năng trong hệ thống xử lý ảnh số.

ảnh số đen trắng kích thước 1024x1024 điểm, mỗi điểm được mã hóa bằng 8 bits

Một hệ thống xử lý ảnh cơ bản có thể gồm: Máy tính cá nhân kèm theo

cần bộ nhớ ~ 1MB. Để lưu một ảnh màu không nén, dung lượng bộ nhớ phải

vỉ mạch chuyển đổi đồ hoạ VGA hoặc SVGA, đĩa chứa các ảnh dùng để kiểm

tăng lên gấp 3. Bộ nhớ số trong hệ thống xử lý ảnh có thể chia làm 3 loại:

tra các thuật toán và một màn hình có hỗ trợ VGA hoặc SVGA. Nếu điều kiện

1- Bộ nhớ đệm trong máy tính để lưu ảnh trong quá trình xử lý. Bộ nhớ
này phải có khả năng ghi/đọc rất nhanh (ví dụ: 25 hình/s);

cho phép, nên có một hệ thống như Hình 1.2 bao gồm một máy tính PC kèm
theo thiết bị xử lý ảnh. Nối với cổng vào của thiết bị thu nhận ảnh là một

2- Bộ nhớ ngoài có tốc độ truy cập tương đối nhanh, dùng để lưu thông
tin thường dùng. Các bộ nhớ ngoài có thể là ổ cứng, thẻ nhớ flash v.v..
3- Bộ nhớ dùng để lưu trữ dữ liệu. Loại bộ nhớ này thường có dung

video camera, và cổng ra nối với một màn hình. Thực tế, phần lớn các nghiên
cứu của chúng ta được đưa ra trên ảnh mức xám (ảnh đen trắng). Bởi vậy, hệ
thống sẽ bao gồm một thiết bị xử lý ảnh đen trắng và một màn hình đen trắng.

lượng lớn, tốc độ truy cập không cao. Thông dụng nhất là đĩa quang ghi 1 lần

Ảnh mức xám được áp dụng trong nhiều lĩnh vực như sinh vật học hoặc

(ROM) hoặc nhiều lần (ROM) như đĩa DVD có dung lượng 4.7GB (một mặt).

trong công nghiệp. Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh mức xám

Ngoài ra trong hệ thống xử lý ảnh còn sử dụng các thiết bị cho phép lưu
ảnh trên vật liệu khác như giấy in, giấy in nhiệt, giấy trong, đó có thể là máy
in phun, in laser, in trên giấy ảnh đặc biệt bằng công nghệ nung nóng v.v.
- Bộ xử lý ảnh chuyên dụng: Sử dụng chip xử lý ảnh chuyên dụng, có

khả năng thực hiện nhanh các lệnh chuyên dùng trong xử lý ảnh. Cho phép
thực hiện các quá trình xử lý ảnh như lọc, làm nổi đường bao, nén và giải nén
video số v.v.. Trong bộ xử lý ảnh thường tích hợp bộ nhớ đệm có tốc độ cao.
- Màn hình hiển thị: Hệ thống biến đổi điện - quang hay đèn hình (đen
trắng cũng như màu) có nhiệm vụ biến đổi tín hiệu điện có chứa thông tin của
ảnh (tín hiệu video) thành hình ảnh trên màn hình. Có hai dạng display được
sử dụng rộng rãi là đèn hình CRT (Cathode-Ray Tube) và màn hình tinh thể
lỏng LCD (Liquid Crystal Display). Đèn hình CRT thường có khả năng hiển
thị màu sắc tốt hơn màn hình LCD nên được dùng phổ biến trong các hệ
thống xử lý ảnh chuyên nghiệp.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

cũng ứng dụng được trên ảnh màu. Với lý do đó, hệ thống ban đầu nên chỉ
bao gồm các thiết bị thu nhận và hiển thị ảnh đen trắng. Với ảnh màu, nên sử
dụng một hệ thống mới trừ trường hợp bạn cần một camera, TV màu và một
màn hình đa tần số (ví dụ như: NEC MultiSync, Sony Multiscan, hoặc
Mitsubishi Diamond Scan) để hiển thị ảnh màu. Nếu khả năng hạn chế, có thể
dùng PC kèm theo, vỉ mạch VGA và màn hình VGA, để dựng ảnh được.
1.7. Nắn chỉnh biến dạng
1.7.1. Khái niệm nắn chỉnh biến dạng
Nắn chỉnh biến dạng thực hiện việc biến đổi hình học giữa hai ảnh: ảnh
nguồn và ảnh đích. Sự biến đổi hình học định nghĩa mối quan hệ giữa các điểm
ảnh nguồn và điểm ảnh đích. Mối quan hệ này có thể được xác định bằng các
hàm toán học được áp dụng trên toàn bộ ảnh hoặc chỉ trên một vùng ảnh nào
đó. Trong nhiều trường hợp ngoài việc xác định các hàm toán học để nắn chỉnh
ảnh, còn phải xác định thêm các đặc trưng sử dụng trong quá trình nắn chỉnh.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

17

18

Xét về mặt tác động của thuật toán nắn chỉnh thì có hai khuynh hướng:

a. Kỹ thuật dựa trên việc phân vùng ảnh: trước tiên miền không gian của

tác động toàn cục và tác động cục bộ. Để tạo ra tác động toàn cục ta áp dụng

ảnh nguồn được chia thành một tập các vùng nhỏ. Tương tự như vậy, ảnh đích

thuật toán, tiêu chí như nhau đối với mọi điểm ảnh. Còn tác động cục bộ thì

cũng được chia thành tập các vùng nhỏ tương ứng. Sau đó ảnh được nắn

việc nắn chỉnh chỉ áp dụng trên một số vùng ảnh, các vùng khác giữ nguyên.
Các thuật toán nắn chỉnh toàn cục có tốc độ xử lý tương đối nhanh. Tuy
nhiên chỉ áp dụng được đối với các yêu cầu đơn giản như co, giãn ảnh, bóp
méo cả ảnh thành tứ giác hay một số hiệu ứng khác như mắt cá, kính núp v.v..
Thuật toán nắn chỉnh cục bộ cho kết quả ấn tượng hơn. Tuy nhiên để có thể

chỉnh bằng cách chuyển đổi tương ứng mỗi vùng của ảnh nguồn thành mảnh
của ảnh đích. Một trong những phương thức đầu tiên của kỹ thuật dựa trên
phân mảnh là thuật toán nắn chỉnh 2-pass mesh. Với phương thức này, mỗi

chuyển đổi 2-pass sẽ thay thế một chuyển đổi 2-D thành một dãy các chuyển

nắn chỉnh theo từng vùng, phải xác định thêm tập các đặc trưng. Ngoài ra việc

đổi 1-D trực giao. Ngoài ra còn có các phương thức nắn chỉnh dựa trên phân

xây dựng thuật toán cũng tương đối phức tạp.

vùng khác như phân vùng dựa trên phân hình tam giác v.v..
b. Kỹ thuật nắn chỉnh dựa trên các điểm đặc trưng: người ta dùng các
điểm quan trọng làm ánh xạ cơ sở, tức là đã xác định được trước ánh xạ của
các điểm đặc trưng. Từ các cặp điểm đặc trưng tương ứng ở trên ảnh nguồn
và ảnh đích ta xác định được ánh xạ của các điểm còn lại xuất phát từ vị trí

a) Ảnh gốc

b) Ảnh qua xử lý

Hình 1.3 Ví dụ về nắn chỉnh biến dạng
Nắn chỉnh biến dạng bằng hình học thực chất là một khâu trong xử lý
ảnh. Với mỗi một dạng ảnh tuỳ theo mức độ, hiện trạng và chủng loại ảnh mà

của nó trên ảnh gốc. Một số phương thức dựa trên điểm đặc trưng coi nắn
chỉnh như là một hàm nội suy dữ liệu thưa. Sử dụng hàm nội suy để nội suy
tất cả các điểm còn lại.
c. Kỹ thuật nắn chỉnh dựa trên vector: kỹ thuật này sử dụng các cặp

người ta sử dụng ứng dụng nào phù hợp nhất để xử lý.

vector làm cơ sở để biến đổi ảnh. Beier và Neely là những người đầu tiên đề

1.7.2. Một số kỹ thuật xử lý ảnh sử dụng trong nắn chỉnh biến dạng

xuất kỹ thuật này. Mỗi cặp vector định nghĩa một ánh xạ tọa độ giữa chúng.

Thông thường người ta phân kỹ thuật nắn chỉnh thành 4 loại cơ bản:

Độ dịch chuyển của bất kỳ điểm nào trong ảnh sẽ bằng tổng trọng số của các
ánh xạ do tất cả các cặp vector đã được xác định.

- Kỹ thuật nắn chỉnh dựa trên phân vùng ảnh.
- Kỹ thuật nắn chỉnh dựa trên các điểm đặc trưng.
- Kỹ thuật nắn chỉnh dựa trên vector.

thuộc ảnh A có khung lưới là Ma trong ảnh N có khung lưới là Mb. Đây là

- Kỹ thuật nắn chỉnh dựa trên khung lưới.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

d. Kỹ thuật nắn chỉnh dựa trên khung lưới: Sử dụng các hàm biến đổi
nhằm đưa ra cách thức xác định tất cả các điểm tương ứng với từng điểm ảnh

công việc cần thiết khi thực hiện nắn chỉnh một ảnh hay đối tượng ảnh bất kỳ.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

19

20

1.7.3. Các điểm đặc trưng để nắn chỉnh

Ví dụ:

Trước hết phải xác định các đặc trưng tương ứng giữa ảnh nguồn và ảnh

0

0

1

1

0

đích. Đặc trưng có thể là vector, điểm điều khiển, hoặc phân ảnh thành các

1

0

0

1

0

0

1

0

0

0

mảnh khác nhau v.v.. Đây là bước đầu tiên và cũng là bước rất quan trọng
trong nắn chỉnh biến dạng vì hiệu quả của quá trình nắn chỉnh phụ thuộc rất
nhiều vào việc xác định sự tương ứng giữa hai ảnh. Việc xác định các đặc
trưng của ảnh nhằm cung cấp các thông tin về đối tượng giúp cho sự việc nắn
chỉnh được thực hiện thuận lợi. Các công thức nắn chỉnh bao giờ cũng được
đưa ra dựa trên các đặc trưng và xây dựng các công thức nắn chỉnh là đại diện

A = {(0,2), (0,3), (1,0), (1,3), (2,1)}
+ Phép dịch:
Cho một vector x và tập hợp các điểm A, phép dịch A + x được xác
định bởi:

cho một thuật toán nắn chỉnh biến dạng.

A  x    x |   A

Để đạt được chất lượng nắn chỉnh hình tốt, chúng ta phải nội suy từng
phần của ảnh gốc sang các phần tương ứng bên ảnh đích. Điều này có nghĩa là
ta đã biểu diễn được thông tin của đối tượng và ánh xạ từng phần của chúng
cho nhau. Đây cũng chính là mục đích của giai đoạn xác định các đặc trưng.

+ Các phép toán tập hợp Minkowski:
Cho A, B là các tập hợp điểm:
Phép cộng Minkowski: A  B    A   
 B

1.8. Phép toán hình thái (Morphology) trong nắn chỉnh biến dạng
- Hình thái là thuật ngữ chỉ cấu trúc của một đối tượng ảnh trong đó có
phạm vi và mối quan hệ giữa các phần của đối tượng.

 B

+ Phép giãn ảnh và co ảnh

- Với ảnh nhị phân IMxN, điểm ảnh tại vị trí (x,y) là I(x,y) được xác định:
= 0 nếu đó là điểm nền

Từ hai phép toán Minkowski, ta có phép toán hình thái cơ bản là phép
giãn ảnh và co ảnh :
Phép giãn ảnh (Dilation): D  A, B   A  B    A   

= 1 nếu đó là điểm ảnh
Gọi A là tập hợp các điểm ảnh, ta ký hiệu: A={(xi,yi) | I(xi,yi) = 1}
Ac là tập hợp các điểm nền:

 b

Phép co ảnh (Erosion): E  A, B   A  B  

 A   

 B

Ac   |   A

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Phép trừ Minkowski: AB    A   

Trong đó: B   |   B

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

21

22

Ví dụ:

+ Một số tính chất:
Giao hoán:

D  A, B   A  B  B  A  D  B, A

Không giao hoán : E  A, B   E  B, A
Kết hợp: A   B  C    A  B   C
Dịch chuyển bất biến:

A   B  x   A  B  x

+ Ví dụ minh họa:

(a) B = N4

(b) B= N8

Hình 1.5 Minh họa phép co và giãn ảnh
Các điểm ảnh gốc là các điểm màu xám, các điểm thêm vào là các điểm
có màu đen.
* Phép mở và đóng ảnh
Chúng ta có thể kết hợp phép giãn ảnh và co ảnh để tạo nên hai toán tử quan trọng hơn:
(a) Giãn ảnh D(A,B)

(b) Co ảnh E(A,B)

Hình 1.4 Phép co và giãn ảnh
A và B có thể được xem là các đối tượng ảnh và B được gọi là phần tử

Mở ảnh:

O  A, B   A  B  D  E  A, B  , B 

Đóng ảnh:

C  A, B   A  B  E  D  A,  B  ,  B 

+ Một số tính chất:

cấu trúc.
Thông thường, phép giãn ảnh làm tăng kích thước đối tượng ảnh trong
khi phép co ảnh làm giảm kích thước. Điều này tùy thuộc vào việc chọn phần

- Đối ngẫu:

tử cấu trúc. Có hai phần tử cấu trúc phổ biến thường được dùng là tập hợp kề4 và tập hợp kề-8 trong hệ tọa độ Đềcác:

- Dịch chuyển:

Ý nghĩa:
- Phép giãn ảnh biến đổi giá trị của các điểm nền kề-4 (hoặc kề-8) với
điểm ảnh thành các điểm ảnh, do vậy, nó làm tăng kích thước các điểm ảnh.
- Phép co ảnh biến đổi giá trị của các điểm ảnh kề-4 (hoặc kề-8) với

C C  A, B   O  AC , B 
OC  A, B   C  AC , B 
O  A  x, B   O  A, B   x
C  A  x, B   C  A, B   x

Ý nghĩa:
- Phép mở ảnh sẽ mở rộng những khoảng trống giữa các phần tiếp xúc
trong đối tượng ảnh, làm cho ảnh bớt gai hơn.

điểm nền thành các điểm nền, do vậy, nó làm giảm kích thước các điểm ảnh.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

23

24

- Phép đóng ảnh sẽ làm mất đi những khoảng trống nhỏ trong ảnh, làm
mất đi nhiễu trong ảnh.




* Một số kết quả
Các toán tử cấu trúc thường được áp dụng:

1 1 1
B  N8  1 1 1


1 1 1

- - -
B1  - 1 - 


- - -

(a)

(b)

 E  A, B1   E C  AC , B2 


HitMiss  A, B1B2    E  A, B1   E A, B2

 E  A, B1   E A, B2


- 1 -
B2  1 - 1


- 1 - 

với B1 và B2 là giới hạn và rời rạc nhau




 B1  B2  

(phép toán này còn được gọi là xác định viền mẫu, mẫu B1 cho đối
tượng ảnh và mẫu B2 cho nền ảnh)
+ Đường viền các điểm kề 4: A  A  E  A, N8 

(c)

+ Đường viền các điểm kề 8: A  A  E  A, N4 
Cách biểu diễn khác:
Biểu diễn phần tử cấu trúc dưới dạng ma trận
a) Ảnh A

b) Giãn ảnh với 2B

c) Co ảnh với 2B

(gồm B1 và B2)
+ Cách thực hiện: dịch chuyển điểm gốc của phần tử cấu trúc lần lượt

Hình 1.6 Kết quả phép co và giãn ảnh

trên các điểm ảnh theo thứ tự từ trên xuống dưới, từ trái qua phải, nếu các
điểm nền và điểm ảnh của phần tử cấu trúc khớp với trên ảnh thì ta giữ lại
điểm ảnh đó, nếu không ta đặt thành điểm nền.

d) Mở ảnh với 2B

e) Đóng ảnh với 2B f) it-and-Miss với B1 và B2

Hình 1.7 Kết quả phép mở và đóng ảnh

* Phép toán HitAndMiss

4 phần tử cấu trúc được sử dụng để tìm góc của ảnh trong phép toán

Cho một ảnh A và hai phần tử cấu trúc B1 và B2, ta có:

HitAndMiss (thực chất là một phần tử quay theo 4 hướng khác nhau)
Sau khi tìm được góc theo các phần tử cấu trúc trên, ta kết hợp chúng lại
để được kết quả là các góc lồi của ảnh.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

25

26

ta có:

E  A, kB   B  E  A, kB 
K

Xương ảnh là hợp của các tập con xương ảnh: S ( A)   Sk ( A)
k 0

Như vậy, đối tượng ảnh ban đầu có thể được tái tạo lại từ các tập con
K

Hình 1.8 Sử dụng phép toán HitAndMiss để tìm góc lồi của một ảnh
* Xương ảnh

xương ảnh, phần tử cấu trúc B và giá trị K: A    Sk  A  kB 
k 0

Tuy nhiên, công thức này không phải lúc nào cũng bảo toàn được tính

Khái niệm: Xương ảnh là tập hợp các đường độ dày là 1, đi qua phần
giữa của đối tượng ảnh và bảo toàn được tính chất hình học của đối tượng ảnh.
Tuy nhiên, không dễ dàng để nhận ra xương ảnh:

chất hình học của ảnh.
+ Phép toán làm gầy ảnh:
Công thức: Thin  A, B1, B2   A  HitMiss  A, B1, B2 

Ví dụ:

Tùy thuộc vào cách chọn B1, B2 mà ta có các thuật toán làm gầy ảnh khác nhau.
Một cách biểu diễn khác:

(a)

(b)

Hình 1.9 Tìm kiếm xương ảnh

Phần tử cấu trúc được dùng để tìm xương ảnh (điểm gốc ở tâm của phần

Trong ví dụ (a), ta không thể tìm được đường thẳng có độ dày 1 đi qua

tử cấu trúc). Tại mỗi bước lặp, ảnh sẽ được làm gầy bởi phần tử cấu trúc bên

giữa đối tượng mà phản ánh được tính chất đơn giản của đối tượng. Trong ví

trái, sau đó đến phần tử cấu trúc bên phải, tiếp theo với phép quay 90o hai

dụ (b), ta không thể bỏ đi một điểm trong đối tượng kề 8 mà giữ được tính

phần tử cấu trúc trên. Quá trình được lặp đi lặp lại cho đến khi phép toán làm

chất hình học của đối tượng.

gầy không dẫn đến sự thay đổi nào nữa.

Công thức cơ bản:
- Các tập hợp con của xương ảnh Sk(A):
Sk  A   E  A, kB    E  A, kB   B 

k  0,1,...K

với K là giá trị lớn nhất của k trước khi Sk(A) trở thành rỗng.
Hình 1.10 Ví dụ về phép toán làm gầy ảnh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

27

28

Ở giai đoạn xác định các điểm đặc trưng (phần sau) chúng ta tạo ra xây

Chương 2
MỘT SỐ KỸ THUẬT NẮN CHỈNH BIẾN DẠNG HÌNH HỌC

dựng một lưới các tam giác cho ảnh gốc và ảnh đích thoả mãn điều kiện:
Ti = S

Như ta đã bàn trong chương 1, công việc nắn chỉnh thường có nhiều

i

bước, nhưng mục đích cuối cùng là nắn chỉnh bề mặt của một vật (đối tượng)
sao cho sau khi nắn chỉnh đối tượng sẽ không bị cong, bị vênh hay nhăn nheo,
và hình ảnh trông sẽ đẹp hơn.
Ta có thể định nghĩa: Nắn chỉnh ảnh là quá trình thao tác trên một đối
tượng ảnh số, sao cho khi ảnh ở bất kỳ hình dạng nào như cong, vênh, bị bóp
méo,… đều có thể được điều chỉnh.

Ti  Tj = 

Trong đó:
Ti là diện tích của tam giác thứ i
S là diện tích của ảnh.
Đồng thời 3 đỉnh của tam giác là 3 điểm đặc trưng được xác định trên

Công việc của nắn chỉnh ảnh thực chất là đi thay đổi hay di chuyển các
Pixel (điểm ảnh) của hình ảnh từ vị trí này sang vị trí khác .
Sau quá trình nắn chỉnh chúng ta sẽ áp dụng kỹ thuật nội suy ảnh để thu
được ảnh có chất lượng tốt hơn cả về mầu sắc và độ tương phản.

đối tượng ảnh và có sự tham chiếu một - một giữa các điểm này.
Dựa trên lưới các đặc trưng vừa xây dựng được, ứng với mỗi điểm ảnh
cần nội suy, hàm biến đổi sẽ xác định toạ độ của nó rồi xác định hai điểm có
cùng toạ độ trên ảnh đích và ảnh gốc. Sau đó gán giá trị màu của điểm ảnh
đích bằng giá trị màu của điểm gốc tương ứng.

2.1. Nắn chỉnh trên cơ sở phân vùng ảnh
Trong trường hợp các điểm đặc trưng được sắp xếp để tạo thành một
lưới bao phủ lên bề mặt ảnh, khi đó ảnh gồm nhiều phần ghép lại với nhau.
Để nắn chỉnh ảnh, chỉ cần nội suy các phần tương ứng của lưới. Tùy thuộc
vào lưới được tạo thành là lưới gì sẽ có kỹ thuật nắn chỉnh tương ứng. Nếu là

* Cơ sở lý thuyết
+ Khái niệm về toạ độ Barycentric
Với mỗi điểm M(xm,ym) nằm trong tam giác ABC thì chúng ta đều có
thể biểu diễn toạ độ của nó theo toạ độ các đỉnh của tam giác như sau:

lưới tam giác ta có thuật toán biến đổi trên cơ sở phân hình tam giác, nếu là

xm = u  xa + v  xb + w  xc

ym = u  ya + v  yb + w  yc
u+v+ w = 1
u,v, w  0

lưới tứ giác ta có thuật toán biến đổi trên cơ sở phân hình tứ giác v.v..
Khi phân tích ảnh người ta dùng phương pháp phân vùng tam giác và phân
vùng tứ giác. Trong đó kỹ thuật nội suy thường sử dụng là nội suy tam giác
(Affine Interpolation) và nội suy tứ giác (Trilinear Interpolation và Bilinear).

Giải hệ phương trình này ta được một nghiệm duy nhất:

v

( ya - yc) ( xa - xm) - ( xa - xc) ( ya - ym)
( ya - yc) ( xa - xb) - ( xa - xc) ( ya - yb)

w

( ya - ym) ( xa - xb) - ( xa - xm) ( ya - yb)
( ya - yc) ( xa - xb) - ( xa - xc) ( ya - yb)

a. Nội suy tam giác
Để biến đổi lưới tam giác này thành lưới tam giác kia ta thực hiện nội
suy từng tam giác tương ứng cho nhau. Cách đơn giản nhất là sử dụng kỹ

u = 1-v-w

thuật ánh xạ dựa trên hệ toạ độ Barycentric.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

29

30

Chúng ta nói rằng điểm M có toạ độ là (u, v, w) đối với tam giác ABC.

For a = ymin to ymax do

+ Một số đặc điểm cần chú ý của toạ độ Barycentric

- Tìm giao điểm của đường thẳng y=a với 3 cạnh của tam giác.

Đối với mỗi điểm toạ độ của nó là duy nhất.

- Chỉ xét các giao điểm có hoành độ thuộc [xmin,xmax] và sắp xếp các

Toạ độ của một điểm phụ thuộc vào tỉ lệ các khoảng cách từ nó đến các
đỉnh của tam giác chứ không phải là khoảng cách tuyệt đối giữa chúng.
Nếu khoảng cách tương đối của điểm cần biểu diễn đến điểm cơ sở nhỏ

giao điểm theo chiều tăng dần của hoành độ.
- Các điểm nằm trên đường thẳng y=a và có hoành độ thuộc đoạn
[x_min,x_max] là thuộc tam giác (với x_ thể hiện hoành độ giao điểm).

thì hệ số tương ứng với nó sẽ lớn. Hình 2.1 sẽ minh hoạ cho khái niệm hệ toạ
độ Barycentric.

y = ymin

(0,1,0)

(1,0,0)

y = ymax

(0,0,1)

Hình 2.2 Tìm tất cả các điểm thuộc tam giác theo dòng quét

Hình 2.1 Hệ toạ độ Barycentric

Đến đây thuật toán đã hoàn toàn rõ ràng. Vậy các bước phải thực hiện

Sử dụng thuật toán tam giác người ta có thể xác định được tọa độ các
điểm bị bóp méo dựa vào cặp điểm đặc trưng. Các điểm này được xác định

đối với thuật toán này là:

dựa vào việc xác định tam giác nào là cơ sở, cặp điểm nào là cơ sở. Việc xác

Xây dựng lưới tam giác cho ảnh gốc và ảnh đích

định cặp điểm đặc trưng có thể dựa vào thuật toán sau

Đối với mỗi cặp tam giác tương ứng với ảnh gốc và ảnh đích ta nội suy
tam giác ở ảnh gốc thành tam giác ở ảnh đích.

Trước tiên định nghĩa một ánh xạ T cho các đỉnh của tam giác: M(A)=A',
M(B)=B', M(C)=C'. Các điểm còn lại sẽ được ánh xạ theo toạ độ Barycentric

Một vấn đề nảy sinh là làm sao có thể tìm được tất cả các điểm thuộc
tam giác ABC một cách hiệu quả?

(1, 2, 3) nghĩa là:
X= 1*A+2*B+3*C

Có nhiều phương án để giải quyết vấn đề này, phần sau đây sẽ giới thiệu
một phương pháp khá hiệu quả.

Trong đó: i  0 và 1+ 2+ 3 =1
Khi đó điểm Y là ánh xạ của X qua M được tính toán như sau:

* Phương pháp xác định tất cả các điểm thuộc một tam giác
Phương pháp này gồm có các bước như sau:

Y = M(X) = M(1*A+2*B+3*C)
= 1* M (A) +2*M(B) +3*M(C)

Tìm các giá trị xmax, xmin, ymax, ymin đối với các đỉnh của tam giác.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

x = xmax

x = xmin

M

= 1*A'+2*B'+3*C'
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

31

32

giảm nhẹ lực lượng hệ cơ sở từ tập các đặc trưng ban đầu giúp cho việc
biểu diễn là khả thi.
Việc xác định các điểm đặc trưng của ảnh nhằm cung cấp các thông tin về
đối tượng giúp cho sự việc nắn chỉnh được thực hiện thuận lợi. Các công thức

Hình 2.3. Nội suy tam giác

nắn chỉnh bao giờ cũng được đưa ra dựa trên các điểm đặc trưng và xây dựng

b. Phân vùng tứ giác

các công thức nắn chỉnh là đại diện cho một thuật toán nắn chỉnh hình học. Để

Nếu lưới xây dựng trên ảnh nguồn và đích tương ứng là lưới tứ giác, ta

đạt được chất lượng nắn chỉnh hình tốt, chúng ta phải nội suy từng phần của

cần nội suy các tứ giác cho nhau. Để thực hiện điều này ta dùng phép nội suy

ảnh gốc sang các phần tương ứng bên ảnh đích. Điều này có nghĩa là ta đã biểu

Bilinear. Phép nội suy Bilinear xác định một hàm biến đổi từ một hình vuông

diễn được thông tin của đối tượng và ánh xạ từng phần của chúng cho nhau.

kích thước 0,1x0,1 tới một tứ giác trong không gian (tứ giác này không

Đây cũng chính là mục đích của giai đoạn xác định các điểm đặc trưng.

nhất thiết phải đồng phẳng). Phép biến đổi được thực hiện tương đương với
hai việc: Thứ nhất là nội suy trên các cạnh AD và BC thu được điểm P và Q.

Thông thường nắn chỉnh hình dạng người ta dùng phương pháp bình
phương bé nhất hoặc giá trị trung bình nhỏ nhất trên cơ sở thông tin thu được
từ các điểm đặc trưng. Phương pháp bình phương nhỏ nhất (OLS) là một thủ

P = (1-v)A +vD

thuật toán học được sử dụng để ước lượng mối tương quan giữa các biến khác

Q = (1-v)B +vC
Việc tiếp theo là nội suy trên đoạn PQ sử dụng thông số u:

nhau. Kiểu tương quan đơn giản nhất là: Yi  b0  b1 X i  ei

Kết quả quá trình ước lượng các hệ số b 0 và b1 được gọi là b0 mũ và b1

B(u,v)=(1-u)P +uQ

mũ. Các hệ số này được sử dụng để ước lượng biến phụ thuộc Y i mũ.
Chúng ta có thể nói rằng: Y i  b 0  b 1 X i
Chênh lệch giữa giá trị thực tế Yi và giá trị ước lượng Y i là bằng yếu tố
sai số ei. Điều này có thể viết dưới dạng:

Yi  b 0  b 1 X i  ei
Y  Y i  e

Hình 2.4 Nội suy Bilinear
2.2. Nắn chỉnh trên cơ sở tập các điểm đặc trưng

i

i

Thuật toán có hướng tiếp cận dựa trên cơ sở các cặp điểm đặc trưng
như đã trình bầy ở trên. Do vậy, điều quan trọng là làm sao có thể biểu diễn
được một điểm bất kỳ theo tập các đặc trưng khi mà lực lượng của tập lớn.
Tuy nhiên, thuật toán lợi dụng tính chất phân vùng của đối tượng ảnh để
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

33

34

Minh họa lên đồ thị.

Minh họa Yi lên đồ thị.

Hình 2.7 Đồ thị biểu diễn giá trị thực Yi

Hình 2.5 Đồ thị biểu diễn giá trị ước lượng Y

Đường tuyến tính liên hệ X và Y được tính bằng phương pháp OLS là

Minh họa ei lên đồ thị.
Mục đích của phương pháp OLS là tối thiểu hóa tổng e12 , e22 và e32 .

đáng tin cậy bởi vì nó tối thiểu hóa tổng bình phương các sai số. Nghĩa là nó
tối thiểu hóa:

e

2
i

Tương đương với tối thiểu hóa:

 (Y  Y )

i

2

i

Điều này có ba đặc điểm cơ bản:
1. Đường hồi quy đi qua điểm ( X , Y ) , điểm này là trung bình các dữ liệu.
2. Tổng bình phương các sai số hay các phần dư là bằng 0.
3. Phương pháp OLS đưa ra những ước lượng "tốt nhất" phụ thuộc vào
các khái niệm cũng như các điều kiện.
Các Khái Niệm.
Hình 2.6 Đồ thị biểu diễn giá trị chênh lệch ei

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Sai Số Ước Lượng Chuẩn[2] (SEE).

 e2 
SEE    i 
n2
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1

2

35

36

Tổng bình phương tất cả các sai lệch[3] (TSS).

TSS  (Yi  Y )

Minh họa lên đồ thị.

2

Hình 2.9 Đồ thị biểu diễn sự biến động của các biến
Hình 2.8 Đồ thị biểu diễn tổng bình phương tất cả các điểm sai lệch

Với phương pháp bình phương bé nhất ta có thể xây dựng được tọa độ
điểm cần nắn chỉnh như sau:

Ta có: TSS = RSS + ESS.
Mô hình giải thích bao nhiêu biến động của biến phụ thuộc! R2 sẽ giải
quyết vấn đề này. R2 là tỉ lệ giữa tổng bình phương tất cả các sai lệch của biến
giải thích với tổng bình phương tất cả các sai lệch, hay: R 2 

ESS
RSS
1
TSS
TSS

R2 cao nghĩa là mô hình ước lượng được giải thích được một mức độ cao

Với một điểm (x,y) ở ảnh gốc phải chuyển sang toạ độ (u,v) tương ứng ở ảnh
đích. Phép chuyển đổi này là xác định mối quan hệ giữa (x,y) và (u,v) và ngược lại.
Chuyển đổi ngược được biểu diễn như sau:
T-1(x,y)  u,v
Chuyển đổi thuận sẽ là:

biến động của biến phụ thuộc.

T(u,v)  x, y

Nếu R2 bằng 0. Nghĩa là mô hình không đưa ra thông tin nào về biến phụ
thuộc và dự đoán tốt nhất về giá trị của biến phụ thuộc là giá trị trung bình của
nó. Các biến "giải thích" thực sự không đưa ra được một giải thích nào.

(1.1)

(1.2)

Giải pháp chung là xác định cặp hàm đa thức:
N

N

  aij Pi(x) Pj(y)
i=0 j=i

(1.3)

N

N

  bij Pi(x) Pj(y)
i=0 j=i

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

37

38

Trong đó, hàm P thông thường là đa thức Chebychev và các tham số a ij
và bij được xác định bằng phương pháp bình phương bé nhất hoặc giá trị trung
bình nhỏ nhất.

i n

Ta có:

 0  1  q1

 ( x  x)(u
i

i 1

 ( x  x)

Để xác định đa thức bậc N ta phải có ít nhất k=(N+1)(N+2)/2 điểm đặc
i n

1 

i n

 ( y  y)(u  x )   q ( x  x)( y  y) 
i 1

i

(1.4)

2 

Trong đó, cặp (uc , vc) và (xc, yc) là cặp toạ độ biểu diễn trường của các

Biến đổi Affine sáu tham số hay được sử dụng để mô hình hoá biến đổi

3 

i

i

 q  ( xi  x)( yi  y )
i 1

1
 (ui  xi )  x  0 x  1 y
n i 1
i n

 ( x  x)(v  y )  p ( y  y)(v  y )
i 1

i

i

i

i n

 ( x  x)
i 1

i n

i 1

i

i

i

 p  ( xi  x)( yi  y )

2

i

i 1

i n

u = 0 x + 1 y + 2

 4  1  p3

v = 3 x + 4 y + 5
Trong đó, (x,y) là điểm ở ảnh gốc cần ánh xạ sang ảnh đích.
(u ,v) là toạ độ ảnh đích.
Các hệ số  được ước lượng bằng phương pháp bình phương tối thiểu.
được tính toán như sau:

 ( y  y)(v  y ) 
i 1

i

i

i

i n

 ( y  y)
i 1

5 

Giả sử ta đã chọn n điểm đặc trưng trên ảnh gốc và ảnh đích, các giá trị 

2

i

1 i n
 (vi  yi )  y  4 y  2 y
n i 1

Phương pháp này rất hiệu quả khi nắn chỉnh các vùng có diện tích không
lớn. Tuy nhiên không có giải pháp nào để xác định kích thước vùng đó là bao

i n

x

i n

x
i 1

i

y

;

n

nhiêu là phù hợp với phép biến đổi này mà chỉ phụ thuộc vào kinh nghiệm và

y

i

i 1

n

 ( xi  x)( yi  y)
i n

 ( y  y)

thực nghiệm. Nếu ảnh gốc có các mặt cần nắn chỉnh lớn thì chia thành các

;

i n

i 1

2

i

i 1

i n

từ vị trí toạ độ ảnh gốc sang vị trí ảnh đích. Hình thức của chúng như sau:

i 1

i n

i n

điểm đặc trưng và (N+1)(N+2)/2  k.

p

i

i n
i 1

-1

Đặt:

i

 ( y  y)

(1.1) sẽ trở thành phương pháp đa thức.
TN ([F(uc,vc)]k, [xc,yc]k, x, y)  u,v

2

i

i 1

trưng. Trong bài toán này, hệ toạ độ được sử dụng là hệ toạ độ Đề các nên chỉ
cần ba hay nhiều hơn điểm đặc trưng cho đa thức bậc nhất (N=1). Quan hệ

 xi ) 

i

i n

vùng nhỏ hơn và thực hiện biến đổi riêng rẽ từng vùng con này.

i n

;

2

i

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

và

q

 ( xi  x)( yi  y)
i 1

i n

 ( x  x)
i 1

2

i

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

39

40

Nắn chỉnh

Ảnh nguồn

Ảnh đích
Hình 2.10 Ảnh gốc và ảnh bị nắn chỉnh
Để có được kết quả như vậy, ta cần có các phép biến đổi toạ độ của các

Hình 2.12 Mô tả sự biến đổi của tọa độ các điểm ảnh

điểm ảnh, cụ thể theo thuật toán thì ta biến đổi toạ độ (x,y) thành (u,v). có thể

Thuật toán có thể viết như sau:

thể hiện bằng hình ảnh như sau:

For ( int u= 0; u< umax; u++) {
For (int v=0; vFloat x = fx(u,v);
Float y=fy(u,v);
Dst (x,y) = Src (u,v);
}
}
Kết quả của thuật toán:

Hình 2.11 Nắn chỉnh bằng cách biến đổi tọa độ các điểm ảnh

Thực chất của việc biến đổi toạ độ x, y là thực hiện kéo x đi một góc α
khi đó: x = u + T*v , y = v
Khi kéo y đi một góc α thì x = u , y = v + T*u

Ảnh nguồn
Ảnh đích
Hình 2.13 Mô tả kết quả thuật toán biến đổi

Kết quả kéo sẽ được : x= fx(u,v) , y= fy(u,v)

Như đã nói ở thuật toán trên trước khi để nắn chỉnh được ảnh gốc thì ta
cần xác định được các cặp điểm đặc trưng. Đây là bước đầu tiên cũng là bước
quan trọng trong nắn chỉnh ảnh.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

41

42

2.3. Kỹ thuật nắn chỉnh dựa trên cơ sở vector

Giá trị u thể hiện chiều dài của đoạn thẳng và v là khoảng cách tới đường

Trong trường hợp trên giữa các điểm điều khiển không có sự ràng buộc
nào. Khi các điểm đặc trưng được xác định sao cho chúng tạo thành từng cặp
điểm, tức là các vector, ta sẽ có phương thức nắn chỉnh trên cơ sở các vector.
a. Chuyển đổi với một cặp vector

thẳng. Giá trị của u tăng từ 0 đến 1 khi điểm ảnh tiến từ P đến Q và nhỏ hơn 0
hoặc lớn hơn 1 thì sẽ vượt qua vùng giới hạn. Giá trị của v là khoảng cách từ
điểm ảnh đến đoạn thẳng.
Nếu có một cặp vector thì thuật toán biến đổi được cho như sau:
Với mỗi điểm ảnh X trên ảnh đích:

Xét trường hợp chỉ có một cặp vector: PQ trên ảnh đích và P’Q’ trên ảnh
nguồn. Khi đó với mỗi điểm X trên ảnh đích, điểm X’ tương ứng với X trên
ảnh nguồn được tính như sau:

Tìm cặp giá trị tương ứng (u,v)
Tìm điểm X’ trên ảnh nguồn dựa trên (u,v) vừa xác định
ImgDestination.X = ImgSource.X’

 
PX .PQ
u   2
PQ


PX . perpendicular ( PQ)

V
2
PQ



Đặt A ' B ' = perpendicular( P ' Q ' )
X '  P'u  (Q'P' )  v  (B' A' )

Hình 2.14 Cặp đoạn thẳng đơn

Trong đó: Perpendicular() trả lại vector vuông góc, cùng chiều dài với
vector vào. Hướng của perpendicular() có thể chọn một trong hai hướng:

Hình 2.15 minh hoạ cho thuật toán, cách tìm điểm X’ khi biết PQ, P’Q’
và điểm ảnh X.

Nếu quay perpendicular() một góc 900 theo chiều kim đồng hồ quanh
gốc của vector perpendicular() thì perpendicular() có hướng trùng với hướng
của vector vào.
Nếu quay perpendicular() một góc 900 ngược chiều kim đồng hồ quanh
gốc của vector perpendicular() thì perpendicular() có hướng trùng với hướng
của vector vào.

Hình 2.15 Một số kết quả minh họa của thuật toán

Nếu đã chọn hướng nào thì trong suốt quá trình thực hiện biến đổi phải
tuân theo hướng đã chọn.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Trong đó ảnh góc trên bên trái là ảnh gốc, các ảnh còn lại là các ảnh kết
quả với đoạn thẳng được xác định tương ứng.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

43

44

For mỗi vector PiQi

b. Chuyển đổi với nhiều cặp vector
Biến đổi với nhiều cặp vector sẽ phức tạp hơn so với một cặp vector. Trong

Tính u, v dựa trên Pi,Qi

thuật toán này chúng ta sẽ tính toán thêm các giá trị weight cho sự biến đổi của

Tính X’i dựa trên u,v và Pi’Qi’

từng vector. Mỗi điểm X’ sẽ được tính toán cho từng cặp vector. Độ dịch chuyển

Di=Xi’-X

Di=Xi’-X đo sự sai khác giữa vị trí của điểm ảnh nguồn và đích. Một trọng số

dist = khoảng cách từ X tới PiQi

dựa trên những độ dịch chuyển này sẽ được tính toán. Trọng số này sẽ được xác

weight= ((lengthp)/(a+dist))b

định bởi khoảng cách từ X đến vector. Giá trị trọng số này được thêm với X để
xác định điểm X’ cần lấy trên ảnh nguồn. Trường hợp vector đơn sẽ là một
trường hợp đặc biệt của trường hợp nhiều vector nếu như giá trị weight không
bao giờ là 0 tại mọi điểm trên ảnh. Giá trị weight là lớn nhất nếu điểm ảnh nằm

DSUM=DSUM+Di*weight
weightsum=weightsum+weight
X’=X+DSUM/weightsum
ImgDestination.X=ImgSource.X’

đúng trên vector và sẽ là bé nhất nếu nó nằm xa vector nhất.

 length p 
Công thức tính weight được cho như sau: W  

 (a  dist ) 

b

Trong đó:
Length là chiều dài của vector, dist là khoảng cách từ điểm ảnh đến
vector, a, b, p là các hằng số dùng để thay đổi quan hệ giữa các vector.
Nếu a tiến tới 0 và dist đúng bằng 0 thì weight tiến tới vô cực. Khi đó điểm
ảnh nằm trên vector gốc sẽ được ánh xạ đúng đến vị trí tương ứng trên vectơ
đích. Giá trị a lớn sẽ cho kết quả nắn chỉnh tốt hơn (trơn hơn). Giá trị b thể hiện
sự tác động của chiều dài vector đến các điểm ảnh. Nếu b lớn thì điểm ảnh chỉ bị
tác động bởi một vector có khoảng cách đến nó ngắn nhất. Nếu b=0 thì điểm ảnh

Hình 2.16 Nhiều cặp vector
Hình 2.16 là một minh hoạ cho việc tính toán điểm X’ trên cơ sở biết X
và các cặp vector tương ứng.

sẽ bị tác động như nhau đối với mọi vector. Giá trị hay sử dụng của b là [0.5;2].
Giá trị của p là [0;1]. Nếu p = 0 thì tất cả các weight không phụ thuộc vào chiều
dài vector. Nếu p=1 thì vector nào dài hơn sẽ có weight lớn hơn.
Thuật toán được cho như sau:
For mỗi điểm X trên ảnh đích
DSUM=(0,0)

Hình 2.17 Kết quả của thuật toán

Weightsum =0
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

45

46

Với kỹ thuật vector khi thực hiện bóp méo một hình ảnh thì hình ảnh

Giả sử khung lưới Ma và Mb của hai ảnh A và B như hình vẽ:

không còn ở trạng thái ban đầu nữa, tuy nhiên khi các tọa độ ánh xạ sang ảnh
đích thì một số pixel ảnh sẽ không thể ánh xạ sang được, vì vật sẽ khó khăn
cho việc chuyển đổi màu của ảnh.
Việc xác định lại màu sắc cho ảnh lại phải sử dụng đến thuật toán tô màu
(theo làn, theo dòng,..). Nhưng để sử dụng được các thuật toán này thì việc
tìm tọa độ của các điểm ảnh là rất quan trọng. Hình 2.18 cho thấy khi bóp
méo ảnh thì tọa độ thay đổi phụ thuộc vào hàm chuyển đổi f, hàm này có thể
được xác định bằng thuật toán vector như đã trình bày ở trên.
x = fx(u,v)
y = fy(u,v)

Hình 2.19 Khung lưới B-Spline của hai ảnh
Ở giai đoạn quét ngang chúng ta sẽ chỉ quan tâm đến các đường BSpline dọc trên cả hai ảnh và xếp chồng chúng với nhau. Chú ý rằng có một sự
tham chiếu một - một giữa các đường B-Spline dọc này. Chúng ta sẽ quét từng
dòng ngang từ trên xuống dưới, với mỗi dòng quét ngang chúng ta sẽ xác định
giao của nó với các đường B-Spline.
Các bước cần làm đối với đường quét ngang có phương trình y=a được
xác định như sau (xem minh hoạ trong hình 2.20):
Xây dựng một hệ trục toạ độ hai chiều.

Hình 2.18 Tọa độ ảnh thay đổi khi bóp méo



Xây dựng các điểm, mỗi điểm này nhận giá trị hoành độ giao điểm của

đường quét ngang với các đường B - Spline của ảnh A làm hoành độ và hoành
2.4. Kỹ thuật nắn chỉnh dựa trên khung lưới

độ giao điểm với đường B-Spline tương ứng với nó trên ảnh B làm tung độ.

2.4.1. Xây dựng hàm biến đổi



Xây dựng một đường cong đi qua tất cả các điểm này.

Hàm biến đổi được trình bày sau đây sẽ chỉ ra cách thức xác định tất cả
các điểm tương ứng với từng điểm ảnh thuộc ảnh A có khung lưới là Ma
trong ảnh N có khung lưới là Mb. Đây là công việc cần thiết khi thực hiện nắn
chỉnh một ảnh hay đối tượng ảnh bất kỳ.
Công việc này được tiến hành qua hai giai đoạn: quét ngang và quét
dọc. Do hai giai đoạn này được thực hiện tương tự nhau nên chúng ta chỉ trình
bày đại diện một giai đoạn là giai đoạn quét ngang.
Hình 2.20 Xác định các điểm tương đương cho mỗi dòng quét
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

47



48

Đường cong trong hình 2.20 là ánh xạ hoành độ của các điểm có tung

định các cặp điểm đặc trưng, ta chưa có một phương pháp hiệu quả nào để
cho phép tự động nhận biết các mặt này. Vì thế không còn phương pháp nào

độ là a của hai ảnh A và B.
Với cách xác định tọa độ điểm như thuật toán khung lưới thì ta có thể
xác định được tọa độ của các điểm ảnh khi ánh xạ sang ảnh đích.
Theo công thức cosi thì tọa độ đó có thể xác định theo công thức sau:

khác là nhờ sự trợ giúp của con người một cách thủ công. Việc xác định các
mặt đồng nghĩa với việc chia ảnh thành các vùng đa giác mà các đỉnh của đa
giác là các điểm đặc trưng.
Thực tế người ta cũng có thể nắn chỉnh được mà không cần bước xác

Quay một góc Θ :

định các mặt của đối tượng cần nắn chỉnh. Vì trên cơ sở các điểm đặc trưng

x = ucosΘ - vsinΘ

đã chọn, dùng phương pháp nội suy dựa trên lưới tam giác và tập các điểm
đặc trưng là tìm ra ngay được công thức biến đổi đối với mỗi điểm ảnh cần

y = usinΘ + vcosΘ

nội suy. Tuy nhiên sẽ gặp phải một số khó khăn sau:

Mô tả bằng hình ảnh như sau:



Khối lượng tính toán tăng lên.

Bởi vì: Đối với mỗi điểm ảnh bất kỳ cần nội suy thì ta phải xét ảnh
hưởng của tất cả các điểm đặc trưng của ảnh đối với điểm đó. Nghĩa là, một
điểm ảnh của vùng này thực chất chỉ cần xét sự ảnh hưởng của các điểm đặc
trưng thuộc vùng đó đến nó nhưng làm theo cách không phân vùng thì phải

Quay
300

xét đến cả những điểm đặc trưng của các vùng còn lại.

Hình 2.21 Cách xác định tọa độ mới



Việc nội suy thiếu chính xác. Do đó hiệu quả nắn chỉnh không cao.

Chính vì những nhược điểm trên khi không định nghĩa rõ ràng các

2.4.2. Nhận xét kết quả


Đây là thuật toán có chất lượng đầu tiên, tuy nhiên nó cũng chưa thật tốt.



Thời gian chạy tương đối lâu do phải làm việc với các đường cong

phức tạp là B-Spline.

mặt cần nội suy nên ở đây sẽ sử dụng phương pháp chia ảnh thành các
vùng cần nội suy riêng biệt nhằm mục đích xây dựng khung cho đối tượng
cần nắn chỉnh.
2.6. Các mô hình nắn chỉnh sử dụng trong phần mềm IrasC



Cần nhiều tương tác của người sử dụng trong việc xây dựng khung lưới.



Trong nhiều trường hợp mô hình khung lưới không phù hợp.

2.5. Xây dựng khung nắn chỉnh

2.6.1. Các mô hình nắn chỉnh trong IrasC
Nói chung mục đích của quá trình nắn là chuyển đổi các ảnh quét đang
ở toạ độ hàng cột của các pixel về toạ độ trắc địa (toạ độ thực - hệ toạ độ địa

Vấn đề đặt ra ở đây là phải xác định được các cặp mặt tương ứng giữa

lý hoặc toạ độ phẳng). Đây là bước quan trọng nhất trong quá trình thành lập

ảnh gốc được chụp vào cần nắn chỉnh và ảnh đích. Cũng giống như việc xác

ảnh số vì nó ảnh hưởng tới toàn bộ độ chính xác của ảnh sau khi được số hoá

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

NẮN CHỈNH BIẾN DẠNG HÌNH HỌC VÀ ỨNG DỤNG

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về