Tải bản đầy đủ (.doc) (69 trang)

Lập trình một số bài toán cơ bản trong xử lý ảnh số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.55 MB, 69 trang )

Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
‘pơMỤC LỤC
‘pơMỤC LỤC..............................................................................................................1
DANH MỤC CÁC HÌNH VẼ......................................................................................4
DANH MỤC CÁC BẢNG BIỂU................................................................................5
THÔNG TIN KẾT QUẢ NGHIÊN CỨU....................................................................6
MỞ ĐẦU......................................................................................................................7
CHƯƠNG 1
GIỚI THIỆU CHUNG VỀ XỬ LÝ ẢNH.....................................................................9
1.1 Tổng quan về hệ thống xử lý ảnh.......................................................................9
1.2 Những vấn đề cơ bản trong xử lý ảnh...............................................................10
1.2.1 Những khái niệm liên quan.......................................................................10
1.2.2 Biểu diễn ảnh.............................................................................................15
1.2.3 Tăng cường ảnh.........................................................................................17
1.2.4 Phân vùng ảnh...........................................................................................18
1.2.5 Trích chọn đặc tính....................................................................................18
1.2.6 Nhận dạng ảnh...........................................................................................18
1.2.7 Nén ảnh......................................................................................................19
1.3 Các định dạng ảnh cơ bản.................................................................................19
1.3.1 Ảnh BMP (Bitmap)...................................................................................20
1.3.2 Ảnh JPEG (Joint Photographic Experts Group)........................................20
1.3.3 Ảnh GIF (Graphics Interchange Format)..................................................20
1.3.4 Ảnh WMF (Windows Metafiles)...............................................................20
CHƯƠNG 2
MỘT SỐ BÀI TOÁN VỀ XỬ LÝ ẢNH.....................................................................21
2.1 Các bài toán cải thiện ảnh sử dụng toán tử điểm..............................................21
2.1.1 Tăng giảm độ sáng....................................................................................21
Nguyễn Chí Hướng 1 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
2.1.2 Tăng độ tương phản...................................................................................22
2.1.3 Biến đổi âm bản ........................................................................................24


2.1.4 Biến đổi ảnh đen trắng...............................................................................24
2.1.5 Các bài toán với lược đồ xám(Histogram)................................................25
2.2 Một số bài toán về lọc nhiễu ảnh......................................................................27
2.2.1 Phép cuộn (Tính chập) và mẫu (nhân chập) .............................................28
2.2.2 Làm trơn nhiễu bằng lọc tuyến tính...........................................................29
2.2.3 Làm trơn nhiễu bằng lọc phi tuyến............................................................32
2.3 Bài toán về phát hiện biên ảnh..........................................................................34
2.3.1 Khái niệm, ý nghĩa của biên trong xử lý ảnh.............................................34
2.3.2 Các phương pháp phát hiện biên...............................................................35
CHƯƠNG 3
CHƯƠNG TRÌNH ỨNG DỤNG................................................................................43
3.1 Giới thiệu về chương trình................................................................................43
3.2 Các chức năng của chương trình.......................................................................44
3.2.1 Chức năng thao tác với file ảnh.................................................................44
3.2.2 Chức năng “Chỉnh sửa”.............................................................................45
3.2.3 Chức năng “Xử lý điểm ảnh”....................................................................46
3.2.4 Chức năng “Lọc ảnh”................................................................................49
3.2.5 Chức năng dò biên(Edge Detection)..........................................................50
3.2.6 Chức năng Zoom ảnh................................................................................51
3.3 Một số hàm và thủ tục chính trong chương trình..............................................51
3.3.1 Mở một file ảnh.........................................................................................51
3.3.2 In ảnh lên Form.........................................................................................51
3.3.3 Lưu File ảnh sau xử lý...............................................................................52
3.3.4 Hàm Undo ảnh...........................................................................................52
3.3.5 Hàm thực hiện Zoom ảnh..........................................................................52
3.3.6 Hàm khai báo mặt nạ nhân chập (mẫu).....................................................53
3.3.7 Hàm thực hiện nhân chập ma trận ............................................................53
3.3.8 Hàm thực hiện lọc trung vị .......................................................................55
3.3.9 Hàm phát hiện và làm nổi biên .................................................................57
3.3.10 Hàm resize – Thay đổi kích thước ảnh....................................................61

Nguyễn Chí Hướng 2 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
KẾT LUẬN................................................................................................................64
TÀI LIỆU THAM KHẢO..........................................................................................65
PHỤ LỤC...................................................................................................................66
Nguyễn Chí Hướng 3 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
DANH MỤC CÁC HÌNH VẼ
Hình 1-1 Quá trình xử lý ảnh........................................................................................9
Hình 1-2 Các giai đoạn chính trong xử lý ảnh..............................................................9
Hình 1-3 Ví dụ về ảnh đen trắng.................................................................................11
Hình 1-4 Ví dụ ảnh xám..............................................................................................12
Hình 1-5 Ví dụ về ảnh màu ........................................................................................13
Hình 1-6 Lân cận của 1 điểm ảnh...............................................................................13
Hình 1-7 Lược đồ xám của ảnh đậm...........................................................................15
Hình 1-8 Lược đồ xám ảnh sáng.................................................................................15
Hình 1-9 Minh họa ảnh biểu diễn bằng mã loạt dài....................................................16
Hình 1-10 Minh họa biểu diễn bằng mã xích..............................................................17
Hình 2-11 Ảnh sau khi tăng độ sáng (c =100)............................................................22
Hình 2-12 Biểu đồ dãn độ tương phản........................................................................23
Hình 2-13 Ảnh gốc và ảnh kết quả sau khi tăng tương phản......................................23
Hình 2-14 Ảnh gốc và ảnh sau khi biến đổi âm bản ..................................................24
Hình 2-15 Ảnh gốc sau khi được tách ngưỡng...........................................................25
Hình 2-16 Minh họa về Histogram của ảnh................................................................26
Hình 2-17 Minh họa về cân bằng lược đồ xám...........................................................27
Hình 2-18 Tâm mặt nạ và các điểm lân cận................................................................29
Hình 2-19 Minh họa lọc trung bình không gian..........................................................30
Hình 2-20 Minh họa lọc thông thấp............................................................................31
Hình 2-21 Minh họa lọc thông cao..............................................................................32
Hình 2-22 Minh họa lọc ảnh trung vị..........................................................................33

Hình 2-23 Các dạng đường biên trong xử lý ảnh........................................................34
Hình 2-24 Minh họa dò biên sử dụng toán tử Sobel...................................................37
Hình 2-25 Minh họa dò biên sử dụng toán tử Prewitt.................................................37
Hình 2-26 Minh họa dò biên sử dụng toán tử La bàn..................................................39
Hình 2-27 Minh họa dò biên theo kỹ thuật Lalace – H2.............................................40
Nguyễn Chí Hướng 4 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Hình 2-28 Minh họa dò biên theo PP gián tiếp...........................................................42
Hình 3-29 Giao diện chính của chương trình..............................................................43
Hình 3-30 Các chức năng con thao tác với File ảnh...................................................44
Hình 3-31 Form load ảnh............................................................................................44
Hình 3-32 Form lưu ảnh sau xử lý..............................................................................45
Hình 3-33 Các chức năng con trong chỉnh sửa ảnh.....................................................45
Hình 3-34 Form resize kích thước cho ảnh.................................................................46
Hình 3-35 Chức năng “Xử lý điểm ảnh”.....................................................................46
Hình 3-36 Form thay đổi độ tương phản.....................................................................47
Hình 3-37 Form thay đổi độ sáng................................................................................47
Hình 3-38 Form phân ngưỡng tạo ảnh đen trắng........................................................48
Hình 3-39 Form thay đổi màu sắc...............................................................................48
Hình 3-40 Chức năng Lọc ảnh....................................................................................49
Hình 3-41 Chức năng dò và làm nổi biên ảnh.............................................................50
Hình 3-42 Form nhập ngưỡng khoảng cách màu .......................................................50
Hình 3-43 Chức năng Zoom ảnh.................................................................................51
DANH MỤC CÁC BẢNG BIỂU
Bảng 1-1 Cấu trúc một tệp ảnh....................................................................................20
Nguyễn Chí Hướng 5 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
THÔNG TIN KẾT QUẢ NGHIÊN CỨU
1. Thông tin chung
Tên đề tài: Lập trình một số bài toán cơ bản trong xử lý ảnh số

Sinh viên thực hiện: Nguyễn Chí Hướng
Lớp: Tin Học Trắc Địa K50
Hệ đào tạo: Chính quy
Điện thoại: 01685.688.585
Email:
Thời gian thực hiện: 2010
2. Mục tiêu
Nghiên cứu tổng quan về lý thuyết xử lý ảnh số (các thành phần của hệ thống
xử lý ảnh, các khái niệm và vấn đề liên quan, bộ lọc ảnh, biên ảnh…).
Xây dựng giải thuật một số bài toán cơ bản trong xử lý ảnh số.
Xây dựng chương trình thực nghiệm.
3. Nội dung chính
Chương 1: Giới thiệu chung về xử lý ảnh.
Chương 2: Một số bài toán về xử lý ảnh số (Giới thiệu + Thuật toán).
Chương 3: Xây dựng chương trình thực nghiệm.
4. Kết quả chính đạt được
Có được nền tảng kiến thức về xử lý ảnh số. Từ đó vận dụng nó để xây dựng
được thuật toán cho một số bài toán cơ bản trong xử lý ảnh số bằng ngôn ngữ C#.
Xây dựng được chương trình thực nghiệm cho một số bài toán xử lý ảnh số.
Nguyễn Chí Hướng 6 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
MỞ ĐẦU
1. Tổng quan tình hình nghiên cứu thuộc lĩnh vực của đề tài
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành
khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó
rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính
chuyên dụng riêng cho nó.
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lượng
ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh
báo được truyền qua cáp từ Luân Đôn đến New York từ những năm 1920. Vấn đề

nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh.
Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm 1955. Điều này
có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều
kiện cho quá trình xử lý ảnh số thuận lợi. Năm 1964, máy tính đã có khả năng xử lý
và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm
nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất
lượng, nhận dạng ảnh phát triển không ngừng. Các phương pháp tri thức nhân tạo
như mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén
ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan.
Ở Việt Nam xử lý ảnh được đưa vào giảng dạy ở bậc đại học khoảng chục năm
nay. Việc nghiên cứu, xây dựng và phát triển các ứng dụng về lĩnh vực xử lý ảnh là
một vấn đề mới và đang ngày càng được quân tâm nhiều hơn. Đã có một số ứng dụng
được xây dựng để xử lý ảnh trong viễn thám, trong y học hay trong an ninh và giám
sát …v.v.
2. Tính cấp thiết, ý nghĩa khoa học và thực tiễn của đề tài
Trong những năm gần đây, phần cứng máy tính và các thiết bị liên quan đã có
sự tiến bộ vượt bậc về tốc độ tính toán, dung lượng chứa, khả năng xử lý v.v.. và giá
cả đã giảm đến mức máy tính và các thiết bị liên quan đến xử lý ảnh đã không còn là
thiết bị chuyên dụng nữa. Khái niệm ảnh số đã trở nên thông dụng với hầu hết mọi
người trong xã hội và việc thu nhận ảnh số bằng các thiết bị cá nhân hay chuyên dụng
cùng với việc đưa vào máy tính xử lý đã trở nên đơn giản.
Nguyễn Chí Hướng 7 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Trong hoàn cảnh đó, xử lý ảnh là một lĩnh vực đang được quan tâm và đã trở
thành môn học chuyên ngành của sinh viên ngành công nghệ thông tin trong nhiều
trường đại học trên cả nước. Tuy nhiên tài liệu, giáo trình phần lớn tập trung vào lý
thuyết, các bài toán cơ bản trong xử lý ảnh số thường được thể hiện dưới dạng công
thức toán học, không thể hiện dưới dạng công thức thực dụng để có thể lập trình
được.
Vì thế, việc xây dựng thuật toán và lập trình một số bài toán cơ bản trong xử lý

ảnh số là rất cần thiết, giúp cho việc nghiên cứu, tìm hiểu về lý thuyết xử lý ảnh số
được trực quan, sinh động hơn và dễ tiếp thu hơn.
Nguyễn Chí Hướng 8 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
CHƯƠNG 1
GIỚI THIỆU CHUNG VỀ XỬ LÝ ẢNH
1.1 Tổng quan về hệ thống xử lý ảnh
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho
ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh
“tốt hơn” hoặc một kết luận.
Hình 1-1 Quá trình xử lý ảnh
Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay một hệ
thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta xem xét các bước
cần thiết trong xử lý ảnh.
Hình 1-2 Các giai đoạn chính trong xử lý ảnh
Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera. Thường
ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu CCIR), nhưng
cũng có thể là tín hiệu số hóa (loại CCD – Charge Coupled Device).
Nguyễn Chí Hướng 9 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Ngoài ra, ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor) hay
ảnh, tranh được quét trên scanner.
Tiếp theo là quá trình số hóa (digitalizer) để biến đổi tín hiệu tương tự sang tín
hiệu rời rạc(lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử
lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước hết là
công việc tăng cường ảnh. Do những nguyên nhân khác nhau: có thể do chất lượng
thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu mà ảnh có thể bị suy biến. Do vậy
cần phải tăng cường và khôi phục ảnh để làm nổi bật một số đặc tính của ảnh,hay làm
cho ảnh gần giống với trạng thái gốc – trạng thái trước khi ảnh bị biến dạng. Giai

đoạn tiếp theo là phát hiện các đặc tính như: biên, phân vùng ảnh, trích chọn các đặc
tính, v.v…
Cuối cùng, tùy theo mục đích của ứng dụng mà sẽ là giai đoạn nhận dạng, phân
lớp hay các quyết định khác.
1.2 Những vấn đề cơ bản trong xử lý ảnh
1.2.1 Những khái niệm liên quan
a) Điểm ảnh (pixel element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý
bằng máy tính (số), ảnh cần phải được số hoá. Số hoá ảnh là sự biến đổi gần đúng
một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ
sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt
người không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là
điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều,
mỗi pixel ứng với cặp tọa độ (x, y).
b) Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một
ảnh số được hiển thị.
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt
người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo
nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y
trong không gian hai chiều.
Nguyễn Chí Hướng 10 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là
một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh
(320*200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA
17” độ phân giải 320*200. Lý do: cùng một mật độ (độ phân giải) nhưng diện tích
màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn.
c) Mức xám của ảnh (Gray level)
Là kết quả của sự biến đổi tương ứng một giá trị độ sáng của một điểm ảnh với

một giá trị nguyên dương. Thông thường nó xác định trong khoảng [0...255]. Tùy
thuộc vào giá trị xám mà mỗi điểm ảnh được biểu diễn trên 1, 4, 8, 24 hay 32 bit.
d) Ảnh số
Là tập hợp hữu hạn các điểm ảnh, thường được biểu diễn bằng một mảng hai
chiều I(m,n) với m là số hàng, n là số cột. Ta ký hiệu P(x,y) là một điểm ảnh tại vị trí
(x, y). Số lượng điểm ảnh trên mỗi hàng hoặc các hàng xác định độ phân giải của
ảnh. Ảnh số được chia làm 3 loại:
• Ảnh nhị phân
Giá trị xám của tất các các điểm ảnh chỉ nhận giá trị 1 hoặc 0. Như vậy mỗi
điểm ảnh trong ảnh nhị phân được biểu diễn bới 1 bit.
Hình 1-3 Ví dụ về ảnh đen trắng
• Ảnh xám
Nguyễn Chí Hướng 11 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Giá trị xám nằm trong khoảng 0…255. Như vậy mỗi điểm ảnh trong ảnh nhị
xám được biểu diễn bới 1 byte.
Hình 1-4 Ví dụ ảnh xám
• Ảnh màu
Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: đỏ (R), lục
(G), lơ (B) và thường thu nhận trên các dải băng tần khác nhau. Với ảnh màu, cách
biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của
ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red), lục (green) và lam (blue). Để
biểu diễn cho một điểm ảnh màu cần 24 bit. 24 bit này được chia thành ba khoảng 8
bit. Mỗi màu cũng phân thành L cấp màu khác nhau (thường L=256). Mỗi khoảng
này biểu diễn cho cường độ sáng của một trong các màu chính.
Mỗi pixel ảnh màu ký hiệu Px, được viết: (T: trong công thức dưới đây là ký
hiệu chuyển vị)
[ ]
T
x

bluegreenredP ,,
=
(1.1)
Nguyễn Chí Hướng 12 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Hình 1-5 Ví dụ về ảnh màu
e) Các mối quan hệ cơ bản giữa các điểm ảnh
• Lân cận của một điểm ảnh
Một điểm ảnh p tại tọa độ (x, y) có các lân cận theo chiều ngang và chiều dọc
là: (x+1, y), (x-1, y), (x,y+1), (x, y-1).
Tập hợp các điểm ảnh trên được gọi là lân cận 4 của p, ký hiệu N4(p). Mỗi
điểm ảnh có khoảng cách đơn vị đến (x, y), và nếu (x, y) nằm trên biên của ảnh thì
lân cận của nó có thể nằm ngoài ảnh
Các lân cận chéo của p có tọa độ: (x+1, y+1), (x+1, y-1), (x-1, y+1), (x-1, y-1)
Tập lân cận chéo được ký hiệu ND(p).
Tập lân cận chéo cùng với lân cận 4 tạo thành lân cận 8 của p, ký hiệu N8(p).
Hình 1-6 Lân cận của 1 điểm ảnh
Nguyễn Chí Hướng 13 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
• Liên kết giữa các điểm ảnh
Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của đối tượng
vật thể hoặc xác định vùng trong một ảnh. Một liên kết được đặc trưng bởi tính liền
kề giữa các điểm và mức xám của chúng.
Giả sử V là tập các giá trị mức xám. Một ảnh có các giá trị cường độ sáng từ
thang mức xám từ 32 đến 64 được mô tả như sau:
V={32, 33, … 63, 64}.
Có 3 loại liên kết:
+ Liên kết 4: Hai điểm ảnh p và q với các giá trị cường độ sáng V được nói là
liên kết 4 nếu q nằm trong tập N4(p).
+ Liên kết 8: Hai điểm ảnh p và q với các giá trị cường độ sáng V được gọi là

liên kết 8 nếu q nằm trong tập N8(p).
+ Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị cường độ
sáng V được nói là liên kết m nếu: q thuộc N4(p) hoặc q thuộc ND(p).
f) Lược đồ mức xám (Histogram)
Lược đồ mức xám của ảnh là một hàm cung cấp tuần suất xuất hiện của mỗi
mức xám trong ảnh. Lược đồ mức xám được biểu diễn trong hệ tọa độ Decac xOy,
trong đó Ox biểu diễn các mức xám của ảnh (256 mức trong trường hợp chúng ta
xét), Oy biểu diễn số điểm ảnh cho một mức xám (số điểm ảnh có cùng mức xám).
Lược đồ mức xám cung cấp rất nhiều thông tin về sự phân bố mức xám của
ảnh. Theo thuật ngữ của xử lý ảnh gọi là tính động của ảnh, tính động của ảnh cho
phép phân tích một khoảng nào đó phân bố phần lớn các mức xám của ảnh: ảnh rất
sáng hay rất đậm. Nếu ảnh sáng, lược đồ xám nằm bên phải (mức xám cao), còn ảnh
đậm thì lược đồ xám nằm bên trái (mức xám thấp).
Hình minh họa cho lược đồ xám:
Nguyễn Chí Hướng 14 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Hình 1-7 Lược đồ xám của ảnh đậm
Hình 1-8 Lược đồ xám ảnh sáng
1.2.2 Biểu diễn ảnh
Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp
theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ
nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ. Thông
thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các
đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh
(Boundary), vùng ảnh (Region). Một số phương pháp biểu diễn thường dùng:
• Biểu diễn bằng mã chạy (Run-Length Code)
• Biểu diễn bằng mã xích (Chaine -Code)
Nguyễn Chí Hướng 15 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
• Biểu diễn bằng mã tứ phân (Quad-Tree Code)

a) Biểu diễn bằng mã chạy
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân.
Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:
U(m,n) = 1 nếu (m,n) thuộc R
U(m,n) = 0 nếu (m,n) không thuộc R
(1.2)
Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n). Với cách biểu
diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1. Giả sử
chúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ độ (x, y) theo
các chiều và đặc tả chỉ đối với giá trị “1”. Khi đó dạng mô tả có thể là: (x, y)r; trong
đó (x, y) là toạ độ, r là số lượng các bit có giá trị “1” liên tục theo chiều ngang hoặc
dọc.
Hình 1-9 Minh họa ảnh biểu diễn bằng mã loạt dài.
b) Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh. Một đường bất kỳ
được chia thành các đoạn nhỏ. Nối các điểm chia, ta có các đoạn thẳng kế tiếp được
gán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các đoạn. Các hướng có
thể chọn 4, 8, 12, 24,… mỗi hướng được mã hoá theo số thập phân hoặc số nhị phân
thành mã của hướng.
Nguyễn Chí Hướng 16 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Hình 1-10 Minh họa biểu diễn bằng mã xích
Theo Hình 1 -10 ta thấy được hướng các điểm biên và mã tương ứng là:
A11070110764545432
c) Biểu diễn bằng mã tứ phân
Theo phương pháp mã tứ phân, một vùng của ảnh coi như bao kín bời một hình
chữ nhật. Vùng này được chia làm 4 vùng con. Nếu vùng con gồm toàn điểm đen(1)
hay toàn điểm trắng (0) thì không cần chia tiếp. Trong trường hợp ngược lại, vùng
con gồm cả đen và trắng gọi là vùng xám lại tiếp tục được chia làm 4 vùng con tiếp.
Quá trình chia dừng lại khi không thể chia tiếp được nữa, có nghĩa là vùng con chỉ

chứa thuần nhất điểm đen hay trắng. Như vậy, cây biểu diễn gồm một chuỗi các kí
kiệu b(black), w(white) và g (grey) kèm theo ký hiệu mã hóa 4 vùng con. Biểu diễn
theo phương pháp này ưu việt hơn so với các phương pháp trên, nhất là so với mã
loạt dài. Tuy nhiên, để tính toán số đo các hình như chu vi, mo men là khá khó.
1.2.3 Tăng cường ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Tăng cường ảnh
nhằm hoàn thiện các đặc tính của ảnh như:
• Lọc nhiễu, hay làm trơn ảnh.
• Tăng độ tương phản, điều chỉnh mức xám của ảnh.
• Làm nổi biên ảnh.
Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên các kỹ
thuật trong miền điểm, không gian và tần số.
Nguyễn Chí Hướng 17 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
1.2.4 Phân vùng ảnh
Để phân tích các đối tượng trong ảnh, chúng ta cần phải phân biệt được các đối
tượng cần quan tâm với phần còn lại của ảnh. Những đối tượng này có thể tìm ra
được nhờ các kỹ thuật phân vùng ảnh.
Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh. Nói đến vùng ảnh là nói
đến tính chất bề mặt của ảnh. Nó là một tập hợp các điểm có cùng hoặc gần cùng một
tính chất nào đó : mức xám, màu sắc… Đường bao quanh một vùng ảnh (Boundary)
là biên ảnh. Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối
đồng đều hay tính kết cấu tương đồng.
Một phương pháp phân vùng ảnh là sử dụng một ngưỡng giá trị xám để phân
tách ảnh thành đối tượng và nền (những điểm dưới ngưỡng xám thuộc về nền, ngược
lại thuộc về đối tượng).
1.2.5 Trích chọn đặc tính
Dựa trên các thông tin thu nhận được qua quá trình phân vùng, kết hợp với các
kỹ thuật xử lý để đưa ra các đặc trưng, đối tượng ảnh cũng như các thông tin cần thiết
trong quá trình xử lý.

Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng
ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống.
1.2.6 Nhận dạng ảnh
Nhận dạng là quá trình phân loại các đối tượng được biểu diễn theo một mô
hình nào đó và gán chúng một tên (gán cho đối tượng một tên gọi, tức là một dạng)
dựa theo những quy luật và mẫu chuẩn.
Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai
loại nhận dạng ảnh cơ bản:
• Nhận dạng theo tham số.
• Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong
khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử),
nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt
người…
Nguyễn Chí Hướng 18 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Ngoài ra, hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng nơ ron
đang được áp dụng và cho kết quả khả quan.
1.2.7 Nén ảnh
Nhằm giảm thiểu không gian lưu trữ của ảnh, nén ảnh thường được tiến hành
theo cả hai khuynh hướng là nén có bảo toàn và không bảo toàn thông tin.
Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục
hồi thì kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén
ảnh:
• Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất xuất
hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích
hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
• Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm
ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh
trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX

• Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén
không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn. *.JPG chính là
tiếp cận theo kỹ thuật nén này.
• Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện
sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần
gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
1.3 Các định dạng ảnh cơ bản
Ảnh thu được sau quá trình số hóa thường được lưu lại cho các quá trình xử lý
tiếp theo hay truyền đi. Trong quá trình phát triển của kỹ thuật xử lý ảnh, tồn tại
nhiều định dạng ảnh khác nhau từ ảnh đen trắng (với định dạng IMG), ảnh đa cấp
xám cho đến ảnh màu: (BMP, GIF, JPE…). Tuy các định dạng này khác nhau, song
chúng đều tuân thủ theo một cấu trúc chung nhất. Nhìn chung, một tệp ảnh bất kỳ
thường bao gồm 3 phần:
• Mào đầu tệp (Header)
• Dữ liệu nén (Data Compression)
• Bảng màu (Palette Color)
Nguyễn Chí Hướng 19 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Bảng 1-1 Cấu trúc một tệp ảnh
Mào đầu tệp
Là phần chứa các thông tin về kiểu ảnh, kích thước, độ phân giải,
số bit dùng cho 1 pixel, cách mã hóa, vị trí bảng màu…
Dữ liệu nén
Số liệu ảnh được mã hóa bởi kiểu mã hóa chỉ ra trong phần Header.
Bảng màu
Bảng màu không nhất thiết phải có, ví dụ khi ảnh là đen trắng. Nếu
có, bảng màu cho biết số màu dùng trong ảnh và bảng màu được sử
dụng để hiện thị màu của ảnh.
1.3.1 Ảnh BMP (Bitmap)
Là ảnh được mô tả bởi một ma trận các giá trị số xác định màu và bảng màu của

các điểm ảnh tương ứng khi hiển thị. Ưu điểm của ảnh Bitmap là tốc độ vẽ và tốc độ
xử lý nhanh. Nhược điểm của nó là kích thước rất lớn.
1.3.2 Ảnh JPEG (Joint Photographic Experts Group)
Đây là một định dạng ảnh được hỗ trợ bởi nhiều trình duyệt web. Ảnh JPEG
được phát triển để nén dung lượng và lưu trữ ảnh chụp, và được sử dụng tốt nhất cho
đồ họa có nhiều màu sắc, ví dụ như là ảnh chụp được scan. File Ảnh JPEG là ảnh
Bitmap đã được nén lại.
1.3.3 Ảnh GIF (Graphics Interchange Format)
Ảnh GIF được phát triển dành cho những ảnh có tính chất thay đổi. Nó được sử
dụng tốt nhất cho đồ họa có ít màu, ví dụ như là ảnh hoạt hình hoặc là những bức vẽ
với nhiều đường thẳng. File ảnh GIF là những ảnh Bitmap được nén lại.
Có hai sự khác nhau cơ bản giữa ảnh GIF và ảnh JPEG:
+ Ảnh GIF nén lại theo cách giữ nguyên toàn bộ dữ liệu ảnh trong khi ảnh
JPEG nén lại nhưng làm mất một số dữ liệu trong ảnh.
+ Ảnh GIF bị giới hạn bởi số màu nhiều nhất là 256 trong khi ảnh JPEG không
giới hạn số màu mà chúng sử dụng.
1.3.4 Ảnh WMF (Windows Metafiles)
Là một tập hợp các lệnh GDI dùng để mô tả ảnh và nội dung ảnh. Có hai ưu
điểm khi sử dụng ảnh WMF: kích thước file WMF nhỏ và ít phụ thuộc vào thiết bị
hiển thị hơn so với ảnh Bitmap.
Nguyễn Chí Hướng 20 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
CHƯƠNG 2
MỘT SỐ BÀI TOÁN VỀ XỬ LÝ ẢNH
2.1 Các bài toán cải thiện ảnh sử dụng toán tử điểm
Xử lý điểm ảnh thực chất là biến đổi giá trị một điểm ảnh dựa vào giá trị của
chính nó mà không hề dựa vào các điểm ảnh khác. Có hai cách tiệm cận với phương
pháp này. Cách thứ nhất dùng một hàm biến đổi thích hợp với mục đích hoặc yêu cầu
đặt ra để biến đổi giá trị mức xám của điểm ảnh sang một giá trị mức xám khác. Cách
thứ hai là dùng lược đồ mức xám (Gray Histogram). Về mặt toán học, toán tử điểm là

một ánh xạ từ giá trị cường độ ánh sáng u(m, n) tại toạ độ (m, n) sang giá tri cường
độ ánh sáng khác v(m, n) thông qua hàm f, tức là:
)),((),( nmufnmv
=
(2.3)
Nói một cách khác, toán tử điểm là toán tử không bộ nhớ, ở đó một mức xám
[ ]
Nu ,0

được ánh xạ sang một mức xám
[ ]
Nv ,0

: v = f (u). Ứng dụng chính của các
toán tử điểm là biến đổi độ tương phản của ảnh. Ánh xạ f khác nhau tùy theo các ứng
dụng. Các dạng toán tử điểm được giới thiệu cụ thể như sau:
2.1.1 Tăng giảm độ sáng
Giả sử ta có ảnh đầu vào I ~ kích thước (m x n) và số nguyên c
Khi đó, kỹ thuật tăng, giảm độ sáng được thể hiện qua thuật toán:
B1: Với mỗi điểm ảnh, thực hiện phép cộng mức xám của nó với giá trị c
for (int i = 0; i < m; i + +)
for (int j = 0; j < n; j + +)
I [i, j] = I [i, j] + c;
B2: Gán giá trị độ xám mới cho điểm ảnh đầu ra.
Nếu c > 0: ảnh sáng lên.
Nếu c < 0: ảnh tối đi.
Để minh họa cho bài toán này ta xem xét một ví dụ về sự thay đổi của ảnh gốc
sau khi ta cho tăng độ sáng của nó là c =100.
Nguyễn Chí Hướng 21 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa

Ảnh gốc Ảnh sau khi tăng mức sáng c = +100
Hình 2-11 Ảnh sau khi tăng độ sáng (c =100)
2.1.2 Tăng độ tương phản
Trước tiên cần làm rõ khái niệm độ tương phản. Ảnh số là tập hợp các điểm,
mỗi điểm có giá trị độ sáng khác nhau. Ở đây, độ sáng để mắt người dễ cảm nhận
ảnh song không phải là quyết định. Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng
nhưng đặt trên hai nền khác nhau sẽ cho cảm nhận sáng khác nhau. Như vậy, độ
tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền. Nói một cách
khác, độ tương phản là độ nổi của điểm ảnh hay vùng ảnh so với nền. Như vậy, nếu
ảnh có độ tương phản kém, ta có thể thay đổi tùy ý theo ý muốn theo hàm sau:





<≤+−
<≤+−
<≤
=
LubVbu
buaVau
auu
uf
b
a
)(
)()(
γ
β
αα

(2.4)
Các độ dốc α, β, γ xác định độ tương phản tương đối. L là số mức xám cực đại.
Ta có:
α = β = γ =1 ảnh kết quả trùng với ảnh gốc.
α, β, γ > 1 dãn độ tương phản.
α, β, γ < 1 co độ tương phản.
Nguyễn Chí Hướng 22 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Hình 2-12 Biểu đồ dãn độ tương phản
Thuật toán:
B1: Nhập vào các cận a, b, Va và Vb.
B2: Tính giá trị các đại lượng
γβα
,,
.
B3: For(Với mỗi điểm ảnh)
Nếu giá trị xám I của nó < a: I(x,y)= I(xy)*
α
Nếu giá trị xám I của nó a < I < b thì:
VaaII
+−=
β
*)(

Nếu giá trị xám I của điểm ảnh I > b thì:
VbbII
+−=
γ
*)(
B4: Gán giá trị xám mới trở lại cho điểm ảnh.

Hình minh họa:
Ảnh gốc Ảnh sau khi tăng tương phản
Hình 2-13 Ảnh gốc và ảnh kết quả sau khi tăng tương phản
Nguyễn Chí Hướng 23 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
2.1.3 Biến đổi âm bản
Âm bản nhận được bằng phép biến đổi âm. Phép biến đổi này có rất nhiều hữu
ích cho các phim ảnh dùng trong y học.
uLuf
−=
)(
(2.5)
Giả sử ta có ảnh I ~ kích thước (m x n). Khi đó: Kỹ thuật biến đổi âm bản được
thể hiện qua thuật toán sau:
B1: Với mỗi điểm ảnh, thực hiện phép toán thay đổi mức xám của nó
for (int i = 0; i < m; i + +)
for (int j = 0; j < n; j + +)
I[i,j] = 255 – I[i,j];
B2: Gán giá trị mức xám mới cho ảnh đầu ra
Hình minh họa:
Ảnh gốc Ảnh được biến đổi âm bản
Hình 2-14 Ảnh gốc và ảnh sau khi biến đổi âm bản
2.1.4 Biến đổi ảnh đen trắng
Để chuyển đổi một ảnh màu sang ảnh đen trắng ta dùng kĩ thuật tách ngưỡng.
Giả sử ta có ảnh I ~ kích thước (m x n), hai số Min, Max và ngưỡng θ. Khi đó: Kỹ
thuật tách ngưỡng được thể hiện qua thuật toán sau:
B1: Thực hiện vòng lặp,thay đổi giá trị độ xám của từng điểm ảnh
for (i = 0; i < m; i + +)
for (j = 0; j < n; j + +)
I [i, j] = I [i, j] > = θ? Max: Min (Ở trường hợp này Max =1, Min = 0)

B2: Gán các giá trị độ xám mới cho ảnh đầu ra.
Hình minh họa:
Nguyễn Chí Hướng 24 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Ảnh gốc Ảnh đen trắng
Hình 2-15 Ảnh gốc sau khi được tách ngưỡng
Kỹ thuật chuyển ảnh thành ảnh đen trắng được ứng dụng khi quét và nhận dạng
văn bản có thể xảy ra sai sót “nền thành ảnh” hoặc “ảnh thành nền” dẫn đến ảnh bị
đứt nét hoặc dính.
2.1.5 Các bài toán với lược đồ xám(Histogram)
a) Hiển thị lược đồ xám của ảnh
Theo định nghĩa của lược đồ xám, thì việc xây dựng nó là khá đơn giản. Thuật
toán xây dựng lược đồ xám có thể miêu tả như sau:
Bắt đầu
H là bảng chức lược đồ xám (là véc tơ có N phần tử)
B1:. Khởi tạo bảng và đặt tất cả các phần tử của bảng là 0.
B2: Tạo bảng
Với mỗi điểm ảnh I(x,y) tính H[I(x,y)] = H[I(x,y)] + 1
B3: Tính giá trị Max của bảng H. Sau đó hiện bảng trong khoảng từ 0
đến Max.
Kết thúc
Hình minh họa:
Nguyễn Chí Hướng 25 Lớp Tin học trắc địa K50

×