Tải bản đầy đủ (.docx) (81 trang)

Một số bài toán xử lý ảnh bằng c sharp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.39 MB, 81 trang )

Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
‘pơMỤC LỤC
‘pơMỤC
LỤC
.1
DANH MỤC CÁC HÌNH
VẼ 4
DANH MỤC CÁC BẢNG
BIỂU 5
THÔNG TIN KẾT QUẢ NGHIÊN
CỨU 6
MỞ
ĐẦU
7
CHƯƠNG 1
GIỚI THIỆU CHUNG VỀ XỬ LÝ
ẢNH 9
1.1 Tổng quan về hệ thống xử lý
ảnh 9
1.2 Những vấn đề cơ bản trong xử lý
ảnh 10
1.2.1 Những khái niệM liên
quan 10
1.2.2 Biểu diễn
ảnh 15
1.2.3 Tăng cường
ảnh 17
1.2.4 Phân vùng
ảnh 18
1.2.5 Trích chọn đặc
tính 18


1.2.6 Nhận dạng
ảnh 18
1.2.7 Nén
ảnh 1
9
1.3 Các định dạng ảnh cơ
bản 19
1.3.1 Ảnh BMP
(BitMap) 20
1.3.2 Ảnh JPEG (Joint Photographic Experts
Group) 20
1.3.3 Ảnh GIF (Graphics Interchange
ForMat) 20
1.3.4 Ảnh WMF (Windows
Metafiles) 20
CHƯƠNG 2
MỘT SỐ BÀI TOÁN VỀ XỬ LÝ
ẢNH 21
2.1 Các bài toán cải thiện ảnh sử dụng toán tử
điểM 21
2.1.1 Tăng giảM độ
sáng 21
Nguyễn Chí Hướng
1 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
2.1.2 Tăng độ tương phản 22
2.1.3 Biến đổi âM bản 24
2.1.4 Biến đổi ảnh đen trắng 24
2.1.5 Các bài toán với lược đồ xáM(HistograM) 25
2.2 Một số bài toán về lọc nhiễu ảnh 27

2.2.1 Phép cuộn (Tính chập) và Mẫu (nhân chập) 28
2.2.2 LàM trơn nhiễu bằng lọc tuyến tính 29
2.2.3 LàM trơn nhiễu bằng lọc phi tuyến 32
2.3 Bài toán về phát hiện biên ảnh 34
2.3.1 Khái niệM, ý nghĩa của biên trong xử lý ảnh 34
2.3.2 Các phương pháp phát hiện biên 35
CHƯƠNG 3
CHƯƠNG TRÌNH ỨNG DỤNG 43
3.1 Giới thiệu về chương trình 43
3.2 Các chức năng của chương trình 44
3.2.1 Chức năng thao tác với file ảnh 44
3.2.2 Chức năng “Chỉnh sửa” 45
3.2.3 Chức năng “Xử lý điểM ảnh” 46
3.2.4 Chức năng “Lọc ảnh” 49
3.2.5 Chức năng dò biên(Edge Detection) 50
3.2.6 Chức năng ZooM ảnh 51
3.3 Một số hàM và thủ tục chính trong chương trình 51
3.3.1 Mở Một file ảnh 51
3.3.2 In ảnh lên ForM 51
3.3.3 Lưu File ảnh sau xử lý 52
3.3.4 HàM Undo ảnh 52
3.3.5 HàM thực hiện ZooM ảnh 52
3.3.6 HàM khai báo Mặt nạ nhân chập (Mẫu) 53
3.3.7 HàM thực hiện nhân chập Ma trận 53
3.3.8 HàM thực hiện lọc trung vị 55
3.3.9 HàM phát hiện và làM nổi biên 57
3.3.10 HàM resize – Thay đổi kích thước ảnh 62
Nguyễn Chí Hướng
2 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa

KẾT LUẬN 65
TÀI LIỆU THAM KHẢO 66
PHỤ LỤC 67
Nguyễn Chí Hướng
3 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
DANH MỤC CÁC HÌNH VẼ
Hình 1-1 Quá trình xử lý ảnh 9
Hình 1-2 Các giai đoạn chính trong xử lý ảnh 9
Hình 1-3 Ví dụ về ảnh đen trắng 11
Hình 1-4 Ví dụ ảnh xáM 12
Hình 1-5 Ví dụ về ảnh Màu 13
Hình 1-6 Lân cận của 1 điểM ảnh 13
Hình 1-7 Lược đồ xáM của ảnh đậM 15
Hình 1-8 Lược đồ xáM ảnh sáng 15
Hình 1-9 Minh họa ảnh biểu diễn bằng Mã loạt dài 16
Hình 1-10 Minh họa biểu diễn bằng Mã xích 17
Hình 2-11 Ảnh sau khi tăng độ sáng (c =100) 22
Hình 2-12 Biểu đồ dãn độ tương phản 23
Hình 2-13 Ảnh gốc và ảnh kết quả sau khi tăng tương phản 23
Hình 2-14 Ảnh gốc và ảnh sau khi biến đổi âM bản 24
Hình 2-15 Ảnh gốc sau khi được tách ngưỡng 25
Hình 2-16 Minh họa về HistograM của ảnh 26
Hình 2-17 Minh họa về cân bằng lược đồ xáM 27
Hình 2-18 TâM Mặt nạ và các điểM lân cận 29
Hình 2-19 Minh họa lọc trung bình không gian 30
Hình 2-20 Minh họa lọc thông thấp 31
Hình 2-21 Minh họa lọc thông cao 32
Hình 2-22 Minh họa lọc ảnh trung vị 33
Hình 2-23 Các dạng đường biên trong xử lý ảnh 34

Hình 2-24 Minh họa dò biên sử dụng toán tử Sobel 37
Hình 2-25 Minh họa dò biên sử dụng toán tử Prewitt 38
Hình 2-26 Minh họa dò biên sử dụng toán tử La bàn 39
Hình 2-27 Minh họa dò biên theo kỹ thuật Lalace – H2 41
Nguyễn Chí Hướng
4 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Hình 2-28 Minh họa dò biên theo PP gián tiếp 42
Hình 3-29 Giao diện chính của chương trình 43
Hình 3-30 Các chức năng con thao tác với File ảnh 44
Hình 3-31 ForM load ảnh 44
Hình 3-32 ForM lưu ảnh sau xử lý 45
Hình 3-33 Các chức năng con trong chỉnh sửa ảnh 45
Hình 3-34 ForM resize kích thước cho ảnh 46
Hình 3-35 Chức năng “Xử lý điểM ảnh” 46
Hình 3-36 ForM thay đổi độ tương phản 47
Hình 3-37 ForM thay đổi độ sáng 47
Hình 3-38 ForM phân ngưỡng tạo ảnh đen trắng 48
Hình 3-39 ForM thay đổi Màu sắc 48
Hình 3-40 Chức năng Lọc ảnh 49
Hình 3-41 Chức năng dò và làM nổi biên ảnh 50
Hình 3-42 ForM nhập ngưỡng khoảng cách Màu 50
Hình 3-43 Chức năng ZooM ảnh 51
DANH MỤC CÁC BẢNG BIỂU
Bảng 1-1 Cấu trúc Một tệp ảnh 20
Nguyễn Chí Hướng
5 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
THÔNG TIN KẾT QUẢ NGHIÊN CỨU
1. Thông tin chung

Tên đề tài:
Lập trình một số bài toán cơ bản trong xử lý ảnh số
Sinh viên thực hiện: Nguyễn Chí Hướng
Lớp: Tin Học Trắc Địa K50
Hệ đào tạo: Chính quy
Điện thoại: 01685.688.585
EMail:
Thời gian thực hiện: 2010
2. Mục tiêu
Nghiên cứu tổng quan về lý thuyết xử lý ảnh số (các thành phần của hệ thống
xử lý ảnh, các khái niệM và vấn đề liên quan, bộ lọc ảnh, biên ảnh…).
Xây dựng giải thuật Một số bài toán cơ bản trong xử lý ảnh số.
Xây dựng chương trình thực nghiệM.
3. Nội dung chính
Chương 1: Giới thiệu chung về xử lý ảnh.
Chương 2: Một số bài toán về xử lý ảnh số (Giới thiệu + Thuật toán).
Chương 3: Xây dựng chương trình thực nghiệM.
4. Kết quả chính đạt được
Có được nền tảng kiến thức về xử lý ảnh số. Từ đó vận dụng nó để xây dựng
được thuật toán cho Một số bài toán cơ bản trong xử lý ảnh số bằng ngôn ngữ C#.
Xây dựng được chương trình thực nghiệM cho Một số bài toán xử lý ảnh số.
Nguyễn Chí Hướng
6 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
MỞ ĐẦU
1. Tổng quan tình hình nghiên cứu thuộc lĩnh vực của đề tài
Xử lý ảnh là Một lĩnh vực Mang tính khoa học và công nghệ. Nó là Một ngành
khoa học Mới Mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó
rất nhanh, kích thích các trung tâM nghiên cứu, ứng dụng, đặc biệt là Máy tính
chuyên dụng riêng cho nó.

Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất
lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao chất
lượng ảnh báo được truyền qua cáp từ Luân Đôn đến New York từ những năM
1920. Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố Mức sáng và độ
phân giải của ảnh. Việc nâng cao chất lượng ảnh được phát triển vào khoảng những
năM 1955. Điều này có thể giải thích được vì sau thế chiến thứ hai, Máy tính phát
triển nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận lợi. NăM 1964, Máy tính
đã có khả năng xử lý và nâng cao chất lượng ảnh từ Mặt trăng và vệ tinh Ranger 7
của Mỹ bao gồM: làM nổi đường biên, lưu ảnh. Từ năM 1964 đến nay, các phương
tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng. Các phương
pháp tri thức nhân tạo như Mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và
cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả
khả quan.
Ở Việt NaM xử lý ảnh được đưa vào giảng dạy ở bậc đại học khoảng chục
năM nay. Việc nghiên cứu, xây dựng và phát triển các ứng dụng về lĩnh vực xử lý
ảnh là Một vấn đề Mới và đang ngày càng được quân tâM nhiều hơn. Đã có Một số
ứng dụng được xây dựng để xử lý ảnh trong viễn tháM, trong y học hay trong an
ninh và giáM sát …v.v.
2. Tính cấp thiết, ý nghĩa khoa học và thực tiễn của đề tài
Trong những năM gần đây, phần cứng Máy tính và các thiết bị liên quan đã có
sự tiến bộ vượt bậc về tốc độ tính toán, dung lượng chứa, khả năng xử lý v.v và giá
cả đã giảM đến Mức Máy tính và các thiết bị liên quan đến xử lý ảnh đã không còn
là thiết bị chuyên dụng nữa. Khái niệM ảnh số đã trở nên thông dụng với hầu hết
Mọi người trong xã hội và việc thu nhận ảnh số bằng các thiết bị cá nhân hay
chuyên dụng cùng với việc đưa vào Máy tính xử lý đã trở nên đơn giản.
Nguyễn Chí Hướng
7 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Trong hoàn cảnh đó, xử lý ảnh là Một lĩnh vực đang được quan tâM và đã trở
thành Môn học chuyên ngành của sinh viên ngành công nghệ thông tin trong nhiều

trường đại học trên cả nước. Tuy nhiên tài liệu, giáo trình phần lớn tập trung vào lý
thuyết, các bài toán cơ bản trong xử lý ảnh số thường được thể hiện dưới dạng công
thức toán học, không thể hiện dưới dạng công thức thực dụng để có thể lập trình
được.
Vì thế, việc xây dựng thuật toán và lập trình Một số bài toán cơ bản trong xử
lý ảnh số là rất cần thiết, giúp cho việc nghiên cứu, tìM hiểu về lý thuyết xử lý ảnh
số được trực quan, sinh động hơn và dễ tiếp thu hơn.
Nguyễn Chí Hướng
8 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
CHƯƠNG 1
GIỚI THIỆU CHUNG VỀ XỬ LÝ ẢNH
1.1 Tổng quan về hệ thống xử lý ảnh
Quá trình xử lý ảnh được xeM như là quá trình thao tác ảnh đầu vào nhằM cho
ra kết quả Mong Muốn. Kết quả đầu ra của Một quá trình xử lý ảnh có thể là Một ảnh
“tốt hơn” hoặc Một kết luận.
Hình 1-1 Quá trình xử lý ảnh
Để có thể hình dung cấu hình Một hệ thống xử lý ảnh chuyên dụng hay Một hệ
thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta xeM xét các
bước cần thiết trong xử lý ảnh.
Hình 1-2 Các giai đoạn chính trong xử lý ảnh
Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua caMera.
Thường ảnh thu nhận qua caMera là tín hiệu tương tự (loại caMera ống kiểu CCIR),
nhưng cũng có thể là tín hiệu số hóa (loại CCD – Charge Coupled Device).
Nguyễn Chí Hướng
9 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Ngoài ra, ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảM ứng (sensor)
hay ảnh, tranh được quét trên scanner.
Tiếp theo là quá trình số hóa (digitalizer) để biến đổi tín hiệu tương tự sang tín

hiệu rời rạc(lấy Mẫu) và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử
lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồM nhiều công đoạn nhỏ. Trước hết
là công việc tăng cường ảnh. Do những nguyên nhân khác nhau: có thể do chất
lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu Mà ảnh có thể bị suy biến.
Do vậy cần phải tăng cường và khôi phục ảnh để làM nổi bật Một số đặc tính của
ảnh,hay làM cho ảnh gần giống với trạng thái gốc – trạng thái trước khi ảnh bị biến
dạng. Giai đoạn tiếp theo là phát hiện các đặc tính như: biên, phân vùng ảnh, trích
chọn các đặc tính, v.v…
Cuối cùng, tùy theo Mục đích của ứng dụng Mà sẽ là giai đoạn nhận dạng,
phân lớp hay các quyết định khác.
1.2 Những vấn đề cơ bản trong xử lý ảnh
1.2.1 Những khái niệm liên quan
a) Điểm ảnh (pixel element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý
bằng Máy tính (số), ảnh cần phải được số hoá. Số hoá ảnh là sự biến đổi gần đúng
Một ảnh liên tục thành Một tập điểM phù hợp với ảnh thật về vị trí (không gian) và
độ sáng (Mức xáM). Khoảng cách giữa các điểM ảnh đó được thiết lập sao cho Mắt
người không phân biệt được ranh giới giữa chúng. Mỗi Một điểM như vậy gọi là
điểM ảnh (PEL: Picture EleMent) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai
chiều, Mỗi pixel ứng với cặp tọa độ (x, y).
b) Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là Mật độ điểM ảnh được ấn định trên Một
ảnh số được hiển thị.
Theo định nghĩa, khoảng cách giữa các điểM ảnh phải được chọn sao cho Mắt
người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo
nên Một Mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y
trong không gian hai chiều.
Nguyễn Chí Hướng
10 Lớp Tin học trắc địa K50

Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Ví dụ: Độ phân giải của ảnh trên Màn hình CGA (Color Graphic Adaptor) là
Một lưới điểM theo chiều ngang Màn hình: 320 điểM chiều dọc * 200 điểM ảnh
(320*200). Rõ ràng, cùng Màn hình CGA 12” ta nhận thấy Mịn hơn Màn hình CGA
17” độ phân giải 320*200. Lý do: cùng Một Mật độ (độ phân giải) nhưng diện tích
Màn hình rộng hơn thì độ Mịn (liên tục của các điểM) kéM hơn.
c) Mức xám của ảnh (Gray level)
Là kết quả của sự biến đổi tương ứng Một giá trị độ sáng của Một điểM ảnh
với Một giá trị nguyên dương. Thông thường nó xác định trong khoảng [0 255].
Tùy thuộc vào giá trị xáM Mà Mỗi điểM ảnh được biểu diễn trên 1, 4, 8, 24 hay 32
bit.
d) Ảnh số
Là tập hợp hữu hạn các điểM ảnh, thường được biểu diễn bằng Một Mảng hai
chiều I(M,n) với M là số hàng, n là số cột. Ta ký hiệu P(x,y) là Một điểM ảnh tại vị
trí (x, y). Số lượng điểM ảnh trên Mỗi hàng hoặc các hàng xác định độ phân giải của
ảnh. Ảnh số được chia làM 3 loại:
• Ảnh nhị phân
Giá trị xáM của tất các các điểM ảnh chỉ nhận giá trị 1 hoặc 0. Như vậy Mỗi
điểM ảnh trong ảnh nhị phân được biểu diễn bới 1 bit.
Hình 1-3 Ví dụ về ảnh đen trắng
Nguyễn Chí Hướng
11 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
• Ảnh xáM
Giá trị xáM nằM trong khoảng 0…255. Như vậy Mỗi điểM ảnh trong ảnh nhị
xáM được biểu diễn bới 1 byte.
Hình 1-4 Ví dụ ảnh xáM
• Ảnh Màu
Ảnh Màu theo lý thuyết của ThoMas là ảnh tổ hợp từ 3 Màu cơ bản: đỏ (R), lục
(G), lơ (B) và thường thu nhận trên các dải băng tần khác nhau. Với ảnh Màu, cách

biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại Mỗi phần tử
của Ma trận biểu diễn cho ba Màu riêng rẽ gồM: đỏ (red), lục (green) và laM (blue).
Để biểu diễn cho Một điểM ảnh Màu cần 24 bit. 24 bit này được chia thành ba
khoảng 8 bit. Mỗi Màu cũng phân thành L cấp Màu khác nhau (thường L=256). Mỗi
khoảng này biểu diễn cho cường độ sáng của Một trong các Màu chính.
Mỗi pixel ảnh Màu ký hiệu Px, được viết: (T: trong công thức dưới đây là ký
hiệu chuyển vị)
P
x
=
[
red , green, blue
]
Nguyễn Chí Hướng
T
12
(1.1)
Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Hình 1-5 Ví dụ về ảnh Màu
e) Các mối quan hệ cơ bản giữa các điểm ảnh
• Lân cận của Một điểM ảnh
Một điểM ảnh p tại tọa độ (x, y) có các lân cận theo chiều ngang và chiều dọc
là: (x+1, y), (x-1, y), (x,y+1), (x, y-1).
Tập hợp các điểM ảnh trên được gọi là lân cận 4 của p, ký hiệu N4(p). Mỗi
điểM ảnh có khoảng cách đơn vị đến (x, y), và nếu (x, y) nằM trên biên của ảnh thì
lân cận của nó có thể nằM ngoài ảnh
Các lân cận chéo của p có tọa độ: (x+1, y+1), (x+1, y-1), (x-1, y+1), (x-1, y-1)
Tập lân cận chéo được ký hiệu ND(p).
Tập lân cận chéo cùng với lân cận 4 tạo thành lân cận 8 của p, ký hiệu N8(p).

Hình 1-6 Lân cận của 1 điểM ảnh
Nguyễn Chí Hướng
13 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
• Liên kết giữa các điểM ảnh
Các Mối liên kết được sử dụng để xác định giới hạn ( Boundaries) của đối
tượng vật thể hoặc xác định vùng trong Một ảnh. Một liên kết được đặc trưng bởi
tính liền kề giữa các điểM và Mức xáM của chúng.
Giả sử V là tập các giá trị Mức xáM. Một ảnh có các giá trị cường độ sáng từ
thang Mức xáM từ 32 đến 64 được Mô tả như sau:
V={32, 33, … 63, 64}.
Có 3 loại liên kết:
+ Liên kết 4: Hai điểM ảnh p và q với các giá trị cường độ sáng V được nói là
liên kết 4 nếu q nằM trong tập N4(p).
+ Liên kết 8: Hai điểM ảnh p và q với các giá trị cường độ sáng V được gọi là
liên kết 8 nếu q nằM trong tập N8(p).
+ Liên kết m (liên kết hỗn hợp): Hai điểM ảnh p và q với các giá trị cường độ
sáng V được nói là liên kết m nếu: q thuộc N4(p) hoặc q thuộc ND(p).
f) Lược đồ mức xám (Histogram)
Lược đồ Mức xáM của ảnh là Một hàM cung cấp tuần suất xuất hiện của Mỗi
Mức xáM trong ảnh. Lược đồ Mức xáM được biểu diễn trong hệ tọa độ Decac xOy,
trong đó Ox biểu diễn các Mức xáM của ảnh (256 Mức trong trường hợp chúng ta
xét), Oy biểu diễn số điểM ảnh cho Một Mức xáM (số điểM ảnh có cùng Mức xáM).
Lược đồ Mức xáM cung cấp rất nhiều thông tin về sự phân bố Mức xáM của
ảnh. Theo thuật ngữ của xử lý ảnh gọi là tính động của ảnh, tính động của ảnh cho
phép phân tích Một khoảng nào đó phân bố phần lớn các Mức xáM của ảnh: ảnh rất
sáng hay rất đậM. Nếu ảnh sáng, lược đồ xáM nằM bên phải (Mức xáM cao), còn
ảnh đậM thì lược đồ xáM nằM bên trái (Mức xáM thấp).
Hình Minh họa cho lược đồ xáM:
Nguyễn Chí Hướng

14 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Hình 1-7 Lược đồ xáM của ảnh đậM
Hình 1-8 Lược đồ xáM ảnh sáng
1.2.2 Biểu diễn ảnh
Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp
theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ
nhớ cực lớn và không hiệu quả theo quan điểM ứng dụng và công nghệ. Thông
thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là Mã hoá) theo các
đặc điểM của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh
(Boundary
)
, vùng ảnh (Region
)
. Một số phương pháp biểu diễn thường dùng:
• Biểu diễn bằng Mã chạy (Run-Length Code)
• Biểu diễn bằng Mã xích (Chaine -Code)
Nguyễn Chí Hướng
15 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
• Biểu diễn bằng Mã tứ phân (Quad-Tree Code)
a) Biểu diễn bằng mã chạy
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị
phân. Một vùng ảnh R có thể Mã hoá đơn giản nhờ Một Ma trận nhị phân:
U(M,n) = 1 nếu (M,n) thuộc R
U(M,n) = 0 nếu (M,n) không thuộc R
(1.2)
Trong đó: U(m, n) là hàM Mô tả Mức xáM ảnh tại tọa độ (m, n). Với cách biểu
diễn trên, Một vùng ảnh được Mô tả bằng Một tập các chuỗi số 0 hoặc 1. Giả sử
chúng ta Mô tả ảnh nhị phân của Một vùng ảnh được thể hiện theo toạ độ (x, y) theo

các chiều và đặc tả chỉ đối với giá trị “1”. Khi đó dạng Mô tả có thể là: (x, y)r; trong
đó (x, y) là toạ độ, r là số lượng các bit có giá trị “1” liên tục theo chiều ngang hoặc
dọc.
Hình 1-9 Minh họa ảnh biểu diễn bằng Mã loạt dài.
b) Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh. Một đường bất
kỳ được chia thành các đoạn nhỏ. Nối các điểM chia, ta có các đoạn thẳng kế tiếp
được gán hướng cho đoạn thẳng đó tạo thành Một dây xích gồM các đoạn. Các
hướng có thể chọn 4, 8, 12, 24,… Mỗi hướng được Mã hoá theo số thập phân hoặc
số nhị phân thành Mã của hướng.
Nguyễn Chí Hướng
16 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Hình 1-10 Minh họa biểu diễn bằng Mã xích
Theo Hình 1 -10 ta thấy được hướng các điểM biên và Mã tương ứng là:
A11070110764545432
c) Biểu diễn bằng mã tứ phân
Theo phương pháp Mã tứ phân, Một vùng của ảnh coi như bao kín bời Một
hình chữ nhật. Vùng này được chia làM 4 vùng con. Nếu vùng con gồM toàn điểM
đen(1) hay toàn điểM trắng (0) thì không cần chia tiếp. Trong trường hợp ngược lại,
vùng con gồM cả đen và trắng gọi là vùng xáM lại tiếp tục được chia làM 4 vùng
con tiếp. Quá trình chia dừng lại khi không thể chia tiếp được nữa, có nghĩa là vùng
con chỉ chứa thuần nhất điểM đen hay trắng. Như vậy, cây biểu diễn gồM Một chuỗi
các kí kiệu b(black), w(white) và g (grey) kèM theo ký hiệu Mã hóa 4 vùng con.
Biểu diễn theo phương pháp này ưu việt hơn so với các phương pháp trên, nhất là
so với Mã loạt dài. Tuy nhiên, để tính toán số đo các hình như chu vi, Mo Men là
khá khó.
1.2.3 Tăng cường ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Tăng cường
ảnh nhằM hoàn thiện các đặc tính của ảnh như:

• Lọc nhiễu, hay làM trơn ảnh.
• Tăng độ tương phản, điều chỉnh Mức xáM của ảnh.
• LàM nổi biên ảnh.
Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên các kỹ
thuật trong Miền điểM, không gian và tần số.
Nguyễn Chí Hướng
17 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
1.2.4 Phân vùng ảnh
Để phân tích các đối tượng trong ảnh, chúng ta cần phải phân biệt được các
đối tượng cần quan tâM với phần còn lại của ảnh. Những đối tượng này có thể tìM
ra được nhờ các kỹ thuật phân vùng ảnh.
Vùng ảnh là Một chi tiết, Một thực thể trong toàn cảnh. Nói đến vùng ảnh là
nói đến tính chất bề Mặt của ảnh. Nó là Một tập hợp các điểM có cùng hoặc gần
cùng Một tính chất nào đó : Mức xáM, Màu sắc… Đường bao quanh Một vùng ảnh
(Boundary) là biên ảnh. Các điểM trong Một vùng ảnh có độ biến thiên giá trị Mức
xáM tương đối đồng đều hay tính kết cấu tương đồng.
Một phương pháp phân vùng ảnh là sử dụng Một ngưỡng giá trị xáM để phân
tách ảnh thành đối tượng và nền (những điểM dưới ngưỡng xáM thuộc về nền,
ngược lại thuộc về đối tượng).
1.2.5 Trích chọn đặc tính
Dựa trên các thông tin thu nhận được qua quá trình phân vùng, kết hợp với các
kỹ thuật xử lý để đưa ra các đặc trưng, đối tượng ảnh cũng như các thông tin cần
thiết trong quá trình xử lý.
Việc trích chọn hiệu quả các đặc điểM giúp cho việc nhận dạng các đối tượng
ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảM xuống.
1.2.6 Nhận dạng ảnh
Nhận dạng là quá trình phân loại các đối tượng được biểu diễn theo Một Mô
hình nào đó và gán chúng Một tên (gán cho đối tượng Một tên gọi, tức là Một dạng)
dựa theo những quy luật và Mẫu chuẩn.

Theo lý thuyết về nhận dạng, các Mô hình toán học về ảnh được phân theo hai
loại nhận dạng ảnh cơ bản:
• Nhận dạng theo thaM số.
• Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong
khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử),
nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng Mã vạch, nhận dạng Mặt
người…
Nguyễn Chí Hướng
18 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Ngoài ra, hiện nay Một kỹ thuật nhận dạng Mới dựa vào kỹ thuật Mạng nơ ron
đang được áp dụng và cho kết quả khả quan.
1.2.7 Nén ảnh
NhằM giảM thiểu không gian lưu trữ của ảnh, nén ảnh thường được tiến hành
theo cả hai khuynh hướng là nén có bảo toàn và không bảo toàn thông tin.
Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục
hồi thì kéM hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén
ảnh:
• Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất xuất
hiện của giá trị các điểM ảnh, trên cơ sở đó Mà có chiến lược Mã hóa thích
hợp. Một ví dụ điển hình cho kỹ thuật Mã hóa này là *.TIF
• Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểM
ảnh để tiến hành Mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểM
ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là Mã nén *.PCX
• Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén
không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn. *.JPG chính
là tiếp cận theo kỹ thuật nén này.
• Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện
sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần

gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
1.3 Các định dạng ảnh cơ bản
Ảnh thu được sau quá trình số hóa thường được lưu lại cho các quá trình xử lý
tiếp theo hay truyền đi. Trong quá trình phát triển của kỹ thuật xử lý ảnh, tồn tại
nhiều định dạng ảnh khác nhau từ ảnh đen trắng (với định dạng IMG), ảnh đa cấp
xáM cho đến ảnh Màu: (BMP, GIF, JPE…). Tuy các định dạng này khác nhau, song
chúng đều tuân thủ theo Một cấu trúc chung nhất. Nhìn chung, Một tệp ảnh bất kỳ
thường bao gồM 3 phần:
• Mào đầu tệp (Header)
• Dữ liệu nén (Data CoMpression)
• Bảng Màu (Palette Color)
Nguyễn Chí Hướng
19 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Bảng 1-1 Cấu trúc Một tệp ảnh
Mào đầu tệp
Dữ liệu nén
Bảng Màu
Là phần chứa các thông tin về kiểu ảnh, kích thước, độ phân giải,
số bit dùng cho 1 pixel, cách Mã hóa, vị trí bảng Màu…
Số liệu ảnh được Mã hóa bởi kiểu Mã hóa chỉ ra trong phần
Header.
Bảng Màu không nhất thiết phải có, ví dụ khi ảnh là đen trắng.
Nếu có, bảng Màu cho biết số Màu dùng trong ảnh và bảng Màu
được sử dụng để hiện thị Màu của ảnh.
1.3.1 Ảnh BMP (Bitmap)
Là ảnh được Mô tả bởi Một Ma trận các giá trị số xác định Màu và bảng Màu
của các điểM ảnh tương ứng khi hiển thị. Ưu điểM của ảnh BitMap là tốc độ vẽ và
tốc độ xử lý nhanh. Nhược điểM của nó là kích thước rất lớn.
1.3.2 Ảnh JPEG (Joint Photographic Experts Group)

Đây là Một định dạng ảnh được hỗ trợ bởi nhiều trình duyệt web. Ảnh JPEG
được phát triển để nén dung lượng và lưu trữ ảnh chụp, và được sử dụng tốt nhất
cho đồ họa có nhiều Màu sắc, ví dụ như là ảnh chụp được scan. File Ảnh JPEG là
ảnh BitMap đã được nén lại.
1.3.3 Ảnh GIF (Graphics Interchange Format)
Ảnh GIF được phát triển dành cho những ảnh có tính chất thay đổi. Nó được
sử dụng tốt nhất cho đồ họa có ít Màu, ví dụ như là ảnh hoạt hình hoặc là những bức
vẽ với nhiều đường thẳng. File ảnh GIF là những ảnh BitMap được nén lại.
Có hai sự khác nhau cơ bản giữa ảnh GIF và ảnh JPEG:
+ Ảnh GIF nén lại theo cách giữ nguyên toàn bộ dữ liệu ảnh trong khi ảnh
JPEG nén lại nhưng làM Mất Một số dữ liệu trong ảnh.
+ Ảnh GIF bị giới hạn bởi số Màu nhiều nhất là 256 trong khi ảnh JPEG
không giới hạn số Màu Mà chúng sử dụng.
1.3.4 Ảnh WMF (Windows Metafiles)
Là Một tập hợp các lệnh GDI dùng để Mô tả ảnh và nội dung ảnh. Có hai ưu
điểM khi sử dụng ảnh WMF: kích thước file WMF nhỏ và ít phụ thuộc vào thiết bị
hiển thị hơn so với ảnh BitMap.
Nguyễn Chí Hướng
20 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
CHƯƠNG 2
MỘT SỐ BÀI TOÁN VỀ XỬ LÝ ẢNH
2.1 Các bài toán cải thiện ảnh sử dụng toán tử điểm
Xử lý điểM ảnh thực chất là biến đổi giá trị Một điểM ảnh dựa vào giá trị của
chính nó Mà không hề dựa vào các điểM ảnh khác. Có hai cách tiệM cận với phương
pháp này. Cách thứ nhất dùng Một hàM biến đổi thích hợp với Mục đích hoặc yêu
cầu đặt ra để biến đổi giá trị Mức xáM của điểM ảnh sang Một giá trị Mức xáM khác.
Cách thứ hai là dùng lược đồ Mức xáM (Gray HistograM). Về Mặt toán học, toán tử
điểM là Một ánh xạ từ giá trị cường độ ánh sáng u(m, n) tại toạ độ (m, n) sang giá tri
cường độ ánh sáng khác v(m, n) thông qua hàM f, tức là:

v(m, n)
=
f (u(m, n))
(2.3)
Nói Một cách khác, toán tử điểM là toán tử không bộ nhớ, ở đó Một Mức xáM
u

[
0, N
]
được ánh xạ sang Một Mức xáM
v

[
0, N
]
: v = f (u). Ứng dụng chính của
các toán tử điểM là biến đổi độ tương phản của ảnh. Ánh xạ f khác nhau tùy theo
các ứng dụng. Các dạng toán tử điểM được giới thiệu cụ thể như sau:
2.1.1 Tăng giảm độ sáng
Giả sử ta có ảnh đầu vào I ~ kích thước (M x n) và số nguyên c
Khi đó, kỹ thuật tăng, giảM độ sáng được thể hiện qua thuật toán:
B1: Với mỗi điểm ảnh, thực hiện phép cộng mức xám của nó với giá trị c
for (int i = 0; i < m; i + +)
for (int j = 0; j < n; j + +)
I [i, j] = I [i, j] + c;
B2: Gán giá trị độ xám mới cho điểm ảnh đầu ra.
Nếu c > 0: ảnh sáng lên.
Nếu c < 0: ảnh tối đi.
Để Minh họa cho bài toán này ta xeM xét Một ví dụ về sự thay đổi của ảnh gốc

sau khi ta cho tăng độ sáng của nó là c =100.
Nguyễn Chí Hướng
21 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Ảnh gốc
Ảnh sau khi tăng Mức sáng c = +100
Hình 2-11 Ảnh sau khi tăng độ sáng (c =100)
2.1.2 Tăng độ tương phản
Trước tiên cần làM rõ khái niệM độ tương phản. Ảnh số là tập hợp các điểM,
Mỗi điểM có giá trị độ sáng khác nhau. Ở đây, độ sáng để Mắt người dễ cảM nhận
ảnh song không phải là quyết định. Thực tế chỉ ra rằng hai đối tượng có cùng độ
sáng nhưng đặt trên hai nền khác nhau sẽ cho cảM nhận sáng khác nhau. Như vậy,
độ tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền. Nói Một
cách khác, độ tương phản là độ nổi của điểM ảnh hay vùng ảnh so với nền. Như
vậy, nếu ảnh có độ tương phản kéM, ta có thể thay đổi tùy ý theo ý Muốn theo hàM
sau:
 〈
u

 
(u

b)
+
V
b
〈 ≤
u
<
a

a

u
<
b
b

u
<
L
(2.4)
Các độ dốc 〈, ,  xác định độ tương phản tương đối. L là số Mức xáM cực
đại. Ta có:
α = β = γ =1 ảnh kết quả trùng với ảnh gốc.
α, β, γ > 1 dãn độ tương phản.
α, β, γ < 1 co độ tương phản.
Nguyễn Chí Hướng
22 Lớp Tin học trắc địa K50
f (u)
=  
(u

a)
+
V
a

Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
Hình 2-12 Biểu đồ dãn độ tương phản
Thuật toán:

B1: Nhập vào các cận a, b, Va và Vb.
B2: Tính giá trị các đại lượng

,

,

.
B3: For(Với mỗi điểm ảnh)
Nếu giá trị xám I của nó < a: I(x,y)= I(xy)*

Nếu giá trị xám I của nó a < I < b thì:
I
=
(I

a) *

+
Va
Nếu giá trị xám I của điểm ảnh I > b thì:
I
=
(I

b) *

+
Vb
B4: Gán giá trị xám mới trở lại cho điểm ảnh.

Hình Minh họa:
Ảnh gốc
Ảnh sau khi tăng tương phản
Hình 2-13 Ảnh gốc và ảnh kết quả sau khi tăng tương phản
Nguyễn Chí Hướng
23 Lớp Tin học trắc địa K50
Đồ án tốt nghiệp chuyên ngành Tin học Trắc địa
2.1.3 Biến đổi âm bản
ÂM bản nhận được bằng phép biến đổi âM. Phép biến đổi này có rất nhiều hữu
ích cho các phiM ảnh dùng trong y học.
f (u)
=
L

u
(2.5)
Giả sử ta có ảnh I ~ kích thước (M x n). Khi đó: Kỹ thuật biến đổi âM bản
được thể hiện qua thuật toán sau:
B1: Với mỗi điểm ảnh, thực hiện phép toán thay đổi mức xám của nó
for (int i = 0; i < m; i + +)
for (int j = 0; j < n; j + +)
I[i,j] = 255 – I[i,j];
B2: Gán giá trị mức xám mới cho ảnh đầu ra
Hình Minh họa:
Ảnh gốc
Ảnh được biến đổi âM bản
Hình 2-14 Ảnh gốc và ảnh sau khi biến đổi âM bản
2.1.4 Biến đổi ảnh đen trắng
Để chuyển đổi Một ảnh Màu sang ảnh đen trắng ta dùng kĩ thuật tách ngưỡng.
Giả sử ta có ảnh I ~ kích thước (M x n), hai số Min, Max và ngưỡng θ. Khi đó: Kỹ

thuật tách ngưỡng được thể hiện qua thuật toán sau:
B1: Thực hiện vòng lặp,thay đổi giá trị độ xám của từng điểm ảnh
for (i = 0; i < m; i + +)
for (j = 0; j < n; j + +)
I [i, j] = I [i, j] > = θ? Max: Min (Ở trường hợp này Max =1, Min = 0)
B2: Gán các giá trị độ xám mới cho ảnh đầu ra.
Hình Minh họa:
Nguyễn Chí Hướng
24 Lớp Tin học trắc địa K50

×