Tải bản đầy đủ (.pdf) (75 trang)

Phát hiện độ dịch chuyển của phiếu điểm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.85 MB, 75 trang )

i
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG

ĐÀO SƠN

PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA
PHIẾU ĐIỂM

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên - 2015
ĐẠI HỌC THÁI NGUYÊN

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

ii

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG

ĐÀO SƠN

PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA
PHIẾU ĐIỂM
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH


Ngƣời hƣớng dẫn khoa học: PGS.TS ĐỖ NĂNG TOÀN

Thái Nguyên - 2015

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

i

LỜI CAM ĐOAN
Tôi xin cam đoan kết quả trong luận văn là sản phẩm của riêng cá nhân
tôi. Trong toàn bộ nội dung của luận văn, những điều đƣợc trình bày hoặc là
của cá nhân hoặc là đƣợc tổng hợp từ nhiều nguồn tài liệu. Tất cả các tài liệu
tham khảo đều có xuất xứ rõ ràng và đƣợc trích dẫn hợp pháp.
Tôi xin hoàn toàn chịu trách nhiệm theo quy định cho lời cam đoan của
mình.
Ngƣời cam đoan
Đào Sơn

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

ii

LỜI CẢM ƠN
Trƣớc hết em xin gửi lời cảm ơn sâu sắc đến thầy hƣớng dẫn khoa học
PGS.TS Đỗ Năng Toàn về những chỉ dẫn khoa học, định hƣớng nghiên cứu
và tận tình hƣớng dẫn tôi trong suốt quá trình làm luận văn.

Em cũng xin cảm ơn các Thầy trong viện Công Nghệ Thông Tin, các
Thầy Cô trong trƣờng Đại học Công Nghệ Thông Tin và Truyền Thông - Đại
học Thái Nguyên đã quan tâm chỉ bảo và trực tiếp giảng dạy, giúp đỡ trong
suốt quá trình học tập và nghiên cứu.
Tôi xin chân cảm ơn lãnh đạo các phòng, ban trong trƣờng Cao đẳng Cơ
khí – Luyện kim đã tạo điều kiện cho tôi học tập và nghiên cứu đề tài này.
Cuối cùng, tôi xin cảm ơn gia đình và bạn bè, những ngƣời đã luôn ủng
hộ và động viên tôi để tôi yên tâm nghiên cứu luận văn này.
Đào Sơn

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

iii

MỤC LỤC

LỜI CAM ĐOAN ..................................................................................................................... i
LỜI CẢM ƠN........................................................................................................................... ii
MỤC LỤC................................................................................................................................ iii
DANH MỤC HÌNH ẢNH .................................................................................................... .v
MỞ ĐẦU................................................................................................................................... 1
Chƣơng 1 : KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG BIỂU MẪU ........... 3
1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH.................................................................................... 3
1.1.1. Xử lý ảnh là gì ........................................................................................ 3
1.1.2. Mô tả ảnh................................................................................................. 6
1.1.2.1. Picture Element: phần tử ảnh .............................................................. 6
1.1.2.2. Grey level: mức xám ........................................................................... 7
1.1.2.3. Quan hệ giữa các điểm ảnh ................................................................. 9

1.1.3. Các vấn đề trong xử lý ảnh .................................................................. 11
1.1.3.1. Kỹ thuật tăng, giảm độ sáng............................................................... 12
1.1.3.2. Kỹ thuật tăng, giảm độ tƣơng phản.................................................... 13
1.1.3.3. Tách ngƣỡng....................................................................................... 14
1.1.3.4. Chuyển đổi sang ảnh nhị phân ........................................................... 14
1.1.3.5. Loại bỏ nhiễu...................................................................................... 17
1.2. NHẬN DẠNG PHIẾU ĐIỂM ..................................................................................... 21
1.2.1. Biểu diễn phiếu điểm ........................................................................... 21
1.2.1.1. Cấu trúc vật lý .................................................................................... 22
1.2.1.2. Cấu trúc logic ..................................................................................... 23
1.2.2. Phân tách vùng chứa dữ liệu. ................................................................ 24
1.2.3. Tách dòng và tách kí tự. ........................................................................ 27
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

iv

1.2.3.1. Giải thuật Horizontal Projection ........................................................ 27
1.2.3.2.Giải thuật Vertical Projection ............................................................. 27
1.2.4. Trích rút đặc trƣng. ............................................................................... 28
Chƣơng 2 : KỸ THUẬT PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM . 29
2.1. KHỬ NHIỄU............................................................................................ 29
2.1.1. Nhiễu ảnh ............................................................................................. 29
2.1.2. Khử nhiễu ............................................................................................. 30
2.1.2.1. Lọc tuyến tính (Linear Filter)............................................................. 30
2.1.2.2. Lọc phi tuyến (NonLinear Filter) ....................................................... 36
2.1.2.3. Mặt nạ gờ sai phân và làm nhăn (Unharp Masking and Crispering) . 40
2.1.2.4. Lọc thông thấp, thông cao và lọc dải thông ....................................... 40
2.2. PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM DỰA VÀO

HISTOGRAM .................................................................................................................... 42
2.3. PHÁT HIỆN ĐỘ DỊCH CHUYỂN PHIẾU ĐIỂM THEO VĂN BẢN MẪU ... 50
Chƣơng 3 : CHƢƠNG TRÌNH THỬ NGHIỆM.............................................................. 55
3.1. Bài toán ............................................................................................................................ 55
3.2. Phân tích bài toán .................................................................................... 55
3.3. Chƣơng trình thử nghiệm.............................................................................................. 56
PHẦN KẾT LUẬN ............................................................................................................... 64
TÀI LIỆU THAM KHẢO.................................................................................................... 66

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

v

DANH MỤC HÌNH ẢNH
Hình 1.1: Quá trình xử lý ảnh
Hình 1.1: Các bƣớc cơ bản trong xử lý ảnh
Hình 1.3: Ví dụ lƣợc đồ xám
Hình 1.4: Lân cận các điểm ảnh của toạ độ (x,y)
Hình 1.5. Ảnh gốc
Hình 1.6. Ảnh đã giảm độ sáng
Hình 1.7. Ảnh đã đƣợc tăng cƣờng độ sáng
Hình 1.8. Ảnh gốc
Hình 1.9. Ảnh đã giảm độ tƣơng phản
Hình 1.10. Ảnh đã đƣợc tăng độ tƣơng phản
Hình 1.11. Mô phỏng thuật toán lọc trung vị để loại bỏ nhiễu.
Hình 1.12. Mô tả phép quay ảnh
Hình 1.13: Tổng quan quá trình tạo ảnh tài liệu
Hình 1.14. Mẫu phiếu điểm thu nhận từ máy quét

Hình 1.15. Bức ảnh trƣớc khi điều chỉnh kích thƣớc
Hình 1.16. Bức ảnh sau khi điều chỉnh kích thƣớc thành 7x5
Hình 2.1: Ảnh gốc và ảnh thu đƣợc qua lọc tuyến tính
Hình 2.2: Ví dụ bộ lọc giữ biên
Hình 2.3: Các toán tử gờ sai phân
Hình 2.4: Sơ đồ lọc thông cao
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

vi

Hình 2.5: Một số nhân chập trong lọc thông cao
Hình 2.6: Ảnh qua lọc thông cao (ảnh gốc 2.1)
Hình 2.7. Mô hình histogram dọc của phiếu điểm mẫu.
Hình 2.8. Mô hình histogram dọc của phiếu điểm cần nhận dạng.
Hình 2.9. Mô hình histogram của phiếu điểm mẫu và phiếu điểm cần
nhận dạng đƣợc xếp trên cùng một trục tọa độ.
Hình 2.10. (a) là ảnh mẫu (b) là ảnh cần nhận dạng
Hình 2.11. Mô hình histogram dọc của phiếu điểm mẫu.
Hình 2.12. Mô hình histogram dọc của phiếu điểm cần nhận dạng
Hình 2.13. Mô hình histogram của phiếu điểm mẫu và phiếu điểm cần
nhận dạng đƣợc xếp trên cùng một trục tọa độ.
Hình 2.14. Xây dựng lƣới tựa các hình chữ nhật
Hình 3.1: Giao diện chƣơng trình thử nghiệm
Hình 3.2: Menu File
Hình 3.3: Menu Basic
Hình 3.4: Menu Filter
Hình 3.5: Menu Skew Detection
Hình 3.6: Một mẫu phiếu điểm sau khi scan chƣa đƣợc xử lý

Hình 3.7: Phiếu điểm sau khi đƣợc chỉnh độ nghiêng bị dịch chuyển
Hình 3.8: Kết quả sau khi hiệu chỉnh

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

1

MỞ ĐẦU
Hiện nay, trong việc quản lý, thu nhận và xử lý thông tin với khối
lƣợng ngày càng lớn, nhiều lúc với những phần mềm thủ công không đem lại
hiệu quả mong muốn, tốn nhiều thời gian và công sức. Nhằm đem lại sự chính
xác và nhanh chóng, đỡ tốn công sức của con ngƣời. Trong những năm gần
đây nhiều nhà nghiên cứu đã phát triển mạnh mẽ bài toán nhập liệu tự động.
Nhập liệu tự động là việc nạp thông tin vào máy thông qua những tác
động thủ công của con ngƣời.Tuy nhiên trong thực tế để cài một hệ nhập liệu
tự động cụ thể gặp khá nhiều khó khăn.
Trong hầu hết các cơ sở giáo dục đào tạo của nƣớc ta đều đƣợc trang bị
phần mềm quản lý đào tạo nhằm nâng cao chất lƣợng giảng dạy và quản lý
học sinh, sinh viên, giúp giảm bớt một phần lớn công việc của đội ngũ cán bộ
quản lý giáo dục. Tuy nhiên việc lƣu trữ, cập nhật vào hệ thống phần mềm
quản lý giáo dục vẫn còn thủ công, không những làm tốn nhiều công sức của
đội ngũ giáo vụ mà còn có nhiều sai sót đặc biệt với những trƣờng có số
lƣợng môn học và số sinh viên lớn.
Từ những lý do trên, để khắc phục phần nào các nhƣợc điểm em đã chọn
đề tài “PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM” với mong
muốn phần nào giải quyết đƣợc phần nào những khó khăn đó. Thay vì phải
nhập thủ công, giờ đây việc nhập trở nên dễ dàng, thuận tiện hơn. Các công
đoạn chính bao gồm:

- Phiếu điểm viết tay của giảng viên qua máy quét thu đƣợc hình ảnh
và đƣa vào máy tính.
- Áp dụng các kỹ thuật tiền xử lý ảnh (nâng cao chất lƣợng ảnh,
chuyển sang ảnh nhị phân, loại bỏ nhiễu,...).
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

2
- Nhận dạng với các mẫu thu thập đƣợc.
- Cập nhật vào Cơ sở dữ liệu.
Việc cập nhật tự động rõ ràng đã giải quyết đƣợc những khó khăn và
bất tiện của quản lý điểm thông thƣờng để lại.
Nội dung của luận văn tốt nghiệp gồm có 3 chƣơng:
Chương 1. Khái quát về xử lý ảnh và nhận dạng biểu mẫu.
Chương 2. Kỹ thuật phát hiện độ dịch chuyển của phiếu điểm .
Chương 3. Chƣơng trình thử nghiệm.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

3

Chƣơng 1
KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG BIỂU MẪU
1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH
1.1.1. Xử lý ảnh là gì
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một
ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhƣng tốc độ phát

triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc
biệt là máy tính chuyên dụng riêng cho nó.
Quá trình xử lý ảnh đƣợc xem nhƣ là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận.

Hình 1.1: Quá trình xử lý ảnh
Để dễ tƣởng tƣợng, xét các bƣớc cần thiết trong xử lý ảnh. Đầu tiên,
ảnh tự nhiên từ thế giới ngoài đƣợc thu nhận qua các thiết bị thu (nhƣ
Camera, máy chụp ảnh, máy scanner). Trƣớc đây, ảnh thu qua Camera là các
ảnh tƣơng tự (loại Camera ống kiểu CCIR). Gần đây, với sự phát triển của
công nghệ, ảnh màu hoặc đen trắng đƣợc lấy ra từ Camera, sau đó nó đƣợc
chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. (Máy ảnh số
hiện nay là một thí dụ gần gũi). Mặt khác, ảnh cũng có thể tiếp nhận từ vệ
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

4
tinh; có thể quét từ ảnh chụp bằng máy quét ảnh. Hình 1.2 dƣới đây mô tả các
bƣớc cơ bản trong xử lý ảnh.

Hình 1.1: Các bƣớc cơ bản trong xử lý ảnh
Sơ đồ này bao gồm các thành phần sau:
a) Phần thu nhận ảnh (Image Acquisition)
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thƣờng ảnh nhận qua
camera là ảnh tƣơng tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh
25 dòng), cũng có loại camera đã số hoá (nhƣ loại CCD – Change Coupled
Device) là loại photodiot tạo cƣờng độ sáng tại mỗi điểm ảnh.
Camera thƣờng dùng là loại quét dòng, ảnh tạo ra có dạng hai chiều.

Chất lƣợng một ảnh thu nhận đƣợc phụ thuộc vào thiết bị thu, vào môi trƣờng
(ánh sáng, phong cảnh)
b) Tiền xử lý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tƣơng phản thấp nên cần đƣa vào
bộ tiền xử lý để nâng cao chất lƣợng. Chức năng chính của bộ tiền xử lý là lọc
nhiễu, nâng độ tƣơng phản, nổi biên, làm trơn biên ảnh, khuyếch đại ảnh… để
làm ảnh rõ hơn, nét hơn.
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

5

c) Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để
biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch)
trên phong bì thƣ cho mục đích phân loại bƣu phẩm, cần chia các câu, chữ về
địa chỉ hoặc tên ngƣời thành các từ, các chữ, các số (hoặc các vạch) riêng biệt
để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ
gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất
nhiều vào công đoạn này.
d) Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã
phân đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số
liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính.
Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trƣng (Feature
Selection) gắn với việc tách các đặc tính của ảnh dƣới dạng các thông tin định
lƣợng hoặc làm cơ sở để phân biệt lớp đối tƣợng này với đối tƣợng khác trong
phạm vi ảnh nhận đƣợc. Ví dụ: trong nhận dạng ký tự trên phong bì thƣ,
chúng ta miêu tả các đặc trƣng của từng ký tự giúp phân biệt ký tự này với ký

tự khác.
e) Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thƣờng thu
đƣợc bằng cách so sánh với mẫu chuẩn đã đƣợc học (hoặc lƣu) từ trƣớc. Nội
suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và
nét gạch ngang trên phong bì thƣ có thể đƣợc nội suy thành mã điện thoại. Có
nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các
mô hình toán học về ảnh đƣợc phân theo hai loại nhận dạng ảnh cơ bản:
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

6

- Nhận dạng theo tham số.
- Nhận dạng theo cấu trúc.
Một số đối tƣợng nhận dạng khá phổ biến hiện nay đang đƣợc áp dụng
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký
điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch,
nhận dạng mặt ngƣời…
f) Cơ sở tri thức (Knowledge Base)
Nhƣ đã nói ở trên, ảnh là một đối tƣợng khá phức tạp về đƣờng nét, độ
sáng tối, dung lƣợng điểm ảnh, môi trƣờng để thu ảnh phong phú kéo theo
nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các
phƣơng pháp toán học đảm bảo tiện lợi cho xử lý, ngƣời ta mong muốn bắt
chƣớc quy trình tiếp nhận và xử lý ảnh theo cách của con ngƣời. Trong các
bƣớc xử lý đó, nhiều khâu hiện nay đã xử lý theo các phƣơng pháp trí tuệ con
ngƣời. Vì vậy, ở đây các cơ sở tri thức đƣợc phát huy.
1.1.2. Mô tả ảnh
Để hiểu chi tiết hơn, trƣớc tiên ta xem xét hai khái niệm (thuật ngữ)

thƣờng dùng trong xử lý ảnh đó là Picture Element (phần tử ảnh) và grey
level (mức xám).
1.1.2.1. Picture Element: phần tử ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ
sáng. Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh.
Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù
hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Khoảng cách
giữa các điểm ảnh đó đƣợc thiết lập sao cho mắt ngƣời không phân biệt đƣợc
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

7
ranh giới giữa chúng. Mỗi một điểm nhƣ vậy gọi là điểm ảnh (PEL: Picture
Element) hay gọi tắt là Pixel (điểm ảnh). Trong khuôn khổ ảnh hai chiều, mỗi
pixel ứng với cặp tọa độ (x, y).
Theo định nghĩa Pixel, khoảng cách giữa các điểm ảnh phải đƣợc chọn
sao cho mắt ngƣời vẫn thấy đƣợc sự liên tục của ảnh. Việc lựa chọn khoảng
cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và đƣợc
phân bố theo trục x và y trong không gian hai chiều. Ví dụ: Độ phân giải của
ảnh trên màn hình CGA (Color Graphic Adaptor) là một lƣới điểm theo chiều
ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200). Rõ ràng,
cùng màn hình CGA 12" ta nhận thấy mịn hơn màn hình CGA 17" độ phân
giải 320*200. Lý do: cùng một mật độ (độ phân giải) nhƣng diện tích màn
hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn.
Nhƣ vậy, một ảnh là một tập hợp các điểm ảnh. Khi đƣợc số hoá, nó
thƣờng đƣợc biểu diễn bởi bảng hai chiều I(n,p): n dòng và p cột. Ta nói ảnh
gồm n x p pixels. Ngƣời ta thƣờng kí hiệu I(x,y) để chỉ một pixel. Thƣờng giá
trị của n chọn bằng p và bằng 256.
1.1.2.2. Grey level: mức xám

Mức xám là kết quả sự mã hoá tƣơng ứng một cƣờng độ sáng của mỗi
điểm ảnh với một giá trị số - kết quả của quá trình lƣợng hoá. Các thang giá
trị mức xám thƣờng dùng là 16, 32 hay 64 mức. Mã hoá 256 mức là phổ dụng
nhất do lý do kỹ thuật máy tính dùng 1 byte (8 bít) để biểu diễn mức xám.
Mức xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255)
Lƣợc đồ xám: là một hàm rời rạc cung cấp tần suất xuất hiện của mỗi
mức xám:
h(sk) = nk
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

8
trong đó:

sk là mức xám thứ k
nk là số các điểm ảnh có cùng mức xám thứ k
n là tổng số các điểm ảnh

Biểu diễn lƣợc đồ xám:
 Trục tung biểu diễn số điểm ảnh cho một mức xám (hoặc tỷ lệ số
điểm ảnh có cùng mức xám trên tổng số điểm ảnh)
 Trục hoàng biểu diễn các mức xám
Ví dụ:

Hình 1.3: Ví dụ lƣợc đồ xám
Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác)
với mức xám ở các điểm ảnh có thể khác nhau.
Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô
tả 21 mức khác nhau, hay nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ

có thể là 0 hoặc 1.
Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo
nên thế giới màu, ngƣời ta thƣờng dùng 3 byte để mô tả mức màu, khi đó các
giá trị màu: 28*3=224≈ 16,7 triệu màu.
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

9
Nhƣ vậy từ những lý thuyết trên có thể nói ảnh số là tập hợp các điểm
ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật
1.1.2.3. Quan hệ giữa các điểm ảnh
Một ảnh số giả sử đƣợc biểu diễn bằng hàm f(x, y). Tập con các điểm
ảnh là S; cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q. Chúng ta nêu một
số các khái niệm sau:
a) Các lân cận của điểm ảnh (Image Neighbors)
Giả sử có điểm ảnh p tại toạ độ (x, y). p có 4 điểm lân cận gần nhất
theo chiều đứng và ngang (có thể coi nhƣ lân cận 4 hƣớng chính: Đông, Tây,
Nam, Bắc).
{(x-1, y); (x, y-1); (x, y+1); (x+1, y)} = N4(p)
trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p

Hình 1.4: Lân cận các điểm ảnh của toạ độ (x,y)
Các lân cận chéo: Các điểm lân cận chéo NP(p) (Có thể coi lân cận
chéo la 4 hƣớng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)
Np(p) = { (x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}
Tập kết hợp: N8(p) = N4(p) + NP(p) là tập hợp 8 lân cận của điểm ảnh
p.
Số hóa bởi Trung tâm Học liệu - ĐHTN


/>

10
Chú ý: Nếu (x, y) nằm ở biên (mép) ảnh; một số điểm sẽ nằm ngoài
ảnh.

b) Các mối liên kết điểm ảnh
Các mối liên kết đƣợc sử dụng để xác định giới hạn (Boundaries) của
đối tƣợng vật thể hoặc xác định vùng trong một ảnh. Một liên kết đƣợc đặc
trƣng bởi tính liền kề giữa các điểm và mức xám của chúng.
Giả sử V là tập các giá trị mức xám. Một ảnh có các giá trị cƣờng độ
sáng từ thang mức xám từ 32 đến 64 đƣợc mô tả nhƣ sau :
V={32, 33, … , 63, 64}.
Có 3 loại liên kết.
* Liên kết 4: Hai điểm ảnh p và q đƣợc nói là liên kết 4 với các giá trị
cƣờng độ sáng V nếu q nằm trong một các lân cận của p, tức q thuộc N4(p)
* Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p,
tức q thuộc N8(p)
* Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị
cƣờng độ sáng V đƣợc nói là liên kết m nếu.
- q thuộc N4(p) hoặc
- q thuộc NP(p)
c) Đo khoảng cách giữa các điểm ảnh.
Định nghĩa: Khoảng cách D(p, q) giữa hai điểm ảnh p toạ độ (x, y), q
toạ độ (s, t) là hàm khoảng cách (Distance) hoặc Metric nếu:
- D(p,q) ≥ 0 (Với D(p,q)=0 nếu và chỉ nếu p=q)
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>

11


- D(p,q) = D(q,p)
- D(p,z) ≤ D(p,q) + D(q,z); z là một điểm ảnh khác.
Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x, y)
và q(s, t) đƣợc định nghĩa nhƣ sau:
De(p, q) = [(x - s)2 + (y - t)2]1/2
Khoảng cách khối: Khoảng cách D4(p, q) đƣợc gọi là khoảng cách khối
đồ thị (City-Block Distance) và đƣợc xác định nhƣ sau:
D4(p,q) = | x - s | + | y - t |
Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa điểm
ảnh từ tâm điểm ảnh đến tâm điểm ảnh q khác. Ví dụ: Màn hình CGA 12”
(12”*2,54cm = 30,48cm=304,8mm) độ phân giải 320*200; tỷ lệ 4/3 (Chiều
dài/Chiều rộng). Theo định lý Pitago về tam giác vuông, đƣờng chéo sẽ lấy tỷ
lệ 5 phần (5/4/3: đƣờng chéo/chiều dài/chiều rộng màn hình); khi đó độ dài
thật là (305/244/183) chiều rộng màn hình 183mm ứng với màn hình CGA
200 điểm ảnh theo chiều dọc. Nhƣ vậy, khoảng cách điểm ảnh lân cận của
CGA 12” là ≈ 1mm.
Khoảng cách D8(p, q) còn gọi là khoảng cách bàn cờ (Chess-Board
Distance) giữa điểm ảnh p, q đƣợc xác định nhƣ sau:
D8(p,q) = max (| x-s | , | y-t |)
1.1.3. Các vấn đề trong xử lý ảnh
Ta nhận thấy một ảnh màu RGB bao gồm 3 ảnh xám: R, G và B. Nhƣ
vậy để xử lý ảnh mầu ta phải xử lý trên 3 ảnh xám R, G, B của nó và kết hợp
lại sẽ có kết quả nhƣ mong muốn.
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

12


1.1.3.1. Kỹ thuật tăng, giảm độ sáng
Tăng cƣờng độ sáng của một ảnh có thể đƣợc hiểu nhƣ sự phát sáng
toàn bộ ảnh. Hay nói một cách cụ thể đó là sự phát sáng toàn bộ của mọi Pixel
trong ảnh đó.
Đây là một kỹ thuật khá đơn giản: để tăng thêm độ sáng, tất cả các
Pixel của ảnh cần đƣợc cộng thêm giá trị điều chỉnh vào mọi kênh màu RGB.
Tuy kỹ thuật này đơn giản nhƣng nó đem lại hiệu quả khá cao và rất hay đƣợc
sử dụng trong lĩnh vực xử lý ảnh. Nó giúp ích rất nhiều trong các ngành nhƣ y
học, địa lý, quân sự,... trong việc phân tích và nhận dạng.
Điều chỉnh độ sáng không chỉ đƣợc sử dụng để làm sáng lên những ảnh
tối mà còn đƣợc sử dụng để làm tối đi các ảnh sáng. Một ảnh sáng hoàn toàn
đơn giản là tất cả các Pixel đều màu trắng trong khi một ảnh tối hoàn toàn là
tất cả các Pixel đều màu tối. Sự khác nhau duy nhất trong làm tối một ảnh là
trừ đi giá trị điều chỉnh vào mỗi kênh màu RGB của ảnh.
Đối với mỗi kênh màu, chúng chỉ nhận các giá trị [0..255]. Chính vì thế
khi tăng cƣờng hay giảm độ sáng của một ảnh ta phải chú ý đến ngƣỡng của
các kênh. Điều đó có nghĩa là với mỗi kênh màu của một Pixel nếu nhỏ hơn 0
thì ta phải gán bằng 0 và nếu lớn hơn 255 thì ta phải gán bằng 255. Biểu thức
cho kỹ thuật Brightness có dạng:
g(x,y) = f(x,y) + b
Trong đó b là hằng số cộng thêm vào giá trị màu f(x,y). Độ sáng của
ảnh tăng nếu b > 0, và giảm bớt nếu b < 0.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

13

Hình 1.5. Ảnh gốc


Hình 1.6. Ảnh đã giảm

Hình 1.7. Ảnh đã đƣợc

độ sáng

tăng cƣờng độ sáng

1.1.3.2. Kỹ thuật tăng, giảm độ tương phản
Độ tƣơng phản (Contrast) thể hiện sự thay đổi cƣờng độ sáng của đối
tƣợng so với nền, hay nói cách khác, độ tƣơng phản là độ nổi của điểm ảnh
hay vùng ảnh so với nền.
Ảnh số là tập hợp các điểm, mà mỗi điểm có giá trị độ sáng khác nhau. Ở
đây, độ sáng để mắt ngƣời dễ cảm nhận ảnh song không phải là quyết định.
Thực tế chỉ ra rằng hai đối tƣợng có cùng độ sáng nhƣng đặt trên hai nền khác
nhau nhau sẽ cho cảm nhận khác nhau. Vì vậy ta có thể thay đổi độ tƣơng
phản của ảnh sao cho phù hợp.
Việc làm tăng độ tƣơng phản rất hữu ích khi tiến hành xử lý trƣớc theo
phƣơng pháp phân ngƣỡng. Bằng việc làm tăng độ tƣơng phản, sự khác nhau
của giá trị nền và đối tƣợng, độ dốc của cạnh đối tƣợng đƣợc tăng lên. Do đó
sau khi làm tăng độ tƣơng phản ta có thể tìm các giá trị màu thích hợp với
một vùng sáng hơn.
Trong một ảnh có độ tƣơng phản cao, có thể xác định đƣợc các viền rõ
ràng và chi tiết khác nhau của ảnh đó đƣợc nổi bật. Còn trong một ảnh có độ
tƣơng phản thấp, tất cả các màu đều gần nhƣ nhau gây khó khăn cho việc xác
định các chi tiết của ảnh.
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>


14

Hình 1.8. Ảnh gốc

Hình 1.9. Ảnh đã giảm

Hình 1.10. Ảnh đã

độ tƣơng phản

đƣợc tăng độ tƣơng
phản

Biểu thức cho kỹ thuật Contrast có dạng:
g(x,y) = af(x,y)
Trong đó a là hằng số nhân vào giá trị màu tại f(x,y). Độ sáng của ảnh
tăng nếu a > 1, và giảm bớt nếu a < 1.
1.1.3.3. Tách ngưỡng
Ta chọn hai mức Thấp- Min, Cao-Max và giá trị ngƣỡng λ, khi đó giá
trị các pixel đƣợc định nghĩa lại nhƣ sau:
+ Inew(x, y) = Max nếu I(x, y) >= λ
+ Inew(x, y) = Min nếu I(x, y) < λ
1.1.3.4. Chuyển đổi sang ảnh nhị phân
Nhiệm vụ của việc chuyển đổi sang ảnh nhị phân là tách màu của “đối
tƣợng” ra khỏi nền. Biểu đồ hình cột của giá trị mức xám của tài liệu ảnh
thông thƣờng chứa 2 giá trị: giá trị mức cao tƣơng ứng với màu nền trắng và
giá trị nhỏ hơn tƣơng tứng với màu chữ. Vì thế, nhiệm vụ của việc xác định
ngƣỡng giá trị mức xám (giá trị mức xám lớn hơn giá trị ngƣỡng sẽ là màu
trắng, giá trị mức xám nhỏ hơn giá trị ngƣỡng sẽ là màu đen) là xác định một

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

15
giá trị thích hợp để việc chuyển đổi từ ảnh xám sang ảnh nhị phân sao cho
lƣợng thông tin mất mát là ít nhất.
Trong đề tài này tôi tính ngƣỡng để chuyển đổi từ ảnh xám sang ảnh
nhị phân theo phƣơng pháp của Otsu. Và việc chuyển đổi từ ảnh xám sang
ảnh nhị phân đƣợc thực hiện theo phƣơng pháp ngƣỡng tổng thể.
 Phương pháp ngưỡng toàn cục
Trong phƣơng pháp sử dụng ngƣỡng toàn cục, giá trị ngƣỡng đƣợc tính
toán từ toàn bộ ảnh. Các điểm ảnh có giá trị mức xám dƣới ngƣỡng sẽ đƣợc
coi nhƣ là “nét bút”; các điểm ảnh có mức xám lớn hơn ngƣỡng đƣợc coi là
“nền”. Quá trình này có thể đƣợc mô tả nhƣ sau:
1
b ( x, y )  
0

if

f ( x, y )  T
otherwise

Trong phƣơng pháp ngƣỡng toàn cục, tôi sử dụng phƣơng pháp Otsu để
tính ngƣỡng của mỗi bức ảnh. Phƣơng pháp của Otsu dựa trên việc phân tích
biểu đồ hình cột mức xám của toàn bộ ảnh và sau đó chọn một giá trị làm giá
trị ngƣỡng phù hợp với việc chuyển đổi ảnh sang ảnh nhị phân.
 Phương pháp Otsu
Trong lĩnh vực xử lý ảnh, phƣơng pháp Otsu đƣợc dùng để tự động

thực hiện việc tính ngƣỡng của một ảnh, và sau đó dùng giá trị ngƣỡng vừa
tính đƣợc để chuyển đổi ảnh xám sang ảnh nhị phân.
Thuật toán tính ngƣỡng có thể mô tả nhƣ sau: Các giá trị mức xám của
ảnh đƣợc chia ra làm 2 lớp sau đó tính giá trị ngƣỡng. Chúng ta sẽ tìm giá trị
ngƣỡng nhỏ nhất trong các lớp khác nhau, đƣợc định nghĩa nhƣ là một tổng
các giá trị khác nhau của các lớp;
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

16
 w2 (t )  1 (t )  12 (t )  2 (t ) 22 (t )

Trọng số wi là xác suất của 2 lớp đƣợc tác riêng biệt bởi ngƣơng t và
các  i2 khác nhau của các lớp đó.
Phƣơng pháp Otsu chỉ ra rằng giá trị nhỏ nhất trong một lớp đồng thời
cũng đƣợc coi nhƣ là giá trị lớp nhất giữa 2 lớp.

 b2 (t )   2   w2 (t )  1 (t )2 (t )1 (t )   2 (t )2
Phƣơng pháp tính ngƣỡng theo Otsu dựa trên một ý tƣởng khá là đơn
giản: Tìm giá trị ngƣỡng mà có giá trị trọng số nhỏ nhất trong các lớp khác nhau.
Điều này cũng tƣơng đƣơng với việc tìm giá trị lớn nhất giữa 2 lớp khác nhau.
Trọng số trong một lớp đƣợc tính nhƣ sau:
 w2 (t )  1 (t ) 12 (t )  1 (t ) 22 (t )

Trong đó các xác suất của lớp đƣợc tính nhƣ sau:
t

L


1 (t )   P(i )

 2 (t )   P(i )

i 1

i  t 1

Và các giá trị trung bình đƣợc cho bởi công thức:
t

1 (t )  
i 1

iP (i )
1 (t )

 2 (t ) 

L

iP (i )
i  t 1
2 (t )



Cuối cùng, các lớp khác nhau đƣợc tính theo công thức sau:
2


t

 (t )   i  1 (t )
2
1

i 1

L

2

 (t )   i   2 (t )
2
2

Số hóa bởi Trung tâm Học liệu - ĐHTN

i t 1

P(i )
1 (t )

P(i )
2 (t )

/>

17
* Thuật toán:

- Tính biểu đồ hình cột và xác suất của mỗi cƣờng độ xám.
- Khởi tạo  i (0) và  i (0)
- Tính toán tất cả các trƣờng hợp có thể có giá trị ngƣỡng từ t=1 tới
cƣờng độ mức xám lớn nhất.
- Cập nhật i và  i
- Tính  b2 (t )
- Giá trị ngƣỡng mong muốn tƣơng đƣơng với giá trị  b2 (t ) lớn nhất.
1.1.3.5. Loại bỏ nhiễu
Đối với một tệp tin ảnh thì nhiểu đƣợc định nghĩa là nhƣng thông tin
không có trong ảnh gốc, nhƣng trong quá trình sử dụng các thiết bị để đọc ảnh
vào trong máy tính xuất hiện thêm những thông tin không mong muốn. Việc
xử lý nhiễu tức là loại bỏ các thông tin này ra khỏi ảnh để thuận tiện cho việc
trích rút thông tin phục vụ cho việc xử lý ảnh dễ dàng hơn và chính xác hơn.
 Một số kiểu nhiễu:
Có một số kiểu nhiễu mà chúng ta hay gặp:
Loại nhiễu “salt” và “peper”, các điểm ảnh trong ảnh là những màu hay
cƣờng độ sáng khác nhau so với các điểm xung quanh nó. Đối với những
điểm ảnh là loại nhiễu này thì thông thƣờng giá trị mức xám của chúng không
liên quan tới các điểm ảnh xung quanh nó.
Trong đề tài này, dữ liệu ảnh chủ yếu đƣợc lấy bằng cách scan ảnh, do
đó loại nhiễu phổ biến và thƣờng gặp đó là „salt‟ và „peper‟.
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

×