Tải bản đầy đủ (.pdf) (74 trang)

Nhận dạng kí tự và ứng dụng chấm điểm thi trắc nghiệm tự động

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.48 MB, 74 trang )

MỤC LỤC
LỜI CẢM ƠN ................................................... Error! Bookmark not defined.
LỜI CAM ĐOAN.............................................. Error! Bookmark not defined.
MỤC LỤC ........................................................................................................ 1
LỜI NÓI ĐẦU .................................................................................................. 5
CHƯƠNG 1. TỔNG QUAN VỀ XỬ LÝ ẢNH ................................................. 6
1.1 MỘT SỐ ĐỊNH NGHĨA CƠ BẢN .......................................................... 6
1.1.1 Xử lý ảnh .......................................................................................... 6
1.1.2 Ảnh số .............................................................................................. 6
1.1.3 Điểm ảnh .......................................................................................... 6
1.1.4 Mức xám........................................................................................... 7
1.1.5 Kỹ thuật xử lý ảnh............................................................................. 7
1.1.6 Hệ thống xử lý ảnh trên máy tính ...................................................... 7
1.1.7 Thị giác máy ..................................................................................... 8
1.2 THU NHẬN ẢNH VÀ THÔNG TIN VỀ ẢNH ....................................... 8
1.2.1 Thu nhận ảnh .................................................................................... 8
1.2.2 Thông tin về ảnh ............................................................................. 10
1.3 CẤU TRÚC TẬP TIN ẢNH BITMAP .................................................. 11
1.4 MÔ HÌNH MÀU ................................................................................... 13
1.4.1 Các mô hình màu ............................................................................ 13
1.4.2 Chuyển đổi các mô hình màu .......................................................... 19
1.5 CÁC GIAI ĐOẠN TRONG XỬ LÝ ẢNH............................................. 19


1.5.1 Thu nhận ảnh .................................................................................. 20
1.5.2 Tiền xử lý ....................................................................................... 20
1.5.3 Trích chọn dấu hiệu ........................................................................ 20
1.5.4 Nhận dạng....................................................................................... 20
1.6 CÁC MỨC ĐỘ CỦA HỆ THỐNG XỬ LÝ ẢNH .................................. 21
1.7 ỨNG DỤNG CỦA XỬ LÝ ẢNH .......................................................... 21
CHƯƠNG 2. NHẬN DẠNG ẢNH................................................................. 23


2.1 TỔNG QUAN VỀ NHẬN DẠNG ẢNH................................................ 23
2.1.1 Mô hình nhận dạng ảnh................................................................... 23
2.1.2 Bản chất nhận dạng ảnh .................................................................. 25
2.2 MỘT SỐ CÁCH TIẾP CẬN TRONG NHẬN DẠNG ẢNH .................. 26
2.2.1 Nhận dạng dựa vào phân hoạch không gian. ................................... 27
2.2.2 Nhận dạng dựa vào cấu trúc ............................................................ 29
2.2.3 Nhận dạng dựa vào kỹ thuật mạng nơ ron. ...................................... 31
CHƯƠNG 3. NHẬN DẠNG KÍ TỰ VÀ BÀI TOÁN CHẤM ĐIỂM
THI TRẮC NGHIỆM...................................................................................... 37
3.1 LÝ THUYẾT CHUNG VỀ NHẬN DẠNG KÍ TỰ ................................ 37
3.1.1 Sơ đồ tổng quát của một hệ nhận dạng chữ ..................................... 37
3.1.2 Giai đoạn xử lý sơ bộ ...................................................................... 38
3.1.3 Giai đoạn tách chữ .......................................................................... 42
3.1.4 Một số thuật toán nhận dạng chữ..................................................... 42
3.1.5 Phục hồi văn bản............................................................................. 49
3.2 MỘT SỐ KĨ THUẬT CỤ THỂ TRONG NHẬN DẠNG KÍ TỰ ............ 49

2


3.2.1 Kỹ thuật nhận dạng dòng văn bản ................................................... 49
3.2.2 Kỹ thuật xác định từng kí tự trong một dòng................................... 50
3.2.3 Nhận dạng....................................................................................... 53
3.2.4 Học ................................................................................................. 54
3.2.5 Phục hồi văn bản............................................................................. 54
3.3 NHẬN DẠNG CHỮ VIẾT TAY ........................................................... 55
3.3.1 Đặt vấn đề....................................................................................... 55
3.3.2 Phân tích bài toán............................................................................ 55
3.3.3 Một ý tưởng đơn giản cho bài toán nhận dạng chữ viết tay.............. 56
3.4 ỨNG DỤNG TRONG CÔNG TÁC CHẤM ĐIỂM THI TRẮC NGHIỆM

.......................................................................................................... 56
3.4.1 Đặt vấn đề....................................................................................... 56
3.4.2 Phân tích bài toán............................................................................ 57
3.4.3 Cách giải quyết bài toán.................................................................. 57
3.5 GIỚI THIỆU CHƯƠNG TRÌNH NHẬN DẠNG KÍ TỰ VÀ ỨNG DỤNG
TRONG CÔNG TÁC CHẤM ĐIỂM THI TRẮC NGHIỆM........................ 58
3.5.1 Chương trình nhận dạng kí tự......................................................... 59
3.5.2 Chương trình chấm điểm thi trắc nghiệm ....................................... 61
3.5.3 Chương trình nhận dạng chữ viết tay.............................................. 62
3.5.4 Chương trình soạn thảo văn bản ..................................................... 62
TÀI LIỆU THAM KHẢO ............................................................................... 63
PHỤ LỤC........................................................................................................ 64


Mã nguồn một số module chính ........................................................ 64


Chuẩn hóa trang giấy ........................................................................ 64

3




Xác định dòng................................................................................... 65



Xác định biên kí tự............................................................................ 66




Nhận dạng......................................................................................... 67



Học ................................................................................................... 68



Một số hàm trong nhận dạng chữ viết tay.......................................... 69



Một số hàm cơ bản phuc vụ hàm nhận dạng chữ viết tay................... 70



Nội dung đĩa CD đi kèm.................................................................... 73


Tài liệu báo cáo đề tài ....................................................................... 73



Chương trình cài đặt.......................................................................... 73



Hướng dẫn sử dụng ........................................................................... 73


NHẬN XÉT .................................................................................................... 74

4


LỜI NÓI ĐẦU
Hiện nay, trên thế giới nhu cầu chuyển đổi qua lại giữa các loại dữ liệu là
rất lớn. Để đáp ứng nhu cầu này cũng đã có rất nhiều phần mềm được tạo ra và
phần nào đã giải quyết được những nhu cầu đó. Tuy nhiên những phần mềm
chuyển đổi giữa kí tự có trong một tập tin ảnh sang một tập tin văn bản thì chưa
nhiều về số lượng cũng như còn hạn chế về chất lượng và giá cả.
Không nằm ngoại lệ, ở Việt Nam hiện nay, các phần mềm nhận dạng kí tự
không nhiều do sự khó khăn trong công tác nhận dạng cũng như xử lý nhiễu.
Việc nhận dạng kí tự tiếng Việt lại càng phức tạp hơn do số lượng kí tự nhiều, tỷ
lệ nhiễu rất cao. Không những vậy giá thành còn chưa thực sự phù hợp với phần
đông người dùng. Đề tài “Nhận dạng ký tự và ứng dụng chấm điểm thi trắc
nghiệm” sẽ là một đề tài có ý nghĩa xã hội cao do nó cung cấp cho mọi người
một ứng dụng miễn phí để giải quyết vấn đề nhận dạng kí tự tiếng Việt.
Viêc áp dụng thuật toán nhận dạng còn có thể được ứng dụng trong việc
chấm điểm thi trắc nghiệm tự động, với tốc độ cao, độ chính xác đảm bảo, đặc
biệt tạo tính nghiêm minh khách quan.

5


CHƯƠNG 1. TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1 MỘT SỐ ĐỊNH NGHĨA CƠ BẢN
1.1.1 Xử lý ảnh
Kỹ thuật xử lý ảnh: là quá trình biến đổi một hình ảnh thành một hình ảnh

khác bằng máy tính điện tử một cách tự động phụ thuộc vào mục đích của người
sử dụng.
Hệ thống xử lý ảnh trên máy tính: là tập hợp các kỹ thuật xử lý ảnh phục
vụ cho một mục đích ứng dụng nào đó.

1.1.2 Ảnh số
Ảnh tạo bởi các điểm ảnh, điểm ảnh có vô vàn thứ, ví dụ như: ảnh chân
dung, ảnh X- quang, ảnh thân nhiệt. Điểm ảnh đặc trưng cho một giá trị nào đó là
một hàm n biến.
Ảnh được xem như là một tập hợp các điểm ảnh. Khi được số hoá nó
thường được biểu diễn là ma trận hai chiều a[i][j] mà mỗi phần tử có một giá trị
nguyên hoặc là một véc tơ cấu trúc màu.
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng.
Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong quá
trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá
trình lấy mẫu (rời rạc hoá về không gian) và lượng tử hoá thành phần giá trị mà
về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau. Trong
quá trình này người ta sử dụng khái niệm điểm ảnh được gọi từ picture element.

1.1.3 Điểm ảnh
Điểm ảnh hay còn gọi là pixel (picture element, pels, image elements)
được xem như là dấu hiệu hay cường độ sáng tại một toạ độ trong không gian của
đối tượng.

6


1.1.4 Mức xám
Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗi
điểm ảnh với một giá trị số - kết quả của quá trình lượng hoá.

Ví dụ: xem cả lớp là một ảnh, mỗi người là một điểm ảnh. mỗi người có một đặc
trưng. Nếu xem về đặc trưng giới tính thì ảnh có 2 mức xám là: nam và nữ. Nếu
xem năm cuối của năm sinh thì ảnh có nhiều nhất 10 mức xám.
Khái niệm điểm không có kích thước.
Ảnh

Số bit/pixel

Số màu

Ảnh đen trắng

1

2

Ảnh đa cấp xám

8

256

Ảnh RGB

24

256 3

Ảnh 32 bit (true color + 32


256 4

độ sâu)

1.1.5 Kỹ thuật xử lý ảnh
Kỹ thuật xử lý ảnh là quá trình biến đổi một hình ảnh thành một hình ảnh
khác bằng máy tính điện tử một cách tự động phụ thuộc vào mục đích của người
sử dụng.

1.1.6 Hệ thống xử lý ảnh trên máy tính
Hệ thống xử lý ảnh trên máy tính là tập hợp các kỹ thuật xử lý ảnh phục
vụ cho một mục đích ứng dụng nào đó.
Phân biệt đồ họa máy tính và xử lý ảnh: đồ hoạ máy tính thiên về tổng hợp
hình ảnh, còn xử lý ảnh thiên về phân tích hình ảnh.
Đồ hoạ máy tính:
Đầu vào: là ảnh hoặc không là ảnh.
Đầu ra: là một ảnh trên máy tính.

7


Xử lý ảnh:
Đầu vào: là ảnh.
Đầu ra: là ảnh “tốt hơn” (theo nghĩa của người sử dụng).
hoặc một đặc điểm hoặc một dãy đặc điểm.
Trong đồ hoạ máy tính, đối tượng xử lý là 2 hoặc 3 chiều. Còn xử lý ảnh
không chỉ làm việc với dữ liệu 2 chiều hay 3 chiều có khi nhiều hơn.

1.1.7 Thị giác máy
Thị giác máy là một hệ xử lý ảnh hoàn chỉnh bao gồm thu nhận ảnh, tăng

cường chất lượng ảnh, nhận dạng.

1.2 THU NHẬN ẢNH VÀ THÔNG TIN VỀ ẢNH
1.2.1 Thu nhận ảnh
Các thiết bị thu ảnh thông thường gồm Camera cộng với bộ chuyển đổi
tương tự số AD (Analog to Digital), scanner, sensor.
Scanner
A4: ADF (Automatic Document Feeder), Duplex.
A3: Fujitshu, Vííonhape cầm tay
A0: Intergraph 250 µp

Các thiết bị thu nhận ảnh này có thể cho ảnh đen trắng, đa cấp xám, ảnh
màu, có độ phân giải từ 100 đến 1600 DPI (dot per inch).
Các thiết bị thu nhận ảnh có 2 loại chính ứng với 2 loại ảnh thông dụng là
Raster (Scaner, camera) và vector (sensor, bàn số hoá, hoặc được chuyển từ ảnh
Raster).
Nhìn chung các hệ thống thu nhận ảnh thực hiện hai quá trình:
+ Cảm biến: biến đổi năng lượng quang học thành năng lượng điện.
+ Tổng hợp năng lượng điện thành năng lượng ảnh.
Trong quá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời
rạc thông qua quá trình lấy mẫu và lượng tử hoá thành phần giá trị.

8


Cảm nhận màu
Phần nhạy cảm với ảnh: võng mạc.
Retina bao gồm hai loại tế bào: rods (dạng hình que) và cones (dạng hình
nón).
Cone nhạy với màu sắc.

Các tế bào que cho một hình ảnh chung về trường chiếu sáng, nó không
nhạy với màu sắc mà nhạy với ánh sáng có mức thấp.

Biểu diễn màu
Ánh sáng màu là tổ hợp của ánh sáng đơn sắc. Mắt người chỉ có thể cảm
nhận được vài chục màu. Song lại có thể phân biệt tới hàng ngàn màu:
Brightness: sắc màu, còn gọi là độ chói.
Hue: sắc lượng hay còn là sắc thái màu.
Saturation: độ bão hoà.
Với nguồn sáng đơn sắc, độ hue tương ứng với bước sóng  [380nm,
780 nm].

Hình 1.1 Mắt người

9


1.2.2 Thông tin về ảnh
 Chiều rộng: số pixel/ dòng ( số byte/dòng).
 Chiều cao: số dòng.
 độ phân giải: số pixel/inch thường là 300dpi (dots per inch).

 số bit/ pixel.
1 bit↔ đen, trắng (2 màu).
4 bit↔16 màu.
8 bit↔256 màu.
n bít ↔ 2n màu.
số bit/ pixel ≤ 8 phải có pallete màu.
> 8 dùng màu trực tiếp.


header

palette

infor

R

G

B

R

G

B

palette

i

data
Pal: palette.
Pal[index].R, Pal[index].G, Pal[index].B,
16 bit/pixel

10



1

5

5

5

R

G

B

24 bit/pixel, mỗi phần màu là một byte

8

8

8

R

G

B

 ảnh có 3 giá trị R G B là ảnh đa cấp xám không cần lưu giá trị palatte vì
bản thân nó là giá trị điểm ảnh (pallete đúng bằng chỉ số giá trị điểm ảnh).


1.3 CẤU TRÚC TẬP TIN ẢNH BITMAP
Ảnh Bitmap là một trong rất nhiều định dạng chuẩn thường gặp, có phần
mở rộng là *.BMP, được Microsoft Corporation đưa ra lần đầu tiên trong phiên
bản Windows 3.0 trở lên. Mỗi ảnh Bitmap đều gồm 3 phần chính là:
+ Bitmap header.
+ Palette màu.
+ Bitmap data.
Trong đó phần Bitmap header chứa thông tin chung về file, và các thông
tin về ảnh, khuôn dạng.
Sau phần Header và bảng màu là phần chứa dữ liệu của file ảnh, phần này
nằm ngay sau phần Palette, đây là phần chứa giá trị màu của điểm ảnh trong
Bitmap. Các dòng ảnh được lưu trữ từ dưới lên trên, các điểm ảnh được lưu từ
trái sang phải, trong đó giá trị của mỗi điểm ảnh là một số trỏ tới phần tử màu
tương ứng của phần Palette ảnh. Số bit dành cho riêng một pixel sẽ xác định số
lượng màu cho pixel đó.

11


Ví dụ như nếu mỗi pixel được thể hiện bởi 4 bits, thì khi đó số lượng màu
mà pixel có thể xác định là 16 màu. Bảng sau thấy mối liên hệ giữa số bit trên
một pixel với số màu mà pixel có thể thể hiện:

Bits/pixel

Số màu pixel thể hiện

1


2^1=2

2

2^2=4

4

2^4=16

8

2^8=256

16

2^16=65536

24

2^24 = 16, 777, 216

Hình sau cho thấy các giá trị màu của một ảnh Bitmap mà 1 pixel được thể
hiện bởi 24 bit (mỗi màu RGB được xác định bởi 8 bits):

Hình 1.2 Bảng màu của ảnh Bitmap 24 bit/pixel
Trên thực tế thường gặp nhất là loại ảnh bitmap với 24 bits/pixel, do định
dạng của ảnh nhị phân không được nén nên nó không thích hợp cho việc truyền
tải trên môi trường mạng. Một khái niệm khác liên quan đến định dạng file
Bitmap không thể không nhắc đến là “Bitmap độc lập với thiết bị” hay còn gọi là

Device-Independent Bitmap (DIB). DIB bao gồm một bảng màu mô tả làm sao

12


để các giá trị điểm ảnh có thể tương ứng những giá trị màu R G B, điều đó cũng
mô tả màu sắc được tạo ra từ sự phát sáng. Vì vậy DIB có thể thể hiện được màu
sắc thích hợp trên bất kì thiết bị nào, DIB bao gồm những thông tin về màu sắc
và kích thước như sau:
+ Khuôn dạng màu sắc của thiết bị mà trên đó ảnh được tạo ra.
+ Độ phân giải của thiết bị tạo ra ảnh.
+ Bảng màu cho thiết bị tạo ra ảnh.
+ Một mảng những bit ánh xạ bộ màu Red, Green, Blue tới những pixel
trong khung ảnh hình chữ nhật .
Xác định chế độ nén dữ liệu được thể hiện bởi lược đồ nén (nếu có ) để
giảm bớt kích thước của mảng bit.
Thông tin về kích thước và màu sắc được lưu trữ trong cấu trúc
BitmapInfor, trong đó cũng chứa đựng cấu trúc BitmapInforHeader theo sau bởi
hai hay nhiều cấu trúc RGBQuad. Cấu trúc BitmapInforHeader chỉ ra kích thước
của khung pixel hình chữ nhật, kĩ thuật màu sắc của thiết bị và lược đồ nén được
sử dụng để giảm bớt kích thước của ảnh bitmap. Cũng cấu trúc RGBQuad lại xác
định những màu xuất hiện trên các pixel đó. Có hai sự khác biệt của DIB đó là:
+ DIB từ dưới lên, tức là dòng ảnh đầu tiên sẽ là ở dưới cùng bắt đầu từ
bên trái.
+ DIB từ trên xuống, dòng ảnh đầu tiên ở trên cùng bên trái.

1.4 MÔ HÌNH MÀU
1.4.1 Các mô hình màu
Ánh sáng mà con người nhận biết (hay màu khác nhau) là dải tần hẹp
trong quang phổ điện từ.


13


Hình 1.3 Quang phổ

Xét cấu tạo của mắt và việc nhìn thì tất cả các màu đều là liên kết của 3
màu sơ cấp: đỏ (R), lục(B), lam(G). Bước sóng của 3 màu cơ bản là: B = 435,8
nm; G = 546,1 nm; R = 700nm.
a) RGB
Mô hình màu RGB được biểu diễn bởi lập phương với các trục R, G, B.
Gốc biểu diễn màu đen.
Tọa độ (1, 1, 1) biểu diễn màu trắng.
Tọa độ trên các cạnh trục biểu diễn các màu cơ sở.
Các cạnh còn lại biểu diễn màu bù cho mỗi màu cơ sở.

14


Black (0,0,0)

Green (0,1,0)

Cyan (0,1,1)
Blue (0,0,1)
yellow (1,1,0)
Red (1,0,0)
White (1,1,1)
Magenta (1,0,1)


Hình 1.4 Mô hình màu RGB

Đường chéo từ (0, 0, 0) đến (1, 1, 1) là biểu diễn màu xám.
Cho 2 điểm ảnh P1 (r1, g1, b 1), P2 (r2, g2, b2)
khoảng cách Ơcơlit giữa 2 màu
= (r1  r 2)2  ( g1  g 2) 2  (b1  b2)2
Khoảng cách Hamono labus
=(x-y)T A(x-y)
A là ma trận xác định dương xTAx >0
Biểu đồ RGB thuộc mô hình cộng:
Phát sinh màu mới bằng cách cộng cường độ màu cơ sở
Gán giá trị từ 0 đến 1 cho R, G, B
Red+Blue → Magenta (1, 0, 1)
Nhận xét
+ Mô hình này không thể biểu diễn mọi màu trong phổ nhìn thấy.
+ Đủ cho các ứng dụng máy tính.
+ Màn hình máy tính và TV sử dụng mô hình này.
+ Được sử dụng rộng rãi nhất.
+ Đơn giản và nó được sử dụng rộng rãi nhất biểu diễn trong hệ nhị
phân.

15


Red = 4, Green = 2, Blue = 1, Magenta = R + B = 5, Yellow = R + G = 6,
Cyan = G + B = 3, Black = 0, White = 7.
b)

CMY, CMYK:


Mô hình màu xác định bởi các màu cơ sở cyan, magenta và yellow dành
cho máy in màu. Mô hình CMY là bù của mô hình RGB.
Biểu đồ CMY thuộc loại mô hình trừ.

CMY (cộng tính)

Hình 1.5 Mô hình CMY cộng tính
CMYK(trừ tính)

Hình 1.6 Mô hình CMYK(trừ tính)
C) HSV

H (Hue) bước sóng gốc của ánh sáng.
S (Saturation) thước đo độ tinh khiết ánh sáng gốc.
Biểu diễn tỷ lệ tinh khiết của màu sẽ chọn với độ tinh khiết cực đại.
V (value) cường độ hay độ chói ánh sáng.

16


Mô hình HSV suy diễn từ mô hình RGB.
Hãy quan sát hình hộp RGB theo đường chéo từ White đến Black (gốc) ta
sẽ có hình lục giác.
Sử dụng làm đỉnh hình nón HSV
0  H  360

0  S , V  1

V=0,màu đen. Đỉnh lục giác có màu cực đại
Red=(0 0, 1, 1)

Green=(120 0, 1, 1)
Blue=(2400, 1, 1)
Mô hình HSV trực giác hơn mô hình RGB.
+ Bắt đầu từ Hue (H cho trước và V=1, S=1).
+ Thay đổi S: Bổ sung hay bớt trắng.
+ Thay đổi V: Bổ sung hay bớt đen.
+ Cho đến khi có màu mong muốn.

Red
Magenta

Yellow
White

Blue

Green
Cyan

RGB

17


V
White

Tints (add
white)


Pure Hue

Tones
(add
B&W)
Shades (add black)

Black

S

Hình 1.7 Mô hình HSV
Mắt người có thể phân biệt 128 Hues, 130 tints và cực đại 30 shades
(Yellow):
128 x 130 x 30 = 382 720 màu khác nhau.
H ↔130 mức
S, V↔ 23 mức
Tổ hợp màu 130x23x23 là khoảng 16 triệu màu. Có thể truyền theo kênh
tivi bằng HSV nhưng trên màn hình là RGB.
d) HSI
Hue

130 mứcH

Saturation

23 mức S

Intension


23 mức I (cường độ sáng)

18


1.4.2 Chuyển đổi các mô hình màu
RGB chuyển đổi sang HSV, CMY, HIS và ngược lại.
RGB ↔ CMY

R  C  1

G  M  1
B  Y  1


C  C  K

CMYK, K=min (C, M, Y ) M  M  K
Y  Y  K


1.5 CÁC GIAI ĐOẠN TRONG XỬ LÝ ẢNH
Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay
một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta sẽ
xem xét các bước cần thiết trong xử lý ảnh.
Đầu tiên là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera.
Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu
CCIR), nhưng cũng có thể là tín hiệu số hoá (loại CCD - Charge Coupled
Device).


Thu nhận ảnh

Tiền xử lý

Trích chọn
dấu hiệu

Học

Hậu xử lý

Nhận dạng
Hình 1.8 Các giai đoạn chính trong xử lý ảnh

19


1.5.1 Thu nhận ảnh
Ảnh có thể thu nhận qua camera (thường ảnh thu nhận qua camera là tín
hiệu tương tự cũng có thể là tín hiệu số hoá), từ vệ tinh qua các bộ cảm ứng
(sensor) hay ảnh, tranh được quét trên scanner.
Sau đó ảnh được số hoá để biến đổi tín hiệu tương tự sang tín hiệu rời rạc
(lấy mẫu) và số hoá bằng lượng hoá.

1.5.2 Tiền xử lý
Làm tốt các ảnh để nâng cao chất lượng ảnh (xoá nhiễu, tăng cấp sáng,
làm trơn các biên, lọc, tăng độ tương phản…).
Do những nguyên nhân khác nhau: có thể do chất lượng thiết bị thu nhận,
do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến, do vậy cần phải tăng cường
và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho

ảnh gần giống nhất với trạng thái gốc - trạng thái trước khi ảnh bị biến dạng
(Photoshop dừng ở giai đoạn này).

1.5.3 Trích chọn dấu hiệu
Phát hiện các đặc tính như biên, phân vùng ảnh, trích chọn các đặc tính…
tuỳ thuộc vào từng ứng dụng.
Mỗi đối tượng ảnh có đặc trưng riêng phụ thuộc phương pháp nhận dạng,
một ứng dụng có nhiều phương pháp nhận dạng, mỗi phương pháp nhận dạng có
nhiều phương pháp chọn dấu hiệu.

1.5.4 Nhận dạng
Nhận dạng ảnh: là quá trình liên quan đến các mô tả đối tượng mà người
ta muốn đặc tả nó.
Nhận dạng bao gồm: nhận dạng chữ(chữ in, chữ viết tay), vân tay, mã
vạch, mặt người …

20


1.6 CÁC MỨC ĐỘ CỦA HỆ THỐNG XỬ LÝ ẢNH
-Mức độ thấp: chỉ biết sử dụng các kỹ thuật xử lý ảnh đơn giản, thuần tuý,
không có tri thức.
-Trung bình: có một chút về tri thức (trí tuệ nhân tạo).
-Cao: thu nhận ảnh, xử lý, nhận dạng, phân tích ảnh, ra quyết định.

1.7 ỨNG DỤNG CỦA XỬ LÝ ẢNH
 Văn phòng: hệ thống nhận dạng chữ, nhận dạng tiếng Anh, tiếng Việt
Image→Table + Text + Image : nhận dạng được cả chữ, ảnh, bảng.
Image→f orm.
Nhận dạng chữ OCR (Optical charater Recognition),

Nhận dạng nhãn OMR (Optical Mark Recognition).
Nhận dạng tiếng Anh.
Omnipage 12.0 của hang Scansoft, Fine Reader 6.0 của hang ABBRY.
Nhận dạng tiếng việt.
VN Docr của Viện CNTT, Image Scan của công ty Tcapro.
 Kiểm tra sản phẩm
So sánh mầu của sản phẩm mẫu với sản phẩm mới.
Kiểm tra độ tròn của chai, lọ.
 Nhận dạng công nghiệp, y học, thương mại, điều tra khoáng sản.
 Địa lý: véc tơ hoá bản đồ.
Các phần mềm chuyển đổi ảnh Raster sang ảnh vector.
R2V của hãng Able.
MapScan của Viện CNTT.
TrixSystem R2V và V2R.
 Hoạt hình: biến đổi hình học, bóp méo hình học.
 Quân sự.
 Dự báo thời tiết, cháy rừng, lũ lụt, sâu bệnh, khoáng sản.
 Thiên văn học, vật lý, sinh học.

21


 An ninh.
Nhận dạng vân tay,Water Marking.
Nhận dạng khuôn mặt người, nhận dạng tội phạm.
Dấu thông tin trong ảnh.
Chống bạo lực: dùng camera để phát hiện ra sự an toàn ở nơi công
cộng.
 Siêu thị
Bar code: nhận dạng mã vạch.

Các robot tự động phục vụ.
Ngoài ra có ứng dụng trong y học làm nổi các ảnh, trong thiên văn học để
khôi phục lại ảnh do tác động của khí quyển hay nén ảnh trong truyền đi xa hoặc
lưu trữ.

22


CHƯƠNG 2. NHẬN DẠNG ẢNH
2.1 TỔNG QUAN VỀ NHẬN DẠNG ẢNH
Nhận dạng ảnh là quá trình liên quan đến mô tả các đối tượng mà người ta
muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc
tính chủ yếu của đối tượng.

2.1.1 Mô hình nhận dạng ảnh
Nhìn chung, dù là mô hình nào và kỹ thuật nhận dạng ra sao, một hệ thống
nhận dạng có thể tóm tắt theo sơ đồ sau:

Trích chọn đặc tính
biểu diễn đối tượng

Phân lớp

trả lời

ra quyết định

Quá trình tiền xử lý

Đánh

giá

Khối nhận dạng

Hình 2.1 Sơ đồ tổng quát một hệ nhận dạng.
Việc chọn lựa một quá trình nhận dạng có liên quan mật thiết đến kiểu mô
tả mà người ta sử dụng để đặc tả đối tượng. Trong nhận dạng, người ta phân chia
làm 2 họ lớn:
- Họ mô tả theo tham số.
- Họ mô tả theo cấu trúc.
Cách mô tả được lựa chọn sẽ xác định mô hình của đối tượng. Như vậy,
với hai họ mô tả trên chúng ta sẽ có hai loại mô hình: mô hình theo tham số và
mô hình cấu trúc.
2.1.1.1 Mô hình theo tham số
Sử dụng một véctơ để đặc tả đối tượng. Mỗi phần tử của véctơ mô tả một
đặc tính của đối tượng. Thí dụ như trong các đặc trưng chức năng, người ta sử

23


dụng các hàm cơ sở trực giao để biểu diễn. Và như vậy ảnh sẽ được biểu diễn bởi
một chuỗi các hàm trực giao.
2.1.1.2 Mô hình theo cấu trúc
Cách tiếp cận của mô hình này dựa vào việc mô tả đối tượng nhờ một số
khái niệm biểu thị các đối tượng cơ sở trong ngôn ngữ tự nhiên. Để mô tả đối
tượng, người ta dùng một số dạng nguyên thuỷ như đoạn thẳng, cung, vv…
Chẳng hạn một hình chữ nhật được định nghĩa gồm bốn đoạn thẳng vuông góc
với nhau từng đôi một.
Trong mô hình này người ta sử dụng một bộ kí hiệu kết thúc Vt, một bộ kí
hiệu không kết thúc gọi là Vn. Ngoài ra có dùng một tập các luật sản xuất để mô

tả cách xây dựng các đối tượng phù hợp dựa trên các đối tượng đơn giản hơn
hoặc đối tượng nguyên thuỷ (tập Vt).
Trong cách tiếp cận này, ta chấp nhận một khẳng đinh là: cấu trúc một
dạng là kết quả của việc áp dụng luật sản xuất theo theo những nguyên tắc xác
định bắt đầu từ một dạng gốc bắt đầu. Một cách hình thức, ta có thể coi mô hình
này tương đương một văn phạm G = (Vt, Vn, P, S) với:
- Vt là bộ ký hiệu kết thúc,
- Vn là bộ ký hiệu không kết thúc,
- P là luật sản xuất,
- S là dạng (ký hiệu bắt đầu).
Thí dụ, đối tượng nhà gồm mái và tường, mái là một tam giác gồm 3 cạnh
là 3 đoạn thẳng, tường là một hình chữ nhật gồm 4 cạnh vuông góc với nhau từng
đôi một sẽ được mô tả thông qua cấu trúc mô tả dựa vào văn phạm sinh như chỉ
ra trong hình dưới đây.

24


(1)

(2)

Nhà

(3)
Mái

(6)

Tường


(4)
Đọạn 1 Đoạn 2 Đoạn 3 Đoạn 3 Đoạn 4 Đoạn 5 Đoạn 6
(5)

Hình 2.2 Mô hình cấu trúc của một đối tượng nhà.

2.1.2 Bản chất nhận dạng ảnh
Quá trình nhận dạng gồm ba giai đoạn chính:
- Lựa chọn mô hình biểu diễn đối tượng.
- Lựa chọn luật ra quyết định (phương pháp nhận dạng) và suy diễn quá
trình học.
- Học, nhận dạng.
Khi mô hình biểu diễn đối tượng đã được xác định, có thể là định lượng
(mô hình tham số) hay định tính (mô hình cấu trúc), quá trình nhận dạng chuyển
sang giai đoạn học. Học là giai đoạn rất quan trọng. Thao tác học nhằm cải thiện,
điều chỉnh việc phân hoạch tập đối tượng thành các lớp.
Việc nhận dạng chính là tìm ra quy luật và các thuật toán để có thể gán đối
tượng vào một lớp hay nói một cách khác gán cho đối tượng một tên. Cho đến
nay, công tác nhận dạng ảnh vẫn được thực hiện thông qua hai kỹ thuật chính đó
là: học có thầy và học không có thầy.
2.1.2.1 Học có thầy
Kỹ thuật phân loại nhờ kiến thức biết trước gọi là học có thầy. Đặc điểm
cơ bản của kỹ thuật này là người ta có một thư viện các mẫu chuẩn. Mẫu cần
nhận dạng sẽ được đem sánh với mẫu chuẩn để xem nó thuộc loại nào.
Thí dụ như trong một ảnh viễn thám, người ta muốn phân biệt một cánh
đồng lúa, một cánh rừng hay một vùng đất hoang mà đã có các miêu tả về các đối
tượng đó. Vấn đề chủ yếu là thiết kế một hệ thống để có thể đối sánh đối tượng
trong ảnh với mẫu chuẩn và quyết định gán cho chúng vào một lớp. Việc đối


25


×