Tải bản đầy đủ (.pdf) (76 trang)

Xây dựng phần mềm nhận dạng hộ chiếu và làm thủ tục xuất nhập cảnh tại cửa khẩu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.44 MB, 76 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
VŨ TUẤN LÂM

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------

Vũ Tuấn Lâm

CÔNG NGHỆ THÔNG TIN

XÂY DỰNG PHẦN MỀM NHẬN DẠNG HỘ CHIẾU VÀ LÀM THỦ
TỤC XUẤT NHẬP CẢNH TẠI CỬA KHẨU

LUẬN VĂN THẠC SỸ KHOA HỌC
CÔNG NGHỆ THÔNG TIN

KHÓA 2009 - 2011
Hà Nội - 2011


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-----------------------------------------

Vũ Tuấn Lâm

XÂY DỰNG PHẦN MỀM NHẬN DẠNG HỘ CHIẾU VÀ LÀM THỦ
TỤC XUẤT NHẬP CẢNH TẠI CỬA KHẨU

Chuyên ngành: Công nghệ thông tin
Mã đề tài: NTT09-50



Người hướng dẫn khoa học:
TS Tạ Tuấn Anh

Hà Nội - 2011


MỤC LỤC
Trang

Danh mục các từ ngữ tiếng Anh
Danh mục hình vẽ, đồ thị
MỞ ĐẦU
1. Đặt vấn đề

4
4
8
8

2. Mục đích nghiên cứu của luận văn

10

3. Cơ sở nghiên cứu

11

4 Cấu trúc của luận văn


11

5. Phương pháp nghiên cứu

12

Chương 1: NHẬN THỨC CHUNG VỀ NHẬN DẠNG HỘ CHIẾU

13

1. Hộ chiếu là gì?

13

2. Đặc điểm hộ chiếu

14

3. Quy trình nhận dạng hộ chiếu

17

Chương 2 : MỘT SỐ PHƯƠNG PHÁP NHẬN DẠNG KÝ TỰ

20

I- Sử dụng mạng Neural nhân tạo

20


1. Khái niệm mạng Nueral

20

2. Mô hình mạng Nueral

22

3. Xây dựng mạng Nueral

23

4. Huấn luyện mạng Nueral

24

4.1 Phương pháp học

24

4.2 Học có giám sát

24

4.3 Học không giám sát

25

4.4 Học tăng cường


25

5. Một số vấn đề của mạng Nueral trong nhận dạng

26

6. Kiến trúc mạng Nueral MLP trong hệ thống nhận dạng

26

6.1. Kiến trúc hệ thống mạng

26

6.2 Phương thức hoạt động

27

6.3 Nhận dạng

29

II Sử dụng hệ mờ để nhận dạng ký tự

30

1. Khái niệm nhận dạng với hệ mờ

30


1


2. Mô hình mờ và kỹ thuật mô hình hóa mờ

31

2.1. Cấu trúc và hoạt động của một mô hình mờ

31

2.2 Phân loại mô hình mờ

31

- Mô hình mờ Mandani

31

- Mô hình mờ Takagi- Sugeno

32

- Mô hình mờ Tsukamoto

32

III- Phương pháp trích chọn đặc trưng kết hợp với SVM (Support Vector
Machine) cho việc nhận dạng


33

1. Đặc điểm

33

2. Một số phương pháp tuyển chọn

33

2.1 Trọng số vùng (Zoning)

34

2.2 Biểu đồ chiếu (Projection Histograms)

34

2.3 Trích chọn chu tuyến (Contour Profiles)

35

2.4 Trích chọn đặc trưng Wavalet Haar

35

2.5 Vector đặc trưng hướng (Direction Feature)

37


3. Nhận dạng sử dụng phương pháp SVM
Chương 3: QUY TRÌNH XỬ LÝ ẢNH NHẬN DẠNG, ỨNG DỤNG
GIẢI THUẬT ARAOKAR CHO VIỆC NHẬN DẠNG HỘ CHIẾU
I- Quy trình thuật toán xử lý ảnh nhận dạng

37
39
39

1. Thu nhận ảnh Hộ chiếu

39

2. Phân tích Văn bản - Ảnh

39

3. Xác định góc nghiêng của Ảnh

42

4. Giảm nhiễu cho ảnh

43

5 Chuyển ảnh về ngưỡng xám

44

6. Chuyển đổi ảnh về dạng nhị phân 2 mầu đen trắng


45

7 . Xác định tọa độ dòng dữ liệu cần nhận dạng

45

8. Xác tọa độ biên ký tự

47

8.1 Xác định tọa độ bên phải, bên trái ký tự

47

8.2 Xác định tọa độ bên trên, bên dưới ký tự

48

9 . Xây dựng ma trận điểm ảnh nhận dạng

49

II. Sử dụng giải thuật Araokar trong nhận dạng hộ chiếu

2

51



1. Đặc điểm giải thuật

51

2. Kích thước dữ liệu đầu vào với giải thuật Araokar

52

3. Cơ chế học của mạng Nueral với thuật toán Araokar

53

4. Kiến trúc mạng Nueral

56

4.1 Kết quả tuyển chọn

56

4.2 Trọng số lý tưởng

57

4.3 Yếu tố nhận dạng

57

5. Các vấn đề về hiệu suất trong nhận dạng


58

6. Một số lưu ý với giải thuật

59

Chương 4: PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG CHƯƠNG TRÌNH

60

I. Phân tích và thiết kế hệ thống theo mô hình UML

60

1. Mô tả chức năng làm thủ tục XNC

60

2. Biểu đồ trình tự

61

3. Biểu đồ trạng thái

62

4. Biểu đồ hợp tác

62


5. Phân tích các trường hợp sử dụng

63

6 . Biểu đồ lớp

64

7. Kết quả đạt được

65

II. Một số giao diện chương trình

66

1. Chương trình chính huấn luyện và nhận dạng tự động

66

2. Tra cứu số liệu XNC

67

3. Thông kê số liệu XNC

68

4. Báo cáo số lượng XNC theo cửa khẩu


68

KẾT QUẢ CÀI ĐẶT VÀ THỬ NGHIỆM HỆ THỐNG

69

ĐỀ XUẤT, KIẾN NGHỊ

70

TÀI LIỆU THAM KHẢO

72

3


DANH MỤC CÁC TỪ NGỮ TIẾNG ANH

ORC -

Optical Character Recognition

ICAO-

International Civil Aviation Organization

SVM -

Support Vecter Machine


SDM -

sequential decision making

MLP-

MultiLayer Perceptron

PH -

Projection Histograms

CC-

Chain Code

WH-

wavelet Haar

CPU-

Control Processing Unit

LC-

Linear Component

PR-


Passpord Reader

SO-

Self Organizing

OL-

Over Learning

RM-

Reasoning Mechanism

FI-

Fuzzification Interface

DI-

Defuzzification Interface

4


DANH MỤC CÁC HÌNH VẼ ĐỒ THỊ
Hình 1: Máy đọc hộ chiếu của hãng IBOX.
Hình 2 : Máy đọc hộ chiếu hãng Keen Sinh
Hình 3: Trang nhân thân của hộ chiếu

Hình 4: Thông tin trên dòng ICAO của hộ chiếu
Hình 5 : Hộ chiếu trẻ em không có số chứng minh nhân dân
Hình 6: Một số hộ chiếu các quốc gia khác
Hình 7: Quy trình nhận dạng hộ chiếu
Hình 8: Mô hình một neural nhân tạo
Hình 9 : Sơ đồ đơn giản về một mạng neural nhân tạo
Hình10 - Sơ đồ đồ thị có hướng đơn giản
Hình 11: Mô hình mạng neural nhiều lớp
Hình 12: Sơ đồ quá trình mô hình hoá mờ và ba giai đoạn chính của nó
Hình 13 - Cấu trúc mô hình mờ.
Hình14: Mô hình mờ Mamdani sử dụng tích và max lần lượt cho phép toán
AND mờ và OR mờ.
Hình15: Mô hình mờ Sugeno
Hình 16: Mô hình mờ Tsukamoto.
Hình17: Trích chọn đặc trưng trọng số vùng
Hình 18: Biểu đồ hình chiếu (Projection histograms)
Hình 19: Trích chọn các khối bên ngoài của chữ
Hình 20: Trích chọn đặc trưng wavelet Haar
Hình 21: Lấy mẫu theo véc tơ đặc trưng hướng.
Hình 22: Tách vùng ký tự nhận dạng
Hình 23: Ảnh bị nghiêng sau khi đươc quét hoặc chụp.
Hình 24: Xác định giới hạn dòng
Hình 25: Quá trình tách kí tự
Hình 26: Xác định giới hạn kí tự
Hình 27: Quá trình chia lưới

5


Hình 28: Quá trình ánh xạ từ ma trận điểm sang ma trận nhị phân

Ảnh 29: Ảnh ma trận I chuyển thành ma trận M
Hình 30: Minh họa 3 ký tự ma trận điểm ảnh S
Hình 31: Ma trận trọng số sau 3 lần huấn luyện
Hình 32: Mô hình mạng nueral nhân tạo cho thuật toán Araokar
Hình 33: Mẫu ký tự S đã được huấn luyện và P chưa được huấn luyện
Hình 34. Sơ đồ dòng thông tin trong hệ thống làm thủ tục XNC
Hình 35 : Biểu đồ trình tự
Hình 36 : Biểu đồ trạng thái
Hình 37 : Biểu đồ hợp tác
Hình 38 : Trường hợp sử dụng quản lý XNC
Hình 39 : Biểu đồ lớp
Hình 40 : Form nhận dạng hộ chiếu
Hình 41: Form tra cứu số liệu XNC
Hình 42: Thống kê danh khách XNC
Hình 43: Báo cáo thống kê theo danh sách cửa khẩu

6


LỜI CẢM ƠN
Được học tập tại Trường Đại học Bách khoa Hà nội chuyên ngành Công nghệ
thông tin. Dưới sự giảng dạy và hướng dẫn nhiệt tình của các thầy cô giáo Viện Công
nghệ Thông tin và truyền thông. Các học viên Cao học khóa 2009 đã hoàn thành
chương trình khóa học và được trang bị các kỹ năng, phương pháp tiếp cận, nghiên
cứu khoa học giải quyết các vẫn đề thuộc về chuyên ngành của mình.
Thực hiện Quyết định số 1772/ QĐ-ĐHBK-SĐH ngày 9 tháng 3 năm 2010 của
Hiệu trưởng trường Đại học Bách khoa Hà nội về việc giao đề tài luận văn Thạc sỹ
cho Học viên Vũ Tuấn Lâm – Số hiệu học viên CB091328 với đề tại “Xây dựng phần
mềm nhận dạng hộ chiếu và làm thủ tục xuất nhập cảnh tại cửa khẩu”, dưới sự
hướng dẫn của TS Tạ Tuấn Anh – Phó Viện trưởng Viện CNTT và Truyền thông –

Đại học Bách khoa Hà nội.
Trong quá trình tiến hành làm luận văn, được sự giúp đỡ và định hướng nghiên
cứu của TS Tạ Tuấn Anh, Tôi đã đi nghiên cứu các vấn đề về Hộ chiếu, ảnh hộ chiếu,
các phương pháp xử lý ảnh và các giải thuật, phương pháp liên quan đến việc nhận
dạng ký tự trên hộ chiếu để xây dựng một chương trình tự động nhận dạng hộ chiếu và
làm thủ tục xuất nhập cảnh tại cửa khẩu.
Tuy nhiên, do thời gian có hạn, mặc dù đã cố gắng nhưng chắc chắn luận văn
còn nhiều điểm thiếu xót. Rất mong nhận được ý kiến đóng góp của các thầy cô giáo
và các bạn đồng nghiệp để luận văn thêm hoàn thiện.
Em xin chân thành cảm ơn TS Tạ Tuấn Anh, người đã định hướng nghiên cứu
và hướng dẫn em nhiệt tình trong quá trình hoàn thành Luận văn này.

7


MỞ ĐẦU
1. Đặt vấn đề
Công nghệ xử lý ảnh và nhận dạng ký tự là một lĩnh vực mới, có tính ứng
dụng thực tế cao, đem lại hiệu quả rõ rệt. Ở Việt Nam xử lý ảnh và nhận dạng là
một ngành khoa học được nghiên cứu và phát triển muộn hơn so với nhiều ngành
khoa học khác nhưng tốc độ phát triển khá nhanh, sự ra đời của nó đã tạo ra các kỹ
thuật quan trọng ảnh hưởng trực tiếp đến các lĩnh vực của đời sống, xã hội.
Trong thực tế, những công viêc, những bài toán thực hiện theo phương thức cũ
sẽ không còn phù hợp nữa. Ngày nay trước yêu cầu hội nhập quốc tế đòi hỏi phải
ứng dụng, tiếp cận những công nghệ mới để thay đổi phương thức thực hiện công
việc đạt hiệu quả cao nhất. Kỹ thuật xử lý hình ảnh và nhận dạng ký tự không nằm
ngoài quy luật đó.
Ở Việt Nam hàng năm số lượng người xuất nhập cảnh qua các cửa khẩu rất
lớn, khoảng trên 4 triệu người 1 năm. Cả nước có hơn 30 cửa khẩu quốc tế (trong đó
có 4 cửa khẩu quốc tế hàng không) và 50 cửa khẩu chính. Việc làm thủ tục xuất

nhập cảnh ở các cửa khẩu là công việc thường xuyên và liên quan đến các thông tin
lưu trên hộ chiếu.
Việc kiểm soát và làm thủ tục xuất nhập cảnh được thực hiện theo đúng quy
trình. Các thông tin sẽ được nhập vào máy tính để lưu trữ, theo dõi quá trình xuất
nhập cảnh của hành khánh. Việc làm này hoàn toàn theo lối thủ công, bằng tay mất
rất nhiều thời gian mà hiệu quả không cao.
Hiện tại ở các cửa khẩu của Việt Nam đã được trang bị một số loại thiết bị
nhận dạng hộ chiếu của nước ngoài nhằm bán tự động quá trình làm thủ tục XNC
cho hành khách, các loại máy đọc có thể kể đến như.
1.1. Máy đọc hộ chiếu IBOX
Đây là thiết bị của Hungary. được lắp giáp tại Việt Nam. Tích hợp với hệ
thống máy tính.
Dòng máy đọc và kiểm tra hộ chiếu đa năng IBOX Passport Multi Reader là
dòng máy chuyên dùng với thuật toán xử lý chặt chẽ và thông minh. Máy được tích
hợp giữa phần cứng tiên tiến với phần mềm nhận dạng OCR, 2D Barcode có độ

8


chính xác chuyên dùng cho việc đọc và kiểm tra Hộ chiếu, Visa và các loại giấy tờ
tuy thân khác một cách hoàn toàn tự động.

Hình 1: Máy đọc hộ chiếu của hãng IBOX.
Nhược điểm: Giá thành cao 11.000USD. trước khi tiến hành nhận dạng phải
có mẫu để căn chỉnh tọa độ. Tích hợp với phần mềm phức tạp và thường xuyên
hỏng hóng. Khi hỏng phải thay thế cả cụm linh kiện, rất tốn kém.
Không thích hợp với thời tiết khí hậu của Việt Nam, hay bị lỗi khi thời tiết bị
ẩm. Đèn tín hiệu cực tím thường xuyên bị cháy.
1.2. Máy đọc hộ chiếu Passpord Reader của hãng Keen Sing


Hình 2 : Máy đọc hộ chiếu hãng Keen Sinh

9


Đây là dòng máy đọc hộ chiếu có tốc độ đọc nhanh, nhưng khả năng nhận
dạng thường bị lỗi và sót ký tự. Việc tích hợp với phần mềm hay bị lỗi, yêu cầu
phải mua phần mềm nhận dạng đi kèm. Giá thành khá cao.
Chi tiết có thể tham khảo tại Website của hãng theo địa chỉ:
/>ort_reader
1.3. Máy đọc hộ chiếu Border Guard.
Nước sản xuất Mỹ. Tích hợp tương ứng như một máy tính kèm thiết bị đọc
hộ chiếu. Nhỏ gọn, có phần mềm nhận dạng đi kèm.
Nhược điểm: cấu hình không cao, chỉ chạy được hệ điều hành WinNT rất
khó khăn trong việc kết nối mạng. Hỏng thường không có thiết bị thay thế. Bóng
đèn tạo ánh sáng trắng hay bị cháy.
Các đời máy thường thay đổi, không thể mua thiết bị thay thế.
Tuy đã được đầu tư các hệ thống máy nhận dạng hộ chiếu mua ở nước
ngoài nhưng có nhược điểm là giá thành quá cao (200 triệu/chiếc). Không làm chủ
được công nghệ khi có sự cố hỏng hóc phải tiến hành thay thế không có trang thiết
bị. Việc tích hợp phần mềm với thiết bị luôn bị trục trặc và yêu cầu về hình ảnh
nhận dạng phải rõ nét theo đúng kích thước quy định sẵn của trang thiết bị.
Từ những nhược điểm trên và xuất phát từ yêu cầu thực tế, cần thiết phải đi
nghiên cứu, xây dựng một chương trình nhận dạng để hoàn toàn làm chủ công
nghệ, thuận tiện trong việc nâng cấp, thay thế phần mềm, giảm giá thành sản phẩm
và có khả năng ứng dụng cao.
2. Mục đích nghiên cứu của luận văn
Mục đích của luận văn là nghiên cứu kỹ thuật xử lý ảnh và nhận dạng ký
tự. Tập trung vào nghiên cứu ứng dụng mạng nueral nhân tạo, thuật toán nhận dạng
Araokar để nhận dạng những thông tin trên hộ chiếu, xây dựng chương trình nhận

dạng hộ chiếu và làm thủ tục xuất nhập cảnh tại cửa khẩu, phát triển thành một ứng
dụng có ý nghĩa thực tiễn.

10


3. Cơ sở nghiên cứu
Dựa trên đầu vào là các đối tượng ảnh hộ chiếu. Đây là một đối tượng khá
phức tạp với dung lượng điểm ảnh, độ sáng tối, môi trường để thu nhận ảnh phong
phú kéo theo nhiễu. Từ đó tiếp cận các phương pháp xử lý ảnh, phương pháp nhận
dạng ký tự để chuyển các thông tin trên ảnh hộ chiếu thành tài liệu sử dụng cho
mục đích làm thủ tục xuất nhập cảnh.
Dựa vào các phương pháp nhận dạng đã và đang được sử dụng như trích
chọn mẫu, máy học, sử dụng mạng nueral với trọng số, các kỹ thuật trong hệ thống
nhận dạng để có cái nhìn tổng thể về nhận dạng ký tự, khắc phục các nhược điểm,
tận dụng các ưu điểm như chất lượng, độ chính xác, tính hiệu quả của những
phương pháp trên, tập trung nghiên cứu kỹ thuật nhận dạng ứng dụng giải thuật
Araokar để nhận dạng thông tin trên hộ chiếu, tối ưu hóa giải thuật, xây dựng
chương trình làm thủ tục XNC.
4 Cấu trúc của luận văn
Luận văn được trình bày thành 4 chương và 1 phụ lục.
Chương 1: Nhận thức chung về nhận dạng hộ chiếu, khái niệm hộ chiếu,
các loại hộ chiếu, các đặc điểm hộ chiếu, những thông tin lưu trữ trên dòng ICAO
của hộ chiếu, các bước tiến hành nhận dạng hộ chiếu.
Chương 2: Tìm hiểu một số phương pháp nhận dạng ký tự đã và đang được
sử dụng như như phương pháp sử dụng mang Nueral nhân tạo, sử dụng hệ mờ để
nhận dạng, phương pháp máy học SVM (Support Vecter Machine).
Chương 3: Quy trình xử lý ảnh với các bài toán con xử lý ảnh nhận dạng,
phân tích giải thuật Araokar, ứng dụng giải thuật này cho việc nhận dạng ký tự trên
hộ chiếu.

Chương 4: Xây dựng chương trình nhận dạng hộ chiếu hỗ trợ việc làm thủ
tục xuất nhập cảnh tại cửa khẩu.

11


5. Phương pháp nghiên cứu
Nghiên cứu cấu trúc, các thông tin trên hộ chiếu, cách thức mã hóa thông tin
cá nhân trên dòng ICAO của hộ chiếu.
Nghiên cứu các phương pháp xử lý ảnh như giảm nhiễu, xoay, tách dòng dữ
liệu cần nhận dạng , cân bằng xám, chuyển ảnh về ma trận nhị phân, phương pháp
lấy mẫu.
Tìm hiểu một số phương pháp nhận dạng ký tự ảnh đã và đang được ứng
dụng từ đó rút ra ưu, khuyết điểm của mỗi phương pháp.
Nghiên cứu giải thuật Araokar về nhận dạng ký tự, ứng dụng giải thuật
Araokar xây dựng các module nhận dạng dòng ICAO của hộ chiếu, xây dựng
chương trình tự động làm thủ tục xnc tại cửa khẩu.

12


Chương 1
NHẬN THỨC CHUNG VỀ NHẬN DẠNG HỘ CHIẾU
1.Hộ chiếu là gì:
Hộ chiếu có hình dạng như một quyển sách nhỏ, có số quản lý của nhà sản
xuất và từ “Hộ chiếu” (PassPort) được in trên nó. Hộ chiếu mang ảnh người được
cấp, chữ ký người có thẩm quyền cấp, đặc điểm nhận dạng và những thông tin cá
nhân để nhận dạng người được cấp.
Chức năng: Chức năng chính của hộ chiếu là để nhận dạng người được cấp
hộ chiếu, là chứng minh thư quốc tế của mỗi cá nhân và và cung cấp các thông tin

cho cơ quan xuất nhập cảnh để làm thủ tục qua lại biên giới giữa các quốc gia.
Các loại hộ chiếu gồm có:
- Hộ chiếu phổ thông: Cấp cho mọi công dân có ý định đi nước ngoài.
- Hộ chiếu công vụ đặc biệt: Cấp cho các công chức đi nước ngoài về
việc công.
- Hộ chiếu ngoại giao: Cấo cho công dân đảm nhận nhiệm vụ tại cơ quan
ngoại giao và lãnh sự ở nước ngoài và thành viên gia đình họ đi theo. Hộ chiếu
ngoại giao còn được cấp cho người đứng đầu nhà nước, Bộ trưởng trong chính phủ,
quan chức lãnh đạo trong quân đội, các giáo sỹ cao cấp, thành viên của đoàn đại
biểu ngoại giao đặc biệt và người đứng đầu đoàn đại biểu các nước dự hội nghị
chính phủ.
- Hộ chiếu thuyền viên: Cấp cho thành viên đoàn thủy thủ của các tầu buôn
của nước cấp hộ chiếu nhằm tạo điều kiện đi lại trên thế giới cùng tầu, thuyền.
2. Đặc điểm hộ chiếu:
- Hộ chiếu thường có 72 trang, 2 trang bìa được làm bằng bìa cứng, có in chữ
PassPort, khâu lại bằng chỉ. Giấy in hộ chiếu là giấy có chất liệu phát quang, với
nhiều hình hoa văn để tránh làm giả , bên trong gồm có trang nhân thân chứa các
thông tin :

13


+ Quốc tịch (Nationality) - Ghi cả tên quốc gia cấp hộ chiếu và mã quốc gia
theo chuẩn ISO 3166-1 alpha-3.
+ Số hộ chiếu (Passport N0)– Là một dãy ký tự, thông thường ký tự đầu tiên
là 1 chữ cái, các ký tự tiếp theo là chữ số.
+ Loại hộ chiếu (Type): Có thể là 1 hoặc 2 ký tự, mỗi loại hộ chiếu được quy
ước sử dụng các ký tự khác nhau. Hộ chiếu phổ thống có ký hiệu là “P”, Hộ chiếu
công vụ “CV”, Hộ chiếu ngoại giao “NG”, Hộ chiếu thuyền viên “TV”.


Hình 3: Trang nhân thân của hộ chiếu
+ Ảnh - Ảnh của người được cấp hộ chiếu, thường là ảnh dán có đóng dấu
nổi quốc huy của quốc gia hoặc được in trực tiếp ảnh lên hộ chiếu để tránh trường
hợp làm giả.
+Họ và tên người được cấp hộ chiếu (Full name): Ghi đầy đủ họ và tên
người được cấp hộ chiếu.
+ Mã số (Code) – Mã quốc tịch 3 ký tự.
+ Ngày sinh (Date of birth) –Ghi đầy đủ ngày tháng năm sinh.
+ Giới tính (Sex) : Nam ghi là M, Nữ ghi là F

14


+ Thời hạn hộ chiếu (Date of expiry):
+ Nơi cấp (Place of issue).
+ Số CMTND (ID Card N0):
Tất cả các thông tin này được mã hóa và ghi vào 02 dòng theo chuẩn của tổ
chức hàng không quốc tế ICAO (International Civil Aviation Organization.
- Ngoài ra trong hộ chiếu còn có thể có các thông thi về nơi cấp, cơ quan cấp,
chữ ký người có thẩm quyền cấp hộ chiếu.
Các thông tin trên dòng ICAO
Loại HC
( 1 ký tự)

Mã quốc tịch
(3 ký tự)

Mã quốc tịch
( 3 ký tự)


Số HC

Phần Họ và tên
(các ký tự tiếp theo đến dấu <)

Ngày sinh
( Năm/tháng/ngày)

GT

Các ký tự dự phòng
hoặc ngăn cách

Ngày hết hạn
( Năm/tháng/ngày)

Số
CMND

Các mã kiểm
tra (Check sum)

Hình 4: Thông tin trên dòng ICAO của hộ chiếu
- Các mã kiểm tra: là một dãy số dùng để kiểm tra tính hợp lệ của hộ chiếu. Từ
dãy số này muốn kiểm tra xem hộ chiếu có bị làm giả không ta sử nhân dãy số với 1
mã số bí mật. Kết quả sẽ được ghi vào chữ số cuối cùng của dòng 2 trên bảng
ICAO.
- Có các trang để dán thị thực các nước.
- Vùng đóng dấu kiểm chứng xuất nhập cảnh mỗi khi qua lại biên giới giữa
các nước.


15


Ảnh 5 : Hộ chiếu trẻ em không có số chứng minh nhân dân
Hiện nay một số nước đã sử dụng hộ chiếu điện tử, đây là hộ chiếu có gắn
chíp bên trong trang nhân thân lưu trữ toàn bộ thông tin cá nhân người cấp hộ chiếu
tuy nhiên số lượng sử dụng chưa nhiều và chủ yếu các nước vẫn sử dụng loại hộ
chiếu thông dụng kể trên.
Trên hộ chiếu, mỗi nước sử dụng các ký tự và cách in khác nhau, tuy nhiên
về cơ bản thông tin trên dòng ICAO theo đúng chuẩn và font chữ giống nhau:

Hình 6: Một số hộ chiếu các quốc gia khác

16


- Mỗi quốc gia có quy định cơ quan cấp hộ chiếu riêng, ở Việt Nam cơ quan
được phép cấp hộ chiếu là Cục quản lý Xuất nhập cảnh – Bộ Công an, các tổng lãnh
sứ quán tại các nước, Bộ ngoại giao.
- Thủ tục cấp hộ chiếu hiện nay cũng khá đơn giản, khai báo các thông tin cá
nhân, chụp ảnh và làm đơn xin cấp hộ chiếu. Thời hạn làm hộ chiếu khoảng 7 ngày
từ khi làm đủ các thủ tục trên.
- Mỗi cá nhân phải quản lý hộ chiếu của mình, khi xuất nhập cảnh tại các cửa
khẩu đều phải xuất trình hộ chiếu, nếu bị mất phải báo cho cơ quan công an để tiến
hành hủy hộ chiếu bị mất.
3. Quy trình và phương pháp nhận dạng hộ chiếu
Nhận dạng hộ chiếu là quy trình nhận dạng từ ảnh hộ chiếu để trích suất
được các thông tin lưu trữ trong dòng ICAO từ đó sử dụng các thông tin này phục
vụ quá trình làm thủ tục XNC tại cửa khẩu.

Đầu vào quá trình nhận dạng là là file ảnh (*.bmp,*.jpg,…) được chụp hoặc
quét từ trang nhân thân chứa các thông tin về người xuất nhập cảnh. Để việc nhận
dạng có độ chính xác vùng nhận dạng (Dòng ICAO) có kích thước 1200 x 180
pixel. Ảnh nhận dạng đã được đưa về ảnh đen trắng và qua quá trình tiền xử lý.
Việc nhận dạng Hộ chiếu và làm thủ tục xuất nhập cảnh diễn ra tại các cửa
khẩu quốc gia, quốc tế . Mỗi cá nhân khi làm thủ tục xuất nhập cảnh tại cửa khẩu
phải xuất trình hộ chiếu, cán bộ làm thủ tục sẽ kiểm tra hộ chiếu, đối chiếu các
thông tin trên hộ chiếu với người mang hộ chiêu, nếu phù hợp sẽ đóng dấu kiểm
chứng để cho công dân đó xuất cảnh hoặc nhập cảnh.
Phương pháp nhận dạng hộ chiếu bao gồm các bước được mô tả như sau:

17


Phân tích ảnh để tách lấy
phần thông tin cần nhận
dạng

Thu nhận ảnh hộ chiếu

Tiền xử lý ảnh

Lấy mẫu, chuyển đổi
sang ma trận điểm ảnh

Xử lý ảnh
- Xác định số lượng dòng
- Tách biên từng ký tự
-


Sử dụng giải thuật
Araokar để nhận dạng

Sử dụng thông tin
nhận dạng làm thủ
tục XNC
Hình 7: Quy trình nhận dạng hộ chiếu

- Thu nhận ảnh hộ chiếu: thực chất là quy trình chụp ảnh, quét ảnh phần
trang thông tin chứa dòng ICAO. Quá trình này có thể sử dụng máy quét canner
Fuji Xerox DocuScan C3200Avới tốc độ quét Tốc độ quét đen trắng 31 tờ/phút độ
phân giải 600x600dpi Optical. 24bit color.
- Phân tích ảnh để tách lấy phần thông tin cần nhận dạng: quá trình này sẽ tách
phần ảnh và phần thông tin cần nhận dạng (dòng ICAO) để đưa vào bước tiếp theo.
- Tiền xử lý ảnh: Đây là quá trình phân ngưỡng, xoay ảnh, cân bằng xám,
chuyển đổi về ảnh đen trắng.
- Xử lý ảnh
+ Xác định vị trí dòng : Xác định tọa độ các dòng dữ liệu cần nhận dạng
+ Tách biên từng ký tự: Xác định tọa biên bên trái, bên phải của ký tự phục vụ
việc nhận dạng

18


- Lấy mẫu, chuyển đổi sang ma trận điểm ảnh: xử dụng giải thuật lấy mẫu để
đưa vào ma trận nhị phân kích thước 20x30 phục vụ quá trình nhận dạng.
- Sử dụng giải thuật Araokar để nhận dạng: sử dụng giải thuật với việc so sánh
ma trận trọng số để đưa ra được ký tự cần nhận dạng từ ma trận điểm ảnh.
- Sử dụng thông tin nhận dạng làm thủ tục XNC: Từ thông tin này, sử dụng
giải thuật tách các thông tin riêng lẻ gồm họ tên, ngày tháng năm sinh, số hộ chiếu,

loại hộ chiếu…và kết hợp với phần mềm làm thủ tục XNC.

19


Chương 2:
MỘT SỐ PHƯƠNG PHÁP NHẬN DẠNG KÝ TỰ
I. Sử dụng mạng neural nhân tạo.
1. Khái niệm mạng neural nhân tạo.
Neural nhân tạo là một đơn vị tính toán có nhiều đầu vào và một đầu ra, mỗi
đầu vào đến từ một liên kết. Đặc trưng của neural là một hàm kích hoạt phi tuyến
chuyển đổi tổ hợp tuyến tính của tất cả các tín hiệu đầu vào thành tín hiệu đầu ra.
Hàm kích hoạt này đảm bảo tính chất phi tuyến cho tính toán của mạng neural.

y1
y2

yk
Đầu vào

a

w1

f

w2
wk
b0
Đầu ra a=f( ∑w’y+b)


Hình 8: Mô hình một neural nhân tạo
Một neural được cầu tạo gồm các thành phần chính : liên kết neural, bộ cộng
, hàm kích hoạt.
Liên kết neural là một thành phần của mạng neural nhận tạo để liên kết giữa
các neural, nó nối đầu ra của neural lớp này với đầu vào của một neural trong lớp
khác. Đặc trưng của thành phần liên kết là một trọng số mà mỗi tín hiệu đi qua đều
được nhân với trọng số này. Các trọng số liên kết chính là các tham số tự do cơ bản
của mạng neural, có thể thay đổi được nhằm thích nghi với môi trường xung quanh.
Bộ cộng dùng để tính tổng các tín hiệu đầu vào của neural, đã được nhân với
các trọng số liên kết tương ứng. phép toán được mô tả ở đây tạo nên một bộ hợp
tuyến tính.

20


Hàm kích hoạt hay còn gọi hàm kích hoạt phi tuyến, chuyển đổi một tổ hợp
tuyến tính của tất cả các tín hiệu đầu vào thành tín hiệu đầu ra. Hàm kích hoạt này
đảm bảo tính chất phi tuyến cho tính toán mạng neural. Nó được xem như là một
hàm giới hạn, nó giới hạn phạm vi biên độ cho phép của tín hiệu đầu ra trong một
khoảng giá trị hữu hạn. Mô hình neural trong hình 1.2 còn bao gồm một hệ số điều
chỉnh b tác động từ bên ngoài. Hệ số điều chỉnh b có tác dụng tăng lên hoặc giảm đi
đầu vào thực của hàm kích hoạt, tùy theo nó dương hay âm.
Bảng 1.1 : Một số hàm kích hoạt cơ bản trong mạng neural:
Tên hàm

Công thức

hardlim


a=0

hardlims

với n < 0

a=1

với n ≥ 0

a = -1

với n < 0

a=1

với n ≥ 0

purelin

a=n

Satlin

a=0

với n < 0

a=n


với 0 ≤ n ≤ 1

a=1

với n > 1

a = -1

với n < 0

a=n

với 0 ≤ n ≤ 1

a=1

với n > 1

satlins

tansig

poslin

a=

en − e−n
1 + e −n

a=0


với n < 0

a=n

với n ≥ 0

21


compet

a = 1 với neural có n lớn nhất
a = 0 với các neural còn lại

logsig

a=

1
1 + e −n

2. Mô hình mạng neural.

Hình 9: Sơ đồ đơn giản về một mạng neural nhân tạo
Mô hình mạng neural ở trên gồm 3 lớp: lớp nhập (input), lớp ẩn(hidden) và
lớp xuất (output). Mỗi nút trong lớp nhập nhận giá trị của một biến độc lập và
chuyển vào mạng.
Dữ liệu từ tất cả các nút trong lớp nhập được tích hợp – ta gọi là tổng trọng số
– và chuyển kết quả cho các nút trong lớp ẩn. Gọi là “ẩn” vì các nút trong lớp này

chỉ liên lạc với các nút trong lớp nhập và lớp xuất, và chỉ có người thiết kế mạng
mới biết lớp này (người sử dụng không biết lớp này).
Các nút trong lớp xuất nhận các tín hiệu tổng trọng hóa từ các nút trong lớp
ẩn. Mỗi nút trong lớp xuất tương ứng với một biến phụ thuộc.

22


3.Xây dựng mạng neural.
Về cơ bản ta có thể hiểu mạng neural là một đồ thị có hướng như hình 1.8.
Trong đó các đỉnh của đồ thị là các neural và các cạnh của đồ thị là các liên kết giữa
các neural.

h1
g1
x

h2

f
g2

h3

Hình10 - Sơ đồ đồ thị có hướng đơn giản
Vì vậy để xây dựng một mạng neural ta xây dựng một đồ thị có hướng: số
đỉnh của đồ thị bằng số neural trong mạng, giá trị của các cạnh chính là trọng số liên
kết neural.
Ví dụ xây dựng một mạng neural đơn giản:
Đầu vào: Cho :

Mạng neural có sô lớp (với sô lớp>1).
Mỗi lớp có số neural trong một lớp (số neural>=1).
Trọng số w liên kiết neural ngẫu nhiên trong khoảng (-a,a).
Đầu ra: Mạng neural nhân tạo.
Kiểu dữ liệu: chọn lưu dữ kiểu mảng :
int số lớp;
int số neural[số lớp];
float w[i][j][k]; với 2<=i<=số lớp, 1<=j,k<=số neural[] ,
Thuật toán.

23


×