Tải bản đầy đủ (.pdf) (25 trang)

Nhận dạng chữ ký trực tuyến

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.33 MB, 25 trang )

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
CƠ SỞ TẠI THÀNH PHỐ HỒ CHÍ MINH

TIỂU LUẬN MƠN HỌC
XỬ LÝ ẢNH

ĐỀ TÀI : NHẬN DẠNG CHỮ KÝ TRỰC TUYẾN

Giảng viên: PGS.TS Lê Hoàng Thái


MỤC LỤC
ĐỀ TÀI: “NHẬN DIỆN CHỮ KÝ ” ............................................... Error! Bookmark not defined.
I .GIỚI THIỆU VỀ SINH TRẮC HỌC CHỮ KÝ TRỰC TUYẾN
1. Giới thiệu về chữ ký trực tuyến
2. Các bước tiến hành
3. Các ứng dụng được áp dụng vào cuộc sống
II.CHỨNG MINH TÍNH HIỆU QUẢ THUẬT TỐN
PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC TRƯNG ............................................................................... 3
1. Harris Corner Detector(HCD). .................................................................................................... 6
A.Giới Thiệu: .................................................................................................................................. 6
B.Cơng Thức Tính Tốn. ................................................................................................................ 6
C.Code Thực Thi: ............................................................................................................................ 9
D.Ưu Và Nhược Điểm .................................................................................................................. 12
2. Scale-Invariant Feature Transform (SIFT). ............................................................................. 12
A.Giới Thiệu. ................................................................................................................................ 12
B.Cơng Thức Tính Tốn. .............................................................................................................. 13
C. Code Thực Thi .......................................................................................................................... 18
D. Ưu Và Nhược Điểm ................................................................................................................. 18
II. Mơ Hình Tổng Qt. ...................................................................................................................... 18
1. Tiền Xử Lý. .................................................................................................................................. 18


2. Kết hợp các đặc trưng để nhận diện .......................................................................................... 21
3. Nhận Dạng Và Huấn Luyện ....................................................................................................... 21
A.Nhận Dạng................................................................................................................................. 21
B.Huấn Luyện ............................................................................................................................... 23


I . GIƯỚI THIỆU VỀ SINH TRẮC HỌC CHỮ KÝ
TRỰC TUYẾN
1. Giới thiệu
Xác minh chữ ký tự động là một lĩnh vực nghiên cứu quan trọng vì sự chấp
nhận của xã hội và luật pháp cũng như việc sử dụng rộng rãi chữ ký viết tay như một
phương pháp xác thực cá nhân . Một ưu điểm khác của chữ ký viết tay như một
phương thức sinh trắc học là nó có thể dễ dàng có được bằng bút mực trên một tờ giấy
hoặc bằng phương tiện điện tử với một số thiết bị dựa trên con trỏ hiện có (ví dụ: bút
máy tính bảng, PDA, Máy tính bảng, màn hình cảm ứng, v.v.)
Phương pháp xác minh chữ ký có thể được phân loại theo thông tin chữ ký đầu vào
thành hai lớp: trực tuyến và off- trực tuyến . Trực tuyến đề cập đến việc sử dụng các
chức năng thời gian của q trình ký động (ví dụ: vị trí quỹ đạo, hoặc áp suất so với
thời gian), thu được bằng cách sử dụng các thiết bị thu nhận như màn hình cảm ứng
hoặc máy tính bảng số hóa. Dịng O đề cập đến việc sử dụng hình ảnh tĩnh của chữ
ký. Chương này đề cập đến việc xác minh chữ ký trực tuyến. . Cũng lưu ý rằng một số
vấn đề trực tuyến có thể được giải quyết bằng các phương pháp trực tuyến , vì một số
thơng tin động có thể được ước tính từ ảnh tĩnh và ngược lại, vì ảnh tĩnh có thể dễ dàng
tạo ra từ thông tin động.

2. CÁC BƯỚC TIẾN HÀNH

2.1 Thu thập và tiền xử lý dữ liệu
Việc thu nhận trực tuyến các chức năng thời gian của chữ ký viết tay thường được thực
hiện bằng cách sử dụng các thiết bị như máy tính bảng số hóa hoặc màn hình cảm ứng,

chẳng hạn như các thiết bị có trong Máy tính bảng và PDA. Các thiết bị thu nhận này
cung cấp thơng tin tọa độ (ví dụ, vị trí bút ngang x và dọc y ) và trong một số trường
hợp, áp lực bút và góc đặt bút so với thời gian. Các thiết bị thu thập chữ ký trực tuyến
khác là bút chuyên dụng có gắn phần cứng chuyên dụng để cung cấp một số dữ liệu chữ
ký trực tuyến như thông tin tọa độ hoặc vận tốc .
2.2 Trích xuất tính năng
Phương pháp hiện có có thể được chia thành hai lớp: dựa trên đặc trưng , trong
đó biểu diễn vectơ tổng thể bao gồm một tập hợp các đặc trưng toàn cục được bắt nguồn
từ quỹ đạo ký hiệu và dựa trên hàm , trong đó thời gian trình tự mơ tả các thuộc tính
cục bộ của chữ ký được sử dụng để nhận dạng.


Cách tiếp cận thứ hai được cho là phù hợp hơn với vấn đề xác minh chữ ký ,chủ yếu
là do sự khác biệt lớn về nội dung thông tin và sự phức tạp giữa những người ký . Tuy
nhiên, cách tiếp cận dành riêng cho người dùng gặp phải thách thức về sự khan hiếm
dữ liệu đào tạo.
2.3 Enrollment
Đăng ký dựa trên tham chiếu thích hợp hơn đăng ký dựa trên mơ hình khi tập hợp
các chữ ký đào tạo nhỏ. Điều này là do các mơ hình thống kê được sử dụng để xác minh
chữ ký yêu cầu ít nhất 4 đến 6 chữ ký đào tạo để hoạt động tốt một cách hợp lý.
Một thách thức lớn liên quan đến giai đoạn thu thập là sự thay đổi thời gian của các
chữ ký .

10.2.4 Similarity Computation

Pre-Alignment
Giai đoạn đối sánh thường được đặt trước bởi sự căn chỉnh trước giữa chữ ký đưa
vào và mẫu / mơ hình đã đăng ký. Trong trường hợp đăng ký dựa trên tham chiếu, việc
căn chỉnh trước thường được tiến hành trước khi trích xuất đối tượng địa lý chỉ dựa trên
hình dạng chữ ký. Khi không sử dụng căn chỉnh trước, căn chỉnh sẽ được nhúng vào

quy trình đối sánh hoặc một khung cố định được sử dụng trong quá trình thu thập để
có các chữ ký căn chỉnh trước .
Matching
Trong các phương pháp tiếp cận dựa trên đặc điểm với đăng ký dựa trên tham
chiếu, điểm phù hợp thường thu được bằng cách sử dụng một số loại thước đo khoảng
cách giữa các vectơ đặc trưng của đầu vào và chữ ký mẫu hoặc một bộ phân loại được
đào tạo.Các thước đo khoảng cách được sử dụng để xác minh chữ ký bao gồm khoảng
cách Euclid, khoảng cách Euclid có trọng số và khoảng cách Mahalanobis.
Trong trường hợp các phương pháp tiếp cận dựa trên tính năng với đăng ký dựa
trên mơ hình, các mơ hình thống kê như ước tính mật độ phi tham số dựa trên Parzen
Windows đã được sử dụng.


Các cách tiếp cận dựa trên chức năng có thể được phân loại thành địa phương và
khu vực tùy thuộc vào chiến lược phù hợp.

10.2.5 Score Normalization
Điểm phù hợp thu được bằng cách so sánh chữ ký đầu vào với tem-plate hoặc mơ
hình đã đăng ký thường được chuẩn hóa thành một phạm vi phổ biến trước khi so
sánh chúng với ngưỡng quyết định, sử dụng các hàm map-ping khác nhau .Bước
chuẩn hóa điểm số này là rất quan trọng khi kết hợp các trình so khớp khác nhau trong
một phương pháp đa sinh trắc học .
Sự khác biệt đáng kể giữa các đối tượng của sự phân bố điểm số phụ thuộc vào
người dùng được quan sát trong xác minh chữ ký có liên quan đến độ phức tạp của
chữ ký và khả năng chống lại các cuộc tấn công giả mạo, nhưng mối quan hệ này
chưa được hiểu đầy đủ.

3. CÁC ỨNG DỤNG THỰC TẾ
Các ứng dụng quan trọng nhất của sinh trắc học chữ ký trực tuyến là trong lĩnh
vực pháp lý (xác thực tài liệu), y tế (bảo vệ hồ sơ) và ngân hàng (xử lý séc và thẻ tín

dụng). Các ứng dụng chính bao gồm:
Pháp y chữ ký. Đây là ứng dụng lâu đời nhất của chữ ký viết tay , thường được áp
dụng cho hình ảnh dịng chữ của chữ ký viết tay. Các phương pháp
tiếp cận pháp y để đánh giá bằng chứng chữ ký trực tuyến hiện đang
được phát triển .
Xác thực chữ ký. Loại ứng dụng này bao gồm đăng nhập hệ thống dựa trên chữ ký,
mã hóa tài liệu, truy cập web, v.v. Có thể tìm thấy một ví dụ cho Máy
tính bảng trong .
Giám sát chữ ký. Việc so sánh tự động các chữ ký trực tuyến có thể được sử dụng để
theo dõi và phát hiện những người ký (ví dụ: danh sách đen của các
cá nhân) hoặc có thể được sử dụng để cảnh báo người điều hành tại
các điểm bán hàng hoặc các dịch vụ dựa trên thẻ tín dụng khác.
Quản lý quyền kỹ thuật số dựa trên chữ ký. Các cơng nghệ kiểm sốt truy cập để
hạn chế việc sử dụng phần cứng bản quyền và các tác phẩm có bản
quyền.Cơng nghệ DRM cố gắng kiểm soát việc sử dụng, sửa đổi và
phân phối các tác phẩm có bản quyền (chẳng hạn như phần mềm và
nội dung đa phương tiện), cũng như các hệ thống trong các thiết bị
thực thi các chính sách này.
࿿Hệ thống mật mã sinh trắc học dựa trên chữ ký. Những phát triển mới đã chứng
minh tính khả thi của việc tạo ra các khóa mật mã dựa trên các hàm
thời gian của các chữ ký trực tuyến .


II.GIỚI THIỆU PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC
TRƯNG
1. Harris Corner Detector(HCD).
A.Giới Thiệu:
° Được giới thiệu bởi Chris Harris and Mike Stephens vào năm 1988.
° Ý tưởng chính của Harris là ơng dựa vào sự biến đổi cường độ sáng tại
một vùng lân cận

° Một vùng nhỏ xung quanh các đặc trưng sẽ có 1 sự thay đổi lớn về
cường độ sáng nếu một window dịch chuyển 1 đoạn (u,v) từ điểm (x,y)
theo bất kì hướng nào.

B.Cơng Thức Tính Tốn.
° Cơng thức tính cường độ sáng: E(u,v)=∑x,yw(x,y)[I(x+u,y+v)−I(x,y)]2
° W: Cửa sổ w có thể coi = 1 để cho đơn giản trong việc tính tốn nhưng
để chuẩn xác hơn cho kết quả đầu ra ta có thể coi đây như một mặt nạ
Gauss(3x3, 5x5, ...).
° I(x, y): Cường độ sáng tại điểm x, y .
° I(x + u, y + v): Cường độ sáng sau khi dịch chuyển cửa sổ đến
điểm (x + u, y + v).




C.Code Thực Thi:




D.Ưu Và Nhược Điểm
-Ưu điểm :
° Thuật toán harris bất biến với phép quay (rotation). Với vị trí góc đã
được xoay, hình ellipse sẽ xoay theo nhưng độ lớn các trục (hai trị
riêng λmax và λmin khơng đổi).
° Thuật tốn harris bất biến với phép tịnh tiến (translation). Dễ hiểu với
một góc được di chuyển tịnh tiến thì nó vẫn là góc.
° Thay đổi cường độ ảnh (intensity) được hiểu như việc phân các phần tử
trong ảnh II với một số thực αα, I=αII=αI. Vì tất cả điểm ảnh đều thay đổi

như nhau nên sẽ không ảnh hướng đến việc phát hiện góc. Tuy nhiên
nếu αα quá bé một số góc sẽ khơng cịn phân biệt rõ (tất cả các điểm ảnh
gần bằng 0). Đó chính là lý do vì sao Harris bất biến một phần với thay
đổi cường độ.
-Nhược Điểm :
° Nhược điểm của Harris là không bất biến với phép tỷ lệ (scale). Nhược
điểm này là do harris phát hiện góc dựa trên cửa sổ. Ví dụ bên dưới cho
thấy, khi phóng to một góc, kích thước cửa sổ cũ khơng cịn phát hiện
được góc nữa.
2. Scale-Invariant Feature Transform (SIFT).
A.Giới Thiệu.
° SIFT là phát minh đã được đăng kí bản quyền của David G. Lowe, nó
được cấp bằng sáng chế tại Canada bởi Đại học British Columbia, muốn
dùng cho mục đích thương mại thì phải xin phép.
° Ý tưởng:
° Từ ảnh tìm ra các điểm ảnh đặc biệt, gọi là feature point hay
keypoint. Đầu vào và đầu ra của phép biến đổi SIFT: ảnh -> SIFT
-> các keypoint
° Để có thể phân biệt keypoint này với keypoint khác cần tìm ra tham
số gì đó, gọi là descriptor. 2 keypoint khác nhau thì phải descriptor
khác nhau. Thường thì descriptor là chuỗi số gồm 128 số (vector 128
chiều).
° Sau khi áp dụng biến đổi SIFT, ứng với mỗi keypoint, thu được (1)
toạ độ keypoint (2) scale và orientation của keypoint (3) descriptor.


° Điểm hấp dẫn (Interest Point (Keypoint)): Là vị trí (điểm ảnh) "hấp
dẫn" trên ảnh.
° "Hấp dẫn" ở đây có nghĩa là điểm đó có thể có các đặc trưng bất
biến với việc quay ảnh, co giãn ảnh hay thay đổi cường độ chiếu sáng

của ảnh.
B.Cơng Thức Tính Tốn.
° Phương pháp trích rút các đặc trưng bất biến SIFT được tiếp cận theo
phương pháp thác lọc, theo đó phương pháp được thực hiện lần lượt theo
các bước sau:
° Phát hiện các điểm cực trị Scale-Space (Scale-Space extrema
detection): Bước đầu tiên này tiến hành tìm kiếm các điểm hấp dẫn
trên tất cả các tỉ lệ và vị trí của ảnh. Nó sử dụng hàm different-ofGaussian để xác định tất cả các điểm hấp dẫn tiềm năng mà bất biến
với quy mô và hướng của ảnh.



° Các điểm hấp dẫn được xác định là các cực đại hoặc cực tiểu của
các ảnh DoG qua các tỉ lệ. Mỗi điểm ảnh trong DoG được so sánh với
8 điểm ảnh láng giềng của nó ở cùng tỉ lệ đó và 9 láng giềng kề ở các
tỉ lệ ngay trước và sau nó. Nếu điểm ảnh đó đạt giá trị cực tiểu hoặc
cực đại thì sẽ được chọn làm các điểm hấp dẫn ứng viên.

° Về các thông số khác nhau, một số dữ liệu thực nghiệm có thể được
tóm tắt là, số quãng tám = 4, số mức tỷ lệ = 5, ban đầu σ= 1.6, k =√2
v…v… như một giá trị tối ưu.


° Định vị các điểm hấp dẫn (keypoint localization): Một hàm kiểm tra
sẽ được đưa ra để quyết định xem các điểm hấp dẫn tiềm năng có
được lựa chọn hay khơng?
° Loại bỏ các điểm hấp dẫn có độ tương phản thấp .
° Một số điểm hấp dẫn dọc theo các cạnh khơng giữ được tính
ổn định khi ảnh bị nhiễu cũng bị loại bỏ .
° Bằng cách tương tự như phương pháp dị góc (ngưỡng ).

° Ngưỡng được chọn là 0.03.


° Xác định hướng cho các điểm hấp dẫn (Orientation assignment):
Xác định hướng cho các điểm hấp dẫn được chọn
° Để xác định hướng cho các điểm hấp dẫn, người ta tính
tốn biểu đồ hướng Gradient trong vùng láng giềng của điểm
hấp dẫn. Độ lớn và hướng của các điểm hấp dẫn được xác
định theo công thức:

° Mô tả các điểm hấp dẫn (Keypoint descriptor): Các điểm hấp dẫn
sau khi được xác định hướng sẽ được mô tả dưới dạng các vector
đặc trưng 128 chiều.


C. Code Thực Thi

D. Ưu Và Nhược Điểm
-Ưu Điểm :
° Bất biến với độ sáng, xoay, thu phóng, ...
° Keypoint phụ thuộc rất ít vào cường độ sáng, nhiễu, che khuất (một
phần ảnh bị che), góc xoay (ảnh bị xoay trong mặt phẳng 2D), thay đổi
của tư thế (pose thay đổi trong khơng gian 3D).
° Nhanh, tốc độ xử lí gần như thời gian thực (realtime).
-Nhược Điểm :
° Tốc độ trích xuất keypoint và chi phí cho đối sánh cịn lớn.

II. Mơ Hình Tổng Qt.
1. Tiền Xử Lý.
- Giai đoạn này góp phần làm tăng độ chính xác của hệ thống nhận dạng, tuy

nhiên nó cũng làm cho tốc độ nhận dạng của hệ thống chậm lại, khối tiền xử lý
bao gồm một số chức năng : Nhị phân hóa ảnh,làm trơn ảnh,lọc nhiễu, lọc
cạnh,cắt khoảng trắng.
° Nhị phân hóa ảnh : nhị phân hóa ảnh là một kỹ thuật chuyển ảnh đa cấp
xám sang ảnh nhị phân.Trong bất kỳ bài tốn phân tích hoặc nâng cao
chất lượng hình ảnh nào, nó cũng cần thiết để xác định các đối tượng
quan trọng. Nhị phân hóa ảnh chia ảnh thành 2 phần : Phần nền và phần
chữ .


° Lọc Nhiễu : Nhiễu là một tập các điểm sáng thừa trên ảnh. Khử nhiễu là
một vấn đề thường gặp trong nhận dạng,nhiễu có rất nhiều loại(nhiễu
muối tiêu ….).

Để khử nhiễu muối tiêu ta có thể sử dụng phương pháp lọc trung vị .
° Làm Trơn Ảnh : đôi khi do chất lượng quét ảnh quá xấu nên các đường
biên của chữ ký khơng cịn giữ được trơn tru ban đầu mà hình thành nên
các đường răng cưa, nên ta sử dụng thuật toán làm trơn để khắc phục.


° Đóng mở ảnh :
- Đóng ảnh : nó rất hữu ích cho việc loại bỏ những nhiễu nhỏ.
- Trong các trường hợp chúng ta muốn loại bỏ đi các nhiễu nhỏ thì
sau khi đóng ảnh ta mở ảnh , bởi vì đóng ảnh sẽ loại bỏ những
nhiễu nhỏ nhưng cũng thu nhỏ đối tượng vì vậy chúng ta sẽ mở nó,
vì nhiễu đã biến mất sau khi đóng nên khi mở sẽ không hiện trở lại.
-Trong trường hợp nối các nét đứt thì ta mở ảnh rồi đóng ảnh :

° Cắt Khoảng Trắng : Trong các trường hợp hình ảnh nhận dạng bị dư
những khoảng trắng không cần thiết thì ta cắt cho nó sát chữ để tối ưu.

Hình đưa vào.


Sau khi cắt.

2. Kết hợp các đặc trưng để nhận diện
-Từ 2 đặc trưng ở trên để hiệu quả và tối ưu hơn ta kết hợp chúng lại với nhau
qua các bước như sau:
° Ta sẽ tìm kiếm một chùm các điểm góc và lọc các điểm góc gần nhau
chỉ chọn 1 điểm duy nhất tại mỗi góc.
° Tại các điểm góc của ảnh(1 điểm góc duy nhất tại 1 góc) ta chọn ra
keypoint gần nhất sao cho keypoint đó chưa được sử dụng bởi 1 điểm góc
khác.

3. Nhận Dạng Và Huấn Luyện
A.Nhận Dạng


B1: Trước tiên chúng ta sẽ chuyển đổi hình ảnh vào thang độ xám trước khi làm
điều đó chúng ta thêm một chút làm mờ để làm điều đó chúng ta sẽ sử dụng
chức năng làm mờ cv2.GaussianBlur() tiếp theo chuyển đổi chúng ta sẽ chuyển
đổi ảnh vào thang độ xám bằng cách sử dụng thang độ xám BGR .
B2:Chuyển đổi hình ảnh sang thang độ xám để tiếp theo chúng ta sẽ sử dụng
máy dò cạnh canny của chúng ta để phát hiện các cạnh trong ảnh bằng cách sử
dụng máy dị cạnh canny có hai ngưỡng.Máy dị sẽ di chuyển xung quang cho
đến khi ta nhận được các giá trị phù hợp.
B3: Khởi tạo mảng 5*5 bằng mảng numpy sau đó chúng ta gọi hàm cv2.dilate()
và chuyền vào mảng mới khởi tạo để giản nở. hình ảnh.

B4: Sau khi qua các bước xử lý ảnh thì ta gọi đến hàm getContours:

+Tìm và lưu tất cả các thơng tin đường viền bằng hàm findContours().
+Duyệt qua tất cả các đường viền đã tìm được tính chu vi của nó rồi loại bớt các
đối tượng không đạt được ngưỡng chúng ta đặt ra ở đây là 500 rồi dùng phương
pháp Poly để lấy đường biên xấp xỉ và những đường biên này sẽ có một số điểm
nhất định dựa vào các điểm có thể xác định được hình dạng của đối tượng và
chuyển nó về hình chữ nhật và các thơng số x,y,w,h.


Phần này chủ yếu là:
+Trường hợp 1:Tìm ra một đối tượng nào nằm hoàn toàn trong khung của đối
tượng kia thì tự động bỏ qua đối tượng nhỏ hơn
+Trường hợp 2: Cịn nếu bị đè một phần thì chữ nhật sẽ biến rộng để bao cả 2.
Khi các đối tượng đã được khoang vùng sẽ gọi đến hàm dropImage() để cắt các
đối tượng ra lưu vào thư mục crop.
B.Huấn Luyện
-Mô hình SVM (Support Vector Machine):
° SVM là gì? :
- SVM là một khái niệm trong thống kê và khoa học máy tính cho
một tập hợp các phương pháp học có giám sát liên quan đến
nhau để phân loại và phân tích hồi quy.
- SVM là một thuật tốn phân loại nhị phân, SVM nhận dữ liệu
vào và phân loại chúng vào hai lớp khác nhau. Với một bộ các
ví dụ train thuộc hai đối tượng cho trước, thuật toán train SVM
xây dựng một mơ hình SVM để phân loại các ví dụ khác vào
hai đối tượng đó.
° Ứng dụng của SVM? :
- Nhận diện khuôn mặt, Phân loại văn bản và siêu văn bản, Phân
loại hình ảnh, Tin sinh học, Nhận dạng chữ viết tay, Điều khiển
dự báo tổng quát (GPC)…
° Train bằng SVM như thế nào? :

- Đầu tiên cần chọn loại SVM: Chọn C_SVC
C_SVC

C-Support Vector Classification. Phân loại n lớp (n≥ 2), cho phép phân
loại các lớp không hoàn hảo với hệ số nhân C cho các ngoại lệ.

NU_SVC

ν-Support Vector Classification. Phân loại n lớp với sự tách biệt có thể
khơng hồn hảo. Tham số ν (trong phạm vi 0->1, giá trị càng lớn, ranh
giới quyết định càng mượt mà) được sử dụng thay cho C.

ONE_CLASS
EPS_SVR
NU_SVR

Distribution Estimation (One-class SVM). Tất cả các dữ liệu đào tạo là
từ cùng một lớp, SVM xây dựng một ranh giới ngăn cách lớp với phần
cịn lại của khơng gian tính năng.
ϵ-Support Vector Regression. Dùng để phân tích hồi quy

ν-Support Vector Regression. Dùng để phân tích hồi quy


- Chọn loại nhân mơ hình phân loại: Chọn Inter
CUSTOM
LINEAR
POLY
RBF


Được trả về bởi SVM :: getKernelType trong trường hợp khi kernel tùy chỉnh đã
được đặt
Nhân tuyến tính. Khơng có ánh xạ được thực hiện, phân biệt tuyến tính (hoặc hồi
quy) được thực hiện trong khơng gian tính năng ban đầu. Đây là lựa chọn nhanh
nhất. K(xi , xj ) = x𝑖𝑇 xj
Hạt nhân đa thức: K(xi , xj ) = (γx𝑇
𝑖 xj + coef0)

degree

, γ > 0.

Hàm cơ sở xuyên tâm (RBF), một lựa chọn tốt trong hầu hết các trường
2
hợp. K(xi , xj ) = e−γ||x −x || , γ > 0.
i

j

SIGMOID
CHI2

Hạt nhân Sigmoid: K(xi , xj ) = tanh(γx𝑖𝑇 xj + coef0)
Hạt nhân Chi2 theo cấp số nhân, tương tự như hạt nhân RBF: K(xi , xj ) =

INTER

e−γχ (x ,x ) , χ2(xi , xj ) = (xi − xj )2 /(xi + xj ), γ > 0.
Biểu đồ giao điểm nhân. Một hạt nhân nhanh chóng. K(xi , xj ) = min(xi , xj )
2


i

j

- Thiết lập các thông số phù hợp với từng kiểu hạt nhân: C = 100
C

Hệ số C thiết lập các ngoại lệ cho các lớp khơng
hồn hảo

Gamma
Coef0
Degree

SVM::POLY, SVM::RBF, SVM::SIGMOID và SVM::CHI2
SVM::POLY và SVM::SIGMOID
SVM::POLY


° Code train:
-

-

Ý tưởng chính: Chia hình ảnh thành 10 phần bằng nhau theo
chiều dọc và mỗi phần sẽ áp dụng một lần phân loại tất cả các
keypoint.

Lí do: Vì chữ ký thông thường của người Việt được viết theo

chiều ngang, và để giảm nhiễu số liệu trong quá trình phân loại
– một keypoint của chữ cái này sẽ ít ảnh hưởng đến keypoint
của chữ cái khác, từ đơn nhiều ký tự nhất trong tiếng Việt là
nghiêng – 7 chữ cái nên cơ bản 10 phần sẽ hạn chế được ảnh
hưởng không mong muốn giữa chữ này đối với các chữ cái
khác.
- Thông số C thiết lập ở mức 100 vì cơ bản chữ ký khơng bất
biến, ln có một sai khác nhất định.
- Kiểm tra các trường hợp ngoại lệ như tồn tại một đối tượng chữ
ký mà ở một phần nào đó khơng có bất kì keypoint nào, khiến
cho mơ hình phân loại khơng sử dụng được vì chỉ có một đối
tượng.


×