Tải bản đầy đủ (.pdf) (16 trang)

Tóm tắt Đồ án tốt nghiệp Nhận dạng biển chỉ dẫn dịch sang tiếng Việt bằng PCA

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (993.79 KB, 16 trang )

TÓM TẮT ĐỒ ÁN TỐT NGHIỆP
1. Tên đề tài
Nhận dạng biển chỉ dẫn dịch sang tiếng việt bằng PCA.
2. Mô tả bải toán
Ứng dụng nhận dạng biển chỉ dẫn cũng nhƣ tất cả các loại biển phục vụ trong
đời sống của con ngƣời là đề tài thu hút nhiều sự quan tâm nghiên cứu và phát triển.
Ứng dụng này không chỉ dừng ở nhận dạng ra các ký tự mà còn dịch từ tiếng anh ra
tiếng việt. Góp phần xây dựng nên từ điển Anh Việt, nghĩa là nó dịch nghĩa từ hình
ảnh.
3. Đóng góp của tác giả
Xây dựng phƣơng pháp trích thông tin trên biển chỉ dẫn (cụ thể là từ ngữ trên
đó).
Xây dựng phƣơng pháp áp dụng PCA cho ký tự và nêu ra đƣợc ƣu nhƣợc
điểm của phƣơng pháp PCA cho việc nhận dạng ký tự
Xây dựng bộ từ điển Anh – Việt về chủ đề biển chỉ dẫn.
4. chức năng chính

i


Hình 1. Chức năng load ảnh, nhận dạng, dịch nghĩa.

ii


MỤC LỤC
LỜI CẢM ƠN ............................................................... Error! Bookmark not defined.
LỜI CAM ĐOAN .......................................................... Error! Bookmark not defined.
NHẬN XÉT CỦA GIÁO VIÊN HƢỚNG DẪN .......... Error! Bookmark not defined.
PHIẾU DUYỆT ĐỒ ÁN TỐT NGHIỆP ....................... Error! Bookmark not defined.
TÓM TẮT ĐỒ ÁN TỐT NGHIỆP ..................................................................................i


MỤC LỤC
............................................................................................................... iii
DANH MỤC CÁC HÌNH VẼ .........................................................................................v
Chƣơng 1.
TỔNG QUAN ĐỀ TÀI ............................................................................1
1.1
Giới thiệu đề tài .............................................................................................. 1
1.2

mục đích và ý nghĩa ........................................................................................1

1.2.1

Mục đích:................................................................................................ 1

1.2.2

Ý nghĩa: .................................................................................................. 1

1.3

Biển chỉ dẫn ....................................................................................................2

1.3.1

Khái niệm ............................................................................................... 2

1.3.2

Ứng dụng ................................................................................................ 3


1.4

phƣơng pháp giải quyêt bài toán đặt ra ..........................................................3

1.4.1

Một số hƣớng giải quyết bài toán nhận dạng biển chỉ dẫn .................... 4

1.4.2

Một số hƣớng giải quyết nhận dạng ký tự ............................................. 5

1.4.3

Một số hƣớng giải quyết dịch sang tiếng việt ........................................ 5

1.5

Hƣớng giải quyết của đề tài ............................................................................6

1.5.1

Đặc điểm của bảng chỉ dẫn .................................................................... 6

1.5.2

Các bƣớc thực hiện................................................................................. 6

1.6


Mục tiêu và nhiệm vụ .....................................................................................7

1.6.1

Mục tiêu.................................................................................................. 7

1.6.2

Nhiệm vụ ................................................................................................ 7

1.7

Bố cục luận văn .............................................................................................. 7

Chƣơng 2.
NỀN TẢNG CÔNG NGHỆ................... Error! Bookmark not defined.
2.1
Mô Hình Giải Quyết Bài toán ...................... Error! Bookmark not defined.
2.2

Lý Thuyết Xử Lý Ảnh .................................. Error! Bookmark not defined.

2.2.1

Tổng quan về xử lý ảnh ........................ Error! Bookmark not defined.

2.2.2

Nhận dạng ảnh ...................................... Error! Bookmark not defined.


2.2.3 Giới thiệu một số ứng dụng của xử lý ảnh .......... Error! Bookmark not
defined.
iii


2.3
2.3.1

Thƣ Viện Xử Lý Ảnh OPENCV .................. Error! Bookmark not defined.
Vài nét về Computer Vision ................. Error! Bookmark not defined.

2.3.2 Thƣ viện mã nguồn mở OpenCV của Intel ......... Error! Bookmark not
defined.
2.4

Hệ Quản Trị Cơ Sở Dữ Liệu MYSQL ......... Error! Bookmark not defined.

2.4.1

Khái niệm: ............................................ Error! Bookmark not defined.

2.4.2

Tại sao dùng MYSQL .......................... Error! Bookmark not defined.

2.5

khái niệm Toán học trong pca (phân tích thành phần chính)Error! Bookmark not defin


2.5.1

Độ lệch chuẩn ....................................... Error! Bookmark not defined.

2.5.2

Hiệp phƣơng sai ................................... Error! Bookmark not defined.

2.5.3

Ma trận hiệp phƣơng sai....................... Error! Bookmark not defined.

2.5.4

Ma trận đại số ....................................... Error! Bookmark not defined.

2.5.5

Eigenvector (Vectơ riêng) .................... Error! Bookmark not defined.

2.5.6

Eigenvalue (Giá trị riêng)..................... Error! Bookmark not defined.

Chƣơng 3.
ỨNG DỤNG VÀ THỰC NGHIỆM ...... Error! Bookmark not defined.
3.1
Môi trƣờng thực nghiệm ............................... Error! Bookmark not defined.
3.2


Dữ liệu đầu vào ............................................. Error! Bookmark not defined.

3.3

Quá trình xử lý để nhận dạng dịch nghĩa...... Error! Bookmark not defined.

3.3.1

Tổng quan quá trình thực hiện ............. Error! Bookmark not defined.

3.3.2

Tải ảnh .................................................. Error! Bookmark not defined.

3.3.3

Tách vùng từ có trên trên biển ............. Error! Bookmark not defined.

3.3.4

Chƣơng trình tách ký tự ....................... Error! Bookmark not defined.

3.3.5

Nhận dạng ký tự bằng PCA ................. Error! Bookmark not defined.

3.3.6

Dịch sang tiếng việt .............................. Error! Bookmark not defined.


3.4

Kết quả đạt đƣợc ........................................... Error! Bookmark not defined.

3.4.1

Giao diện chính chƣơng trình............... Error! Bookmark not defined.

3.4.2

Mở ảnh ................................................. Error! Bookmark not defined.

3.4.3

Xem quá trình xử lý của chƣơng trình . Error! Bookmark not defined.

3.4.4

Nhận dạng và dịch ............................... Error! Bookmark not defined.

Chƣơng 4.
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ...............................................9
4.1
Kết luận...........................................................................................................9
4.1.1

Kết quả đạt đƣợc .................................................................................... 9

4.1.2


Hạn chế ................................................................................................... 9

4.2

Hƣớng phát triển ...........................................................................................10

DANH MỤC TÀI LIỆU THAM KHẢO ...................... Error! Bookmark not defined.
iv


v


DANH MỤC CÁC HÌNH VẼ
Hình 1. Chức năng load ảnh, nhận dạng, dịch nghĩa. ----------------------------------- ii
Hình 2. Biển chỉ dẫn đƣờng. ---------------------------------------------------------------- 2
Hình 3. Biển chỉ dẫn cổng vào tòa nhà. --------------------------------------------------- 3
Hình 4. Biển chỉ dẫn phòng. ---------------------------------------------------------------- 3
Hình 5. Mô hình giải quyết bài toán. ----------------- Error! Bookmark not defined.
Hình 6. Ví dụ về Computer Vision. ------------------ Error! Bookmark not defined.
Hình 7. Tổ chức thƣ viện OpenCV.------------------- Error! Bookmark not defined.
Hình 8. Tổng quan quá trình thực hiện. -------------- Error! Bookmark not defined.
Hình 9. Quá trình mở ảnh. ----------------------------- Error! Bookmark not defined.
Hình 10. Quá trình tách từ. ----------------------------- Error! Bookmark not defined.
Hình 11. Biển chỉ dẫn đƣợc khoanh vùng chọn. ---- Error! Bookmark not defined.
Hình 12. Sơ đồ tách ký tự. ----------------------------- Error! Bookmark not defined.
Hình 13. ảnh đầu vào để tách hình chứa ký tự. ----- Error! Bookmark not defined.
Hình 14. Kết quả nhị phân ảnh.----------------------- Error! Bookmark not defined.
Hình 15. Kết quả khoanh vùng đối tƣợng. ----------- Error! Bookmark not defined.
Hình 16. Kết quả tách từ. ------------------------------- Error! Bookmark not defined.

Hình 17. Kết quả lọc khi đã lọc nhiễu. --------------- Error! Bookmark not defined.
Hình 18. Kết quả tách ký tự. --------------------------- Error! Bookmark not defined.
Hình 19. Sơ đồ áp dụng PCA nhận dạng ký tự. ----- Error! Bookmark not defined.
Hình 20. Sơ đồ cài đặt và xây dựng PCA. ----------- Error! Bookmark not defined.
Hình 21. Giao diện chính của chƣơng trình. --------- Error! Bookmark not defined.
Hình 22. Ảnh đƣợc mở và đƣợc hiển thị lên picture box. ---- Error! Bookmark not
defined.
Hình 23. Hiển thị kết quả quá trình xử lý. ----------- Error! Bookmark not defined.
Hình 24. Kết quả nhận dạng và dịch. ----------------- Error! Bookmark not defined.

vi


Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

Chƣơng 1.

TỔNG QUAN ĐỀ TÀI

1.1 GIỚI THIỆU ĐỀ TÀI
Nhận dạng ký tự là bài toán đang thu hút đƣợc nhiều sự quan tâm và nghiên
cứu. Qua đó em cũng muốn tham gia nghiên cứu về bài toán nhận dạng ký tự bằng
phƣơng pháp phân tích thành phần chính gọi tắt là PCA và phát triển sâu hơn khi
tham gia xây dựng ứng dụng “Nhận dạng biển chỉ dẫn và dịch sang tiếng việt”
trơng đợt làm luận văn này.
Đề tài tập trung vào việc nhận dạng các từ trên biển chỉ dẫn rồi dịch sang tiếng
việt. Ứng dụng một phần nào đó góp phần nào đó vào việc tách ký tự ra khỏi vùng
ảnh, nhận dạng ảnh ký tự, rồi cuối cùng mang đi dịch nghĩa. Cái đích cuối cùng là

một quá trình nghiên cứu với mục đích mang lại cho ngƣời dùng nhanh chóng dịch
đƣợc nghĩa của từ (cụ thể là từ tiếng anh) nằm trên bất ký biển chỉ dẫn nào.

1.2 MỤC ĐÍCH VÀ Ý NGHĨA
1.2.1 Mục đích:
Với đề tài “Nhận dạng biển chỉ dẫn và dịch sang tiếng việt” em xác định cho
mình các mục đích cần đạt đƣợc cho quá trình thực hiện luận văn nhƣ sau:


Hiểu thêm đƣợc môn xử lý ảnh.



Biết đƣợc cách xây dựng thuật toán (cụ thể là thuật toán PCA xây
dựng trong bài)



Tìm hiểu xây dựng ứng dụng winForm bằng ngôn ngữ C++.



Biết áp dụng thƣ viện OPENCV cho xử lý ảnh.



Nắm bắt chu trình để xây dựng và phát triển cho sản phẩm phần mềm.




Xây dựng đƣợc ứng dụng hoàn thiện, có khả năng ứng dụng vào thực
tế.

1.2.2 Ý nghĩa:
Với việc xử lý ảnh vẫn đang còn thu hút nhiều dự án nghiên cứu và phát
triển, áp dụng nhiều giải pháp, nhiều kỹ thuật vì vậy với đề tài về xử lý và nhận
dạng mang về cho em những ý nghĩa sau:
 Tham gia nghiên cứu và phát triển thêm phƣơng pháp nhận dạng và xử
lý ảnh.


Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

 Mang lại ứng dụng thiết thực cho ngƣời dùng.
 Nhanh chóng nắm bắt đƣợc công nghệ trong tƣơng lai.

1.3 BIỂN CHỈ DẪN
1.3.1 Khái niệm
Biển chỉ dẫn là biển chứa những thông tin hữu ích, nhằm hƣớng ta nhanh
chóng nắm bắt hoặc hƣớng dẫn ta hiểu về một điều gì đó.
Bảng chỉ dẫn là biển hiệu đƣợc đặt trên đƣờng, hành lang, khung viên, hoặc
trong các tòa nhà lớn, có chứa thông tin bằng chữ hoặc ký hiệu liên quan đến lĩnh
vực nào đó. Chẳng hạn nhƣ biển chỉ dẫn về lối đi, hoặc biển thông tin, biển chỉ dẫn
về trò chơi ..v.v.
Một số hình ảnh biển chỉ dẫn:

Hình 2. Biển chỉ dẫn đƣờng.



Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

Hình 3. Biển chỉ dẫn cổng vào tòa nhà.

Hình 4. Biển chỉ dẫn phòng.

1.3.2 Ứng dụng
Hiện nay có rất nhiều biển chỉ dẫn thuộc nhiều lĩnh vực khác nhau trong đời
sống. Mục đích chính của nó là để hƣớng dẫn con ngƣời hiểu và bắt kịp những gì
cần thiết ngay tại thời điểm mong muốn đƣợc hƣớng dẫn về một cái gì đó.
Chính vì nhu cầu trên em xây dựng phần mềm “Nhận dạng biển chỉ dẫn và
dịch sang tiếng việt”. Với Tiêu chí là góp một phần nào đó vào việc làm cho ngƣời
hiểu đƣợc về bảng chỉ dẫn mà chƣa biết ngoại ngữ (cụ thể đó là biển chỉ dẫn về
tiếng anh).

1.4 PHƢƠNG PHÁP GIẢI QUYÊT BÀI TOÁN ĐẶT RA
Nhằm đạt đƣợc kết quả trông đợi nhƣ đã đề ra, và hoàn thành luận văn đúng
thời hạn, em đã chuẩn bị kế hoạch thực hiện các công việc chi tiết nhƣ sau:
 Liệt kê những yêu cầu lớn trong đề bài.
 Đề ra phƣơng pháp giải quyết với mỗi yêu cầu trên.


Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

 Chọn ra phƣơng pháp giải quyết phù hợp với đề tài cho mỗi yêu cầu

trên.
 Đƣa ra kết luận và rút kinh nghiệm.

1.4.1 Một số hƣớng giải quyết bài toán nhận dạng biển chỉ dẫn
1.4.1.1 Hướng tiếp cận phát triển vùng
Ý tƣởng của phƣơng pháp: Dễ áp dụng cho những biển có chứa màu đồng
nhất, chẳng hạn một màu nhất định, và có diện tích nhất định. Phƣơng pháp phát
triển vùng là dùng một khung chữ nhật di chuyển trong để tìm ra vùng có tính chất
thỏa mãn biển chỉ dẫn rồi tiến hành nhận dạng
Ƣu Điểm: Rất đơn giản, và xử lý nhanh đối với tập ảnh có chứa biển chỉ dẫn
1 màu nhất định và cùng kích thƣớc.
Nhƣợc điểm: Bảng chỉ dẫn thƣờng chứa nhiều màu và nhiều màu sắc khác
nhau kể cả kích thƣớc, Vì vậy Phƣơng pháp này áp dụng sẽ không tối ƣu cho bài
luận.

1.4.1.2 Hướng tiếp cận dò biên và biến đổi Hough
Ý tƣởng của phƣơng pháp: Biển chỉ dẫn thƣơng đƣợc bao quanh bằng các
đƣờng dọc ngang. Do đó có thể dùng phƣơng pháp phát hiện biên, sau đó dùng
Hough để trích các đoạn thẳng dọc ngang tồn tại trong ảnh. Giao điểm của những
đoạn thẳng này chính là vùng chứa biển chỉ dẫn
Ƣu điểm: độ chính xác tƣơng đối cao, đa phần hệ thống nhận dạng đều phát
triển theo hƣớng tiếp cận này.
Nhƣợc điểm: độ phức tạp tính toán cao. Khi ảnh thêm nhiều đối tƣợng khác
thì khối lƣợng tính toán tăng lên khá nhiều.

1.4.1.3 Hướng tiếp cận phát hiện biên và Heuristic
Ý tƣởng của phƣơng pháp: Áp dụng mặt nạ Sobel để dò tìm cạnh trong
ảnh, , kết quả là ảnh chứa tập các cạnh , gọi là G(x, y). Sau đó, áp dụng một số
heuristic về biển chỉ dẫn nhƣ kích thƣớc, tỉ lệ chiều cao/chiều rộng, hoặc sử dụng
một cửa sổ di chuyển trên toàn bộ G(x, y) để tìm ra các vùng có số cạnh thoã điều

kiện.
Ƣu điểm: Không lệ thuộc vào ảnh đầu vào.
Nhƣợc điểm: Chi phí tính toán cao nếu không giải quyết tốt giai đoạn tìm
cạnh , và đòi hỏi những heuristic đƣa vào phải qua thƣc nghiệm kiểm chứng hoặc
do các chuyên gia cung cấp.


Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

1.4.1.4 Hướng tiếp cận thủ công
Ý tƣởng chính của phƣơng pháp: Áp dụng thao tác của ngƣời dùng, vẽ
khung trên ảnh, với điều kiện khung đó nằm trên biển chỉ dẫn.
Ƣu điểm: Nhanh, gọn, thích hợp cho ứng dụng này khi ngƣời dùng cần dịch
những chổ không hiểu, tránh nhập nhằng trong việc nhận dạng bảng chỉ dẫn, chi phí
tính toán không cao.
Nhƣợc điểm: Ngƣời dùng vẽ không chính xác vùng biển hoặc biển có độ
nghiêng và độ lệch cao.

1.4.2 Một số hƣớng giải quyết nhận dạng ký tự
Với tên đề tài là “Nhận dạng biển chỉ dẫn và dịch sang tiếng việt bằng PCA”
thì cũng đã biết đề tài hƣớng nhận dạng chính của bài luận là dùng giải thuật PCA
(phân tích thành phần chính).
Thuật toán PCA cùng với nhận dạng bằng phƣơng pháp nơron, máy học SVN
đƣợc dùng nhiều trong kỹ thuật nhận dạng.
Kỹ thuật PCA đƣợc nhắc nhiều nhất trong nhận dạng khuôn mặt. Với đề tài
này sẽ tìm hiểu sâu hơn kỹ thuật PCA trong vấn đề nhận dạng ký tự. Cũng nhƣ đƣa
ra đƣợc ƣu và nhƣợc điểm của kỹ thuật PCA trong việc nhận dạng ký tự.


1.4.3 Một số hƣớng giải quyết dịch sang tiếng việt
1.4.3.1 Hướng giải quyết đọc dữ liệu từ file text
Ý tƣởng của phƣơng pháp này: Lần đầu tiên chạy chƣơng trình ta load tất
cả các dữ liệu từ file text lên lƣu vào một mảng. Sau quá trình nhận dạng ra từ rồi ta
dùng vòng lặp để đối chiếu thông tin dữ liệu có trong mảng.
Ƣu điểm: Dễ thực hiện.
Nhƣợc điểm: Bƣớc đầu chạy chƣơng trình phải load lên hết các dữ liệu từ
file. Nếu file chứa dữ liệu lớn thì làm ảnh hƣởng tới chƣơng trình. Làm cho chƣơng
trình chạy chậm. Vì đọc file phải dùng vòng lặp và lƣu dữ liệu vào một biến mảng
nào đó. Tới giai đoạn dịch thì một lần nữa ta lại sử dụng vòng lặp for để đối chiếu
dẫn tới tình trạng chƣơng trình sẽ chạy lâu. Dữ liệu trong file không đúng cú pháp
dẫn tới chƣơng trình đọc bị lỗi.

1.4.3.2 Hướng giải quyết kết nối cơ sỡ dữ liệu và thực hiện truy vấn.
Ý tƣởng của phƣơng pháp này: Phƣơng pháp này đƣợc sử dụng sau khi đã
nhận dạng đƣợc các ký tự, rồi ta thực hiện truy vấn cơ sở dữ liệu để lấy dữ liệu về.


Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

Ƣu điểm: Đạt hiệu quả cao, không tốn bộ nhiều bộ nhớ để lƣu hết dữ liệu
nhƣ ở đọc dữ liệu từ file.
Nhƣợc điểm: Khó thực hiện. Có thể xuất hiện tình trạng mất kết nối tới cơ
sở dữ liệu

1.5 HƢỚNG GIẢI QUYẾT CỦA ĐỀ TÀI
1.5.1 Đặc điểm của bảng chỉ dẫn
Đƣợc xem qua những bảng chỉ dẫn trên từ hình 2,3,4 chúng ta thấy về kích

thƣớc các biển không đồng nhất, không cùng loại. Và cả nền và màu nền và màu
sắc của các ký tự trên bảng cũng khác nhau.
Với đặc điểm đó ta áp dụng tiếp cận 3 phƣớng pháp tiếp cần vùng, dò biên
Hough và phát hiên biên – Heuristic là khó khăn
Còn phƣơng pháp cuối là phƣơng pháp bằng phƣơng pháp thủ công, Cũng
may là phƣơng pháp này cũng thuận lợi cho việc ngƣời dùng chỉ trích những chổ họ
muốn trích từ bảng chỉ dẫn rồi dịch sang đoạn tiếng việt. Phƣơng pháp này rất tối
ƣu khi xây dựng trên nền tảng di động. Do bƣớc đầu thực hiện đề tài liên quan đến
xử lý và nhận dạng nên chọn làm trên windown application để dễ thực hiện và điều
tra độ phức tạp trƣớc khi làm trên ứng dụng di động.

1.5.2 Các bƣớc thực hiện
Để nhận dạng bảng chỉ dẫn và dịch sang tiếng việc thì trong báo cáo ta trình
bày các bƣớc hƣớng đề tài thực hiện các bƣớc theo thứ tự sau:
Bƣớc 1: Ảnh truyền vào máy tính, gọi ảnh đầu vào là F(x,y).
Bƣớc 2: Từ ảnh đầu vào ta sử dụng phƣơng pháp hƣớng tiếp cận thủ công để
trích từ cần dịch có trên biển chỉ dẫn.
Để sử dụng phƣơng pháp này ta dùng chuột để để khoanh vùng cần trích.
Bƣớc 3: Tiến hành tách ảnh ký tự trong vùng đã khoanh đƣợc đêm lƣu vào
mảng. Tạm gọi mảng đó là mảng A.
Để sử dụng phƣơng pháp này ta dùng thƣ viện mã nguồn mở OPENCV
và sử dụng hàm của nó và 1 ít đặc điểm của ký tự vào để dễ dàng tách ký tự hơn.
Bƣớc 4: Mang từng ảnh ký tự đó thực hiện nhận dạng bằng thuật toán.
Thật toán để giải quyết: có rất nhiều thuật toán để giải quyết vấn đề này,
nhƣ thuật toán nơron, máy học SVN. Nhƣng bài luận này chủ yếu để nghiên cứu
về thuật toán PCA (Phân tích thành phần chính). Ta sẽ tiến hành nhận dạng bằng


Đồ án tốt nghiệp


Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

phƣơng pháp này và nghiên cứu sâu hơn về ƣu điểm và nhƣợc điểm của nó
trong nhận dạng ký tự.
Bƣớc 5: Ghép các ký tự lại để có đƣợc một từ hoàn chỉnh.
Sau khi đã có kết quả từ nhận dạng qua thuật toán PCA đối với từng ký
tự ta tiến hành ghép chúng lại để có một từ oàn chỉnh.
Bƣớc 6: Thực hiện truy vấn cơ sỡ dữ liệu để dịch nghĩa.
Với đặc điểm gọn nhẹ Mysql so với các loại cơ sỡ dữ liệu khác. Với bài này
ta chỉ thực hiện trên một bảng nên sử dụng cơ sỡ Mysql là thích hợp nhất.

1.6 MỤC TIÊU VÀ NHIỆM VỤ
1.6.1 Mục tiêu
 Xây dựng đƣợc ứng dụng trên visual studio, lập trình với C++.
 Xây dựng demo đơn giản về xử lý ảnh.
 Cài đặt thuật toán PCA.
 Kết nối đƣợc cơ sở dữ liệu.
 Tách đƣợc ký tự để mang đi nhận dạng.

1.6.2 Nhiệm vụ
 Tìm hiểu về ngôn ngữ lập trình C++.
 Tìm hiểu về xử lý ảnh.
 Tìm hiểu thuật toán PCA và từng bƣớc cài đặt.
 Tìm hiểu hệ quản trỵ cơ sở dữ liệu MySql: phƣơng thức kết nối, và viết
câu lệnh truy vấn.
 Tìm hiểu thƣ viện OPENCV có những hàm nào hoặc có chức năng nào
giúp ích cho việc nhận dạng và trích xuất đối tƣợng từ ảnh.
 Thu thập ảnh để làm tập mẫu cho thuật toán PCA và ảnh làm dữ liệu
Test.


1.7 BỐ CỤC LUẬN VĂN
Bố cục luận văn gồm:
Chƣơng 1. Tổng quan về đề tài


Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

Nội dung chủ yếu của chƣơng này là giới thiệu khái quát về các vấn đề cần
thực hiện, các mục tiêu, ý nghĩa mà đề tài hƣớng đến. Đề ra các phƣơng pháp giải
quyết. Chọn phƣơng pháp giải quyết thích hợp cho luận văn.
Chƣơng 2. Cơ sở lý thuyết
Nội dung nghiên cứu lý thuyết liên quan đến quá trình thực hiện đề tài bao
gồm: Lý thiết về xử lý ảnh, Lý thuyết về thƣ viện OpenCV trong nhận dạng, lý
thuyết về hệ quản trị cơ sở MySQL, Lý thuyết về thuật toán PCA.
Chƣơng 3. Thực nghiệm
Nội dung về các bƣớc tiếp cận lý thuyết và áp dụng vào bài toán đã đặt ra.
Nêu ra từng bƣớc một triển khai và kết quả sơ khai của chƣơng trình.
Chƣơng 4. Kết luận và hƣớng phát triển
Nội dung rút ra đƣợc trong quá trình giải quyết bài toán. Những cái giải
quyết đƣợc và những cái chƣa giải quyết đƣợc. Đặt ra hƣớng phát triển hoặc hƣớng
đi mới cho bài luận.


Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN

1.8 KẾT LUẬN
1.8.1 Kết quả đạt đƣợc
Khi bắt đầu đề tài, em đã đề ra các mục tiêu cần thực hiện nhƣ bảng bên dƣới
và một số chức năng bổ sung trong quá trình thực hiện dƣới sự chỉ bảo của giáo
viên hƣớng dẫn.
Chức năng
Xây dựng giao diện ngƣời

Trạng thái

Ghi chú

Hoàn thành

dùng
Xây dựng cơ sở dữ liệu bộ từ

Còn sơ khai

điển Anh – Việt cho biển chỉ
dẫn

update từ ngƣời
dùng

Tách từ từ biển chỉ dẫn

Hoàn thành

Tách ký tự


Hoàn thành

Nhận dạng ký tự bằng PCA

Hoàn thành

Thao tác truy vấn và dịch sang
tiếng việt

Hoàn thành

Xử lý xoay ảnh khi ảnh bị
nghiêng

Cần sự hổ trợ và

Cơ sở dữ liệu
MySql

Chƣa hoàn thành

Dựa vào bảng chức năng liệt kê ở trên cho thấy chƣơng trình tƣơng đối hoàn
chỉnh.
Đồng thời với việc thực hiện chƣơng trình rút ra đƣợc ƣu và nhƣợc điểm của
thuật toán PCA trong nhận dạng ký tự.

1.8.2 Hạn chế
Độ chính xác của chƣơng trình nhận dạng biển chỉ dẫn còn phụ thuộc vào
chất lƣợng của ảnh. Tuy nhiên yếu tố này ta có thể điều chỉnh đƣợc bằng cách nâng

cao chất lƣợng và lọc nhiễu.


Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

Việc nhận dạng ký tự còn nhiều sai sót do không có đƣợc một tập mẫu hoàn
chỉnh, và thuật toán PCA chƣa tối ƣu cho nhận dạng ký tự.
Nhận dạng PCA cho từng ký tự chậm nếu dữ liệu tập mẫu ngày càng lớn.
Nhận dạng PCA không chính xác cao nếu dữ liệu tập mẫu không lớn, cộng
với yếu tố trên ta nhận thấy nhận dạng ký tự chƣa thích hợp khi sử dụng giải thuật
PCA.

1.9 HƢỚNG PHÁT TRIỂN
Phát triển trên thiết bị di động, tiện lợi cho ngƣời dùng hơn, vì với xu thế
phát triển mạnh của di động, và xử lý ảnh, nhận dạng ảnh đã có nhiều ứng dụng trên
di động. Với đề tài nhận dạng biển chỉ dẫn thích hợp làm trên di động hơn hết. Một
phần nào đó tiện lợi cho ngƣời sử dụng,
Xây dựng thuật toán PCA kết hợp với nhận dạng Nơron để có kết quả chính
xác cao hơn.
Sử dụng các thuật toán vào việc trích các từ cũng nhƣ ký tự cộng với kết hợp
sự hổ trợ từ thƣ viện OpenCV để bài toán xử lý tối ƣu.



×