Tải bản đầy đủ (.docx) (15 trang)

Nhập môn lý thuyết nhận dạng Nhận dạng mã vạch

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (338.54 KB, 15 trang )

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI

KHOA CÔNG NGHỆ THÔNG TIN
------------

BÀI TẬP LỚN MÔN
Nhập môn lý thuyết nhận dạng
ĐỀ TÀI: Nhận dạng mã vạch
Giảng viên hướng dẫn:
Nhóm thực hiện:
Lớp:
Sinh viên thực hiện:

Hà Nội, năm 2018

1


MỤC LỤC

2


LỜI NÓI ĐẦU
Xử lý và nhận dạng là một lĩnh vực từ lâu được nhiều người quan tâm. Nó đã
được ứng dụng vào nhiều lĩnh vực như: y học, thiên văn học, các lĩnh vực công
nghiệp, người máy,…
Ngày nay trên thế giới bên cạnh việc tăng trưởng kinh tế là sự phát triển của
các ngành khoa học kỹ thuật nói chung, mà trong đó ngành công nghiệp sản xuất là
một trong những ngành có tốc độ phát triển cực nhanh. Đối với công tác quản lý các
mặt hàng sản phẩm tốn khá nhiều thời gian và công sức. Mỗi loại mặt hàng yêu cầu


cần có mã vạch để phân biệt.
Đồng thời với mong muốn có những hiểu biết sâu hơn về lý thuyết nhận dạng
nên nhóm em đã chọn đề tài: “Nhận dạng mã vạch” .
Em xin chân thành cảm ơn thầy Đỗ Văn Tuấn đã chỉ dạy và hướng dẫn để
chúng em hoàn thành bài tập lớn và đã đóng góp ý kiến để bài báo cáo của chúng
mình hoàn thiện hơn.
Em xin chân thành cảm ơn!

3


CHƯƠNG I: CƠ SỞ LÝ THUYẾT
1. Khái niệm nhận dạng

Nhận dạng – đó là việc xếp một đối tượng cụ thể nào đó (được thể hiện
bằng các thuộc tính của nó) vào một trong các lớp cố định cho trước, theo các quy
tắc giải quyết nhất định, tương ứng với mục tiêu đề ra.
Khả năng nhận dạng dựa vào sự tương đồng của các đối tượng cùng loại
Ví dụ: Nhận dạng bệnh theo triệu chứng của người bệnh hoặc nhận dạng các
hiện tượng xã hội theo thông tin thống kê.
2. Trích chọn đặc trưng

Trích chọn đặc trưng là công việc được thực hiện nhằm biến đổi dữ liệu
thô biểu diễn các mẫu ban đầu thành các dữ liệu hữu ích hơn, có số chiều ít hơn
trước khi đưa vào công đoạn chính của quá trình nhận dạng mà không làm
giảm chất lượng dữ liệu.
* Ý nghĩa của của việc trích chọn đặc trưng:
-

Số chiều của dữ liệu giảm => tăng hiệu quả tính toán trong các công đoạn sau


-

Các thuộc tính ít quan trọng (ít ảnh hưởng đến quá trình phân lớp) bị loại bỏ

-

Giải quyết được sự quá tải thuộc tính trong một số hệ thống nhận dạng

-

Giảm băng thông của dữ liệu đầu vào
Tập dữ liệu ban đầu được biểu diễn dưới dạng các thuộc tính gọi là dữ liệu thô.

Tập thuộc tính ban đầu có thể rất lớn. Việc giảm số lượng chiều của dữ liệu có thể
thực hiện bằng cách:
- Lựa chọn thuộc tính
- Trích rút thuộc tính
Theo Isabelle, trích chọn đặc trưng là quá trình chuyển đổi dữ liệu từ dạng biểu
diễn thô của các mẫu nhận dạng về một tập thuộc tính phù hợp phục vụ cho quá
trình phân loại mẫu. Quá trình này gồm 2 công đoạn:

4


▪ Xây dựng thuộc tính: từ biểu diễn ban đầu của n mẫu, thực hiện các độ đo, các

phép biến đổi nhằm tạo ra them các thuộc tính mới.
Ví dụ: hai thuộc tính “dài”, “rộng”, ta xây dựng them thuộc tính “diện tích”, khi đó
tập thuộc tính mới {dài, rộng, diện tích}



Lựa chọn thuộc tính: từ tập thuộc tính thu được sau công đoạn xây dựng thuộc
tính, ta chon ra các thuộc tính quan trọng, bỏ đi các thuộc tính ít quan trọng

3. Phân lớp theo khoảng cách Euclidean

Phân lớp Bayesian tối ưu được đơn giản hóa với các giả thiết sau:
- Các lớp dữ liệu đều tuân theo phân bố Gaussian
- Dữ liệu trong tất cả các lớp đều tuân theo phân bố Gaussian
- Ma trận hiệp phương sai giống nhau trên tất cả các lớp
- Ma trận hiệp phương sai là ma trận đường chéo và các phần tử đề là hẳng số,
nghĩa là S= I với I là ma trận đơn vị.
Với tất cả các giả thiết thì phân lớp Bayesian tối ưu tương đương với phân lớp
theo khoảng cách Euclidean gần nhất.
Nghĩa là x được gán cho lớp wi có khoảng cách theo chuẩn Euclidean gần nhất:

4. Khái niệm mã số mã vạch

Mã vạch (Barcode) là một dãy các vạch và khoảng trống song song xen kẽ
được sắp xếp theo một quy tắc mã hóa nhất định để thể hiện mã số (hoặc các dữ
5


liệu gồm cả chữ và số). Sự thay đổi trong độ rộng của vạch và khoảng trắng biểu
diễn thông tin số hay chữ số dưới dạng mà máy vạch có thể đọc có gắn đầu laser
(Scanner) nhận và đọc được.
Mã số mã vạch được thu nhận bằng một máy quét mã vạch, là một máy thu
nhận hình ảnh của mã vạch in trên các bề mặt và chuyển thông tin chứa trong mã
vạch đến máy tính hay các thiết bị cần thông tin này. Nó thường có một nguồn

sáng kèm theo thấu kính, để hội tụ ánh sáng lên mã vạch, rồi thu ánh sáng phản xạ
về một cảm quang chuyển hóa tín hiệu ánh sáng thành tín hiệu điện. Ngoài ra,
nhiều máy quét mã vạch còn có thêm mạch điện tử xử lý tín hiệu thu được từ cảm
quang để chuyển thành tín hiệu phù hợp cho kết nối với máy tính.
Mã vạch bao gồm 2 phần:
-

Mã số của hàng hóa

-

Mã vạch: phần thể hiện mã số bằng vạch để cho máy đọc

5. Một số loại mã vạch phổ biến

6


6. Có bao nhiêu loại mã vạch

Có thể nói mã vạch cũng giống như một đạo quân các ký hiệu quen thuộc,
chúng xuất hiện ở khắp mọi nơi, mọi chỗ, trên hầu hết các sản phẩm lưu hành trên
thị trường. Ai cũng đều thấy chúng nhưng ít ai hiểu được rõ ràng về chúng. Khi
được hỏi về mã số mã vạch đa số người ta chỉ biết mã vạch là…Mã vạch. Nó là
biểu tượng, mã hóa một con số gì đó mà người ta không hiểu. Nói như vậy mã
vạch chỉ có một loại duy nhất và nó được sử dụng để lưu trữ 1 con số gì đó.
Thực ra mã số mã vạch gồm nhiều chủng loại khác nhau. Tùy theo dung
lượng thông tin, dạng thông tin được mã hóa cũng như mục đích sử dụng mà người
ta chia ra làm nhiều loại, trong đó có các dạng thông dụng trên thị trường mà ta
thấy gồm: UPC, EAN, Code 39, Interleaved 2of 5, Codabar và Code 128… Ngoài

ra, trong một số loại mã vạch người ta còn phát triển làm nhiều Version khác nhau,
có mục đích sử dụng khác nhau, thí dụ như UPC có các Version UPC-A, UPC-B,
UPC-C, UPC-D và UPC-E; EAN có các Version EAN-8, EAN-13, EAN-14; Code
128 gồm Code 128 Auto, Code 128-A, Code 128-B, Code 128-C
7. Các đặc tính ưu việt của công nghệ mã số vạch
 Hiệu suất : Nhận dạng tự động thay thế ghi chép bằng tay nên giúp: giảm

nhân công, tiết kiệm thời gian, dẫn đến tăng hiệu suất công việc.
 Chính xác: với cấu trúc được tiêu chuẩn hoá, an toàn và đơn giản Mã số Mã
vạch cho phép nhận dạng chính xác vật phẩm và dịch vụ, thay thế khâu
7


“nhập” và “truy cập” dữ liệu bằng tay, do đó cho “kết quả” chính xác, không
nhầm lẫn.
 Thông tin nhanh: Mã số mã vạch giúp thu thập và cung cấp thông tin nhanh,
giúp cho các nhà kinh doanh và quản lý có thể có những quyết định đúng đắn
và kịp thời trong hoạt động sản xuất kinh doanh và quản lý.
 Thoã mãn khách hàng: Do tính hiệu suất, chính xác, thông tin nhanh, Mã số
mã vạch giúp đáp ứng khách hàng về mặt thời gian, số lượng hàng, chủng
loại, về chất lượng hàng và dịch vụ, tính tiền nhanh và chính xác, hướng dẫn
lựa chọn hàng hoá và dịch vụ theo yêu cầu.

8


CHƯƠNG II: TỔNG QUAN VỀ ĐỀ TÀI
1. Lý do chọn đề tài

Ngày nay, công nghệ mã vạch đã trở nên quá phổ biến được nhiều người

tin tưởng và sử dụng, công nghệ này tiếp tục cung cấp nhiều lợi ích trong các
lĩnh vực doanh nghiệp. Chỉ với một số thiết bị in ấn cơ bản máy in mã vạch và
một máy quét mã vạch là doanh nghiệp có thể sử dụng công nghệ mã vạch để
cải thiện độ chính xác, tốc độ và hiệu quả mà không cần gia tăng chi phí.
Các sản phẩm rất đa dạng, đòi hỏi phải có một hệ thống tiện lợi thích
hợp để kiểm kê hàng hóa, đóng nhãn sản phẩm và giúp khách hàng dễ mua đồ
hơn. Việc có thể điều chỉnh nhãn hiệu và quảng cáo cho doanh nghiệp sẽ mang
lại cho bạn nhiều thời gian tập trung vào những nhu cầu cụ thể của khách hàng
2.

3.




4.

hơn
Nội dung đề tài
 Tìm hiểu thông tin về mã số mã vạch
 Tìm hiểu các công đoạn chính của bài toán nhận dạng mã số mã vạch.
Yêu cầu bài toán
o Bài toán mã số mã vạch được chia làm các giai đoạn:
Định vị vùng chứa mã số mã vạch
Phân vùng mã số và mã vạch
Tách từng ký tự số
Nhận dạng từng số
Hướng giải quyết bài toán
*Bước 1: Tiền xử lý


- Các ảnh đầu vào sẽ được chuyển thành ảnh xám theo công thức:

- Chuyển sang ảnh nhị phân
*Bước 2: Định vị đối tượng trong ảnh
-

Để nhận dạng được mã số, ta phải tách được mã số và mã vạch trong ảnh.

9


-

Mỗi dòng văn bản hay ký tự luôn có tọa độ chặn trên và tọa độ chặn dưới,

trong khi đó mỗi ký tự có tọa độ chặn dưới, tọa độ chặn trên, giới hạn trái và giới
hạn phải.
- Thuật toán dò biên tổng quát:
+ Xác định cặp nền vùng xuất phát: Cặp nền vùng xuất phát được xác định bằng
cách duyệt ảnh lần lượt từ trên xuống dưới và từ trái sang phải điểm đen đầu tiên gặp
được cùng với điểm trắng trước đó ( theo hướng 4 ) để tạo nên cặp nền vùng xuất
phát.
+ Xác định cặp nền vùng tiếp theo
+ Lựa chọn điểm biên vùng
+ Nếu gặp lại cặp xuất phát thì dừng nếu không quay lại bước 2.
*Bước 3 : Nhận dạng ký tự (mã số)
Đối sánh mẫu (Template Matching) là một nhóm kỹ thuật nhằm phân loại đối
tượng dựa vào mức độ tương tự giữa những đối tượng xem xét với mẫu cho trước
và một hình bất kì đa mức xám lớn hơn mẫu, xác định xem đối tượng mẫu có xuất
hiện trong hình hay không, nếu có thì khoanh vùng khu vực tương ứng đó, nếu

không thì báo là không tồn tại đối tượng.
Quá trình matching sẽ được tiến hành bằng cách quét hình mẫu lần lượt từ trái
sang phải, từ trên xuống dưới sao cho tâm của nó di chuyển qua tất cả các vị trí có
thể trong hình được xem xét và tính giá trị của tham số phân loại tại mỗi vị trí đó,
tham số này sẽ nói lên mức độ khớp của mẫu với đối tượng xuất hiện tại vị trí
tương ứng đang tính toán trong hình được cho. Đảm bảo rằng hình mẫu luôn nằm
lọt trong hình xem xét. Như vậy quá trình matching được hoàn tất dựa trên cơ sở
xem xét với tọa độ từng điểm ảnh một.

10


*Cách xác định tọa độ mỗi số:
Bắt đầu từ dòng chặn trên vừa tìm được, duyệt theo chiều dọc tới tung độ của
dòng chặn dưới, nếu gặp điểm màu đen thì ghi nhận hoành độ điểm đó là hoành độ
của cột giới hạn trái, nếu không thấy điểm màu đen thì tiếp tục lại từ đầu cột kế
tiếp. Tương tự với tọa độ giới hạn phải, bắt đầu dòng chặn trên, duyệt theo chiều
dọc tới tung độ của dòng chặn dưới , nếu sau hết cột không tìm thấy điểm màu đen
thì hoành độ đang xét là hoành độ cột giới hạn phải của ký tự, nếu tìm thấy thì tiếp
tục lại từ đầu cột kế tiếp
- Từ tọa độ ban đầu (0,0) duyệt theo chiều ngang để tìm điểm có màu đen nếu
đã mà vẫn chưa thấy thì bắt đầu duyệt lại từ đầu dòng kế tiếp. Nếu tìm thấy điểm
có màu đen thì ghi nhận tung độ điểm đó là tung độ của dòng chặn trên và dừng
duyệt.
- Với tọa độ chặn dưới thì xuất phát từ điểm có hoành độ là 0 và tung độ bằng
tung độ của dòng chặn trên theo chiều ngang, nếu sau khi hết dòng không thấy
điểm đen nào thì ghi nhận tung độ dòng đang xét là tung độ của dòng chặn dưới,
còn nếu tìm thấy điểm đen thì lại xét lại từ dòng kế tiếp
*Cách tính tham số phân loại:


11


Chương trình:

Ảnh đầu vào:

12


Ảnh nhị phân

Đối tượng đã được cắt:

13


KẾT LUẬN
Với sự giúp đỡ và sự chỉ bảo tận tình của thầy Đỗ Văn Tuấn, trên cơ sở
những kiến thức có được trong quá trình học tập và thời gian nghiên cứu vừa
qua nhóm em đã hoàn thành bài tập lớn môn Nhập môn lý thuyết nhận dạng của
mình đúng tiến độ.
Một lần nữa em xin chân thành cám ơn các bạn và đặc biệt là thầy Đỗ Văn
Tuấn đã tận tình chỉ bảo, giúp đỡ để nhóm em hoàn thành đề tài này.

14


TÀI LIỆU THAM KHẢO
scribd.com

2.
baigiang.violet.vn
3.
Slide Nhập môn lý thuyết nhận dạng
4.
Wikipedia.org

15



×