document

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.23 MB, 4 trang )

Hội Hội
Thảo
Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

Hệ Thống Mã Hoá Và Nhận Dạng Mẫu Hai Chiều Ứng Dụng Trong In Ấn Và Tra Cứu
Thơng Tin
Hồng Anh Tuấn, Nguyễn Hữu Phương, Bùi Trọng Tú
Trường Đại học Khoa học Tự Nhiên Thành phố Hồ Chí Minh
Email: , ,
Tóm Tắt—Hệ thống Mã hố (MH) và Nhận dạng mẫu (NDM) hai
chiều (2D) được coi như là một kỹ thuật tiềm năng trong lĩnh vực xử
lý thơng tin. Nó được ứng dụng trong khá nhiều ngành kỹ thuật phục
vụ mục đích ẩn dữ liệu và khơi phục thơng tin. Trong bài báo này,
một cơ chế mã hoá được đề xuất để phục vụ tốt hơn cho nhóm
ngành in ấn và tra cứu thông tin từ nhưng sản phẩm in ấn. Để tương
tác nhận dạng các mẫu được mã hoá này, một số thuật tốn về trích
xuất dữ liệu ảnh màu, lọc tín hiệu cũng như cơ chết phân ngưỡng
động được áp dụng cho phần nhận dạng mẫu Bài bào này cũng đưa
ra mơ hình kiểm nghiệm thực tế từ những mẫu được in ấn, kết hợp
với việc mô phỏng trên nền tảng FPGA nhằm tối ưu thuật toán, làm
tiền đề cho việc thiết kế ASIC khối nhận dạng mẫu.

Hình 1: Vị trí thơng thường chứa ảnh nên được mã hố
Các ảnh nền chứa một tập hợp các khối dữ liệu mã hoá
được đặt sát nhau tạo nên một mảng ma trận các chấm tròn li
ti. Mỗi khối dấu chấm tròn là một ma trận gồm 16 dấu chấm
tròn được phân bố đều theo kiểu 4x4. Kích thước mỗi khối
4x4 dấu chấm tròn nhỏ là 2 mm x 2 mm. Ở nghiên cứu này,
việc thực hiên với kích thước này là để đạt được hiệu qua cao
nhất cả cho việc mã hoá và nhận dạng.

Từ khoá- MH, NDM, 2D, FPGA.

I.

Dữ liệu được mã hố trong 16 dấu chấm trịn này theo
những mức xám khác nhau. Trong 16 chấm này dữ liệu thức
tế chỉ nằm trong 9 dấu chấm, còn 7 dấu chấm cịn lại được sử
dụng cho những mục đích khác, ví dụ: canh chuẩn xoay ảnh,
chọn mức ngưỡng cao nhất và thấp nhất. 9 trên 16 dấu chấm
thực hiện mã hố dữ liệu theo 3 mức xám.

GIỚI THIỆU

Các cơng nghê nhận dạng mẫu dựa trên xử lý ảnh đã và
đang được ứng dụng nhiều trong thực tế, phổ biến nhất là mã
vạch, mã QR Code,… Để có được kết quả nhận dạng mẫu tốt
cần phải có phương pháp mã hóa mẫu tốt và thuật toán nhận
dạng tốt. Bài báo này tập trung vào yếu tố đầu, đó là đưa ra
một phương pháp mã hoá mẫu và thuật toán tương ứng để
nhận dạng mẫu nhằm ứng dụng trong lĩnh vực lưu trữ thơng
tin và truy xuất thơng tin tự động. Nó là một phần của lĩnh
vực nhận dạng hình ảnh nhưng ở đây không phải ảnh mặt
người, ảnh sinh học hay ảnh viễn thám mà là ảnh nền của một
văn bản hay một tài liệu có chứa thơng tin mã hố thơng tin.
Kết quả của đề tài này có thể được nguyên cứu và phát triển
để ứng cũng trong lĩnh vực giáo dục với các mơ hình giảng
dạy và học tập thơng minh. Một số lĩnh vực khác có nhu cầu
về mã hố thơng tin để sau đó truy xuất từ cơ sở dữ liệu trả ra
kết quả cũng có thể ứng dụng phương pháp mà đề tài này đã

đề xuất.

Các dấu
chấm này
dung cho mã
hố dữ liệu

Mức 2: #808080
Mức 1: #505050

Hình 2: Định vị dấu chấm mã hoá và cơ chế mức xám của nó
Theo phương pháp thơng kê thì với số lượng dấu chấm là
9 và mỗi dấu có thể có 1 trong 3 mức xám khác nhau thì tổ
hợp các trạng thái có tể đạt được là: =19683.Với số lượng
mẫu này thì phục vụ tương đối cho việc mã hoá dữ liệu
III.

Mẫu mã hoá cũng như nhận dạng của đề tài này là một
mẫu hình ảnh hai chiều được chụp từ các loại máy chụp ảnh,
hoặc cảm biến lấy ảnh.
II.

Mức 3: #B0B0B0

PHƯƠNG PHÁP NHẬN DẠNG MẪU

Quá trình xử lý ảnh nhận dạng được trải qua các bước sau:

TỔNG QUAN VỀ CƠ CHẾ MÃ HỐ

Khơng gian chứa dữ liệu mã hoá là một mẫu dữ liệu được
in ấn lên các chất liệu in ấn bình thường. Các mẫu chứa thơng
tin mã hoá được ghép sát nhau liên tục để tạo thành một mảng
ảnh nền trước khi được in ra.
Hình 3: Mơ hình xử lý mẩu nhận dạng

186

ISBN: 978-604-67-0635-9

186

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Ảnh sau khi được chụp từ camera là một ảnh có kích thước
64x64 pixel sẽ trải qua 3 bước xử lý chính để cho ra được dữ
liệu sau cùng là mã mức xám được luu trữ trong các dấu
chấm trịn. Vì mẫu mã hố được thu từ camera trong điều
kiện thực tế sẽ không chuẩn như thiết kế mẩu đã nói ở phần
trên nên các bộ lọc trung vị và phép phân chia ngưỡng động
được dùng để xử lý mẫu thực. Cụ thể các bước như sau.

tế với mỗi ảnh nhận được do nhiễu nên dữ liệu nhận được đối
với mức đen nhất khơng cịn là 0 nữa mà có thể là 1, 2, 3
hoặc cao hơn. Tương tự như vậy thì màu trắng nhất khơng
cịn là 255 nữa mà có thể thấp hơn 254, 253, 252 hoặc thấp
hơn.

A. Xử lý ảnh màu thành ảnh đa mức xám
Đơn vị cơ bản của một bức ảnh là điểm ảnh (pixel), mỗi
điểm ảnh có thể được biểu diễn bằng n bytes dưới các hệ màu
khác nhau. Việc chuyển đổi giữa các hệ màu thông thường
được thực hiện thông qua các phép biến đổi ma trận. Trong
bài viết này tôi sẽ giới thiệu phương thức chuyển đổi từ ảnh
24 bits RGB sang ảnh 8 bits đa mức xám. Để thực hiện yêu
cầu trên, thông thường ta sử dụng một trong những công thức
sau đây, áp dụng cho từng điểm ảnh [x,y]:
I(x,y) =0.3086*R(x,y)+ 0.6094*G(x,y) + 0.0820* B(x,y)
I(x,y) =0.299 *R(x,y) + 0.587 * G (x,y) + 0.114 * B (x,y)

Hình 5: Mơ hình phân chia ngưỡng theo thiết kế

B. Lọc nhiễu với lọc trung vị (Median Filter)
Lọc trung vị là phép lọc phi tuyến được sủ dụng phổ biến
do khả năng khử nhiễu ngẫu nhiên tốt, và ít bị nhoè hơn so
với phép lọc trung bình.Ý tưởng thuận tốn này là sắp xếp
các giá trị điểm ảnh trong cửa sổ xử lý tăng hoặc giảm dần so
với trung vị. Kích thước cửa sổ được chon sao cho số điểm
ảnh trong cửa sổ là một số lẻ. thường là 3x3= 9 điểm ảnh,
5x5= 25 điểm ảnh.Thay thế giá trị trung tâm bằng giá trị giữa
của danh sách.

Hình 5: Mơ hình phân chia ngưỡng động theo thực tế
Từ các ngưỡng mới này ta mới có thể xem xét chính xác
hơn một dấu chấm thực tế thuộc vùng nào và từ đó sẽ cho ra
dữ liệu nhận dạng được chính xác và đúng thực tế hơn.
IV.

MƠ HÌNH PHẦN CỨNG THUẬT TỐN NHẬN
DẠNG MẪU

Mơ hình thiết kế phần cứng cho thuật toán xử lý dữ liệu đã
phân tích ở phần III được thiết kế và thực hiện trên board DE0
Nano. Project đã hoàn thành và chạy thành cơng trên board
DE0 Nano.

Hình 4: Mơ hình xử lý của thuật toán Median Filter
Giả sử A=
là các giá trị pixel trong cửa sổ
lân cận với

Một mẫu dữ liệu được xử lý theo phương pháp sau

Thì Median (A)
Ví dụ ta có A ={1,2,5,5,6,7,10,12,13} -> Median (A) =6
C. Định mức ngưỡng xám dựa trên dự liệu thực
Cơ sở khoa học của phương pháp này là sử dụng các dấu
chấm không chứa dữ liệu để xác định hai mức xám cao nhất
và thấp nhất theo ảnh thực tế nhận được. Theo lý thuyết
chuyển đổi mức xám ở phần phần A thì ảnh sau khi chuyển
đổi từ ảnh màu RGB sang ảnh đa mức xám thì dữ liệu ảnh tại
mỗi điểm ảnh sẽ cịn là 8 bit Grayscale thay vì 24 bit RGB.
Đo đó giá trị mức xám sẽ thay đổi từ 0 tới 255 tương ứng với
màu đen nhất là 0 và màu trắng nhất là 255. Nhưng trên thực

Hình 6 : Mơ hình dữ liệu thực hiện
Ảnh được chụp từ camera, sau đó được lưu trên máy tính.
Máy tính thực hiện việc chuyển ảnh xuống board nhúng để

chạy thuật toán xừ lý nhận dạng. Kết quả nhận dạng sẽ được
trả về máy tính để hiển thị và lưu trữ. Q trình giao tiếp dữ

187

187

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
liệu giữa máy tính và board được thực hiện qua chuẩn giao
thức USB 2.0

CORE hoạt động gồm 3 cơng đoạn chính: chuyển màu
RGB sang mức xám, lọc Median, phân chia ngưỡng động để
lấy giá trị 16 điểm, so sánh lấy ra kết quả. Trong cá khối xử lý
này thì khối lọc Median khá quan trọng trong việc xử lý với
mẩu thực tế. Mơ hình lọc median để trích giá trị trung vị
(med) từ 9 giá trị của cửa sổ lọc (p0->p8) được thực hiện qua
một loại khối so sánh tuần tự giá trị lớn đi đường trên và giá
trị nhỏ đi đường dưới, từ đó chọn được giá trị trung vị.

Sơ đồ khối của hệ thống phần cứng được xây dựng như sau:

Hình 7: Sơ đồ khối hệ thống phần cứng
Hình 9: Mơ hình các bộ so sánh để lấy giá trị của lọc Median

Hình ảnh ban đầu được chứa trong PC. CPU NiosII trong
FPGA thông qua hệ thống JTAG-UART để đọc file hình từ

PC ghi vào hệ thống để tiến hành xử lý. Sau khi thực hiện việc
tính tốn xong, FPGA sẽ trả kết quả lại cho PC. Board FPGA
sử dụng cho đề tài này là board DE0 nano của Terasis với chip
FPGA là Cyclone IV của Altera.Các thành phần IP chức năng
trong FPGA:

V.

KẾT QUẢ THỰC NGHIỆM

Hệ thống được triển khai thử nghiệm trên số lượng mẫu
thực tế được in ra và chụp lại khoảng gần 1000 mẫu và kế
quả thu được khá tốt với sai số nhỏ hơn <0.1% với góc
nghiên nhỏ hơn 15 độ. Mục tiêu của việc triển khai hệ thống
nhận dạng mẫu này trên chip FPGA là nhằm tạo tiền đề cho
việc mở rộng nghiên cứu tối ưu hiệu quả nhận dạng và tốc độ
nhận dạng. Bên cạnh đó cũng là cơ sở để phát triển ASIC cho
thuật toán nhận dạng này. Như các hãng nghiên cứu về mảng
này họ đều cho ra chip xử lý cho việc nhận dạng, vì thế đề tài
này cũng đi theo hướng phát triển đó.

CPU: là CPU NiosII, thực hiện cơng việc đọc file hình và
ghi vào Onchip memory. Khởi động CORE hoạt động. Chờ
CORE thực thi tính tốn các thuật tốn xong để đọc kết quả
trả về.
JTAG-UART: cho phép CPU truy xuất trực tiếp lên một
file trên máy tính PC thơng qua cổng JTAG-UART.

Hệ thống được cài đặt và thử nghiệm thành công trên
board DE0-Nano với chip FPGA số hiệu là EP4CE22F17C6

với kết quả sử dụng tài nguyên hệ thống như sau.

Onchip Memory: có dung lượng 16KB để lưu bức hình.
Do hình cần xử lý co kích thước bé chỉ có 64x64 pixel nên có
thể lưu trên bộ nhớ trong chip.
SDRAM Controller: controller này để giao tiếp với
memory offchip SDRAM. Bởi vì dung lượng memory onchip
trong FPGA không đủ để chứa lệnh, cho nên SDRAM được
sử dụng để chứa lệnh cho CPU. SDRAM trên board DE0
Nano có dung lượng 32MB.
CORE: lõi tính tốn thuật tốn. Khi nhận lệnh start từ CPU
sẽ tiến hành đọc bức hình được lưu trong Onchip memory.
CORE sẽ xử lý hình ảnh để cho ra kết quả mã tương ứng với
hình ảnh đó.

Hình 10: Kết quả phần cứng chạy trên board nhúng DE0
nano.
Khi chạy xong thì Nios2 tự động printf ra ngồi màn hình
console cho thấy kết quả

Hình 8: Mơ hình của khối xử lý thuật toán trên CORE

188

188

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

:

TÀI LIỆU THAM KHẢO
[1]
[2]
[3]
[4]

Hình 11: Kết quả nhận dạng của một mẫu ví dụ
Chuỗi kết quả này được xử lý từ một ảnh thực tế, 9 giá trị
tất cả [1 2 3 3 2 1 1 2 3] được trích xuất từ 16 dấu chấm của
một mẫu bất kì nào đó ở đây là mẫu dữ liệu ví dụ trong kho
dữ liệu mẫu được tạo sẵn.

[5]
[6]

Hệ thống mã hoá và nhận dạng này được thực hiện trên số
lượng dữ liệu mẫu khoảng 1000 mấu. Và ngày càng mở rộng
thêm để kiểm chứng. Kết quả kiểm chứng tạm thời cho sai số
khá tốt 0.1%. Sau đây là bảng so sánh kết quả với hệ thống
mã hoá và nhận dạng loại hai chiều dùng dấu chấm (dot
matrix) hiện tại mà các công ty công nghê đang nắm giữ:

[7]

[8]
[9]

[10]

[11]

[12]
[13]
[14]

Bảng 1: So sánh kết quả bài báo với một số công nghệ khác
Từ các kết quả trên đây dễ nhận thấy là đề tài đạt được
những kết quả tương đượng hoặc tốt hơn so với các công
nghệ hiện tại đang được sử dụng. Nhưng để triển khai tốt hơn
trong thực tế cần một số cải tiến và tối ưu hơn nữa.
Kết quả được thực hiện cho hệ thống thực tế bao
gồm một camera thu nhận ảnh với độ phân giải 64x64 pixel
và một Chip xử lý nhận dạng. Kết quả nhận dạng được kết
hợp với cơ sở dữ liệu có sẵn để cho ra kết quả thích hợp theo
mơ hình sau

Hình 12: Mơ hình triển khai thực tế của kết quả đề tài

189

189

R.N. Bracewell, Two-Dimensional Imaging, Prentice Hall, 1995
R.C. Gonzalez, R.E. Woods, Digital Image Processing,Prentice Hall,
1992
Haykin, Adaptive Filter Theory Fourth Edition, Prentice Hall, 2006
C.D. Munson, S.T. Huang, C.A. Bovik, “The Effect of Median
Filtering on Edge Estimation and Detection,” IEEE Transactions on
Pattern Analysis and Machine Intelligence, pages.181-194, 1987

Bae K.S., Kim K.K., Chung Y.G., Yu W.P., “Character recognition
system for cellular phone with camera”, Computer Software and
Applications Conference (COMPSAC). pages.539 – 544, 2005
Jain, A.K., Duin, R.P.W. ; Jianchang Mao. “Statistical Pattern
Recognition: A Review”, IEEE Transactions on Pattern Analysis and
Machine Intelligence, Volume:22 , Issue: 1, pages. 4-37, 2000
Khodaskar.A.A, Ladhake.S.A.” Pattern recognition: Advanced
development, techniques and application for image retrieval”,
International Conference on Communication and Network
Technologies (ICCNT), pages.74 – 78, 2014
Yu.F.T.S, Gregory.D.A, “Optical pattern recognition: architectures and
techniques”, Proceedings of the IEEE, pages.733 – 752, 1996
Selvarajan S, Sri Ramakrishna, Palanisamy V. , Mathivanan B.,
“Human identification and recognition system using more significant
hand attributes” International Conference on Computer and
Communication Engineering (ICCCE), pages.1211 – 1216, 2008
Sameer Singh, “2D spiral pattern recognition with possibilistic
measures”, Elsevier Pattern Recognition Letters, pages.141–147, 1998
Yuning Xie, Xiaoguo Zhang, Zhu Zhu, Qing Wang, “An adaptive
median filter using local texture information in image”, International
Conference on Computer and Information Science (ICIS), pages.177 –
180, 2014
OPTICAL ID IMAGE Decoder Specifications [ 2ndgeneration ], sonix
technology co., ltd
Tung-Tsai Liao, Shih-Chien Lin, Yu-Tang Chang,” Method for coding
two dimensional optical identification with the same gray level and
printing product thereof”, Generalplus Technology Inc., 2010
/>

document

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về