BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
LUẬN VĂN THẠC SỸ KHOA HỌC
NGÀNH : QUẢN TRỊ KINH DOANH
MỘT SỐ GIẢI PHÁP NÂNG CAO CHẤT LƯỢNG
ĐÀO TẠO TẠI TRƯỜNG CAO ĐẲNG NGHỀ
CÔNG NGHỆ VÀ NÔNG LÂM NAM BỘ
TRONG GIAI ĐOẠN 2009 - 2015
HÀ HUY HUYỀN
Người hướng dẫn khoa học:
TS. NGHIÊM SĨ THƯƠNG
HÀ NỘI - 2009
Bộ giáo dục và đào tạo
trường đại học bách khoa hà nội
-------------------------------------------------------------
luận văn thạc sĩ khoa học
Nghiên cứu ứng dụng các phương pháp
nhận dạng ảnh trong điều khiển Robot
ngành : tự động hoá xncn
mà số :
nguyễn minh sơn
Người hướng dẫn khoa học : TS Nguyễn Văn khang
hà nội - 2008
Lời cam đoan
Tôi xin cam đoan bản luận văn này được thực hiện bởi chính bản thân tôi
dưới sự hướng dẫn của TS Nguyễn Văn Khang cùng với các tài liệu đà được trích
dẫn trong phần tài liệu tham khảo ở phần cuối bản luận văn.
Nguyễn Minh Sơn
Mục Lục
B
0
Trang
Trang phụ bìa
B
1
Lời cam đoan
B
2
Mục lục
B
3
Danh mục ký hiệu và chữ viết tắt
B
4
Lời mở đầu
1
B
5
6B
chương I - Tổng quan về ứng dụng các phương
B
7
pháp nhận dạng ảnh trong điều khiển Robot
và nội dung cần nghiên cứu
3
8B
1.1 Tổng quan về ứng dụng các phương pháp nhận dạng ảnh
B
9
trong điều khiĨn Robot
3
10B
1.1.1 TÝnh thêi sù
3
B
1
12B
1.1.2 C¬ së khoa häc cđa ứng dụng các phương pháp nhận dạng
B
3
1
ảnh trong điều khiển Robot
4
14B
1.1.3 Tính ứng dụng
5
B
5
1
16B
1.1.4 Tình hình nghiên cứu ứng dụng nhận dạng ảnh trong điều
B
7
1
khiển Robot trên thế giới
6
18B
1.1.5 Tình hình nghiên cứu, ứng dụng trong nước
7
B
9
1
20B
1.2 Các bước chính trong hệ thống nhận dạng
9
B
1
2
2B
1.2.1 Thu nhận hình ảnh
9
B
3
2
24B
1.2.2 Tiền xử lí
9
B
5
2
26B
1.2.3 Phân vùng
9
B
7
2
1.2.4 Phân tích hình ảnh
B
9
2
1.2.5 Nhận dạng
B
1
3
28B
10
B
0
3
10
B
2
3
1.2.6 Xư lÝ møc cao
B
3
1.3 Néi dung nghiªn cøu
B
5
3
1.4 Mơc tiêu và nội dung của luận văn
B
7
3
1.4.1 Mục tiêu
B
9
3
1.4.2 Nội dung
B
1
4
Chương II - phân vùng ảnh
B
3
4
2.1 Phân vùng ảnh theo ngưỡng biên độ
B
5
4
2.1.1 Ngưỡng cố định
B
7
4
2.1.2 Ngưỡng dựa trên lược đồ
B
9
4
2.1.2.1 Tuật toán đẳng liệu
51B
2.1.2.2 Thuật toán tam giác
53B
2.2 Thuật toán gán nhÃn thành phần liên thông
B
5
2.3 Phân vùng theo miền đồng nhất
B
7
5
2.3.1 Phương pháp tách cây tứ phân
B
9
5
2.3.2 Phương pháp cục bộ
B
1
6
2.3.3 Phương pháp tổng hợp
B
3
6
2.4 Phân vùng ảnh theo kết cấu bề mặt
B
5
6
2.4.1 Phương pháp thống kê
B
7
6
2.4.2 Phương pháp cấu trúc
B
9
6
2.4.3 Tiếp cận theo tính kết cấu
71B
Chương III - Các phương pháp nhận dạng ảnh
B
3
7
3.1 Khái quát về nhận dạng
B
5
7
3.1.1 Không gian biểu diễn đối tượng, không gian diễn dịch
B
7
3.1.2 Mô hình và bản chất của quá trình nhận dạng
B
9
7
3.1.2.1 Mô hình
B
1
8
3.1.2.2 Bản chất của quá trình nhận d¹ng
B
3
8
10
B
4
3
11
B
6
3
12
B
8
3
12
B
0
4
12
B
2
4
14
B
4
14
B
6
4
15
B
8
4
15
B
0
5
16
B
2
5
16
B
4
5
17
B
6
5
19
B
8
5
19
B
0
6
21
B
2
6
22
B
4
6
23
B
6
23
B
8
6
27
B
0
7
27
B
2
7
28
B
4
7
28
B
6
7
28
B
8
7
29
B
0
8
29
B
2
8
31
B
4
8
33
B
6
8
3.2 Nhận dạng dựa trên phân hoạch không gian
B
5
8
3.2.1 Phân hoạch không gian
B
7
8
3.2.2 Hàm phân lớp hay hàm ra quyết định
B
9
8
3.2.3 Nhận dạng thống kê
B
1
9
3.2.4 Một số thuật toán nhận dạng tiêu biểu trong tự học
B
3
9
3.2.4.1 Thuật toán dựa vào khoảng cách lớn nhất
95B
3.2.4.2 Thuật toán K trung bình
97B
3.2.4.3 Thuật toán ISODATA
9B
3.3 Nhận dạng theo cấu trúc
B
0
1
3.3.1 Biểu diễn định tính
B
3
0
1
3.3.2 Phương pháp ra quyết định dựa vào cấu trúc
B
5
0
1
3.3.2.1 Một số khái niệm
107B
3.3.2.2 Phương pháp nhận dạng
109B
3.4 mạng nơ ron nhân tạo và Nhận dạng theo mạng nơ ron
B
1
3.4.1.Bộ nÃo và nơ ron sinh học
B
3
1
3.4.2. Mô hình mạng nơ ron nhân tạo
B
5
1
3.4.2.1 Mô hình nơ ron nhân tạo
17B
3.4.2.2 Mạng nơ ron
19B
3.4.3 Các mạng nơ ron một lớp
B
2
1
3.4.3.1 Mạng Hopfield
123B
3.4.3.2 Mạng kiểu bộ nhớ 2 chiều kết hợp thích nghi
125B
3.4.3.3 Mạng Kohonen
127B
3.4.3.4 Mạng Perceptron
129B
3.4.4 Các mạng nơ ron nhiều lớp
B
3
1
3.4.4.1 Mạng nơ ron nhiều lớp lan truyền ngược sai số
13B
3.4.4.2 Mạng nơ ron nhiều lớp ngược hướng
135B
33
B
8
33
B
0
9
35
B
2
9
36
B
4
9
36
B
6
9
37
B
8
9
38
B
0
1
39
B
2
0
1
39
B
4
0
1
39
B
6
0
1
39
B
8
0
1
41
B
0
1
41
B
2
1
42
B
4
1
45
B
6
1
46
B
8
1
47
B
0
2
1
52
B
2
1
52
B
4
2
1
56
B
6
2
1
59
B
8
2
1
64
B
0
3
1
66
B
2
3
1
66
B
4
3
1
71
B
6
3
1
74
B
8
3
1
Chương IV B
7
3
1
ứng dụng nhận dạng ảnh trong
điều khiển Robot
4.1 ứng dụng nhận dạng ảnh trong điều khiển chuyển động
B
9
3
1
của Robot
4.2 Xây dựng các tham số cho bộ điều khiển camera
B
4
1
4.2.1 Tính toán tốc độ quay theo phương ngang
B
3
4
1
4.2.2 Tính toán tốc độ quay theo phương đứng
B
5
4
1
4.3 Xây dựng các tham số cho bộ điều khiển robot
B
7
4
1
4.3.1 Các tham số ảnh hưởng tới tốc độ của Robot
B
9
4
1
4.3.2 Tính toán các tham số trong bộ điều khiển
B
5
1
Chương V - Mô phỏng
B
3
5
1
5.1 Mô phỏng quá trình nhận dạng ảnh
B
5
1
5.1.1 Cơ sở lý thuyết thực hiện quá trình nhận dạng
B
7
5
1
5.1.2 Kết quả mô phỏng
B
9
5
1
5.1.3 Nhận xét
B
6
1
5.2 Mô phỏng bộ điều khiển Robot, quỹ đạo đuổi bắt đối tượng
B
3
6
1
5.2.1 Xây dựng sơ đồ khối
B
5
6
1
5.2.2 Kết quả mô phỏng
B
7
6
1
5.2.3 Nhận xét
B
9
6
1
Kết luận và kiến nghị
B
7
1
Tài liệu tham khảo
B
3
7
1
Phụ lục
B
4
7
1
Tóm tắt luận văn
B
5
7
1
74
B
0
4
1
75
B
2
4
1
75
B
4
1
77
B
6
4
1
78
B
8
4
1
78
B
0
5
1
79
B
2
5
1
83
B
4
5
1
83
B
6
5
1
83
B
8
5
1
85
B
0
6
1
87
B
2
6
1
88
B
4
6
1
88
B
6
1
92
B
8
6
1
94
B
0
7
1
95
B
2
7
1
Danh mục ký hiệu và chữ viết tắt
Giá trị ngưỡng của mức xám
Pixel
Điểm ảnh
X
Là đối tượng ảnh
X
Là không gian đối tượng
Không gian diễn dịch
Tập rỗng
W
Ma trận trọng số
x , y
Tọa độ của đối tượng trong ảnh
Góc của camera theo phương ngang
Góc của camera theo phương đứng
v
Vận tốc dài
Vận tốc góc
e
Vector sai lƯch vÞ trÝ
1
Lời Mở đầu
Sự phát triển của kỹ thuật điện tử và công nghệ thông tin đà kéo theo sự
phát triển của một loạt các ngành liên quan. Một trong những ngành đó là
ngành xử lý nhận dạng ảnh số. Trên thế giới, công nghệ xử lý nhận
dạng ảnh đà và đang được phát triển rất mạnh mẽ vì nó có rất nhiều ứng dụng
trong hầu hết các lĩnh vực của con người. Và hiện nay, nếu sản phẩm nào có
ứng dụng công nghệ này thì đều được coi là sản phẩm thông minh, có sức
cạnh tranh lớn. Một trong những lĩnh vực rất cần được trang bị công nghệ
nhận dạng ảnh đó là công nghiệp chế tạo Robot. Việc ứng dụng công nghệ
này trong điều khiển Robot sẽ làm tăng khả năng nhận thức cho Robot, làm
cho nó ngµy cµng hoµn thiƯn vµ gièng con ngêi.
ë trong níc, môn xử lý ảnh mới chỉ được giảng dạy ở mét sè trêng
träng ®iĨm vỊ khoa häc kü tht nh Đại học Bách khoa Hà nội, Đại học
Quốc gia Hà nội, Đại học Bách khoa thành phố Hồ Chí Minh . Và mới chỉ
giới hạn trong các ngành như công nghệ thông tin, điện tử viễn thông. Hiện,
chưa có nhiều nghiên cứu để đưa công nghệ này vào ứng dụng thực tiễn trong
các ngành, các lĩnh vực khác.
Hiện nay, công nghệ xử lý nhận dạng ảnh số đang được rất nhiều
bạn trẻ quan tâm. Đặc biệt là các bạn sinh viên đang hoặc có ý định tham gia
trò chơi Robocon quốc tế. Bởi vì hầu hết các Robot tự động hiện nay chủ yếu
rò đường theo vạch kẻ sân và không phân biệt được cấu kiện của mình hay của
đội bạn. Việc trang bị kỹ thuật nhận dạng ảnh cho Robot tự động sẽ làm giảm
bớt các nhược điểm trên, đồng thời làm tăng khả năng điều khiển linh hoạt
cho Robot.
Xuất phát từ nhu cầu thực tiễn trên, Tôi đà chọn đề tài Nghiên cứu ứng
dụng các phương pháp nhận dạng ảnh trong điều khiển Robot.
2
Quyển luận văn này sẽ như một tài liệu tham khảo, giúp người đọc có
hình dung về khái niệm nhận dạng ảnh, các phương pháp nhận dạng ảnh và
biết cách ứng dụng công nghệ này trong điều khiển Robot. Cụ thể ở đây tôi
xây dựng phương pháp nhận dạng ảnh để điều khiển Robot trong việc tìm và
đuổi bắt mục tiêu đang di động có phương và vận tốc chưa biết.
Trong khuôn khổ của một đề tài với quỹ thời gian không cho phép và có
một số khó khăn trong việc cập nhập tài liệu cũng như do hạn chế của bản
thân, nên chắc chắn quyển luận văn này không tránh khỏi những thiếu sót.
Vậy kính mong các thầy cô cùng các bạn yêu thích công nghệ này đóng góp
chỉ bảo, phê bình để đề tài này ngày càng hoàn thiện.
Em xin chân thành cảm ơn thầy giáo TS. Nguyễn Văn Khang đà tận
tình hướng dẫn chỉ bảo em trong thời gian thực hiện đề tài này!
Hà nội, 18/ 11/ 2008.
Tác giả
Nguyễn Minh Sơn
3
chương I
Tổng quan về ứng dụng các phương pháp nhận
dạng ảnh trong điều khiển Robot và nội dung
cần nghiên cứu
1.1 Tổng quan về ứng dụng các phương pháp nhận
dạng ảnh trong điều khiển Robot
1.1.1 Tính thời sự
Ngày nay, trước sự phát triển vượt bậc của khoa học kỹ thuật, các thiết
bị máy móc thay thế hoặc hỗ trợ cho con người trong lao động sản xuất, trong
sinh hoạt, đòi hỏi ngày càng phải hoàn thiện hơn. Trong những năm gần đây
do kỹ thuật vi điện tử phát triển rất mạnh, đà khiến cho tốc độ của các bộ vi xử
lý ngày càng cao, chất lượng của các camera kỹ thuật số ngày càng hoàn
thiện. Vì vậy, việc ứng dụng công nghệ xử lý ảnh, nhận dạng ảnh ngày càng
sâu rộng trong tất cả các lĩnh vực như trong công nghiệp, quân sự, an ninh, vũ
trụ, y học, giao thôngvv và cả trong cuộc sống hàng ngày.
Từ khi xuất hiện cho tới nay, không ai có thể phủ nhận được vai trò của
Robot trong sản xuất công nghiệp lẫn trong sinh hoạt gia đình. Chúng sẽ thực
hiện những công việc rất nhàm chán hoặc nguy hiểm, và những công việc mà
tốc độ và độ chính xác vượt quá khả năng của con người. Khi người máy trở
nên tinh vi hơn, thị giác máy tính sẽ đóng vai trò ngày càng quan trọng. Người
ta sẽ đòi hỏi người máy không những phát hiện và nhận dạng các bộ phận
công nghiệp mà còn hiểu được những gì chúng thấy và đưa ra những hành
động phù hợp. Việc phát triển, hoàn thiện các tính năng giúp cho người máy
ngày càng giống với con người đà khiến các nhà khoa học trên thế giới phải
tốn nhiều công sức. Ngày nay, cùng với sự phát triĨn tét bËc cđa khoa häc kü
4
thuật, người ta đà tạo ra được nhiều Robot có khả năng quan sát, làm được
nhiều việc với độ chính xác caovv. Trong những con Robot này, người ta sử
dụng một hay nhiều camera để ghi lại hình ảnh xung quanh Robot. Và bằng
công nghệ nhận dạng ảnh, xử lý ảnh, máy tính sẽ phân tích và đưa ra quyết
định. Như vậy camera, công nghệ nhận dạng ảnh đóng một vai trò rất quan
trọng, nó giống như mắt của con người.
Việc tìm hiểu, nghiên cứu các kỹ thuật xử lý ảnh, nhận dạng ảnh đà và
đang được sự quan tâm của rất nhiều nhà nghiên cứu vì đây là lĩnh vực còn rất
mới. Bên cạnh đó việc nghiên cứu các kỹ thuật này, sẽ giúp chúng ta bắt nhịp
được với sự phát triển công nghệ của thế giới. Từ đó, ta có thể nắm được
nguyên lý để ứng dụng vào các ngành công nghệ khác đồng thời làm chủ được
các thiết bị hiện có trên thị trường đang ứng dụng công nghệ này.
1.1.2 Cơ sở khoa học của ứng dụng các phương
pháp nhận dạng ảnh trong điều khiển Robot
ý tưởng sử dụng camera làm mắt cho robot đà có từ lâu, từ khi camera
mới xuất hiện. Nhưng điều đó rất khã cã thĨ thùc hiƯn bëi v× tÝn hiƯu ra của
camera là tương tự và được lưu trong các băng từ gây khó khăn cho việc truy
xuất, xử lý dữ liệu. Đồng thời, tốc độ xử lý của các chíp điện tử còn rất chậm
nên phải mất rất nhiều thời gian để phân tích các khối dữ liệu lớn. Lý thuyết
về xử lý, nhận dạng ảnh còn chưa phát triển.
Ngày nay, với sự phát triển vược bậc của kỹ thuật vi điện tử đà tạo ra
các bộ vi xử lý có tốc độ rất cao lên đến hàng GHz. Cùng víi sù xt hiƯn cđa
c¸c camera kü tht sè, viƯc truyền và xử lý dữ liệu trở nên dễ dàng hơn. Một
hướng phát triển mới của các hÃng sản xuất chíp điện tử là phát triển các chíp
FPGA chạy các ứng dụng xử lý ảnh một cách độc lập (Nhúng các thuật toán
xử lý ảnh vào các chip).
Cơ sở của nhận dạng ảnh chính là lý thuyết xử lý ảnh số. Nhận dạng
ảnh là giai đoạn cuối của các hệ thống xử lý ảnh. Nhận dạng ảnh dựa trên lý
5
thuyết nhận dạng (Pattern Recognition) đà được đề cập trong nhiều sách về
nhận dạng. Trong lý thuyết về nhận dạng nói chung và nhận dạng ảnh nói
riêng có ba cách tiếp cận khác nhau:
- Nhận dạng dựa vào phân hoạch không gian.
- Nhận dạng dựa vào cấu trúc.
- Nhận dạng dựa vào kỹ thuật mạng nơron.
Hai cách tiếp cận đầu là cách tiếp cận kinh điển. Các đối tượng ảnh
quan sát và thu nhận được phải trải qua giai đoạn tiền xử lý nhằm tăng cường
chất lượng, làm nổi các chi tiÕt, tiÕp theo lµ trÝch chän vµ biĨu diƠn các đặc
trưng, cuối cùng mới là giai đoạn nhận dạng. Cách tiếp cận thứ ba hoàn toàn
khác. Nó dựa vào cơ chế đoán nhận, lưu trữ và phân biệt đối tượng mô phỏng
theo hoạt động của hệ thần kinh con người. Do cơ chế đặc biệt, các đối tượng
thu nhận bởi thị giác người không cần qua giai đoạn cải thiện mà chuyển ngay
sang giai đoạn tổng hợp, đối sánh với các mẫu đà lưu trữ để nhận dạng.
1.1.3 Tính ứng dụng
Việc ứng dụng công nghệ nhận dạng ảnh trong ®iỊu khiĨn Robot më ra
mét triĨn väng ph¸t triĨn rÊt lớn cho ngành nghiên cứu và chế tạo Robot. Việc
ứng dụng này giúp cho Robot có thể quan sát được vật thể, từ đó mà nó có thể
có thêm nhiều tính năng mới giống ở con người. Có thể ứng dụng công nghệ
này trên Robot trong rất nhiều lĩnh vực khác nhau như:
Trong y học: chế tạo ra các Robot dẫn đường giúp người già, người
khuyết tật.
Trong ngành vũ trụ: chế tạo ra các Robot thăm dò, có khả năng tự di
chuyển và phân tích các mẫu đất, đá.
Trong lĩnh vực quân sự: chế tạo ra Robot trinh sát có khả năng dẫn
đường và tự tìm mục tiêu.
Trong lĩnh vực giao thông: đó là các xe ôtô thông minh có khả năng tự
lái, tự di chuyển vào bÃi đỗ.
6
Trong công nghiệp: chế tạo ra các Robot phân loại sản phẩm, xe tự
hành vv.
Trong đời sống: chế tạo ra các Robot bảo mẫu chông trẻ, Robot nội trợ,
Robot văn phòng vv.
1.1.4 Tình hình nghiên cứu ứng dụng nhận dạng
ảnh trong điều khiển Robot trên thế giới
Việc ứng dụng Robot trong y học nhằm giúp những người tàn tật có thể
hội nhập với cộng đồng. Với sản phẩm EagleEyes của trường đại học Boston
sử dụng thiết bị cảm biến và qua một màn hình máy tính, EagleEyes có thể
tránh các vật cản trên đường đi hoặc có thể rẽ trái hoặc phải tùy ý theo tín hiệu
của đôi mắt, các tín hiệu từ đôi mắt sẽ được một bộ cảm nhận tín hiệu chuyển
thành các tín hiệu điện mà EagleEyes Robot có thể hiểu được.
Trong công nghiệp có các sản phẩm như:
- Hệ thống 3 cánh tay máy, sản phẩm của công ty Fanuc, vừa đoạt giải
thưởng robot Nhật Bản 2007 với khả năng gắp 120 chi tiết trong 1 phút từ
băng chuyền. Nó có thể di chuyển nhanh chóng nhưng chính xác dựa trên các
dữ liệu hình ảnh từ camera. Các cánh tay hoạt động phối hợp nhịp nhàng với
nhau và nhặtđồvật bằng giác hút chân không.
HOAP-3 là một robot dạng người thu nhỏ của công ty Fujitsu cao 60
cm, có thể di chuyển trên 2 chân. Với 2 camera, 1 microphone, các đèn LED
biểu thị cảm xúc và khá nhiều cảm biến gắn trên thân, HOAP-3 có thể nhận
dạng hình ảnh, điều khiển 28 bậc tự do. Người sử dụng có thể điều khiển
HOAP-3 thông qua mạng LAN không dây và lập trình để thay đổi nhiệm vụ
cho robot.
Trong sinh hoạt gia đình: iRobo Roomba, có thể lau chùi phòng ăn sạch
bóng, di chuyển với một robot xe jeep nhỏ gắn máy quay phim. Xe jeep
báo cho Roomba biết các chướng ngại để tránh.
7
1.1.5 Tình hình nghiên cứu, ứng dụng trong nước
ở trong nước, môn xử lý ảnh mới chỉ được giảng dạy ë mét sè trêng
träng ®iĨm vỊ khoa häc kü tht như Đại học Bách khoa Hà nội, Đại học
Quốc gia Hà nội, Đại học Bách khoa thành phố Hồ Chí Minh . Và mới chỉ
giới hạn trong các ngành như công nghệ thông tin, điện tử viễn thông. Số
lượng sách tham khảo về xử lý ảnh bằng tiếng việt còn rất hạn chế, chủ yếu
vẫn là sách viết bằng tiếng Anh nên đà gây khó khăn cho những người mới
học hoặc đang muốn tìm hiểu. Tuy nhiên, do sự phát triển của khoa học kỹ
thuật nên công nghệ xử lý ảnh đang được rất nhiều nhà khoa học trẻ quan tâm
nghiên cứu. Các đề tài nghiên cứu khoa học cấp trường, cấp nhà nước đà và
đang được triển khai hàng năm. Trong đó có một số đề tài cho kết quả khả
quan và đang đựơc ứng dụng rộng rÃi như đề tài ứng dụng công nghệ nhận
dạng ảnh trong việc giải quyết bài toán dò đường cho robot, phần mềm nhận
dạng ảnh biển số xe, phần mềm nén và xử lý ảnh, phần mềm nhận dạng chữ
viết vv. Tuy nhiên các ứng dụng của công nghệ xử lý ảnh trong công nghiệp
vẫn còn rất hạn chế.
Sản phẩm của nhóm nghiên cứu: Nguyễn Đức Thành, Nguyễn Đức
Minh, bộ môn điều khiển tự động, Đại học Bách khoa TP Hồ Chí Minh.
Nhóm nghiên cứu đà sử dụng camera kết hợp mạng nơ ron và giải thuật xử lý
ảnh để nhận dạng, xác định vị trí và hướng của vật. Kết quả nghiên cứu được
dùng để điều khiển robot Scorbot gắp vật và di chuyển đến vị trí định trước.
Robot có năm bậc tự do, được điều khiển bằng máy tính qua cổng RS232 và
phần mềm ACL. Nó sử dụng một camera quan sát nhìn từ trên xuống, bao
quát vùng hoạt động của cánh tay robot.
Đề tài "Chế tạo hệ thống điều khiển Robot Scara" của Đỗ Văn Dũng,
thực hiện việc nghiên cứu thiết kế công nghệ, chế tạo thiết bị và phần mềm bộ
điều khiển robot có giao tiếp máy tính bằng hƯ Servo DC Digital. Trong lÜnh
vùc nµy Robot Scara cã thể nhận lệnh từ bất kỳ máy vi tính nào và điều khiển
8
tay Robot di chuyển đến vị trí mong muốn, được ¸p dơng trong viƯc di chun
s¶n phÈm tõ m¸y gia công sang băng tải. Đề tài này đà được mở rộng bằng
cách đưa hình ảnh từ Camera vào máy vi tính và sau đó điều khiển di chuyển
tay máy dựa trên hình ảnh thu nhận được từ Camera.
Trong sân chơi quốc tế như Robocon, trong mấy năm đầu sinh viên Việt
Nam luôn đạt thứ hạng cao nhờ trí tuệ và sức sáng tạo của mình. Nhưng hiện
nay, do các bạn sinh viên các nước có công nghệ phát triển cao như Nhật Bản,
Trung Quốc đà bắt đầu ứng dụng công nghệ nhận dạng ảnh trong việc điều
khiển Robot tự động có thể tự tìm đường đi, tránh chướng ngại vật ®Ĩ tiÕp cËn
mơc tiªu. Trong khi ®ã, Robot tù ®éng của các đội sinh viên Việt Nam hoạt
động chủ yếu bằng cách được lập trình để dò đường dựa trên các vạch trắng
trên sân thi đấu. Robot dò đường hoạt động không ổn định nên việc dò đường
nhầm, chạy nhầm không phải là hiếm; có trường hợp lúc chạy thử thì rất tốt,
nhưng khi thi đấu chính thức lại chạy sai.
ở Việt Nam, công nghệ xử lý ảnh không phải là một công nghệ mới.
Công nghệ này đà được nhắc đến rất nhiều trong cộng đồng Robocon suốt
những năm qua nhưng chưa từng được đem vào ứng dụng trong cuộc thi vì
công nghệ tương đối phức tạp. Các thí sinh tham gia Robocon chưa đủ khả
năng, tài chính và thời gian để chiếm lĩnh công nghệ này, mặc dù những ứng
dụng của nó là vô cùng hiệu quả và là niềm mơ ước của bất cứ đội nào.
Khi chưa có công nghệ xử lý ảnh, thì việc để cho robot chạy được giống
như việc để một người mù lái xe ô tô theo sự chỉ dẫn của một người sáng
mắt nhưng lại hoàn toàn không biết điều khiển phương tiện này. Hiện nay, với
việc áp dụng công nghệ xử lý ảnh, người ta đà lắp thêm cho người mù đôi mắt,
làm tăng độ chuẩn xác trong các quyết định điều khiển robot lên rất nhiều.
Hiện nay, trên các diễn đàn trao đổi khoa học công nghệ có uy tín như
dientuvietnam.net, dientuvienthong.net, đang diễn ra các cuộc thảo luận rất
sôi nổi xung quanh việc ứng dụng công nghệ xử lý ảnh, nhận dạng ảnh trong
9
điều khiển Robot, nhận dạng chữ viết, mặt người . Đây chính là nơi cung
cấp tài liệu, kinh nghiệm, giúp cho các bạn sinh viên có thể thực hiện được ý
tưởng sáng tạo của mình.
1.2 Các bước chính trong hệ thống nhận dạng
1.2.1 Thu NHận ảnh
Việc thu nhận ảnh được thực hiện thông qua việc chụp ảnh từ camera.
Chất lượng của ảnh thu được từ bước này phụ thuộc nhiều vào chất lượng
camera, tốc độ di chuyển khi chụp, góc nhìn và độ sáng.
1.2.2 Tiền xử lí (lấy mẫu, lọc nhiễu, tương phản, ...)
Sau bộ thu nhận, ảnh có thể nhiễu và độ tương phản thấp nên cần đưa
vào bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là
lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn.
Trước khi áp dụng các phương pháp nhận dạng ảnh, chúng ta cần xử lý
ảnh để đảm bảo rằng ảnh sẽ thoả mÃn một vài giả thiết nào đó. Ví dụ như sau:
Lấy mẫu lại để đảm bảo hệ thống tọa độ là đúng. Nếu 2 ảnh lấy liên
tiếp nhau có sự sai khác quá nhiều thì chúng ta có thể loại bỏ ảnh đó vì tư thế
của robot lúc chụp không được ổn định.
Loại bỏ nhiễu để giảm thiểu khả năng xuất hiện các thông tin sai.
Tăng độ tương phản để đảm bảo sẽ xác định được các thông tin cần
thiết.
1.2.3 Phân vùng (Segmentation)
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để
biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mÃ
vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu,
chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch)
riêng biệt để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh
và cũng dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh
10
phụ thuộc rất nhiều vào công đoạn này.
1.2.4 Phân tích hình ảnh (xác định đường, góc,
cạnh, khối, ...)
Đầu ra ảnh sau phân vùng chứa các điểm ảnh của vùng ảnh (ảnh đÃ
phân vùng) cộng với mà liên kết với các vùng lân cận. Việc biến đổi các số
liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính.
Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature
Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định
lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong
phạm vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng
ta miêu tả các đặc trng cđa tõng ký tù gióp ph©n biƯt ký tù này với ký tự
khác.
1.2.5 Nhận dạng
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu
được bằng cách so sánh với mẫu chuẩn đà được học (hoặc lưu) từ trước. Nội
suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và
nét gạch ngang trên phong bì thư có thể được nội suy thành mà điện thoại. Có
nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các
mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số.
- Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký
điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mà vạch,
nhận dạng mặt người
1.2.6 Xử lí mức cao
11
Đến bước này thì dữ liệu đầu vào chỉ là một phần của dữ liệu ban đầu,
đó có thể là tập các điểm ảnh hoặc một vùng ảnh có khả năng chứa một đối
tượng đặc biệt nào đó. Quá trình xử lý sẽ qua các bước sau:
- Thẩm định lại dữ liệu có phù hợp với các yêu cầu cơ bản và đặc biệt.
- Ước lượng các tham số đặc biệt.
- Phân lớp đối tượng xác định được.
1.3 Nội dung nghiên cứu
Do lĩnh vực điều khiển Robot là rất rộng lớn, tùy từng ứng dụng khác
nhau mà Robot có những tính năng riêng. Từ đó mà công việc nhận dạng ảnh
cho từng loại Robot cũng có sự khác biệt. Trong khuôn khổ của Đồ án này tôi
xin trình bày về các phương pháp nhận dạng và mô phỏng quá trình nhận dạng
một đối tượng cụ thể, từ đó sẽ ứng dụng để điều khiển Robot và tính toán các
tham số cần thiết cho bộ điều khiển.
Hình 1.1 Mô hình Robot
Cụ thể là áp dụng thuật toán nhận dạng ảnh để điều khiển chuyển động
của Robot tới chặn quả bóng hình cầu đang chuyển động với các giả thiết:
1) Quả bóng và Robot chuyển động trên cùng mặt phẳng không có
chướng ngại vật. Robot phải phân biệt được mục tiêu với các vật thể khác.
2) Quỹ đạo chuyển động của quả bóng là chung chung và không biết trước.
12
3) Robot có thể di chuyển trên ba bánh: hai bánh phát lực ở đằng sau và
1 bánh lái theo nhiều hướng ở phía trước.
4) Robot được trang bị thêm một camera được gắn trên trục của bánh
lái. Camera có thể quay trên mặt phẳng ngang và mặt phẳng đứng. Mỗi trục
quay của camera đều có một encorder tuyệt đối để đo góc quay.
5) Để giảm bớt khối lượng tính toán trong xử lý ảnh, giả thiết quả bóng
có màu sẫm còn mặt phẳng chuyển động là màu trắng.
Mô hình robot này được ứng dụng trong trò chơi robot đá bóng, trong
đó quả bóng thay đổi tốc độ và hướng thường xuyên, hay Robot tự động trong
cuộc thi Robocon.
Với giả thiết số 5 và chất lượng hình ảnh từ camera là rất tốt, ta có thể
bỏ qua khâu tiền xử lý ảnh. Vì vậy, trong các chương sau, tôi sẽ trình bày về
phân vùng, nhận dạng ảnh, sau đó ứng dụng nhận dạng ảnh cho bài toán điều
khiển robot trên.
1.4 mục tiêu và Nội dung của luận văn
1.4.1 Mục tiêu
Do nhận dạng ảnh là giai đoạn cuối cùng của xử lý ảnh vì vậy để trình
bày chi tiết các bước của một quá trình nhận dạng ảnh sẽ làm cho nội dung
của luận văn rất lớn. Hơn nữa mục tiêu chính của luận văn là Nghiên cứu ứng
dụng các phương pháp nhận dạng ảnh trong điều khiển Robot. Vì vậy ở trong
phần nhận dạng tôi chỉ trình bày hai bước chính đó là phân vùng ảnh và nhận
dạng ảnh. Mục tiêu nghiên cứu của luận văn này là:
- Nghiên cứu các bước chính của quá trình nhận dạng ảnh số.
- ứng dụng nhận dạng ảnh để điều khiển chuyển động của Robot.
- Tính toán được các tham số cần thiết cho bộ điều khiển Robot.
- Mô phỏng được quá trình nhận dạng và quá trình điều khiển.
1.4.2 Nội dung
13
Từ mục tiêu trên, nội dung của luận văn gồm các phần sau:
Chương 1: Tổng quan về ứng dụng các phương pháp nhận dạng ảnh
trong điều khiển Robot và nội dung cần nghiên cứu.
Chương 2: Phân vùng ảnh.
Chương 3: Nhận dạng ảnh.
Chương 4: ứng dụng nhận dạng ảnh trong điều khiển Robot.
Chương 5: Mô phỏng.
14
Chương II
phân vùng ảnh
Để phân tích các đối tượng trong ảnh, chúng ta cần phải phân biệt được
các đối tượng cần quan tâm với phần còn lại của ảnh. Những đối tượng này có
thể tìm ra được nhờ các kỹ thuật phân vùng ảnh, theo nghĩa tách phần tiền
cảnh ra khỏi hậu cảnh trong ảnh.
Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh. Nó là một
tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đó: mức xám,
mức màu, độ nhám Vùng ảnh là một trong hai thuộc tính của ảnh. Nói
đến vùng ảnh là nói đến tính chất bề mặt. Đường bao quanh một vùng ảnh
(Boundary) là biên ảnh. Các điểm trong một vùng ảnh có độ biến thiên giá
trị mức xám tương đối đồng đều hay tính kết cấu tương đồng.
Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân
vùng: phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền
đồng nhất hay miền kề; phân vùng dựa vào biên gọi là phân vùng biên.
Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ, phân vùng
dựa theo kết cấu.
2.1 PHÂN vùng ảNH THEO NGƯỡNG BIÊN Độ
Kỹ thuật này dựa trên một ý tưởng hết sức đơn giản. Một tham số , gọi là
ngưỡng độ sáng, sẽ được chọn để áp dụng cho một ảnh a[m,n] theo cách sau:
Nếu a[m,n] thì a[m,n] = object =1
Ngược lại
a[m,n] = background =0
Thuật toán trên giả định rằng chúng ta đang quan tâm đến các đối tượng
sáng (object) hay nền ảnh (background) bằng các giá trị 1 hoặc 0. Câu hỏi
trung tâm trong kỹ thuật lấy ngưỡng khi đó sẽ là: Chúng ta nªn chän ngìng θ
15
như thế nào? Mặc dù không có thuật toán chọn ngưỡng vạn năng nào có thể áp
dụng cho mọi loại ảnh. Chúng ta cũng có nhiều phương pháp đưa ra dưới đây:
2.1.1 Ngưỡng cố định
Phương pháp đầu tiên là chọn một ngưỡng độc lập với dữ liệu ảnh. Nếu
chúng ta biết trước là chương trình ứng dụng sẽ làm việc với những ảnh có độ
tương phản rất cao, trong đó các đối tuợng quan tâm rất tối còn nền gần như
đồng nhất và rất sáng, thì giá trị ngưỡng không đổi 128 trên thang độ sáng từ 0
đến 255 sẽ là một giá trị chọn khá chính xác. Chính xác ở đây nên được hiểu
theo nghĩa là số lượng các điểm ảnh bị phân lớp sai là cực tiểu.
2.1.2 Ngưỡng dựa trên lược đồ
Trong hầu hết các trường hợp, ngưỡng được chọn từ lược đồ độ xám của
vùng hay ảnh cần được phân vùng. Hình 2.1 cho chúng ta một ví dụ về ảnh và
lược đồ độ xám liên kết với nó.
a) ảnh
b) Lược đồ xám
Hình 2.1 Ví dụ về lược đồ xám
Có rất nhiều kỹ thuật chọn ngưỡng tự động xuất phát từ lược đồ xám.
Những kỹ thuật phổ biến nhất trong số đó sẽ được trình bày dưới đây. Những
kỹ thuật này có thể tận dụng lợi thế do sự làm trơn dữ liệu lược đồ ban đầu
16
mang lại, nhằm loại bỏ những dao động nhỏ về độ sáng. Tuy nhiên các thuật
toán làm trơn cần phải cẩn trọng không được làm dịch chuyển các vị trí đỉnh
của lược đồ. Nhận xét này dẫn đến thuật toán làm trơn lược đồ dưới dây, với
độ rộng của cửa sổ W là N, thông dụng là N=3 hoặc N=5 (bé läc trung b×nh 1chiỊu):
1
hsmooth [b ] =
N
( N −1) / 2
h [b − i ]
∑
(
)
raw
i = − N −1 / 2
(2-1)
2.1.2.1 Tuật toán đẳng liệu (Isodata)
Kỹ thuật chọn ngưỡng theo kiểu lặp này do Ridler và Calvard đưa ra.
Thuật toán như sau:
- Chia lược đồ thành 2 đoạn bằng một giá trị ngưỡng khởi động 0 =2B-1,
tức là bằng phần nửa thang độ xám động của ảnh.
- Sau đó tính toán độ sáng trung bình của 2 vùng:
- m f , 0 của những điểm ảnh thuộc đối tượng
- m b, 0 của những điểm ảnh nền.
- Tính giá trị ngưỡng mới 1 =
m f ,0 + m b,0
2
Quá trình này cứ thế sẽ được tiếp tục với các ngưỡng mới cho đến khi
nào giá trị ngưỡng không thay đổi nữa thì dừng lại. Biểu diễn dưới dạng công
thức to¸n häc, chóng ta cã:
θk =
m f ,k −1 + m b ,k −1
2
cho tíi khi θk = θk-1
2.1.2.2 ThuËt toán tam giác
Thuật toán này do Zack đưa ra và được minh họa trong hình 2.2. Trong
hình này, chúng ta có thể quan sát thấy một đường thẳng đà được xây dựng
bằng cách nối từ giá trị lớn nhất của lược đồ tại độ sáng bmax đến giá trị nhỏ
nhất của lược đồ tại độ sáng bmin .Với mỗi độ sáng b trong khoảng [bmax, bmin],
17
chúng ta đi tính khoảng cách d từ giá trị lược đồ tại b là h[b] đến đường thẳng
đà có. Giá trị b0 ứng với khoảng cách lớn nhất sẽ được chọn làm giá trị ngưỡng
.
Hình 2.2 Xác định ngưỡng theo thuật toán tam giác
Kỹ thuật lấy ngưỡng không nhất thiết phải được áp dụng cho toàn bộ
ảnh, mà có thể áp dụng cho từng vùng ảnh một. Hai tác giả Chow và Kaneko
đà phát triển một biến thể của kỹ thuật lấy ngưỡng bằng cách chia một ảnh có
kích thước MxN ra thành nhiều vùng không chồng chất lên nhau. Các giá trị
ngưỡng được tính riêng biệt cho từng vùng một và sau đó được kết hợp lại
thông qua phép nội suy để hình thành nên một mặt ngưỡng cho toàn bộ ảnh.
Trong thuật toán mới này, kích thước của các vùng cần được chọn một cách
thích hợp sao cho có một lượng đáng kể các điểm ảnh ở trong một vùng, nhằm
phục vụ cho việc tính lược đồ và xác định ngưỡng tương ứng. Tính hữu ích của
thuật toán này, cũng như nhiêu thuật toán khác, sẽ phụ thuộc vào từng ứng
dụng cụ thể.
2.2 Thuật toán gán nhÃn thành phần liên thông
Kỹ thuật này gán cho mỗi thành phần liên thông của ảnh nhị phân một
nhÃn riêng biệt. NhÃn thường là các số tự nhiên bắt đầu từ một đến tổng số các
thành phần liên thông có trong ảnh. Giải thuật quét ảnh từ trái sang phải và tõ