BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM
KHOA ĐÀO TẠO CHẤT LƯỢNG CAO
ĐỒ ÁN TỐT NGHIỆP
NGÀNH CÔNG NGHỆ KỸ THUẬT ĐIỆN - ĐIỆN TỬ
THIẾT KẾ VÀ THI CÔNG HỆ THỐNG PHÂN LOẠI SẢN PHẪM LỖI
GVHD: THS TẠ VĂN PHƯƠNG
SVTH: NGUYỄN CHÍ THƠNG
LÊ VĂN HÙNG
LƯƠNG NGỌC TÚ
SKL 0 0 4 5 7 0
Tp. Hồ Chí Minh, năm 2016
MSSV: 12148340
MSSV: 12142355
MSSV: 1214234
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH
KHO ĐÀO TẠO CH T Ư NG C O
ĐỒ ÁN TỐT NGHIỆP
NGÀNH CÔNG NGHỆ KỸ THUẬT ĐIỆN - ĐIỆN TỬ
THIẾT KẾ VÀ THI CÔNG HỆ THỐNG PHÂN OẠI
SẢN PHẪM ỖI
GVHD: THS TẠ VĂN PHƯƠNG
SVTH:
NGUYỄN CHÍ THƠNG
Ê VĂN HÙNG
ƯƠNG NGỌC TÚ
MSSV: 12148340
MSSV: 12142355
MSSV: 1214234
Tp. Hồ Chí Minh, năm 2016
LỜI CẢM ƠN
Trước tiên, chúng em xin chân thành cảm ơn thầy Tạ Văn Phương đã tận tình
hướng dẫn, truyền đạt kinh nghiệm, kiến thức cho chúng em trong suốt quá trình thực
hiện đồ án tốt nghiệp này. Là người thầy ln được các sinh viên trong và ngồi khoa
ngưỡng mộ về cách giảng dạy, cách truyền lửa vào mỗi người.
Sau đó, chúng em xin gửi lời cảm ơn chân thành tới Ban Giám Hiệu và các thầy
cô trường ĐH Sư phạm kỹ thuật TP. Hồ Chí Minh đã tận tình giảng dạy chúng em
trong thời gian chúng em học tập tại Trường Đại Học Sư Phạm Kỹ Thuật TP.HCM.
Tiếp theo, chúng em xin được gửi làm cảm ơn đến các bạn trong và ngồi lớp đã
trao đổi, góp ý, giúp đỡ chúng em hoàn thành đồ án tốt nghiệp này.
TP.HCM ngày 16 tháng 7 năm 2016
Nguyễn Chí Thơng
Lê Văn Hùng
Lương Ngọc Tú
MỤC LỤC
LỜI CẢM ƠN ................................................................................................................. i
CHƯƠNG 1: TỔNG QUAN - GIỚI THIỆU ................................................................... 1
1.1
Đặt vấn đề ..................................................................................................... 1
1.2
Mục tiêu đề tài .............................................................................................. 1
1.3
Nội dung đề tài ............................................................................................. 3
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT ................................................................................ 4
2.1
Động cơ servo ............................................................................................... 4
2.2
Encoder ......................................................................................................... 8
2.2.1
Giới thiệu và phân loại ................................................................................. 8
2.2.2
Nguyên lý hoạt động cơ bản của encoder .................................................... 9
2.2.3
Độ phân giải của encoder............................................................................. 9
2.3
Xử lý ảnh cơ bản: ....................................................................................... 11
2.3.1
Giới thiệu về xử lý ảnh: ............................................................................. 11
2.3.2
Những vấn đề cơ bản trong hệ thống xử lý ảnh ......................................... 14
2.3.3
Các thiết bị thu nhận ảnh ........................................................................... 18
CHƯƠNG 3: LỰA CHỌN THIẾT KẾ THIẾT BỊ PHẦN CỨNG VÀ THI CƠNG MƠ
HÌNH
21
3.1
Động cơ AC servo HF-KP23 ..................................................................... 21
3.2
Servopack (Driver) ..................................................................................... 22
3.2.1
Thông số kỹ thuật của Driver MR J3-20A ................................................ 23
3.2.2
Sơ đồ cấu tạo và kết nối của Driver ........................................................... 24
3.2.3
Kết nối ngõ vào ra (chế độ vị trí) ............................................................... 25
3.2.4
Sơ đồ kết nối điều khiển theo chế độ vị trí ................................................ 26
3.2.5
Vận hành động cơ servo ............................................................................ 26
3.2.6
Cài đặt chế độ vị trí cho Driver (set parameter) ........................................ 28
3.3
Bộ điều khiển động cơ Servo ETHERNET/IP Kinetix 300 ....................... 29
3.3.1
Thông số kỹ thuật và giao diện của Driver Kinetix K300 ......................... 30
3.3.2
Cổng kết nối điện trở hãm (Braking resistor connector) ........................... 32
3.3.3
Cổng kết nối nguồn cho động cơ ............................................................... 32
3.3.4
Cấp nguồn cho bộ drive ............................................................................. 33
3.3.5
Kết nối chức năng an toàn (Safe Torque-Off) ........................................... 34
3.4
Giới thiệu động cơ AC SERVO của Driver Kinetix K300 ........................ 35
3.5
Phần Cứng .................................................................................................. 37
3.5.1
Nguyên Lý Hoạt Động ............................................................................... 39
3.5.2
Sơ Đồ Khối ................................................................................................ 40
CHƯƠNG 4 : MATLAB VÀ ỨNG DỤNG XỬ LÝ ẢNH ........................................... 42
4.1
Giới thiệu về phần mềm Matlab: ................................................................ 42
4.1.1
Khái niệm về MATLAB ............................................................................ 42
4.1.2
Tổng quan về cấu trúc dữ liệu của Matlab, các ứng dụng ......................... 43
4.1.3
Hệ thống Matlab ........................................................................................ 44
4.1.3
Làm quen với Matlab ................................................................................. 44
4.1.4
Các cửa sổ làm việc của Matlab ................................................................ 45
4.2
4.2.1
Xử Lý Ảnh Trong Matlab........................................................................... 48
Các kiểu ảnh trong Matlab ......................................................................... 48
4.2.2
Các hàm xử lý cơ Bản trong xử lý ảnh Matlab .......................................... 52
4.2.3
Các hàm và lệnh cơ bản sử dụng trong đồ án tốt nghiệp: .......................... 56
4.2.4
Các Bước Thu Nhâ ̣n Ảnh Cơ Bản ............................................................. 58
4.2.5
Tạo Giao Diện Với Guide .......................................................................... 61
4.2.6
Khái quát phương pháp sử dụng trong xử lý ảnh matlab: ......................... 65
4.2.7
Kết Nối Giữa Matlab Và PLC ................................................................... 67
KẾT LUẬN ................................................................................................................... ii
PHỤ LỤC ...................................................................................................................... iii
DANH MỤC TÀI LIỆU THAM KHẢO ...................................................................... iv
CHƯƠNG 1: TỔNG QUAN – GIỚI THIỆU
CHƯƠNG 1: TỔNG QUAN - GIỚI THIỆU
1.1 Đặt vấn đề
Việc ứng dụng tự động hóa là xu thế chung trong cơng nghiệp hiện nay, hịa
chung vào q trình tự động hóa trong sản xuất, khâu phân loại sản phẩm trong các dây
chuyền công nghiệp là một ví dụ điển hình. Trước kia, việc phân loại chủ yếu là dựa
vào sức người, công việc này địi hỏi sự tập trung cao và có tính lặp lại nên các cơng
nhân khó đảm bảo được sự chính xác trong cơng việc. Chưa kể đến có những phân loại
dựa trên các chi tiết kĩ thuật rất nhỏ mà mắt thường khó có thể nhận ra. Điều đó sẽ ảnh
hưởng trực tiếp tới chất lượng sản phẩm và uy tín của nhà sản xuất. Ứng dụng băng
chuyền và các kỹ thuật để phân loại sản phẩm hoàn toàn tự động sẽ giảm chi phí lao
động, nâng cao năng suất và hiệu quả rất nhiều so với phân loại bằng thủ công. Bên
cạnh việc phân loại sản phẩm dựa vào kích thước, hình dáng bao bì, các sản phẩm hiện
nay còn đa dạng về số lượng màu sắc khác nhau nên việc phân loại sản phẩm dựa vào
màu sắc và hình dáng là thực sự cần thiết. Để phân loại được sản phẩm theo màu sắc
trên băng chuyền, ta có thể dùng cách đơn giản là sử dụng cảm biến màu, hiện nay trên
thị trường có rất nhiều loại cảm biến màu của những hãng nổi tiếng khác nhau, như:
Omron (có E3X-DA, E3X-DAC, E3MC,E3ZM-V,. ), Sick của Đức (có G-14819624,NT6-GC-22, CS1-P1111, .), hay Datasensor của Ý (có TL10, ). Nhưng giá thành
của chúng cao mà số màu chúng có thể nhận biết được khơng nhiều và phân biệt hình
dáng của sản phẩm như là hình trịn, chỉ nhận dạng vật hình trịn, nếu bị méo q
ngưỡng cho phép thì loại sản phầm hay là nhận dạng hình vng đúng theo các tiêu
chuẩn về màu và hình dáng. Ngồi ra việc lưu dữ liệu trên giao diện Matlab có thể mất
khi mất điện đột xuất dẫn đến tắt máy, các dữ liệu sẽ bị mất, do đó, phải lưu trên phần
mềm Excel và những dữ liệu đó có thể sử dụng cho các mục đích khác trong excel như
vẽ biểu đồ, thống kê.
1.2 Mục tiêu đề tài
Nhóm đã xây dựng và thực hiện ý tưởng sử dụng camera kết hợp với phần mềm
MATLAB để phân loại sản phẩm theo màu và hình dáng.“Hệ thống phân loại sản
phẩm theo màu sắc và hình dáng” bao gồm một camera kết nối với máy tính (PC) với
phần mềm MATLAB có thể linh hoạt phân loại được nhiều loại màu sắc và hình dáng
khác nhau sẽ là một giải pháp hiệu quả để ứng dụng vào phân loại sản phẩm trong thời
gian tới. Sau đó sử dụng OPC server để liên kết các biến của Matlab và PLC và thông
qua PLC điều khiển các động cơ servo cho phù hợp. Qua đó, chỉ với camera kết nối với
Trang 1
CHƯƠNG 1: TỔNG QUAN – GIỚI THIỆU
PLC, ta có thể phân loại được rất nhiều loại sản phẩm mà cảm biến cịn bị hạn chế, qua
đó loại bỏ kết nối dây cảm biến không cần thiết cho hệ thống. Do đó, đồ án hồn thành
về cơ bản các mục tiêu đề ra.
Đề tài đáp ứng đúng tiến độ mà nhà trường đưa ra
Phận loại sản phẩm chình xác khoảng 90%
Kết nối với PLC qua OPC, servo và kết nối với giữa matlab và camera là tốt
Học và sử dụng cơ bản xử lý ảnh, kết nối động cơ servo đã làm được và đáp ứng
yêu cầu
Nâng cao khả năng đọc hiểu tài liệu bằng tiếng anh và có kỹ năng xử lý lỗi hệ
thống.
Phân loại màu sắc không cần các cảm biến nhận dạng màu, giảm sơ đồ nối dây
của hệ thống.
Sử dụng mạch chuyển cảm biến NPN ra PNP đơn giản không cần rơ le.
Phối hợp một cách linh hoạt các phần phầm với nhau như Excel, Matlab, Rs
logix5000, KepServerEx.
Thấy được cách vận hành của động cơ servo trong thực tế.
Tuy nhiên đồ án vẫn còn mặt hạn chế:
Việc camera chụp hình cịn chưa thực sự ổn định và chính xác 100% do sử dụng
webcam.
Camera hiển thị trên màn hình bị đứng khi đọc dữ liệu từ excel vào matlab.
Thời gian trễ đã được cải thiện tuy nhiên còn dừng lại để xử lý ảnh.
Chưa khai thác các chức năng trong động cơ servo như encoder, chế độ
Differential Line trong servo Mitsubishi.
Chạy song song 2 win trên máy tính cho nên Matlab xử lý cịn chậm và xảy ra
trường hợp đúng máy khi xử lý và gửi tín hiệu xuống PLC.
Trang 2
CHƯƠNG 1: TỔNG QUAN – GIỚI THIỆU
Nếu sử dụng cáp mạng với nhiều thiết bị dẫn đến chất lượng truyền tín hiệu thấp
và PLC khơng nhận ra được sự hiện diện của thiết bị.
1.3 Nội dung đề tài
Nô ̣i dung đề tài này được chia thành sáu chương, nội dung từng chương được
trình bày sơ lược như sau:
Chương 1: Tổng quan – giới thiệu đề tài. Chương này trình bày tổng quan ý
nghiã của việc sử dụng hệ thống phân loại sử dụng xử lý ảnh trong công nghiệp, các
mặt loại của nó và nêu rõ lý do đề tài được chọn cùng với những yêu cầu, mục tiêu
được đặt ra cho hê ̣ thố ng.
Chương 2: Cơ sở lý thuyết. Chương hai trình bày tổng quát về lý thuyết động cơ
servo và cơ bản về xử lý ảnh.
Chương 3: Lựa chọn và thiết kế thiết bị phần cứng và thi cơng mơ hình.
Chương ba trình bày cụ thể về phần cứng của hê ̣ thố ng, bao gồm sơ đồ khối trong hệ
thống và sơ đồ kế t nớ i hệ thống. Các cách lựa chọn, quy trình cài đặt thông số, catalog
về servo mitsubishi, kinextix 300 và cảm biế n NPN.
Chương 4: Matlab Và Ứng Dụng Xử Lý Ảnh. Chương bốn sẽ đưa ra lưu đồ giải
thuật cho hê ̣ thố ng và lưu đồ trên Matlab dựa vào những yêu cầu đặt ra ở chương một,
từ đó xây dựng chương trình cụ thể giúp hê ̣ thố ng hoạt động đúng với mong muốn đặt
ra.
Trang 3
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
2.1 Động cơ servo
Động cơ DC và động cơ bước vốn là những hệ hồi tiếp vòng hở - ta cấp điện để
động cơ quay nhưng chúng quay bao nhiêu thì ta khơng biết, kể cả đối với động cơ
bước là động cơ quay một góc xác định tùy vào số xung nhận được. Việc thiết lập một
hệ thống điều khiển để xác định những gì ngăn cản chuyển động quay của động cơ
hoặc làm động cơ không quay cũng không dễ dàng.
Mặt khác, động cơ servo được thiết kế cho những hệ thống hồi tiếp vịng kín. Tín
hiệu ra của động cơ được nối với một mạch điều khiển. Khi động cơ quay, vận tốc và
vị trí sẽ được hồi tiếp về mạch điều khiển này. Nếu có bầt kỳ lý do nào ngăn cản
chuyển động quay của động cơ, cơ cấu hồi tiếp sẽ nhận thấy tín hiệu ra chưa đạt được
vị trí mong muốn. Mạch điều khiển tiếp tục chỉnh sai lệch cho động cơ đạt được điểm
chính xác.
Động cơ servo có nhiều kiểu dáng và kích thước, được sử dụng trong nhiều máy
khác nhau, từ máy tiện điều khiển bằng máy tính cho đến các mơ hình máy bay và xe
hơi. Ứng dụng mới nhất của động cơ servo là trong các robot, cùng loại với các động
cơ dùng trong mơ hình máy bay và xe hơi.
Hình 2.1 Một số loại động cơ Servo trên thị trường hiện nay.
Trang 4
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
Những loại động cơ Servo phổ biến
Có 3 loại động cơ servo sử dụng rộng rãi hiện nay:
Động cơ servo DC: Dựa trên nền tảng động cơ DC tức là động cơ DC có bộ điều
khiển hồi tiếp.
Hình 2.2 Ảnh minh họa 1 động cơ DC servo.
Hình 2.3 Cấu trúc cơ bản 1 động cơ DC servo.
Động cơ servo R/C (Radio-Controlled): Là động cơ servo được điều khiển bằng
liên lạc vô tuyến (điều khiển từ xa). Trong thực tế, bản thân động cơ servo không phải
được điều khiển bằng vơ tuyến, nó chỉ nối với máy thu vơ tuyến trên các mơ hình máy
bay, xe hơi.... Động cơ servo nhận tín hiệu từ máy thu này.
Trang 5
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
Hình 2.4. Ảnh minh họa 1 động cơ RC servo.
1. Motor
2. Bảng điện tử
3. Dây nguồn dương
4. Dây tín hiệu
5. Dây nối đất
6. Volt kế
7. Trục bánh răng
8. Đĩa trịn đính kèm
9. Vỏ động cơ
10. Encoder
Hình 2.5 Cấu trúc cơ bản động cơ R/C servo.
Trang 6
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
Động cơ servo AC. Động cơ AC Servo được sử dụng rất rộng rãi trong công
nghiệp, trong các nhà máy tự động mà cụ thể là điều khiển vị trí, vận tốc các cơ cấu
servo, robot, chuyển động chạy dao trong máy CNC…
Hình 2.6. Ảnh minh họa 1 động cơ AC servo.
Động cơ AC servo dựa trên nền tảng là động cơ xoay chiều 3 pha. Động cơ xoay
chiều 3 pha làm việc theo nguyên lý cảm ứng điện từ. Khi cấp điện áp xoay chiều 3 pha
vào động cơ, trong stato xuất hiện từ trường quay, từ trường này tác động lên roto làm
roto quay theo.
Hình 2.7 Stato và dịng điện 3 pha
Trang 7
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
Hình 2.8 Cấu trúc cơ bản 1 động cơ AC servo.
2.2
Encoder
2.2.1 Giới thiệu và phân loại
Encoder là tên gọi chung để chỉ các thiết bị mã hóa. Trong thực tế có rất nhiều
loại và hình thức encoder khác nhau. Thông thường, đối với các chuyển động quay,
encoder dùng để quản lý vị trí góc của một điã quay, bánh xe, hay trục động cơ, hoặc
bất kì thiết bị quay nào cần xác định góc của nó.
Encoder được chia làm 2 loại: absolute encoder và incremental encoder.
Absolute encoder là encoder tuyệt đối, nghĩa là tính hiệu ta nhận được chỉ rõ ràng
vị trí của encoder, khơng cần phải xử lý thêm.
Incremetal encoder là encoder mã hóa gia tăng (encoder tương đối), thường chỉ
có tối đa là 3 vịng lỗ. Nếu encoder có càng nhiều lỗ trên đĩa thì thơng tin nhận được
càng chính xác. Cứ mỗi lần đi qua một lỗ, phải lập trình để thiết bị đo đếm lên 1 đơn
vị, do đó loại này có tên la incremetal encoder (encoder mã hóa gia tăng).
Trang 8
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
2.2.2 Nguyên lý hoạt động cơ bản của encoder
Nguyên lý cơ bản của encoder là một đĩa trịn xoay quay quanh trục, trên đĩa có
các lỗ (hoặc rãnh). Dùng đèn led chiếu lên mặt đĩa. Khi quay, chỗ khơng có lỗ (rãnh)
thì đèn khơng thể chiếu xun qua được, chỗ có lỗ (rãnh) thì đèn sẽ chiếu xuyên qua.
Phía mặt bên kia của đĩa được đặt một cảm biến thu. Với các tín hiệu có hoặc khơng có
ánh sáng chiếu qua, người ta ghi nhận được đèn led có chiếu qua lỗ hay khơng.
Giả sử trên đĩa có n lỗ, thì mỗi lần cảm biến thu nhận được n lần tín hiệu đèn led
thì có nghĩa là đĩa đã quay được một vòng.
2.2.3 Độ phân giải của encoder
Absolute encoder
Độ phân giải của encoder là một thông số rất quan trọng. Làm thế nào để biết đĩa
quay được 1/2, 1/4 hay 1/n vịng chứ khơng phải chỉ biết đĩa đã quay được một
vòng.Với một số nhị phân có 2 bit, chúng ta sẽ có 4 trạng thái. Điều đó nghĩa là với
một số nhị phân 2 bit, chúng ta có thể chia đĩa thành 4 phần bằng nhau, và khi quay
chúng ta sẽ xác định được độ chính xác đến ¼ vịng. Tương tự, với một số nhị phân n
bít, ta sẽ xác định được độ chính xác đến 1/2n vịng.
Cách thức để xác định 2n trạng thái của đĩa encoder:
Hình 2.9 Đĩa Encoder.
Ví dụ ở đĩa encoder có 2 vịng đĩa (hình trên). Ở vịng trong cùng có một rãnh
rộng bằng 1/2 đĩa, vịng phía ngồi có 2 rãnh đối diện nhau. Cần 2 led phát để phát
xuyên qua 2 vòng lỗ và 2 cảm biến thu quang.
Giả sử ở vòng lỗ thứ nhất (vòng trong), cảm biến thu đang nằm ở vị trí có lỗ hở
thì tín hiệu nhận được từ mắt thu sẽ là 1. ở vòng lỗ thứ hai, cảm biến thu đang nằm ở vị
Trang 9
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
trí có lỗ hở thì tín hiệu nhận được sẽ là 1. Kết hợp 2 bit ta được số nhị phân 11, chúng
ta sẽ xác định được đĩa quay đang nằm ở góc phần tư phía trên bên phải.
Nếu đĩa quay có 10 vịng lỗ thì ta sẽ quản lí được vị trí chính xác đến 1/210 vòng
(1/1024 vòng), hay còn gọi là dộ phân giải của encoder là 1024 xung trên vòng (pulse
per revolution – ppr).
Incremetal encoder
Lợi thế của encoder tuyệt đối thể hiễn rõ rệt trong trường hợp góc quay nhỏ và
động cơ khơng quay nhiều vịng. Khi đó việc xử lý encoder tuyệt đối trở nên dễ dàng
cho người dùng. Chỉ cần đọc giá trị là chúng ta có thể biết ngay vị trí góc của trục
quay. Tuy nhiên, nếu động cơ quay nhiều vịng thì điều này khơng có lợi, bỏi vì khi đó
ta phải xử lý đếm số vịng quay của trục.
Ngoài ra khi thiết kế encoder tuyệt đối, nếu địi hỏi độ chính xác càng cao thì cần
càng nhiều vịng lỗ, dẫn đến sự giới hạn về kích thước của encoder, bởi vì việc gia
cơng chính xác các lỗ q nhỏ là khơng thê thực hiện. Ngồi ra việc bố trí dãy đèn led
và cảm biến thu cũng chiếm một diện tích rất lớn trong trường hợp này.
Tuy nhiên, điều này đã được khắc phục bằng incremetal encoder một cách khá
đơn giản. Vì vậy, incremetal được sử dụng nhiều trong những ứng dụng hiện đại.
Nguyên lý hoạt động của incremetal encoder: incremetal encoder sẽ tăng một đơn
vị khi có một lần lên xuống của cạnh xung, nghĩa là khi led quét qua một lỗ thì encoder
sẽ tăng một đơn vị trong biến đếm.
Để đếm được số vòng động cơ đã quay và hạn chế sai số xung tích lũy (trong
trường hợp có rung động khơng thể kiểm sốt có thể gây ra sai số xung đếm được ở
encoder), một lỗ định vị được thêm vào để đếm số vòng quay của encoder (hình dưới)
Hình 2.10 Vịng quay Encoder với lỗ định vị.
Trang 10
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
Người ta đặt hai đèn led lệch nhau ở vòng lỗ hoặc sử dụng 2 vòng lỗ và 2 cảm
biến thu phát để xác định chiều quay của động cơ.
Hình 2.11 Xác định chiều quay bằng cách sử dụng 2 vòng lỗ và 2 bộ cảm biến thu phát.
2.3 Xử lý ảnh cơ bản:
2.3.1 Giới thiệu về xử lý ảnh:
Xử lý ảnh là một lĩnh vực mang tính khoa học và cơng nghệ. Nó là một ngành khoa
học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất
nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chun
dụng riêng cho nó.
Xử lý ảnh được đưa vào giảng dạy ở bậc đại học ở nước ta khoảng chục năm nay.
Nó là mơn học liên quan đến nhiều lĩnh vực và cần nhiều kiến thức cơ sở khác. Đầu
tiên phải kể đến Xử lý tín hiệu số là một môn học hết sức cơ bản cho xử lý tín hiệu
chung, các khái niệm về tích chập, các biến đổi Fourier, biến đổi Laplace, các bộ lọc
hữu hạn… Thứ hai, các cơng cụ tốn như Đại số tuyến tính, Sác xuất, thống kê. Một
số kiến thứ cần thiết như Trí tuệ nhân tao, Mạng nơ ron nhân tạo cũng được đề cập
trong q trình phân tích và nhận dạng ảnh.
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lượng
ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo
được truyền qua cáp từ Luân đôn đến New York từ những năm 1920. Vấn đề nâng
Trang 11
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh. Việc
nâng cao chất lượng ảnh được phát triển vào khoảng những năm 1955. Điều này có
thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện
cho quá trình xử lý ảnh sơ thuận lợi. Năm 1964, máy tính đã có khả năng xử lý và
nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi
đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất
lượng, nhận dạng ảnh phát triển không ngừng. Các phương pháp tri thức nhân tạo như
mạng nơ ron nhân tạo, các thuật tốn xử lý hiện đại và cải tiến, các cơng cụ nén ảnh
ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan.
Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh. Đầu tiên, ảnh tự nhiên từ
thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh). Trước
đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR). Gần đây,
với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau
đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. (Máy ảnh
số hiện nay là một thí dụ gần gũi). Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh; có
thể qt từ ảnh chụp bằng máy qt ảnh. Hình 1.1 dưới đây mô tả các bước cơ bản
trong xử lý ảnh.
Thu
nhận
ảnh
Tiền xử
lý ảnh
Phân
đoạn
ảnh
Biểu
diễn và
mô tả
Nhận dạng
và nội suy
Cơ sở tri
thức
Hình 2.12 Các bước cơ bản trong xử lý ảnh
Sơ đồ này bao gồm các thành phần sau:
a) Phần thu nhận ảnh (Image Acquisition)
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua camera là
ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dịng), cũng có
loại camera đã số hố (như loại CCD – Change Coupled Device) là loại photodiot tạo
cường độ sáng tại mỗi điểm ảnh.
Trang 12
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
Camera thường dùng là loại qt dịng ; ảnh tạo ra có dạng hai chiều. Chất lượng
một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong
cảnh)
b) Tiền xử lý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền xử
lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ
tương phản để làm ảnh rõ hơn, nét hơn.
c) Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn
phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư
cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người
thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng. Đây là phần
phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của
ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này.
d) Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn)
cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng
thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể
hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các đặc tính
của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng
này với đối tượng khác trong phạm vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự
trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự
này với ký tự khác.
e) Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được bằng
cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán đoán
theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên phong
bì thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh khác nhau
về ảnh. Theo lý thuyết về nhận dạng, các mơ hình tốn học về ảnh được phân theo hai
loại nhận dạng ảnh cơ bản:
-
Nhận dạng theo tham số.
-
Nhận dạng theo cấu trúc.
Trang 13
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong
khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử),
nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt
người…
f) Cơ sở tri thức (Knowledge Base)
Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng
tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong
nhiều khâu xử lý và phân tích ảnh ngồi việc đơn giản hóa các phương pháp tốn học
đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử
lý ảnh theo cách của con người. Trong các bước xử lý đó, nhiều khâu hiện nay đã xử
lý theo các phương pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri thức được
phát huy. Trong tài liệu, chương 6 về nhận dạng ảnh có nêu một vài ví dụ về cách sử
dụng các cơ sở tri thức đó.
2.3.2 Những vấn đề cơ bản trong hệ thống xử lý ảnh
a) Điểm ảnh (Picture Element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý
bằng máy tính (số), ảnh cần phải được số hố. Số hoá ảnh là sự biến đổi gần đúng một
ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (khơng gian) và độ sáng
(mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người
không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh
(PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel
ứng với cặp tọa độ (x, y)
Định nghĩa:
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc
màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp
sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của
ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh.
b) Độ phân giải của ảnh
Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định
trên một ảnh số được hiển thị.
Trang 14
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt
người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên
một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong
khơng gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một
lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200).
Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA 17” độ phân
giải 320*200. Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng
hơn thì độ mịn (liên tục của các điểm) kém hơn.
c) Mức xám của ảnh
Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ
xám của nó. Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng
trong xử lý ảnh.
Định nghĩa: Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá
trị số tại điểm đó.
Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức
phổ dụng. Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức
xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255).
Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức
xám ở các điểm ảnh có thể khác nhau.
Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mơ tả 21 mức
khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1.
Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế
giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu:
28*3=224≈ 16,7 triệu màu.
d) Khái niệm ảnh đen trắng và ảnh màu
Ảnh có thể biểu diễn dưới dạng tín hiệu tương tự hoặc tín hiệu số. Trong biểu
diễn số của các ảnh đa mức xám, một ảnh được biểu diễn dưới dạng một ma trận hai
Trang 15
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
chiều. Mỗi phần tử của ma trận biểu diễn cho mức xám hay cường độ của ảnh tại vị trí
đó.
Pixel or
PEL
Độ sáng trung bình trong
mỗi hình chữ nhật = giá trị
một điểm ảnh.
Hình 2.13 Biểu diễn mức xám của ảnh số.
Trong Hình 2.13, một lưới chia ô vuông tưởng tượng được đặt lên ảnh. Độ lớn
mỗi ơ vng của lưới xác định kích thước của một điểm ảnh. Mức xám của một điểm
được tính bằng cường độ sáng trung bình tại mỗi ơ vng này. Mắt lưới càng nhỏ thì
chất lượng ảnh càng cao. Trong kỹ thuật truyền hình tiên tiến, (mục đích là cung cấp
cho người xem), hình ảnh cần chất lượng cao với độ phân giải gấp hai lần so với các
chuẩn hiện nay.
Trong kỹ thuật tương tự, một bức ảnh thường được biểu diễn dưới dạng các dòng
nằm ngang kế tiếp nhau. Mỗi dịng là một tín hiệu tương tự mang theo các thông tin về
cường độ sáng dọc theo một đường nằm ngang trong ảnh gốc. Ảnh trên một chiếc TV
được hiện lên qua các dòng quét này. Mặc dù thuật ngữ "tương tự" được dùng để mô
tả cho các ảnh quét liên tiếp nhưng thực tế ảnh chỉ tương tự dọc theo hướng nằm
ngang. Nó là rời rạc khi xét theo hướng dọc và chính vì vậy mà tín hiệu ảnh là tín hiệu
lai nửa tương tự, nửa số.
Một máy truyền hình được thiết kế để thu tín hiệu truyền hình mã hố theo tiêu
chuẩn NTSC của Mỹ có khả năng hiển thị xấp xỉ 525 dịng. Cơng nghệ truyền hình tiến
bộ nỗ lực để cung cấp cho chúng ta số lượng các dòng gấp hai lần, cho độ phân giải tốt
Trang 16
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
hơn là TV màn ảnh rộng. Một TV có màn ảnh lớn hơn 28 inch được coi là một TV có
màn ảnh rộng. Một điều cần chú ý là TV có khả năng hiện một số dịng như nhau cho
dù nó là 5 inch hay là 50 inch. Màn ảnh lớn nhất của loại TV dịng qt xen kẽ mà mắt
người có khả năng phân biệt được từ khoảng cách thông thường vào khoảng 3 mét.
Ảnh đen trắng
Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu trắng. Người ta phân mức
đen trắng đó thành L mức Nếu sử dụng số bit B=8 bít để mã hóa mức đen trắng (hay
mức xám) thì L được xác định :
L=2B (trong ví dụ của ta L=28= 256 mức)
Nếu L bằng 2, B=1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, cịn gọi là ảnh nhị
phân. Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối. Nếu L lớn hơn 2 ta có ảnh
đa cấp xám.
Nói cách khác, với ảnh nhị phân mỗi điểm ảnh được mã hóa trên 1 bit, còn với
ảnh 256 mức, mỗi điểm ảnh được mã hóa trên 8 bit. Như vậy, với ảnh đen trắng: nếu
dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám có thể biểu diễn được là
256. Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0
đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và 255 biểu diễn cho mức
cường độ sáng nhất.
Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi như các phần tử logic.
Ứng dụng chính của nó được dùng theo tính logic để phân biệt đối tượng ảnh với nền
hay để phân biệt điểm biên với điểm khác.
Ảnh màu
Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: đỏ (R), lục
(G), lơ (B) và thường thu nhận trên các dải băng tần khác nhau. Với ảnh màu, cách
biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của
ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red), lục (green) và lam (blue). Để biểu
diễn cho một điểm ảnh màu cần 24 bit. 24 bit này được chia thành ba khoảng 8 bit.
Mỗi màu cũng phân thành L cấp màu khác nhau (thường L=256). Mỗi khoảng này biểu
diễn cho cường độ sáng của một trong các màu chính.
Trang 17
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
Do đó, để lưu trữ ảnh màu người ta có thể lưu trữ từng màu riêng biệt, mỗi màu
lưu trữ như một ảnh đa cấp xám. Do đó, khơng gian nhớ dành cho một ảnh màu lớn
gấp 3 lần một ảnh đa cấp xám cùng kích cỡ.
2.3.3 Các thiết bị thu nhận ảnh
Hai thành phần cho công đoạn này là linh kiện nhạy với phổ năng lượng điện từ
trường, loại thứ nhất tạo tín hiệu điện ở đầu ra tỷ lệ với mức năng lượng mà bộ cảm
biến (đại diện là camera); loại thứ hai là bộ số hoá.
Bộ cảm biến ảnh
Máy chụp ảnh, camera có thể ghi lại hình ảnh (phim trong máy chụp, vidicon
trong camera truyền hình). Có nhiều loại máy cảm biến (Sensor) làm việc với ánh sáng
nhìn thấy và hồng ngoại như: Micro Densitometers, Image Dissector, Camera Divicon,
linh kiện quang điện bằng bán dẫn. Các loại cảm biến bằng chụp ảnh phải số hoá là
phim âm bản hoặc chụp ảnh. Camera divicon và linh kiện bán dẫn quang điện có thể
cho ảnh ghi trên băng từ có thể số hố. Trong Micro Densitometer phim và ảnh chụp
được gắn trên mặt phẳng hoặc cuốn quang trống. Việc quét ảnh thông qua tia sáng (ví
dụ tia Laser) trên ảnh đồng thời dịch chuyển mặt phim hoặc quang trống tương đối
theo tia sáng. Trường hợp dùng phim, tia sáng đi qua phim.
Bây giờ chúng ta đề cập đến tất cả các khối trong hệ thống.
Thiết bị nhận ảnh.
Chức năng của thiết bị này là số hóa một băng tần số cơ bản của tớn hiệu truyền
hình cung cấp từ một camera, hoặc từ một đầu máy VCR. Ảnh số sau đó được lưu trữ
trong bộ đệm chính. Bộ đệm này có khả năng được địa chỉ hóa (nhờ một PC) đến từng
điểm bằng phần mềm. Thơng thường thiết bị này có nhiều chương trình con điều khiển
để có thể lập trình được thơng qua ngôn ngữ C. Khi mua một thiết cần chú ý cácc điểm
sau:
Thiết bị có khả năng số hóa ảnh ít nhất 8 bit (256 mức xỏm) và ảnh thu được
hơn.
Thiết bị phải chứa một bộ đệm ảnh để lưu trữ một hoặc nhiều ảnh có độ
phân giải 512 512 điểm ảnh.
Thiết bị phải được kèm một bộ đầy đủ thư viện các chương trình con có khả
năng giao diện với các chương trình C viết bằng Turbo C hoặc Microsoft C.
Trang 18
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
Sổ tay hướng dẫn sử dụng phải được kèm theo, gồm cả dạng chứa trên đĩa và
khi in.
Một số thiết bị cho phép tuỳ chọn sử dụng cả hai chế độ văn bản và đồ hoạ
trên cùng một màn hình hoặc hai màn hình riêng biệt. Mặc dù chi tiết này là
khơng cần thiết, nhưng nó sẽ rất có giá trị trong trường hợp bị giới hạn về
không gian lắp đặt hoặc khả năng tài chính.
Camera
Tổng qt có hai kiểu camera: kiểu camera dùng đèn chân không và kiểu camera
chỉ dùng bán dẫn. Đặc biệt là trong lĩnh vực này, camera bán dẫn thường hay được
dùng hơn camera đèn chân không. Camera bán dẫn cũng được gọi là CCD camera do
dùng các thanh ghi dịch đặc biệt gọi là thiết bị gộp (Charge-Coupled Devices- CCDs).
Các CCD này chuyển các tín hiệu ảnh sang từ bộ cảm nhận ánh sáng bổ trợ ở phía
trước camera thành các tín hiệu điện mà sau đó được mã hóa thành tín hiệu TV. Loại
camera chất lượng cao cho tín hiệu ít nhiễu và có độ nhậy cao với ánh sáng. Khi chọn
camera cần chú ý đến các thấu kính từ 18 đến 108 mm. Sau đây là danh sách các nhà
sản xuất:
Pulnix America Inc, 770 Lucerne Drive, Sunnyvale, CA 84086. Tel. 408-773-
1550; fax 408-737-2966.
Sony Corp. of America, Component Products Co., 10833 Valley View St.,
Cypress, CA 90630. Fax 714-737-4285.
Parasonic, industrial camera division: 201-329-6674.
JVC Professional: 1-800-JVC-5825.
Màn hình video
Một số nhà sản xuất (như Sony) sản xuất các loại màn hình đen trắng chất lượng
cao. Nên sử dụng loại màn hình chất lượng cao, vì màn hình chất lượng thấp có thể làm
bạn nhầm lẫn kết quả. Một màn hình 9 inch là đủ cho yêu cầu làm việc. Để hiển thị ảnh
màu, nên dùng một màn hình đa hệ.
Máy tính
Cần có một máy tính P4 hoặc cấu hình cao hơn. Để chắc chắn, các máy này phải
có sẵn các khe cắm cho phần xử lý ảnh. Các chương trình thiết kế và lọc ảnh có thể
chạy trên bất kỳ hệ thống nào. Các chương trình con hiển thị ảnh dựng vỉ mạch VGA
Trang 19