TRƯỜNG ĐH CÔNG NGHIỆP THỰC PHẨM TP. HCM
KHOA CÔNG NGHỆ ĐIỆN – ĐIỆN TỬ
KHÓA LUẬN TỐT NGHIỆP
ỨNG DỤNG XỬ LÝ ẢNH NHẬN DẠNG
CỬ CHỈ BÀN TAY ĐIỀU KHIỂN ROBOT DI ĐỘNG
GVHD: ThS. TRẦN HOÀN
SVTH: NGUYỄN VĂN ĐẠT
LỚP: 07DHDT4
MSSV: 2002160185
TP. HỒ CHÍ MINH, NĂM 2020
TRƯỜNG ĐH CÔNG NGHIỆP THỰC PHẨM TP. HCM
KHOA CÔNG NGHỆ ĐIỆN – ĐIỆN TỬ
KHÓA LUẬN TỐT NGHIỆP
ỨNG DỤNG XỬ LÝ ẢNH NHẬN DẠNG
CỬ CHỈ BÀN TAY ĐIỀU KHIỂN ROBOT DI ĐỘNG
GVHD: ThS. TRẦN HOÀN
SVTH: NGUYỄN VĂN ĐẠT
LỚP: 07DHDT4
MSSV: 2002160185
TP. HỒ CHÍ MINH, NĂM 2020
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP
THỰC PHẨM TP. HỒ CHÍ MINH
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
KHOA ĐIỆN – ĐIỆN TỬ
PHIẾU GIAO NHIỆM VỤ
(Phiếu này phải đóng vào trang đầu tiên của báo cáo)
1. Họ và tên sinh viên được giao đề tài (Số lượng sinh viên: 1)
(1) Nguyễn Văn Đạt
Lớp: 07DHDT4
MSSV: 2002160185
2. Tên đề tài: Ứng dung x
̣
ử ly anh nhân dang c
́̉
̣
̣
ử chi ban tay điêu khiên robot di đông
̉ ̀
̀
̉
̣
3. Nhiệm vụ của đề tài:
_ Thực hiện chức năng: nhận dạng cử chỉ bàn tay điều khiển bobot di chuyển: đi thẳng,
rẽ trái, rẽ phải, lùi, dừng lại.
_ Cài đặt hệ điều hành và thư viện OpenCV cho Raspberry Pi
_ Nghiên cứu lý thuyết lập trình python, OpenCV
_ Tìm hiểu lý thuyết xử lý ảnh
_ Xây dựng giải thuật nhận dạng cử chỉ bàn tay
_ Chất lượng thực hiện nhận diện bàn tay đáp ứng tốt không bị nhiễu
4. Ngày giao nhiệm vụ đồ án tốt nghiệp: 29/02/2020
5. Ngày hoàn thành và nộp về khoa:
TP.Hồ Chí Minh, ngày 29 tháng 02 năm 2020
Trưởng khoa
Trưởng bộ môn
Giảng viên hướng dẫn
Lê Thành Tới
Nguyễn Phú Công
Trần Hoàn
NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
LỜI CÁM ƠN
Trước hết chúng em xin gửi lời cảm ơn chân thành đến quý thầy cô trường
Đại học Công Nghiệp Thực Phẩm thành phố Hồ Chí Minh nói chung và quý thầy cô
ở khoa Điện Điện tử và chuyên ngành Tự Động Hóa nói riêng đã tận tình truyền
đạt những kiến thức quý giá trong khoảng thời gian em học đại học.
Em xin được gửi lời cảm ơn đến thầy Trần Hoàn, thầy đã hướng dẫn và giúp
đỡ tận tình em nghiên cứu và hoàn thành luận văn tốt nghệp này. Những lời nhận
xét, góp ý và hướng dẫn của thầy đã giúp em có định hướng đúng đắn trong quá
trình thực hiện đề tài, giúp em nhìn ra được ưu khuyết điểm của đề tài và từng
bước khắc phục để có được kết quả tốt nhất. Xin gửi đến thầy lời chúc sức khỏe
và ngày càng thành công trên trên mục giảng.
Em xin gửi lời cảm ơn chân thành đến quý Thầy/Cô đã dành thời gian quý báu
để nhận xét và chấm Luận văn tốt nghiệp. Đây sẽ là nhưng đóng góp rất quý giá
cho em để hoàn thiện và phát triển đề tài ngày một tốt hơn.
Sau cùng, con xin bày tỏ lòng biết ơn sâu sắc tới Mẹ, Ba, Chị, Em những
người đã luôn luôn động viên, ở bên con trong những lúc khó khăn nhất, là động lực
cho con nỗ lực cố gắng trong suốt những năm tháng học tập tại trường và trên
những bước đường tiếp theo trong cuộc sống.
TP. Hồ Chí Minh, ngày 14 tháng 08 năm 2020
Tác giả
Nguyễn Văn Đạt
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
THỰC PHẨM TP. HỒ CHÍ MINH
Độc lập Tự do Hạnh phúc
KHOA ĐIỆN – ĐIỆN TỬ
TP. HCM, ngày….tháng…..năm……..
TÓM TẮT ĐỀ TÀI
Ngày nay, các mô hình xe, máy bay và robot đang ngày càng phổ biến
trong nghiên cứu và đào tạo. Các thiết bị này thường được vận hành tự động hoặc
điều khiển trực tiếp bởi con người. Nhờ vào sự tiến bộ của công nghệ xử lý hình
ảnh, ngày càng nhiều các thiết bị có khả năng ghi nhận cử chỉ tay và chuyển
đổi thành các tín hiệu có thể xử lý bằng máy tính. Đề tài “Ứng dụng xử lý ảnh
nhận dạng cử chỉ bàn tay điều khiển robot di động” là mô hình dựa theo ngôn ngữ
python với thư viện chính là Opencv và được thực hiện trên Kit Raspberry và Kit
Arduino Wifi ESP826 WeMos D1. Xử lý ảnh ở đây sẽ được nhận dạng theo
ngưỡng của bàn tay để điều khiển robot thông qua cử chỉ tay. Kết quả nghiên cứu
cho thấy cho thấy tính ổn định trong việc điều khiển các mô hình robot bằng cử chỉ
tay.
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
MỤC LỤC
SVTH: NGUYỄN VĂN ĐẠT
9
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
DANH MỤC KÝ HIỆU, CỤM TỪ VIẾT TẮT
KÍ HIỆU
THUẬT NGỮ
RGB
Red Green Blue
IDE
Integrated Development Environment
OpenCV
Open Source Computer Vision
PEL
(Picture Element) hay gọi tắt là Pixel
SVTH: NGUYỄN VĂN ĐẠT
10
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
DANH MỤC BẢNG BIỂU
SVTH: NGUYỄN VĂN ĐẠT
11
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
DANH MỤC HÌNH ẢNH
SVTH: NGUYỄN VĂN ĐẠT
12
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
Chương 1: TỔNG QUAN VỀ ĐỀ TÀI
1.1
Đặt vấn đề
Trong những năm gần đây, các ứng dụng về trí tuệ nhân tạo ngày càng phát
triển và được đánh giá cao. Một lĩnh vực đang được quan tâm của trí tuệ nhân tạo
nhằm tạo ra các ứng dụng thông minh, mang tính tri thức con người đó là nhận
dạng. Với sự phát triển mạnh mẽ của công nghệ và nhu cầu của con người ngày
càng cao. Một bài toán được đặt ra là: Làm sao có thể điều khiển máy tính, các thiết
bị giải trí, robot…bằng những cử chỉ, hành động và lời nói của con người. Nhận
dạng hình ảnh và âm thanh là một giải pháp để giải quyết bài toán này và một phần
nhỏ trong lĩnh vực đó là nhận dạng cử chỉ bàn tay.
Lý do chủ quan khi chọn đề tài: Những năm gần đây robot là một trong
những thế mạnh của Khoa. Và em muốn làm sao để trở nên mạnh hơn nữa về công
nghệ chế tạo robot thông minh. Để lại một cái gì đó quý báu cho những sinh viên
khóa sau của trường phát triển tốt hơn về các công nghệ cao và các ngành khác liên
quan.
1.2
Mục tiêu
Nhận dạng cử chỉ tay xây dựng chương trình điều khiển như sau:
No hand: Không có bàn tay (Robot không di chuyển)
“Up”: Ngón tay thứ nhất trong bàn tay (Robot di chuyển về phía trước)
“Down”: Ngón tay thứ hai trong bàn tay (Robot di chuyển về phía sau)
“Left”: Ngón tay thứ ba trong bàn tay (Robot di chuyển sang trái)
“Right”: Ngón tay thứ tư trong bàn tay (Robot di chuyển sang phải)
Nghiên cứu lý thuyết lập trình python, OpenCV.
Tìm hiểu lý thuyết xử lý ảnh.
Xây dựng giải thuật nhận dạng cử chỉ bàn tay.
SVTH: NGUYỄN VĂN ĐẠT
Trang 13
LUẬN VĂN TỐT NGHIỆP
1.3
GVHD: TRẦN HOÀN
Phạm vi của luận văn tốt nghiệp
Đề tài được nghiên cứu dựa trên nền tảng các kiến thức cơ bản về ngôn ngữ
lập trình và vi điều khiển được học ở trường, cùng với việc tự tìm hiểu và học hỏi
của các tài liệu đi trước. Hệ thống điều khiển của robot được thực hiện dựa trên
máy tính nhúng Raspberry pi 3 kết nối với camera pi và chương trình được viết
bằng Python. Do giới hạn về kiến thức của bản thân nên mục tiêu hướng đến đề
tài là làm sao để robot di động một cách cơ bản nhất có thể.
1.4
Tổng quan về các nghiên cứu liên quan
Bàn tay con người có cấu trúc xương phức tạp bao gồm rất nhiều khớp nối
với nhau. Vì số bậc tự do của bàn tay người là rất lớn nên việc nhận dạng cử chỉ
bàn tay trở nên một thách thức lớn. Có nhiều nghiên cứu về nhận dạng cử chỉ với
các giải thuật khác nhau như: nhận dạng phép trừ nền, dựa vào màu sắc, hình dáng,
các đặc trưng của bàn tay, optical flow, mean shift….
[1]
Nhận dạng bàn tay dựa vào màu sắc và hình dáng
Màu da là một đặc trưng quan trọng để định vị và tracking bàn tay người. Tuy
nhiên thuật toán dựa trên màu da phải đối mặt với khó khăn đó là phải phân biệt đối
tượng có màu tương tự với bàn tay như khuôn mặt và cánh tay người. Để giải
quyết vấn đề này, người sử dụng phải mặc áo sơ mi dài và phải hạn chế trong
khung nền trong đó màu sắc các đối tượng không được tương đồng với màu da
người. Thuật toán này cũng rất nhạy với các điều kiện chiếu sáng khác nhau. Khi
điều kiện ánh sáng không đáp ứng yêu cầu thì bộ nhận dạng thường không nhận ra
bàn tay.
Wuetal đã đề xuất thuật toán bám theo đối tượng dựa trên màu sắc không ổn
định bằng cách học hai phương pháp biểu diễn khác nhau cho sự phân bố màu sắc
và gọi thuật toán mới này là structure adaptive selforganizing map (SASOM). Kết
quả trong việc định vị bàn tay đã chỉ ra rằng thuật toán có thể kiểm soát tốt một vài
điểm khó trong tracking đối tượng có màu sắc không ổn định.
[2]
Nhận dạng dựa vào ngưỡng trên mỗi kênh màu
SVTH: NGUYỄN VĂN ĐẠT
Trang 14
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
Thuật toán dựa trên đặc trưng bàn tay trích xuất đặc trưng trong một vùng
ảnh nhất định như đầu ngón tay hoặc biên bàn tay, và sử dụng một vài phương pháp
suy luận để tìm ra hình dạng hoặc kết hợp những đặc trưng cụ thể để tạo nên một
cử chỉ bàn tay.
Đối với cách tiếp cận dựa trên đặc trưng bàn tay, việc phân đoạn những ảnh
không bị nhiễu là bước cần thiết để phục hồi những đặc trưng của bàn tay. Đây
không phải là nhiệm vụ dễ dàng khi gặp phải những ảnh nền phức tạp.
[3]
Optical Flow
Optical flow là thuật toán dựa trên phân tích chuyển động của bàn tay. Việc
bám theo bàn tay dựa vào quỹ đạo chuyển động và kết hợp với bộ phát hiện màu
da. Bộ lọc theo thời gian dùng thuật toán Viterbi để nhận dạng quỹ đạo của bàn tay
và thuật toán kiểm tra phụ được bổ sung vào thuật toán Viterbi để đảm bảo chắc
chắn quỹ đạo trích xuất sẽ chứa vị trí bàn tay của cùng một bàn tay đã được nhận
dạng trước đó. Những kết quả thực tế cho thấy hệ thống có khả năng bám theo bàn
tay ổn định.
[4]
Phương pháp trừ nền
Bàn tay được phát hiện bằng phương pháp trừ nền, sử dụng thuật toán
“codebook” của thư viện OpenCV.
Các điểm đầu mút được phát hiện bằng thuật toán “convex hull 2”, các điểm
lõm được phát hiện bằng thuật toán “convexity defect”.
Dựa vào số điểm lồi và lõm người ta sẽ biết được số ngón tay được đưa lên.
SVTH: NGUYỄN VĂN ĐẠT
Trang 15
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
Hình .1: Hình minh họa kết quả thuật toán trừ nền
1.5
Ý nghĩa khoa học và thực tiễn của đề tài
Đưa ra một bản lý thuyết với các nội dung tìm hiểu, các phép toán hình thái
trong xử lý ảnh và nhận dạng cử chỉ bàn tay của con người. Nhằm mục đích góp
một phần vào lĩnh vực ứng dụng của nhận dạng, cụ thể hơn ở đây là có thể ứng
dụng vào việc điều khiển di chuyển robot… Ứng với mỗi cử chỉ bàn tay thì robot
sẽ xử lý tiến, lùi, qua phải hay qua trái.
SVTH: NGUYỄN VĂN ĐẠT
Trang 16
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
Chương 2: CƠ SỞ LÝ THUYẾT
Giới thiệu về hệ thống xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành
khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó
rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính
chuyên dụng riêng cho nó.
Xử lý ảnh được đưa vào giảng dạy ở bậc đại học ở nước ta khoảng chục
năm nay. Nó là môn học liên quan đến nhiều lĩnh vực và cần nhiều kiến thức cơ sở
khác. Đầu tiên phải kể đến xử lý tín hiệu số là một môn học hết sức cơ bản cho xử
lý tín hiệu chung, các khái niệm về tích chập, các biến đổi Fourier, biến đổi
Laplace, các bộ lọc hữu hạn… Thứ hai, các công cụ toán như đại số tuyến tính, xác
suất thống kê. Một số kiến thứ cần thiết như trí tuệ nhân tạo, mạng nơron nhân tạo
cũng được đề cập trong quá trình phân tích và nhận dạng ảnh.
Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh. Đầu tiên, ảnh tự
nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như camera, máy chụp
ảnh). Trước đây, ảnh thu qua camera là các ảnh tương tự (loại camera ống kiểu
CCIR). Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được
lấy ra từ camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho
xử lý tiếp theo (máy ảnh số hiện nay là một thí dụ gần gũi).
Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp
bằng máy quét ảnh.
SVTH: NGUYỄN VĂN ĐẠT
Trang 17
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
Hình 2.1: Các bước cơ bản trong xử lý ảnh
Phần thu nhận ảnh (Image Acquisition):
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua
camera là ảnh tương tự, cũng có loại camera đã số hoá. Camera thường dùng là loại
quét dòng, ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu nhận được phụ
thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh…).
Tiền xử lý (Image Processing):
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ
tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu,
nâng độ tương phản để làm ảnh rõ hơn, nét hơn.
Phân đoạn (Segmentation) hay phân vùng ảnh:
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu
diễn phân tích, nhận dạng ảnh.. Đây là phần phức tạp khó khăn nhất trong xử lý
ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh
phụ thuộc rất nhiều vào công đoạn này.
Biểu diễn ảnh (Image Representation):
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân
đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này
thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các
tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với
việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở
để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được.
Nhận dạng và nội suy ảnh (Image Recognition and Interpretation):
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được
bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán
đoán theo ý nghĩa trên cơ sở nhận dạng. Theo lý thuyết về nhận dạng, các mô hình
toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:
SVTH: NGUYỄN VĂN ĐẠT
Trang 18
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
Nhận dạng theo tham số
Nhận dạng theo cấu trúc
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện
tử), nhận dạng văn bản (text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng
mặt người…
Cơ sở tri thức (Knowledge Base):
Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng
tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong
nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán
học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận
và xử lý ảnh theo cách của con người. Trong các bước xử lý đó, nhiều khâu hiện
nay đã xử lý theo các phương pháp trí tuệ con người.
Mô tả (biểu diễn ảnh):
Ảnh sau khi số hóa sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp
theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ
nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ. Thông
thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo
các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên
ảnh (Boundary), vùng ảnh (Region).
Những vấn đề cơ bản trong hệ thống xử lý ảnh
[5] Điểm ảnh (Picture Element)
Gốc của ảnh (ảnh tự nhiên): là ảnh liên tục về không gian và độ sáng. Để xử
lý bằng máy tính (số), ảnh cần phải được số hóa. Số hóa ảnh là sự biến đổi gần
đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không
gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao
cho mắt người không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy
SVTH: NGUYỄN VĂN ĐẠT
Trang 19
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh
hai chiều, mỗi pixel ứng với cặp tọa độ (x, y).
Định nghĩa: Điểm ảnh (Pixel) là một phần tử của ảnh số tại tọa độ (x, y) với
độ xám hoặc màu nhất định. Kích thước và khoản cách giữa các điểm ảnh đó được
chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám
(hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là
một phần tử ảnh.
Một file ảnh là tập hợp nhiều điểm ảnh, thông thường một hình ảnh được
chia thành các hàng và cột chứa điểm ảnh. Điểm ảnh là thành phần bé nhất biểu
diễn ảnh, có giá trị số biểu diễn màu sắc, độ sáng… của một thành phần trong bức
ảnh.
Hình 2.2: Điểm ảnh (pixel picture element)
[6] Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên
một ảnh số được hiển thị. Theo định nghĩa, khoảng cách giữa các điểm ảnh phải
được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn
khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và
được phân bố theo trục x và y trong không gian hai chiều.
SVTH: NGUYỄN VĂN ĐẠT
Trang 20
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
[7] Mức xám của ảnh
Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và
độ xám của nó. Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường
dùng trong xử lý ảnh.
Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số
tại điểm đó. Các thang giá trị mức xám thông thường:16, 32, 64, 128, 256 (mức 256
là mức phổ dụng. Lí do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức
xám: Mức xám dùng 1 byte biểu diễn 2^8 = 256 mức (tức là từ 0 đến 255).
Hình 2.3: Minh họa mức xám sau khi mã hóa
Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức
xám ở các điểm ảnh có thể khác nhau.
Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt, tức dùng 1bit mô tả 21
mức khác nhau. Nói cách khác mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc
1.
SVTH: NGUYỄN VĂN ĐẠT
Trang 21
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
Hình 2.4: Minh họa ảnh nhị phân sau khi mã hóa
Không gian màu HSV (HSB): Không gian màu HSV (còn gọi là HSB) là một
cách tự nhiên hơn để mô tả màu sắc, dựa trên 3 số liệu:
H: (Hue) Vùng màu
S: (Saturation) Độ bão hòa màu
B (hay V): (Bright hay Value) Độ sáng
Hình 2.5: Không gian màu HSV
Ảnh màu RGB: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo
nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các
giá trị màu là 28*3 = 224 = 16,7 triệu màu.
SVTH: NGUYỄN VĂN ĐẠT
Trang 22
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
Hình 2.6: Không gian màu RGB
[8] Định nghĩa ảnh số
Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh
gần với ảnh thật.
[9] Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông thường có
2 hướng tiếp cận:
Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành
một bó. Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen trắng.
Ứng dụng: in ảnh màu ra máy in đen trắng.
Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ
thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
[10] Kỹ thuật năng cao chất lượng ảnh
Nâng cao chất lượng là bước cần thiết trong xử lý ảnh nhằm hoàn thiện một
số đặc tính của ảnh. Nâng cao chất lượng ảnh gồm hai công đoạn khác nhau: tăng
SVTH: NGUYỄN VĂN ĐẠT
Trang 23
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
cường ảnh và khôi phục ảnh. Tăng cường ảnh nhằm hoàn thiện các đặc tính của
ảnh như:
Lọc nhiễu, hay làm trơn ảnh.
Tăng độ tương phản, điều chỉnh mức xám của ảnh.
Làm nổi biên ảnh.
Tăng cường ảnh không phải là làm tăng lượng thông tin vốn có trong ảnh làm
nổi bật các đặt trưng đã chọn. Tức điều chỉnh mức xám của điểm ảnh. Dùng
phương pháp ánh xạ làm thay đổi giá trị điểm sáng.
Khôi phục ảnh bao gồm quá trình lọc ảnh, khử nhiễu do môi trường bên
ngoài hay các hệ thống thu nhận, phát hiện và lưu trữ ảnh thu được, thông qua các
bọ lọc trong miền không gian và trong miền biến đổi. Nhằm làm giảm bớt các biến
dạng để khôi phục lại ảnh giống như ảnh gốc.
Kỹ thuật nâng cao chất lượng ảnh gồm: các kỹ thuật không phụ thuộc vào
không gian và các kỹ thuật phụ thuộc vào không gian.
Kỹ thuật không phụ thuộc vào không gian bao gồm các phép như: tăng giảm
độ sáng, tách ngưỡng, bó cụm, cân bằng histogram, tách ngưỡng tự động,
biến đổi cấp xám tổng thể,...
Kỹ thuật phụ thuộc vào không gian bao gồm các phép như: phép cuộn và
mẫu, lọc trung vị, lọc trung bình,…
[11] Kỹ thuật biến đổi ảnh
Thuật ngữ biến đổi ảnh thường dùng để nói tới một lớp các ma trận đơn vị,
và các kỹ thuật dùng để biến đổi ảnh làm giảm thứ nguyên của ảnh để việc xử lý
ảnh được hiệu quả hơn. Có nhiều loại biến đổi được dùng như: biến đổi Fourier,
Sin, Cosin,…
[12] Kỹ thuật phân tích ảnh
SVTH: NGUYỄN VĂN ĐẠT
Trang 24
LUẬN VĂN TỐT NGHIỆP
GVHD: TRẦN HOÀN
Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của một ảnh
để đưa ra một mô tả đầy đủ về ảnh. Nhằm mục đích xác định biên của ảnh. Có
nhiều kỹ thuật khác nhau như lọc vi phân hay dò theo quy hoạch động. Người ta
cũng dụng các kỹ thuật để phân vùng ảnh. Từ ảnh thu được, người ta tiến hành kỹ
thuật tách hay hợp dựa theo cách tiêu chuẩn đánh giá như: màu sắc cường độ …
Phương pháp được biết đến các kỹ thuật phân lớp dựa theo cấu trúc.
[13] Kỹ thuật nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta
muốn đặt tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính
chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
Mô tả tham số ( nhận dạng theo tham số).
Mô tả theo cấu trúc ( nhận dạng theo cấu trúc).
Người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng
khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có
dấu).
Các phương pháp xử lý ảnh số
[14]
Chuyển ảnh màu RGB thành ảnh mức xám ( Gray level)
Ảnh gốc thường là ảnh màu 24bit màu nên khó nhận dạng ta cần phải
chuyển
về ảnh xám dữ liệu 8bit để dễ nhận dạng hơn. Nghĩa là mỗi pixel được biểu diễn
256 cấp độ xám theo công thức:
X = 0,2125*R + 0,7145*G + 0,0721*B
Quá trình chuyển đổi mức xám tuy có làm mất đi một số thông tin nhưng
cũng có thể chấp nhận được.
[15]
Phương pháp lọc nhiễu ảnh
SVTH: NGUYỄN VĂN ĐẠT
Trang 25