Mục lục
CHƯƠNG 1: MỞ ĐẦU 7
1.1 Bài toán , hướng giải quyết bài toán nhận dạng phân loại vật thể 7
1.2 Tóm tắt nội dung đồ án 8
CHƯƠNG 2: TỔNG QUAN VỀ XỬ LÝ ẢNH - NHẬN DẠNG VẬT
THỂ 9
2.1 Xử lý ảnh (số) và các khái niệm liên quan: 9
2.2 Nhận dạng và phân loại ảnh 13
CHƯƠNG 3: XỬ LÝ ẢNH VỚI MATLAB 15
3.1 Giới thiệu về MATLAB 15
3.2 Xử lý ảnh bằng MATLAB 20
CHƯƠNG 4: XÂY DỰNG CHƯƠNG TRÌNH XỬ LÝ ẢNH 35
4.1 Bài toán nhận dạng vật thể 35
4.2 Sơ đồ thuật toán xử lý ảnh 36
4.3 Các bước chi tiết để xử lý ảnh 37
CHƯƠNG 5: KẾT QUẢ THỰC HIỆN 41
5.1 Kết quả 41
CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỒ ÁN 44
6.1 Đánh giá kết quả đạt được 44
6.2 Các ứng dụng có thể áp dụng: 45
1
TÀI LIỆU THAM KHẢO 46
PHỤ LỤC 47
51
2
DANH MỤC HÌNH VẼ
3
Danh mục từ viết tắt
PEL: Picture Element.
CGA: Color Graphic Adaptor.
VGA: Video Graphic Array.
RGB: Red Green Blue.
4
LỜI CẢM ƠN
Trong quá trình làm đồ án vừa qua được sự giúp đỡ và chỉ bảo nhiệt tình của
TS. Dương Huy Trung – Khoa cơ khí - Bộ môn Kỹ thuật máy ,đồ án của em đã
được hoàn thành. Mặc dù cố gắng cùng với sự chỉ đạo tận tâm của thầy hướng
dẫn nhưng do thời gian và khả năng còn hạn chế nên đồ án khó tránh khỏi
những thiếu sót.
Để hoàn thành đồ án này ,em xin bày tỏ lòng biết ơn sâu sắc đến TS.Dương
Huy Trung –người thầy đã giúp đỡ em tận tình trong suốt quá trình làm đồ án.
Em cũng xin bày tỏ lòng biết ơn đến và các thầy giáo,cô giáo trong bộ môn,
các thầy cô giáo trong trường Đại Học Giao Thông Vận Tải đã giúp đỡ, tạo điều
kiện tốt nhất cho em học tập và thực hiện đồ án này. Cuối cùng em xin chân
thành cảm ơn đến tất cả bạn bè và gia đình đã động viên giúp đỡ em trong lúc
khó khăn.
Hà nội, ngày 2 tháng 5 năm 2014
Sinh viên
Nguyễn Xuân Việt
5
LỜI GIỚI THIỆU
Trong những năm gần đây, xử lý hình ảnh (image processing) đã đạt được
nhiều thành tựu và tiến bộ vượt bậc. Trong đó, nhận dạng và phân loại hình ảnh
là một trong những lĩnh vực được theo đuổi một cách tích cực nhất. Ý tưởng cốt
lõi của việc nhận dạng và phân loại hình ảnh là phân tích ảnh từ các dữ liệu thu
được bởi các cảm biến hình ảnh như camera, Webcam… Nhờ các hệ thống xử lý
ảnh, con người đã giảm được khối lượng công việc cũng như tăng sự chính xác
trong việc đưa ra các quyết định liên quan đến xử lý hình ảnh trên nhiều lĩnh
vực: quân sự và quốc phòng, các hệ thống kỹ nghệ hoá sinh, giải phẫu, các hệ
thống giao thông thông minh, robotics, các hệ thống an ninh, dây chuyền sản
xuất tự động…
Nhận dạng và phân tích ảnh là một lĩnh vực liên ngành. Để thực hiện tốt
công việc nhận dạng và phân tích này, đòi hỏi người nghiên cứu phải am hiểu
nhiều lĩnh vực trong đó đặc biệt là các lĩnh vực liên quan tới cảm biến, các hệ
thống xử lý ảnh, các giải thuật xử lý hình ảnh/tín hiệu, phần cứng và phần mềm,
các hệ thống tích hợp…
Mục đích của báo cáo này là trình bày một phương pháp nhận dạng và phân
loại chi tiết máy. Theo đó, em sẽ lần lượt trình bày về cơ sở lý thuyết của việc
xử lý ảnh, nhận dạng vật thể,chương trình MATLAB với các hộp công cụ về
khảo sát và xử lý ảnh(image acquisition toolbox và image processing toolbox).
Bởi thời gian hạn hẹp cũng và nhiều hạn chế về kiến thức trong lĩnh vực hết
sức mới mẻ này, em mong báo cáo này sẽ trình bày một sự hiểu biết tương đối
về xử lý ảnh nói chung và nhận dạng vật thể nói riêng. Đồng thời, hy vọng rằng
trong một tương lai không xa sẽ có điều kiện ứng dụng những nghiên cứu đã đạt
được trong báo cáo này vào thực tế sản xuất.
6
CHƯƠNG 1: MỞ ĐẦU
1.1 Bài toán , hướng giải quyết bài toán nhận dạng phân loại vật thể.
- Bài toán: Ứng dụng xử lý ảnh trong nhận dạng và phân loại các chi tiết
máy trên một dây truyền sản xuất tự động.
- Phương hướng giải quyết
Để giải quyết bài toán xử lý ảnh trong nhận dạng thì chúng ta có rất nhiều
công cụ hỗ trợ tốt cho việc xử lý ảnh như: Open CV Microsoft Visual Studio
hay công cụ image processing toolbox của Matlab…
Với sự tiện dụng đơn giản trong quá trình lập trình, gần gũi với kỹ thuật thì
công cụ image processing toolbox của Matlab là tối ưu hơn cả và trong báo cáo
em sẽ trình bày ứng dụng xử lý ảnh trên image processing toolbox của Matlab
Hình 1. 1 Các bước thực hiện hoàn chỉnh của một quá trình.
Hình 1. 2 Các bước phân tích và xử lý ảnh
7
Thu nhận
ảnh ( qua
camera )
Phân tích xử
lý ảnh trên
matlab
Trung tâm điều
khiển
Bộ phận
công
tác(robots)
Tiền xử
lý
Phân
đoạn ảnh
Biểu diễn
và mô tả
Nhận
dạng và
nội suy
Cơ sở tri
thức
1.2 Tóm tắt nội dung đồ án
Lĩnh vực xử lý ảnh và thị giác máy đang ngày càng được nghiên cứu và
ứng dụng trong nhiều lĩnh vực của cuộc sống và sản xuất nhờ vào sự phát triển
mạnh mẽ của các hệ thống máy tính. Từ thực tế đó việc xây dựng các chương
trình hoạt động cho các hệ thống phân loại sản phẩm là thiết yếu, đặc biệt là các
hệ thống phân loại sản phẩm theo hình dạng.
Bài toán nhân dạng đối tượng là một bài toán đã và đang thu hút được sự
quan tâm của nhiều nhà nghiên cứu và phát triển. Nó mở ra nhiều ứng dụng hữu
ích của lĩnh vực thị giác máy tính như nhận dạng ảnh, theo dõi đối tượng, tìm
kiếm, vv. Nhận dạng đối tượng có rất nhiều cách tiếp cận để giải quyết, tuy
nhiên với mỗi loại đối tượng sẽ có một phương pháp cụ thể để thực hiện. Đơn
giản nhất là ta so sánh các điểm ảnh (pixel) với nhau giữa các đối tượng cần
nhận dạng. Tuy nhiên việc so sánh này thường tốn nhiều thời gian và không đạt
được kết quả như mong muốn. Một trong những phương pháp được sử dụng đạt
được hiệu quả tốt hơn đó là trích chọn các đặc trưng của ảnh. Các đặc trưng
được trích chọn thường dựa vào các đặc trưng bất biến.
Bố cục của đồ án được trình bày như sau : Trước hết đồ án trình bày về bài
toán đặt ra và phương hướng giải quyết ,sau đó trình bày các cơ sở lý thuyết của
xử lý ảnh và nhận dạng vật thể. Tiếp đó em xin giới thiệu cơ sở lý thuyết về
matlab và công cụ xử lý ảnh trên matlab " image processing toolbox". Trên cơ
sở tìm hiểu công cụ image processing toolbox đồ án xây dựng thuật toán phân
loại và nhận dạng sản phẩm chi tiết máy. Kết quả của đồ án là cơ sở để phát
triển và xây dựng các phần mềm phân loại và nhận dạng vật thể cho hệ thống
phân loại sản phẩm.
8
CHƯƠNG 2: TỔNG QUAN VỀ XỬ LÝ ẢNH - NHẬN DẠNG
VẬT THỂ
2.1 Xử lý ảnh (số) và các khái niệm liên quan:
2.1.1 Xử lý ảnh (số).
Xử lý ảnh(số) là một dạng của xử lý tín hiệu trong đó đầu vào là một hình
ảnh (các bức ảnh, các khung hình) và đầu ra của quá trình xử lý ảnh có thể là
một hình ảnh khác hoặc là một tập chứa các tính chất hoặc tham số liên quan tới
hình ảnh đó. Phần lớn các kỹ thuật xử lý ảnh thì thường qui về việc xử lý hình
ảnh như là một tín hiệu hai chiều rồi sử dụng các kỹ thuật xử lý tín hiệu để xử lý
nó.
2.1.2 Các khái nịêm liên quan:
• Điểm ảnh (Picture Element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử
lý bằng máy tính (số), ảnh cần phải được số hoá. Số hoá ảnh là sự biến đổi gần
đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không
gian) và độ sáng (mức xám). Khoảng cách giữa điểm ảnh đó được thiết lập sao
cho mắt người không phân biệt được ranh giới giữa chúng. Mỗi một điểm như
vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn
khổ ảnh hai chiều, mỗi Pixel ứng với cặp tọa độ (x,y).
Như vậy, điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x,y) với độ
xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được
chọn thích hợp sao cho mắt người cảm nhận sự liên tục về kkhong gian và mức
9
xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được
gọi là một phần tử ảnh.
• Độ phân giải của ảnh
Theo định nghĩa ở trên thi mỗi Pixel gồm một cặp toạ độ (x,y) và màu. Độ
phân giải của ảnh chính là tích số của giá trị lớn nhất của x với giá trị lớn nhất
của y.
Ví dụ: Màn hình máy tính có nhiều loại với độ phân giải khác nhau: màn hình
CGA (Color Graphic Adaptor) có độ phân giải 320 x 200; màn hình VGA
(Video Graphic Array) độ phân giải 1280 x 800;
Rõ ràng màn hình có độ phân giải càng cao thì ta có cảm giác nó càng ‘mịn’ hơn
so với loại có độ phân giải thấp hơn.
• Mức xám (Gray level)
Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗi điểm
ảnh với một giá trị số – kết quả của quá trình lượng tử hoá.
Các thang giá trị mức xám thông thường: 16,32,64,128,256. Trong đó mức
256 được dùng rất phổ biến do máy tính dùng 1 byte(8 bit) để biểu diễn mức
xám, mà mức xám lại dùng 1 byte để biểu diễn: 2
8
=256 mức, tức là từ mức 0
đến mức 255.
Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác ) với mức
xám ở các điểm ảnh có thể khác nhau.
Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức ding 1 bit mô tả 2
1
mức khác nhau hay mỗi điểm ảnh nhị phân chi có 1 trong 2 giá trị hoặc là 1 hoặc
là 2.
Ảnh màu: với mỗi điểm ảnh thì người ta dung 3 byte để mô tả mức màu (do
thế giới màu được tạo nên từ 3 màu cơ bản: đỏ(red), lục(blue) và lơ(green)). Do
đó có 2
8*3
=2
24
=16,7 triệu màu.
10
• Biểu diễn ảnh
Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của ảnh là
pixel. Do đó ta có thể biểu diễn một ảnh bởi một hàm 2 biến chứac thông tin.
Các mô hình biểu diễn ảnh cho ta một mô tả lô gic hay định lượng các tính chất
của hàm này. Chất lượng ảnh hoặc tính hiệu quả của các kỹ thuật xử lý phụ
thuộc vào nhiều yếu tố như: độ phân giải, nhiễu,
Để xử lý được ảnh, thì ảnh đó phải được lấy mẫu (sample) rồi lượng tử hoá
(quantization). Tức là đầu tiên chuyển từ ảnh tương tự sang ảnh số sau đó lưu
giá trị của từng điểm ảnh với một số hữu hạn các mức xám.
• Tăng cường và khôi phục ảnh
- Tăng cường ảnh (image enhancement):
Khi ảnh được chuyển từ dạng này sang dạng khác bởi các quá trình như:
truyền ảnh, quét ảnh,… thì ảnh nhận được thường có chất lượng thấp hơn so với
ảnh ban đầu. Để giúp người ta có thể quan sát bức ảnh một cách chính xác hơn
thì đòi hỏi phải có biện pháp để nâng cao chất lượng ảnh. Qúa trình này được
gọi là tăng cường ảnh (image enhancement).
Tăng cường ảnh giúp loại bỏ các suy giảm (degradation) gây ra bởi hệ thống
xử lý hoặc kênh xử lý ảnh. Ngày nay, nhu cầu phát triển các hệ thống tự động
cho việc xử lý hình ảnh ngày càng phát triển, kéo theo nó là sự cần thiết trong
việc loại bỏ sai số cũng như các yếu tố nhiễu trong qúa trình xử lý. Do đó, tăng
cường ảnh có thể được coi như một tập hợp các kỹ thuật để nâng cao chất lượng
hình ảnh đồng thời tập hợp này cũng được ding để nâng cao độ chính xác trong
quá trình tìm kiếm tự động và chuyển đổi dạng của bức ảnh.
Các kỹ thuật tăng cường ảnh có thể kể đến: kỹ thuật tương phản (contrast),
ánh xạ (mapping- gán mỗi mức xám từ ảnh gốc với một mức xám khác của ảnh
đã được biên dịch),… Nói chung, các kỹ thuật tăng cường ảnh này đều nhằm
mục đích đạt được kết qủa tốt nhất. Những kỹ thuật này thường dựa trên các sự
kết hợp giữa các phương pháp biến đổi trên miền không gian và miền tần số.
11
- Khôi phục ảnh (image restoration):
Khôi phục ảnh là quá trình loại bỏ các suy giảm (degradation) trong ảnh. Có
nhiều nguyên nhân dẫn đến sự suy giảm.
Khi camera không tập trung tiêu cự một cách hợp lý có thể dẫn đến bức ảnh
bị ‘nhòe’.
Khi chụp ảnh trong điều kiên thời tiết không thuận lợi: sương mù, qúa nắng
nóng,… cũng có thể làm cho bức ảnh bị ‘nhòe’.
Chụp ảnh các vật đang chuyển động cũng có thể gây ‘nhòe’ cho bức ảnh.
Do có nhiều nguyên nhân gây nên suy giảm ảnh vì vậy, đối với mỗi loại
nguyên nhân phải có các cách phục hồi khác nhau. Khôi phục ảnh phần lớn
được thực hiện bằng cách tìm ra các giải thuật nhằm phục hồi lại các thông tin bị
thất lạc trong quá trình xử lý ảnh.
Chúng ta cũng cần phân biệt tăng cường ảnh với khôi phục ảnh: trong khi
tăng cường ảnh nhằm tăng chất lượng của bức ảnh thì khôi phục ảnh nhằm đưa
lại hình ảnh gốc của bức ảnh đã bị suy giảm. Các kỹ thuật tăng cường ảnh không
áp dụng được với khôi phục ảnh.
* Biến đổi ảnh (image transformation)
Thuật ngữ biến đổi ảnh thường dùng để nói tới các kỹ thuật dùng để biến đổi
ảnh. Ở đây ảnh có thể được coi như một chuỗi các tín hiệu một chiều được biểu
diễn bởi các hàm cơ sở. Có nhiều biến đổi được dùng như: biến đổi Fourier,
cosin, sin, karhumen loeve,…
* Phân tích ảnh (image analysis)
Sau các bước tiền xử lý ảnh, ảnh đã được tăng cường hay được khôi phục để
làm nổi các đặc trưng chủ yếu. Lúc này nó bắt đầu được đưa vào quá trình phân
tích. Quá trình phân tích ảnh gồm các công đoạn: trích chọn các đặc tính (feature
extraction), phân đoạn ảnh (segmentation) thành các phần tử. Tuỳ theo mục đích
của việc xử lý, các giai đoạn tiếp theo của quá trình phân tích ảnh có thể là nhận
dạng ảnh (phân thành các lớp có miêu tả) hay là giải thích và miêu tả ảnh.
12
Hình vẽ trang 115
Hình 2. 1 Các bước trong phân tích ảnh
Phân tích ảnh thường dựa trên việc phân tích các đặc trưng của ảnh: mật độ
xám, phân bố xác suất, phân bố không gian, biên ảnh…
2.2 Nhận dạng và phân loại ảnh.
* Nhận dạng ảnh (recognition of image partterns):
Khi một bức ảnh đã được phân đoạn, nhiệm vụ tiếp theo là nhận dạng vật thể
hoặc vùng đã được phân đoạn. Mỗi một vật thể là một thành phần ở trong ảnh và
các giá trị đo được là các đặc tính của thành phần đó. Một tập các vật thể cùng
có các đặc tính giống nhau được gọi là một ‘lớp vật thể’(pattern class).
Theo đó có thể định nghĩa, nhận dạng là quá trình phân loại các đối tượng
được biểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp (gán cho
đối tượng một tên gọi) dựa theo những quy luật và các mẫu chuẩn.
Sự nhận dạng ảnh thường dựa trên nhiều tính chất của vật và với mỗi tính
chất đều có các kỹ thuật nhận dạng khác nhau. Ví dụ: Mỗi chữ cái trong tiếng
anh đều là một tập các đường thẳng đứng, ngang, chéo hoặc cong. Trong khi
chữ ‘A’ được mô tả bởi 2 đường chéo và một đường nằm ngang thì chữ ‘B’
được mô tả bởi một đường thẳng đứng với 2 đoạn cong. Một số tính chất của
các vật thể 2 hoặc 3 chiều là diện tích, thể tích, chu vi, bề mặt,… có thể đo được
thông qua việc tính toán số ‘pixel’. Tương tự như vậy, bang của một vật được
đặc trưng bởi đường biên của nó. Một số tham số để xác định bang của một vật
là các mô-ment bất biến (invariant moment), đường trung bình (medial axis) của
vật thể …
13
Ảnh vào
Trích chọn
đặc tính
Phân
đoạn
Phân loại
Giải thích
Mầu của một vật cũng là đặc điểm hết sức quan trọng được dùng trong nhận
dạng. Kỹ thuật dùng để phát hiện các đặc tính của vật thể gọi là kỹ thuật trích
chọn đặc tính (feature extraction). Khi đó vật thể được miêu tả như một tập các
đặc tính. Sự lựa chọn và tách lấy các tính chất thích hợp được coi như là vấn đề
cơ bản đầu tiên trong nhận dạng ảnh.
* Phân loại thành phần ảnh (classification of image patterns)
Phân loại là một công đoạn quan trọng trong quá trình nhận dạng vật. Đã có
nhiều kỹ thuật phân loại được sử dụng trong việc nhận dạng thành phần. Một số
kỹ thuật phân loại được biết như là những kỹ thuật lý thuyết chính xác. Với
những kỹ thuật lý thuyết chính xác này, phân loại một thành phần chưa biết
được quyết định dựa trên một số nguyên tắc hoặc đã xác định hoặc có ý nghĩa
thống kê hoặc thậm chí đôi khi còn chưa được xác định rõ.
14
CHƯƠNG 3: XỬ LÝ ẢNH VỚI MATLAB
3.1 Giới thiệu về MATLAB
MATLAB là ngôn ngữ lập trình bậc cao dùng cho kỹ thuật. Đồng thời nó
là môi trường tương tác có thể thực hiện nhiều nhiệm vụ: phát triển giải thuật,
phân tích dữ liệu, tính toán các phép tính số học và hình ảnh hóa dữ liệu. So với
các ngôn ngữ lập trình truyền thống như C, C++ hay Fortran thì MATLAB có
nhiều ưu điểm hơn do được tích hợp các hỗ trợ rất mạnh.
MATLAB được sử dụng trong nhiều lĩnh vực ứng dụng bao gồm: sử lý tín
hiệu và hình ảnh, truyền thông, thiết kế điều khiển, kiểm tra và đo lường, phân
tích và mô hình hóa các thông tin tài chính, tính toán trong hóa sinh… Ngoài ra,
MATLAB còn được tích hợp các hộp công cụ (mỗi hộp gồm hệ thống các hàm
có những chức năng đặc biệt của MATLAB) nhằm giải quyết các lớp vấn đề cụ
thể trong các lĩnh vực ứng dụng khác nhau.
MATLAB cung cấp nhiều đặc tính tiện lợi đối với việc xử lý và chia sẻ
công việc. Trong quá trình làm việc với MATLAB, các đoạn mã của nó có thể
được tích hợp với các ngôn ngữ và ứng dụng khác.
3.1.1 Các đặc điểm cơ bản của MATLAB:
- Là ngôn ngữ bậc cao dùng cho các tính toán kỹ thuật.
- Là môi trường phát triển để quản lý dữ liệu.
- Gồm nhiều công cụ tương tác cho việc khai thác và xử lý dữ liệu, thiết kế
và giải quyết vấn đề.
- Các hàm đồ thị đối với ảnh 2 hoặc 3 chiều cho phép hình ảnh hóa dữ liệu.
- Chứa các công cụ để xây dựng các giao diện đồ thị của người sử dụng.
15
- Gồm nhiều hàm chức năng dựa trên các giải thuật cơ sở nhằm tích hợp
MATAB với các ứng dụng và ngôn ngữ lập trình khác như: C,C++,
Fortran, Java, Microsoft excel…
3.1.2 Phát triển giải thuật và ứng dụng
MATLAB là một ngôn ngữ bậc cao được tích hợp các công cụ phát triển
giúp người sử dụng phát triển và phân tích các giải thuật và ứng dụng một cách
nhanh chóng.
3.1.3 Ngôn ngữ lập trình MATLAB:
Ngôn ngữ lập trình MATLAB hỗ trợ các phép toán đối với ma trận và vec-tơ
cơ sở cho các vấn đề kỹ thuật và khoa học.
Việc lập trình và phát triển giải thuật trong MATLAB có tốc độ nhanh hơn so
với các ngôn ngữ lập trình truyền thống do MATLAB bỏ qua các công việc điều
khiển bậc thấp như khai báo biến, khai báo mẫu dữ liệu và xác định vùng nhớ.
Trong nhiều trường hợp, MATLAB còn bỏ qua cả sự cần thiếp của các vòng lặp
‘for’. Kết quả là, một dòng lệnh được viết trong MATLAB có thể tương đương
với nhiều dòng lệnh trong C hay C++.
Là một công cụ lập trình mạnh, MATLAB vẫn hỗ trợ những đặc tính của một
ngôn ngữ lập trình truyền thống như: toán tử số học, cấu trúc vòng, các cấu trúc
và dạng dữ liệu cùng đặc tính gỡ rối.
Ví dụ: Chương trình biểu diễn thuật toán điều chế tín hiệu truyền thông tạo ra
1024 điểm, thực hiện điều chế, thêm nhiễu phức Gauss và vẽ lại kết quả.
% tạo một vector N bit
N = 1024;
bits = rand(N,1)>0.5;
% chuyen sang ky tu
Tx=1-2*bits;
16
%them vao nhieu Gauss trang
P=0.4
Nz=P*(randn(N,1)+i*randn(N,1));
Rx= Tx + Nz;
%hien thi ket qua
plot(Rx,'.');
axix([-2 2 -2 2]);
axis square, grid;
Hình 3. 1 Các điểm tạo ra
Trong khi đối với phần lớn các ngôn ngữ lập trình truyền thống phải trải qua
giai đoạn dịch (compilation) và liên kết (linking) thì MATLAB cho phép người
sử dụng có thể thực thi ngay các lệnh hoặc nhóm lệnh cùng lúc. Điều này làm
cho tốc độ xử lý trên MATLAB nhanh hơn đáng kể so với trên các ngôn ngữ
truyền thống.
17
3.1.4 Phân tích và tiếp cận dữ liệu
Trong quá trình phân tích dữ liệu, MATLAB hỗ trợ hầu hết các công đoạn
như: thu nhận dữ liệu từ thiết bị ngoại vi, các phân tích số học, tiền xử lý, hình
ảnh hóa…
Phân tích dữ liệu:
Chương trình MATLAB cung cấp các công cụ tương tác cũng như các hàm
điều khiển theo dòng cho việc tính toán trong phân tích dữ liệu bao gồm:
- Các phép nội suy.
- Trích chọn tính chất.
- Chọn ngưỡng và lọc nhiễu.
- Tương quan, phân tích Fourier và lọc.
- Phát hiện các điểm đỉnh, đáy và điểm không.
- Thống kê cơ bản và chuẩn hóa các đường cong.
- Phân tích ma trận.
Tiếp cận dữ liệu
Việc tiếp cận dữ liệu từ các thư mục, ứng dụng, cơ sở dữ liệu và thiết bị
ngoại vi bởi MATLAB là hết sức dễ dàng. MATLAB hỗ trợ nhiều loại định
dạng file: ASCII, nhị phân, các file hình ảnh và âm thanh hay thậm chí các file
định dạng HDF.
Trong MATLAB có nhiều hộp công cụ (toolbox) hỗ trợ cho việc tiếp cận
dữ liệu như: hộp công cụ cơ sở dữ liệu (Database Toolbox), hộp công cụ thu
nhận dữ liệu (Data Acquisition Toolbox) hay hộp công cụ điều khiển thiết bị
(Instrument Control Toolbox).
18
3.1.5 Hình ảnh hóa dữ liệu
Tất cả các đặc tính về hình ảnh cần thiết cho hình ảnh hóa các dữ liệu khoa
học kỹ thuật đều được tích hợp trong MATLAB. Những đặc tính này bao gồm:
các hàm vẽ ảnh 2 và 3 chiều, các hàm vẽ thể tích 3 chiều, các công cụ tương tác
tạo ảnh, khả năng xuất kết quả dưới các dạng file ảnh thông thường.
VD: vẽ hàm y= sin(x) với -pi < x < pi
Mã chương trình:
>>x = -pi:.1:pi;
>>y = sin(x);
>> plot (x, y)
Hình 3. 2 Đồ thị hàm y = sin(x)
3.1.6 Xuất kết quả và triển khai ứng dụng
MATLAB đưa ra nhiều đặc tính giúp báo cáo và chia sẻ công việc. Các
đoạn code viết trên MATLAB có thể được tích hợp với các ngôn ngữ và ứng
19
dụng khác. Đồng thời cũng có thể triển khai các thuật toán cũng như ứng dụng
của nó như một chương trình hoặc các khối phần mềm riêng biệt.
Xuất kết quả:
Sau khi hoàn thành công việc, người sử dụng cần xuất kết quả ra thường là
dưới dạng hình ảnh hoặc báo cáo. MATLAB có hỗ trợ file hình ảnh với nhiều
định dạng khác do đó việc xuất kết quả dưới dạng đồ thị hay file ảnh là hết sức
dễ dàng. Ngoài ra, nếu muốn thì cũng có thể chuyển code từ MATLAB ra các
dạng khác: HTML, Word, Latex…
Kết hợp mã MATLAB với các loại ngôn ngữ và ứng dụng khác:
MATLAB cung cấp sẵn các hàm cho việc kết hợp mã của các ngôn ngữ lập
trình khác như C, C++, Fortran hay Java với mã chương trình của nó. Sử dụng
thư viện công cụ(engine library) của MATLAB, người sử dụng có thể gọi các
đoạn mã từ C, C++ hay Fortran.
Triển khai ứng dụng:
Các sản phẩm sau khi xử lý bằng MATLAB thường là các đoạn mã. Các
đoạn mã này có thể được cung cấp cho những người khác hoặc ứng dụng vào
các sản phẩm phần cứng hoặc phần mềm cụ thể.
3.2 Xử lý ảnh bằng MATLAB
3.2.1 Ảnh trong MATLAB
Trong MATLAB, dữ liệu chủ yếu được lưu trữ theo cấu trúc mảng (tập có
thứ tự gồm các phần tử số thực hoặc phức). Ảnh trong Matlab cũng được lưu trữ
bởi các mảng phần tử với các giá trị lưu trữ có thể là mầu, cường độ… của ảnh.
Hầu hết các ảnh được MATLAB lưu trữ dưới dạng các mảng 2 chiều (ví
dụ: ma trận). Trong các mảng 2 chiều này, mỗi phần tử tương ứng với một pixel
và thường được biểu diễn bởi một điểm trên màn hình máy tính(ví dụ: Một bức
ảnh có 500 hàng và 700 cột gồm nhiều điểm mầu khác nhau được lưu trữ bởi
một ma trận có kích thước 500x700). Một số bức ảnh, như ảnh mầu đòi hỏi phải
20
được lưu trữ bởi mảng ba chiều. Trong đó, mặt phẳng thứ nhất trong mảng ba
chiều này biểu diễn cho cường độ đỏ (red) của phần tử, mặt phẳng thứ hai biểu
diễn cho cường độ màu xanh là cây (green) và mặt phẳng còn lại biểu diễn cho
cường độ màu xanh da trời (blue) của phần tử. Với việc lưu trữ các ảnh dưới
dạng mảng, việc xử lý ảnh với dữ liệu được lưu bởi dạng ma trận nào đều được
thực hiện rất thuận tiện.
3.2.2 Hộp công cụ xử lý ảnh (image processing toolbox):
Matlab có thể xử lý cũng như lưu trữ các bức ảnh dưới nhiều định dạng
khác nhau: BMP, HDF, JPEG, TIFF… Dù vậy tất cả các định dạng này đều
được quy chuẩn về 4 dạng cơ bản: nhị phân (Binary), được gán chỉ số (Indexed),
mức xám (Grayscale), RGB (RGB hay truecolor). Các định dạng ảnh này sẽ qui
định cách mà Matlab biên dịch các phần tử của ma trận dữ liệu (VD: các giá trị
cường độ phần tử).
* Ảnh dạng mức xám (gray scale image):
Ảnh loại này được biểu diễn bởi một ma trận mà mọi phần tử của nó đều
biểu diễn một giá trị sáng/tối của điểm ảnh ở vị trí tương ứng. Có 2 cách để biểu
diễn giá trị thể hiện mức độ ‘xám’ của một pixel: dạng double và dạng uint8.
Dạng double gán cho mỗi pixel một giá trị động thuộc khoảng (0,1): giá trị 0
ứng với màu đen còn 1 ứng với màu trắng. Dạng uint8 gán cho mỗi pixel một
giá trị từ 0 đến 255 thể hiện độ sáng (brightness): giá trị 0 tương ứng với màu
đen còn 255 ứng với màu trắng. Mỗi bức ảnh lưu trữ dưới dạng uint8 chỉ chiếm
1/8 không gian nhớ so với lưu trữ dưới dạng double. Mặc dù vậy, đôi khi thuật
toán hoặc các ứng dụng chỉ có thể giải quyết với dạng double.
* Ảnh kiểu nhị phân:
Mỗi bức ảnh dạng này được lưu trữ bởi một ma trận trong đó mỗi phần tử
của ma trận chỉ có thể có giá trị hoặc 0 (đen) hoặc 1 (trắng).
* Ảnh được gán chỉ số:
Đây là một cách thông dụng để biểu diễn các bức ảnh mầu. Một bức ảnh
được gán chỉ số được lưu trữ bởi 2 ma trận. Ma trận thứ nhất có cùng kích cỡ
21
với bức ảnh và chứa giá trị thứ nhất của mỗi pixel. Ma trận còn lại được gọi là
ma trận màu (color map) và có kích cỡ có thể khác so với kích cỡ của bức ảnh.
Các chỉ số ở ma trận thức nhất cho ta biết số nào sẽ được biểu diễn bởi ma trận
màu.
* Ảnh dạng RGB:
Các ảnh RGB được Matlab lưu trữ bởi 3 ma trận chứa các kích cỡ ứng với
định dạng của bức ảnh. Mỗi ma trận tương ứng với một trong các mầu: đẻ
(Red), xanh lá cây (Green), xanh da trời (Blue). Đồng thời giá trị mỗi phần tử
của ma trận sẽ thể hiện cường độ từng loại mầu tại mỗi pixel.
3.2.3 Các hàm xử lý ảnh cơ bản trong Matlab
3.2.3.1 Đọc và ghi dữ liệu ảnh
Đọc một ảnh đồ hoạ
- Hàm imread đọc một ảnh từ bất kì định dạng nào được trợ giúp trong bất
kì chiều sâu bit nào được trợ giúp. Hầu hết các file ảnh sử dụng 8 bit để chứa
giá trị của pixel. Khi chúng được đọc vào bộ nhớ, Matlab chứa chúng dưới
dạng uint8. Với các file trợ giúp 16 bít dữ liệu, PNG và TIFF, Matlab chứa
chúng dưới dạng uint16. Chú ý: Với ảnh chỉ số, imread luôn luôn đọc bản
đồ màu vào trong một chuỗi thuộc lớp double, thậm chí mảng ảnh tự nó
thuộc lớp uint8 hay uint16
- Chẳng hạn, đoạn mã sau sẽ đọc một ảnh RGB vào không gian làm việc của
Matlab lưu trong biến RGB.
RGB=imread(‘football.jpg’);
Trong ví dụ này, imread sẽ nhận ra định dạng file để sử dụng từ tên file. Ta cũng
có thể chỉ ra định dạng file như một tham số trong hàm imread. Matlab trợ giúp
rất nhiều định dạng đồ hoạ thông dụng chẳng hạn: BMP, GIF, JPEG, PNG,
TIFF … Để biết thêm các kiểu gọi hàm và tham số truyền vào, xem trợ giúp
online của Matlab.
22
Đọc nhiều ảnh từ một file đồ hoạ
- Matlab trợ giúp một số định dạng file đồ hoạ chẳng hạn như: HDF và TIFF,
chúng chứa nhiều ảnh. Theo mặc định, imread chỉ trợ giúp ảnh đầu tiên trong
file. Để nhập thêm các ảnh từ file, sử dụng cú pháp được trợ giúp bởi định dạng
file. Chẳng hạn khi được sử dụng với TIFF, ta có thể sử dụng một giá trị chỉ số
với imread để chỉ ra ảnh mà ta muốn nhập vào.
- Khi file chứa nhiều ảnh theo một số kiểu nhất định chẳng hạn theo thứ tự
thời gian, ta có thể lưu ảnh trong Matlab dưới dạng mảng 4 chiều. Tất cả các ảnh
phải có cùng kích thước.
Ghi một ảnh đồ hoạ
- Hàm imwrite sẽ ghi một ảnh tới một file đồ hoạ dưới một trong các định
dạng được trợ giúp. Cấu trúc cơ bản nhất của imwrite sẽ yêu cầu một biến ảnh
và tên file. Nếu ta gộp một phần mở rộng trong tên file, Matlab sẽ nhận ra định
dạng mong muốn từ nó.
Chỉ ra định dạng phụ - Tham số đặc biệt
- Khi sử dụng imwrite với một số định dạng đồ hoạ, ta có thể chỉ ra các tham số
phụ. Chẳng hạn, với định dạng PNG ta có thể chỉ ra độ sâu bit như một tham số
phụ.
- Để biết thêm các cấu trúc khác của hàm xem phần trợ giúp trực tuyến của
Matlab.
Đọc và ghi ảnh nhị phân theo định dạng 1 bit
- Trong một số định dạng file, một ảnh nhị phân có thể được lưu trong một
định dạng 1 bit. Nếu định dạng file trợ giúp nó, Matlab ghi ảnh nhị phân như
ảnh 1 bit theo mặc định. Khi ta đọc một ảnh nhị phân với định dạng 1 bit,
Matlab đại diện nó trong không gian làm việc như một mảng lôgic.
Chú ý: Khi ghi file nhị phân, Matlab thiết lập trường ColorType thành
‘grayscale’.
23
Xem lớp lưu trữ của file
- Hàm imwrite sử dụng luật sau đây để quyết định lớp lưu trữ được sử dụng
trong ảnh kết quả:
+ logical: Nếu định dạng ảnh ra (Output Image) được chỉ rõ là trợ giúp ảnh 1 bit,
hàm imwrite tạo một file ảnh 1 bit. Nếu định dạng ảnh ra được chỉ rõ là không
trợ giúp ảnh 1 bit (như JPEG), hàm imwrite chuyển ảnh tới một ảnh thuộc lớp
uint8.
+ uint8: Nếu định dạng ảnh ra được chỉ rõ là trợ giúp ảnh 8 bit, hàm imwrite tạo
một ảnh 8 bit
+ uint16: Nếu định dạng ảnh ra được chỉ rõ trợ giúp ảnh 16 bit (PNG hoặc
TIFF), hàm imwrite tạo một ảnh 16 bit. Nếu định dạng ảnh ra không trợ giúp
ảnh 16 bit, hàm chuyển đổi dữ liệu ảnh tới lớp uint8 và tạo một ảnh 8 bit.
+ double: Matlab chuyển dữ liệu ảnh tới dạng uint8 và tạo một ảnh 8 bit bởi vì
hầu hết các file ảnh sử dụng định dạng 8 bit.
Truy vấn một file đồ hoạ:
Hàm imfinfo cho phép ta có thể nhận được thông tin về một file ảnh được trợ
giúp bởi toolbox. Cú pháp: imfinfo (filename,fmt). Các thông tin được cung cấp
bởi hàm imfinfo là: filename, filemodedate, filesize, format, formatversion,
width, height, bitdepth, colortype … Thông tin mà ta nhận được phụ thuộc vào
kiểu của file nhưng nó luôn bao gồm những thông tin sau:
- Tên của file ảnh.
- Định dạng file ảnh.
- Số version của định dạng file.
- Ngày sửa đổi file gần nhất.
- Kích thước file tính theo byte.
- Chiều rộng ảnh tính theo pixel.
24
- Chiều cao ảnh tính theo pixel.
- Số lượng bít trên một pixel.
- Kiểu ảnh: RGB, chỉ số …
3.2.3.2 Hiển thị ảnh
Dùng hàm imview
- Để hiển thị một ảnh sử dụng hàm imview, dùng hàm imview, chỉ rõ ảnh mà ta
muốn hiển thị. Ta có thể sử dụng imview để hiển thị một ảnh mà đã được nhập
vào trong không gian làm việc của Matlab.
moonfig = imread('moon.tif');
imview(moonfig);
Ta cũng có thể chỉ định tên của file ảnh như trong ví dụ sau:
imview('moon.tif');
- File ảnh phải có mặt trong thư mục hiện tại hoặc trong đường dẫn của
Matlab. Cấu trúc này có thể hữu ích cho việc quét qua nhiều ảnh. Tuy nhiên, lưu
ý, khi sử dụng cấu trúc này, dữ liệu ảnh không được lưu trong không gian làm
việc của Matlab.
- Nếu ta gọi hàm imview mà không chỉ ra mất kì tham số nào, nó sẽ hiển thị
một hộp chọn file cho phép ta chỉ ra tên file muốn hiển thị.
Xem nhiều ảnh
- Nếu ta chỉ ra một file mà chứa nhiều ảnh, hàm imview chỉ hiển thị ảnh đầu
tiên trong file đó. Để xem tất cả các ảnh trong file, sử dụng hàm imread để nhập
mỗi ảnh vào trong không gian làm việc của Matlab sau đó gọi hàm imview
nhiều lần để hiển thị mỗi ảnh riêng biệt.
Dùng hàm imshow
25