Tải bản đầy đủ (.pdf) (74 trang)

Đồ án tốt nghiệp chuyên ngành Kĩ thuật máy tính: Phân loại ảnh MRI u não

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.02 MB, 74 trang )

ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

LỜI CAM ĐOAN
Em xin cam đoan nội dung của đồ án tốt nghiệp này không phải là bản sao chép
của bất cứ đồ án hoặc công trình nào đã có từ trước. Nếu vi phạm em xin chịu mọi hình
thức kỷ luật của Khoa.
Đà Nẵng, ngày 18 tháng 12 năm 2016
Sinh viên thực hiện

Phạm Đức Thiện
Nguyễn Văn Duy Vũ

1


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

BẢNG PHÂN CÔNG NHIỆM VỤ

Tìm hiểu nội dung lý thuyết về xử lý
NGUYỄN VĂN DUY VŨ

ảnh não, viết chương trình Matlab về

11DT3

các kĩ thuật sử dụng để giảm đặc trưng,
trích xuất đặc trưng và phân loại ảnh
não. Xây dựng cơ sở dữ liệu và chạy
thử nghiệm, làm slide.


PHẠM ĐỨC THIỆN

Tìm hiểu nội dung về chương trình giao

11DT3

diện GUI, xây dưng cơ sở dữ liệu mẫu
và chạy thử nghiệm, viết chương trình
Matlab tiền xử lý, lấy ngưỡng trong xử
lý ảnh, làm báo cáo.

2


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

MỤC LỤC
Lời cam đoan ………………………………………………………………………… 1
Bảng phân công công việc …………………………………………………………... 2
Mục lục ……………………………………………………………………………….. 3
Danh mục hình ảnh …………………………………………….……………………. 5
Các từ viết tắt ………………………………………………………………………… 7
Lời mở đầu ……….…………………………………………………………………... 8
Chương 1 Tổng quan, cơ sở lý thuyết và các thuật toán xử lý ảnh MRI não…… 12
1.1

Giới thiệu về ảnh MRI và phân loại ảnh não ……………………… 12

1.2


Giới thiệu về các thuật toán liên quan đến xử lý ảnh ……………… 14

1.2.1

Thuật toán nhị phân và phân ngưỡng otsu……………………….… 14

1.2.1.1

Nhị phân ảnh …………………………………………………….… 14

1.2.1.2

Thuật toán phân ngưỡng Otsu …………………………………….. 14

1.2.2

Biến đổi wavelet rời rạc …………………………………………… 16

1.2.2.1

Phân tích wavelet, các xấp xỉ và chi tiết …………………………... 16

1.2.2.2

Phân tích đa phân giải ……………………………………………... 18

1.2.2.3

Một số ứng dụng nổi bật của wavelet ……………………………... 20


1.2.3

Thuật toán PCA …………………………………………………… 21

1.2.4

Ma trận đồng hiện mức xám ……………………………………… 24

1.2.5

Máy vecto hỗ trợ SVM ……………………………………………. 26

1.2.5.1

Bài toán nhị phân ………………………………………………….. 26

1.2.5.2

SVM cho bài toán phân lớp tuyến tính ……………………………. 26

1.2.5.3

SVM biên cứng ……………………………………………………. 28

1.2.5.4

SVM biên mềm ……………………………………………………. 30

1.2.5.5


SVM cho phân lớp tuyến tính …………………………………….. 30
3


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

1.3

Kết luận chương ………………………………………………….. 34

Chương 2: Xây dựng chương trình phân loại MRI não ………………………… 35
2.1

Đề xuất tổng quan chương trình ………………………………….. 35

2.2

Xây dựng các thuật toán ………………………………………….. 36

2.2.1

Các thuật toán giảm đặc trưng ……………………………………. 36

2.2.2

Trích xuất đặc trưng sử dụng ma trận đồng mức xám ( GLCM) …. 43

2.2.3

Phâm lớp sử dụng SVM …………………………………………... 44


2.3

Kết luận chương …………………………………………………... 44

Chương 3: Thực nghiệm và đánh giá kết quả ……………………………………. 45
3.1

Giới thiệu chương …………………………………………………. 45

3.2

Giao diện chương trình ……………………………………………. 45

3.3

Kết quả thực nghiệm ………………………………………………. 46

3.3.1

Cơ sở dữ liệu kiểm tra …………………………………………….. 46

3.3.2

Kết quả thực nghiệm với mẫu u lành tính ………………………… 47

3.3.3

Kết quả thực nghiệm với mẫu u ác tính …………………………... 49


3.4

Mô hình đánh giá …………………………………………………. 50

3.5

Phân tích thời gian thực hiện ……………………………………... 52

3.6

Kết luận chương …………………………………………………... 53

Kết luận và hướng phát triển đề tài ………………………………………………. 54
Tài liệu tham khảo …………………………………………………………………. 55
Phụ lục ……………………………………………………………………………… 57

4


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

DANH MỤC HÌNH ẢNH
Hình 1.1

Biến đổi wavelet rời rạc của tín hiệu …………………………………. 16

Hình 1.2

Quá trình phân tích biến đổi tín hiệu dung DWT một chiều …………. 17


Hình 1.3

Minh họa DWT hai chiều cho ảnh …………………………………… 18

Hình 1.4

Phân tích tín hiệu đa mức …………………………………………….. 19

Hình 1.5

Minh họa DWT kiểu dynamic mức 3 ………………………………… 19

Hình 1.6

Ảnh DWT của MRI não ………………………………………………. 20

Hình 1.7

Minh họa PCA: phép chiếu lên các trục tọa độ khác nhau có thể cho cùng
cách nhìn rất khác nhau về cùng một dữ liệu …………………………. 22

Hình 1.8

Minh họa PCA: tìm các trục tọa độ mới sao cho dữ liệu có độ biến thiên..
cao nhất ……………………………………………………………….. 22

Hình 1.9

Phân chia biên rộng …………………………………………………… 27


Hình 1.10

Ảnh hưởng của hằng số biên mềm C trên ranh giới quyết định ……… 29

Hình 1.11

SVM cho phân lớp phi tuyến …………………………………………. 31

Hình 1.12

Ảnh hưởng đa chiều Gaussian kernel cho một giá trị cố định đối với …33
các hằng số biên mềm ……………………………………………………

Hình 2.1

Sơ đồ chung của hệ thống xử lý và phân loại ảnh …………………….. 35

Hình 2.2

Ảnh MRI sau khi biến đổi DWT ba mức ……………………………... 37

Hình 2.3

Tập cơ sở dữ liệu hình ảnh MRI não ………………………………….. 38

Hình 3.1

Giao diện chương trình ………………………………………………... 45

Hình 3.2


Các mẫu ảnh bệnh MRI não …………………………………………... 47

Hình 3.3

Kết quả thực nghiệm với u lành tính ……………………………..…… 47

Hình 3.4

Kết quả thực nghiệm với u lành tính khác ……………………………. 48

Hình 3.5

Kết quả thực nghiệm đo tỉ lệ % chính xác của 2 Kernel ……………… 49
5


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

Hình 3.6

Kết quả thực nghiệm với u ác tính …………………………………….. 50

Hình 3.7

Mô hình hold-old để tiến hành đánh giá ………………………………..51

Hình 3.8

Kết quả đánh giá của 2 Kernel Linear và GRB ……………………….. 51


Hình 3.9

Tính toán thời gian của 3 giai đoạn chính …………………………….. 52

6


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

CÁC TỪ VIẾT TẮT
G
GUI

Graphic User Interface

GLCM

Gray-Level Co-Occurrence Matrix

DWT

Discrete Wavelet Transform

PCA

Principal Component Analysis

MRI


Magnetic resonance imaging

SVM

Support Vector Machine

O

P

M

S

7


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

LỜI MỞ ĐẦU
1. Lý do chọn đề tài
Ngày nay, trong dòng chảy của cuộc sống hối hả dường như con người không thể
kiểm soát được những loại thực phẩm mà mình ăn phải, những thực phẩm có hại cho
sức khỏe, những thực phẩm bẩn, đồ ăn nhanh đang ngày càng gia tăng. Điều này đã
gây phát sinh nhiều căn bệnh cho con người, vì vậy mục đích của y tế là thiết kế một
hệ thống nhằm chẩn đoán bệnh một cách nhanh và chính xác. Vì vậy một trong những
kĩ thuật phổ biến nhất được sử dụng trong lĩnh vực y tế là kĩ thuật “Xử Lý Ảnh“ , kĩ
thuật này có thể sử dụng nhiều phương pháp khác nhau nhằm cải thiện hiệu suất và độ
chính xác của hệ thống. Một trong những bệnh nguy hiểm nhất trên thế giới hiện nay là
bệnh u não. Nó xảy ra do sự phát triển bất thường của các tế bào trong não. Những

khối u não có nhiều hình dạng và kích cỡ. Các khối u não có thể lành tính hoặc ác tính.
Các nguồn chính để có được hình ảnh y tế là ảnh X-quang và ảnh MRI. MRI là tốt nhất
được biết đến với đặc điểm của nó như sự khác biệt vượt trội các mô mềm, độ phân
giải không gian cao và độ tương phản. Nó không sử dụng bức xạ ion hóa có hại cho
bệnh nhân, các khối u lành tính có cấu trúc đồng nhất và không chứa các tế bào ung
thư. Khối u ác tính là có thể có một cấu trúc không đồng nhất và có chứa tế bào ung
thư. Những tế bào này có thể được điều trị bằng các kỹ thuật như xạ trị, hóa trị liệu
hoặc một sự kết hợp và họ là đe dọa tính mạng, lĩnh vực y tế có thể vượt trội hơn bằng
cách sử dụng công nghệ chẩn đoán tự động và hiệu quả trong một thời gian ngắn. Với
vai trò và ý nghĩa to lớn mà việc phân loại ảnh u não mang lại, chúng em chọn đề tài
“Phân loại ảnh MRI u não” để phần nào hiểu được nguyên lý, ý nghĩa và có thể áp
dụng được đề tài vào thực tế.
2. Phương pháp nghiên cứu đồ án
Tìm hiểu lý thuyết:

8


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

 Tìm hiểu phần mềm và các Toolbox trong Matlab R2013a.
 Tìm hiểu về lý` thuyết ảnh MRI
 Tìm hiểu về các kỹ thuật xử lý ảnh.
 Tìm hiểu các phương pháp học máy.
 Tìm hiểu cơ sở dữ liệu.
3. Nội dung đồ án
Đồ án gồm 3 chương:
Chương 1: Tổng quan, cơ sở lý thuyết và các thuật toán về xử lý ảnh
1) Giới thiệu về ảnh MRI và phân loại ảnh não .
2) Giới thiệu về các thuật toán liên quan đến xử lý ảnh

a. Nhị phân ảnh và thuật toán phân ngưỡng Otsu
b. Thuật toán biến đổi wavelet rời rạc (DWT)
c. Thuận toán phân tích thành phần chính (PCA)
d. Ma trận đồng hiện mức xám (GLCM )
e. Vector máy hỗ trợ (SVM)
f. Kết luận chương
Chương 2 : Xây dựng chương trình phân loại ảnh MRI não
1) Đề xuất sơ đồ tổng quan chương trình
2) Xây dựng các thuật toán
a. Các thuật toán giảm đặc trưng
b. Trích xuất đặc trưng sử dụng ma trận đồng mức xám ( GLCM)
c. Phân lớp ảnh sử dụng thuật toán SVM
3) Kết luận chương
Chương 3: Thực nghiệm và đánh giá kết quả.
Để hỗ trợ cho việc mô phỏng quá trình nhận dạng, chúng em sử dụng matlab làm
chương trình hỗ trợ chính vì sự tiện ích và hữu dụng của nó trong quá trình xử lý và

9


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

phân loại ảnh. Từ kết quả mô phỏng, ta có thể nhận ra ưu, nhược của các thuật toán xử
lý nhiễu, phân đoạn và phân loại ảnh.

4. Kết quả đồ án
Trong đồ án này, nhóm em đã đạt được những kết quả sau:
 Xây dựng hệ thống phân loại u não để nhận biết ụ nào là ác tính hoặc lành tính
 Xử lý các ảnh MRI đầu vào khác nhau gồm 2 loại : ảnh não có u ác tính và ảnh
não có u lành tính.


10


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

Em xin gửi lời cảm ơn đến cô Nguyễn Thị Anh Thư đã cung cấp tài liệu, hướng
dẫn em giải quyết những khó khăn gặp phải trong nội dung của đồ án.Trong thời gian
thực hiện đồ án, với những kiến thức hạn hẹp nên không tránh khỏi thiếu sót. Kính
mong các Thầy, Cô chỉ bảo và góp ý thêm để đồ án được hoàn thiện hơn.

Nhóm sinh viên thực hiện:
 Nguyễn Văn Duy Vũ
 Phạm Đức Thiện

11


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

CHƯƠNG 1: TỔNG QUAN CƠ SỞ LÝ THUYẾT VÀ CÁC
THUẬT TOÁN VỀ XỬ LÝ MRI NÃO
1.1 Giới thiệu về ảnh MRI và phân loại ảnh não
Chụp cộng hưởng từ (MRI) là một kỹ thuật cho ra những hình ảnh với chất lượng
ảnh cao của cấu trúc giải phẫu cơ thể người [1], đặc biệt là trong não,và cung cấp thông
tin hữu ích cho chẩn đoán lâm sàng và nghiên cứu y sinh học. Các giá trị chẩn đoán của
MRI được đánh giá rất cao về phân loại tự động và chính xác
Biến đổi wavelet là một công cụ hữu ích cho việc trích xuất các đặc trưng của
ảnh MRI não, bởi vì nó cho phép phân tích các hình ảnh ở nhiều cấp độ phân giải khác
nhau bằng phương pháp đa phân giải. Tuy nhiên, kỹ thuật này đòi hỏi lượng lưu trữ lớn

và tốn nhiều chi phí . Để giảm chiều vector và tăng khả năng phân biệt, phân tích thành
phần chính (PCA) đã được sử dụng. PCA[5] được dùng vì nó là một công cụ hữu ích
để giảm chiều không cần thiết của dữ liệu làm cho việc tính toán trở nên dễ dàng hơn
rất nhiều. Trong những năm gần đây, các nhà nghiên cứu đã đề xuất rất nhiều cách tiếp
cận để phân loại ảnh chính là phương pháp học máy, mà rơi vào hai loại. Một loại được
gọi là học máy có giảm sát, bao gồm cả máy vector hỗ trợ (SVM)[17] và K- hàng xóm
gần nhất (k-NN) . Còn loại khác chính là học máy không giám sát thì ta có các kĩ thuật
như SOFM và fuzzy c-mean. Trong khi tất cả các phương pháp này đều đạt được kết
quả tốt, những phân loại có giám sát thực hiện tốt hơn so với phân loại không có giảm
sát về độ chính xác phân loại. Tuy nhiên, độ chính xác phân loại của hầu hết các
phương pháp hiện có thấp hơn 95%, vì vậy mục tiêu của bài viết này là để tìm một
phương pháp có độ tin cậy và chính xác cao hơn.Trong số các phương pháp học máy,
phương pháp SVM là phương pháp học máy có giảm sát. So với các phương pháp
khác như mạng neural, cây quyết định, và mạng Bayes, SVM có lợi thế đáng kể độ
chính xác cao, dễ kiểm soát việc tính toán, và trực tiếp giải hình học. Bên cạnh đó, nó
không cần một số lượng lớn các mẫu huấn luyện để tránh vừa quá dữ liệu
Chụp cộng hưởng từ (MRI) não là kỹ thuật chẩn đoán hình ảnh an toàn và không
gây đau nhờ sử dụng từ trường và sóng radio để tạo ra hình ảnh chi tiết của não và thân
não. Chụp cộng hưởng từ khác với chụp CT (CAT scan,chụp cắt lớp điện toán) ở chỗ
nó không sử dụng bức xạ.Máy bao gồm một nam châm hình bánh rán lớn với một
đường hầm ở trung tâm.. Bệnh nhân được đặt trên bàn có thể trượt vào trong đường
hầm. Một số trung tâm có các máy cộng hưởng từ mở (open MRI) có khoảng hở lớn
hơn để giảm bớt lo lắng cho những bệnh nhân sợ khoang kín (claustrophobia). Trong

12


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

lúc chụp, sóng radio đập vào các vị trí từ của các nguyên tử trong cơ thể, các tín hiệu

được thu nhận bởi một ăng-ten mạnh và gửi đến một máy tính. Máy tính thực hiện
hàng triệu phép tính, cho kết quả rõ ràng hình ảnh đen và trắng các mặt cắt ngang của
cơ thể. Những hình ảnh này có thể được chuyển đổi thành hình ảnh ba chiều (3-D) của
vùng được khảo sát. Điều này giúp xác định các trục trặc và bất thường trong não và
thân não khi khảo sát tập trung vào những vùng này.
 Tại sao phải chụp cộng hưởng từ (MRI) não?
MRI có thể phát hiện một loạt các tình trạng bệnh lý của não như nang, khối u, xuất
huyết, phù nề, các bất thường về cấu trúc hoặc trong quá trình phát triển, các bệnh
nhiễm trùng, tình trạng viêm, hoặc các vấn đề về mạch máu. Nó có thể xác định thông
động tĩnh mạch (shunt) và phát hiện tổn thương não do chấn thương hay đột quỵ.
MRI não có thể hữu ích trong việc đánh giá các vấn đề khác như đau đầu dai dẳng,
chóng mặt, yếu hoặc liệt cơ, suy giảm thị lực (nhìn mờ) hoặc động kinh, và nó có thể
giúp phát hiện các bệnh mãn tính của hệ thần kinh, chẳng hạn như bệnh xơ cứng rải rác
hay đa xơ cứng (Multiple Sclerosis). Trong một số trường hợp, chụp cộng hưởng từ có
thể cung cấp hình ảnh rõ ràng của các thành phần nhu mô não mà không thể thấy rõ
trên phim X-quang, CT scan hoặc siêu âm, điều này làm cho chụp cộng hưởng từ có
giá trị đặc biệt trong việc chẩn đoán các bệnh lý ở tuyến yên và thân não.
 Lợi ích của máy cộng hưởng từ là gì?
o Giá thành còn cao
o Bệnh nhân không bị ảnh hưởng bởi tia xạ.
o Bệnh nhân không bị ảnh hưởng gì về mặt sinh học.
o Thu được hình chụp đa mặt phẳng: Mặt phẳng trán, mặt phẳng ngang,
mặt phẳng dọc hay bất kỳ mặt phẳng nghiêng nào
o Độ phân giải mô mềm cao.
o Hiển thị hình ảnh tốt hơn khi so với CT.
o Chụp được mạch máu não (MRA), kể cả khi không dùng chất tương
phản.
o Là kỹ thuật hình ảnh không xâm lấn.
 Bất lợi của máy cộng hưởng từ là gì?


13


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

o Giá thành còn cao
o Không dùng được nếu bệnh nhân bị chứng sợ nơi chật hẹp hay đóng kín,
hội chứng sợ lồng kính (Claustrophobia)
o Thời gian chụp lâu: Gặp khó khăn nếu bệnh nhân nặng hay không hợp
tác
o Vỏ xương và tổn thương có calci khảo sát không tốt bằng XQ, CT
o Không thể chụp bệnh nhân với máy tạo nhịp tim, các clip phẫu thuật, mô
cấy ở mắt hay tai.
o Không thể mang theo thiết bị hồi sức vào phòng chụp.

1.2

Giới thiệu về các thuật toán liên quan đến xử lý ảnh

1.2.1 Thuật toán nhị phân và phân ngưỡng Otsu
1.2.1.1 Nhị phân ảnh: Ảnh nhận được từ các thiết bị thu nhận hình ảnh như máy ảnh,
camera thường là ảnh màu hay ảnh đa mức xám. Lúc này, các thành phần trong ảnh
khá phức tạp ( màu sắc, kết cấu, vv…vv ). Do đó, muốn làm nổi bật các đặc trưng
trong ảnh thì phải chuyển ảnh về dạng nhị phân (ảnh chỉ có hai màu đen và trắng)
tương ứng với đối tượng và nền ảnh. Nhị phân (hay còn gọi là phân ngưỡng) là thao tác
chuyển từ ảnh đa mức xám (hoặc ảnh màu) về dạng ảnh nhị phân
INPUT: Ảnh đa mức xám hoặc ảnh màu
OUTPUT: Ngưỡng nhị phân cho toàn bộ ảnh
- Xác định ngưỡng T
- Chuyển ảnh về dạng nhị phân


1.2.1.2 Thuật toán phân ngưỡng Otsu
Thuật toán phân ngưỡng OTSU mang tên của một nhà nghiên cứu người Nhật.
Ông Nobuyuki Otsu đã nghĩ ra ý tưởng cho việc phân ngưỡng hình ảnh một cách tự
động (adaptive) dựa vào giá trị của điểm ảnh đầu vào nhằm thay thế cho việc sử dụng
ngưỡng cố định (fixed hay const). Phân ngưỡng được thực hiện dựa trên hình dáng của
lược đồ mức xám hoặc giảm mức xám của ảnh thành ảnh nhị phân. Thuật toán Otsu
xác định ngưỡng cho toàn bộ hình ảnh bằng cách tìm một ngưỡng để phân chia các
14


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

điểm ảnh vào hai lớp là lớp đối tượng và lớp nền. Giá trị ngưỡng được xác định bằng
cách cho “khoãng cách” giữa các điểm trong mỗi lớp là nhỏ nhất, điều này tương
đương với khoãng cách giữa hai lớp là lớn nhất.Khi thống kê các mức xám có trong
ảnh ban đầu dựa trên hàm mật độ được cho bởi công thức:
p r rq  

nq
n

Trong đó:

q  0,1,2,..., L - 1

n - tổng số pixel trên ảnh;
nq - tổng số pixel có mức độ xám rq;
L - tổng số ngưỡng độ xám trên ảnh;


Chúng ta nhận được một đồ thị biểu diễn mức xám có hai đỉnh, một đỉnh biểu
diễn cho những vùng được xem là đối tượng và một đỉnh biểu diễn cho những vùng
được xem là nền ảnh. Theo Otsu, ngưỡng T tốt nhất được chọn là giá trị mà tại đó nó
làm sự chênh lệch giữa hai đoạn trên đồ thị đạt cực đại. Giá trị cực đại được định nghĩa
như sau:
Giả sử có ngưỡng T được chọn sao cho C0 là tập hợp các pixel có ngưỡng từ
[0,1,…,k-1] và C1 là tập hợp các pixel có ngưỡng từ [k,k+1,…,L-1]. Phương pháp Otsu
lựa chọn ngưỡng T sao cho độ lệch chuẩn  2B giữa các lớp là lớn nhất. Độ lệch chuẩn
 2B được xác định theo công thức:

 B2  0  0  T 2  1 1  T 2 ,

Trong đó:
k 1

L 1

q 0

q k

 0   p q rq  1   p q rq ;
k 1

 0   qp q rq / 0
q 0

L 1

L 1


q k

q 0

1   qp q rq / 1 ;  T   qp q rq 

15


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

1.2.2 Biến đổi wavelet rời rạc
Việc tính toán các hệ số wavelet tại tất cả các tỉ lệ là một công việc hết sức phức
tạp, sẽ tạo ra một lượng dữ liệu khổng lồ. Để đơn giản người ta chỉ chọn ra một tập nhỏ
các giá trị tỉ lệ và các vị trí để tiến hành tính toán, cụ thể lựa chọn tiến hành tại các tỷ lệ
và các vị trí trên cơ sở luỹ thừa cơ số 2 thì kết quả thu được sẽ hiệu quả và chính xác
hơn rất nhiều. Quá trình chọn các tỷ lệ và các vị trí để tính toán như trên tạo thành lưới
nhị tố (dyamic). Một quá trình phân tích như thế hoàn toàn có thể thực hiện được nhờ
biến đổi wavelet rời rạc (discrere wavelet transform/ DWT).
1.2.2.1 Phân tích wavelet, các xấp xỉ và chi tiết
Với nhiều tín hiệu, nội dung tần số thấp là quan trọng nhất, nó xác định tín hiệu.
Nội dung tần số cao chỉ làm tăng thêm hương vị. Ví dụ như giọng nói người, nếu tách
bỏ phần cao tần, giọng có khác nhưng vẫn có thể hiểu được nội dung. Tuy nhiên nếu
loại bỏ tần số thấp đến một mức nào đó, sẽ không nghe rõ nữa. Còn đối với ảnh ta quan
tâm đến hai thuật ngữ là xấp xỉ là thành phần tỉ lệ cao tương ứng thành phần tần số
thấp của ảnh và chi tiết tương ứng thành phần tần số cao của ảnh, tỉ lệ thấp. Với phân
tích wavelet ta thu được hai thành phần tương ứng trên, cụ thể việc thực hiện như sau:

Hình 1.1: Biến đổi wavelet rời rạc của tín hiệu


16


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

Do đó, việc tính toán biến đổi DWT thực chất là sự rời rạc hoá biến đổi
Wavelet liên tục (CWT); việc rời rạc hoá được thực hiện với sự lựa chọn các hệ số a
và b như sau:
a=2 m,

b=2 mn

m, n

Có thể hiểu phép biến đổi Wavelet rời rạc – DWT như là áp dụng một tập
các bộ lọc thông cao và thôngthấp. Hình 1.1 minh hoạ dạng tổng quát của biến đổi
DWT một chiều. Theo đó tín hiệu nguyên gốc được cho đi qua các bộ lọc thông cao
H (highpass) và thông thấp L (lowpass) rồi được lấy mẫu xuống hệ số 2 tạo thành
biến đổi DWT mức1.

Hình 1.2: Quá trình phân tích tín hiệu dùng biến đổi DWT một chiều

Từ biến đổi DWT một chiều có thể mở rộng định nghĩa biến đổi hai chiều
theo cách: sử dụng các bộ lọc riêng biệt, thực hiện biến đổi DWT một chiều đối với
dữ liệu vào (ảnh) theo hàng rồi kế tiếp thực hiện theo cột.
Sau khi thực hiện biến đổi DWT lần lượt như vậy ta sẽ tạo ra 4 nhóm hệ số
biến đổi. Quá trình biến đổi DWT hai chiều có thể minh hoạ như hình 1.4, trong đó 4
nhóm hệ số là: LL, HL, LH, HH (chữ cái đầu tiên tương ứng là thực hiện lọc theo
hàng, chữ cái thứ hai tương ứng thực hiện lọc theo cột).

17


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

ẢNH

DWT

Theo hàng

L

H

LL

HL

LH

HH

DWT

Theo cột

Hình 1.3: Minh hoạ DWT hai chiều cho ảnh
1.2.2.2 Phân tích đa phân giải
Vào năm 1986, Stephane Mallat và Yves Meyer lần đầu tiên đặt ra ý tưởng

phân tích đa phân giải (MRA : multire solution analysis) [13,25,38], vào phạm vi
phân tích wavelets. Đây là một ý tưởng mới và đáng chú ý nhằm giải quyết hình
thức tổng quát trong việc xây dựng cơ sở trực giao của wavelets. Hơn nữa phân tích
đa phân giải là trung tâm của tất cả các phép xây dựng nên hàm cơ sở wavelets.
Khi nhìn bức ảnh, một cách tổng quát chúng ta thấy sự liên kết của những vùng
tương quan cấu trúc và mức độ xám mà kết hợp thành hình dạng đối tượng. Nếu đối
tượng nhỏ hoặc sự tương phản thấp thì thông thường chúng ta khảo sát chúng ở độ
phân giải cao. Nếu đối tượng có kích thước lớn hoặc có độ tương phản cao thì
chúng ta khảo sát chúng dưới tầm quan sát thô. Nếu cả đối tượng có kích thước vừa
và nhỏ - hoặc có độ tương phản cao và thấp, được biểu diễn cùng lúc thì ta phải khảo
sát chúng ở vài độ phân giải khác nhau. Quá trình phân tích DWT được lặp lại, các
xấp xỉ hoàn toàn được tách ra, do đó một tín hiệu được phân tích thành nhiều thành
phần phân giải khác nhau, tiến trình được thực hiện theo hình 1.4 như sau:

18


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

Hình 1.4: Phân tích tín hiệu đa mức
Về lý thuyết quá trình phân tích đa mức có thể lặp lại mãi mãi nhưng trong
thực tế, sự phân tích có thể chỉ thực hiện cho đến khi có được tín hiệu chi tiết phù
hợp với chất lượng của tín hiệu cần phân tích (tùy thuộc vào từng ứng dụng cụ thể).
Hình 1.5 mô tả phân tích 3 mức của tín hiệu hình ảnh.

Hình 1.5 : Minh hoạ DWT kiểu dyadic mức 3

19



ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

Thì đối với Đồ án này em tiến hành biến đổi 3 mức. Sau khi ta dùng biến đổi wavelet
rời rạc phân hủy 3 thì làm giảm đáng kể kích thước hình ảnh não đầu vào. Kích thước
của ảnh từ 256x 256 chỉ còn 32 x 32 = 1024.

Hình 1.6: Ảnh DWT của MRI não mức 3

1.2.2.3 Một số ứng dụng nổi bật của Wavelet
 Nén tín hiệu
Do đặc điểm của mình, wavelet đặc biệt tốt khi sử dụng để nén hay phân tích
các tín hiệu không dừng, đặc biệt là tín hiệu ảnh số và các ứng dụng nén tiếng
nói, nén dữ liệu. Việc sử dụng các phép mã hoá băng con, băng lọc số nhiều
nhịp và biến đổi Wavelet rời rạc tương ứng với loại tín hiệu cần phân tích có thể
mang lại những hiệu quả rất rõ rệt trong nén tín hiệu. Do tính chất chỉ tồn tại
trong các khoảng thời gian rất ngắn (khi phân tích tín hiệu trong miền thời gian
tần số) mà các hệ số của biến đổi Wavelet có khả năng tập trung năng lượng rất
tốt vào các hệ số biến đổi. Các hệ số mang thông tin chi tiết của biến đổi
Wavelet thường rất nhỏ và có thể bỏ qua mà không ảnh hưởng tới việc mã hoá
dữ liệu (trong phương pháp mã hoá ảnh hay tiếng nói là những tín hiệu cho
phép mã hoá có tổn thất thông tin).

20


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

 Khử nhiễu
Tính chất của biến đổi Wavelet mà chúng ta đã xét tới trong phần ứng dụng
cho nén tín hiệu được mở rộng bởi Iain Johnstone và David Donohos trong các

ứng dụng khử nhiễu cho tín hiệu. Phương pháp khử nhiễu này được gọi là
Wavelet Shrinkage Denoising (WSD). Ý tưởng cơ bản của WSD dựa trên việc
tín hiệu nhiễu sẽ lộ rõ khi phân tích bằng biến đổi Wavelet ở các hệ số biến đổi
bậc cao. Việc áp dụng các ngưỡng loại bỏ tương ứng với các bậc cao hơn của
hệ số Wavelet sẽ có thể dễ dàng loại bỏ nhiễu trong tín hiệu.
 Mã hoá nguồn và mã hoá kênh
Sở dĩ Wavelet được ứng dụng trong mã hoá nguồn và mã hoá kênh vì trong mã
hoá nguồn thì chúng ta cần khả năng nén với tỷ lệ nén cao còn trong mã hoá
kênh thì cần khả năng chống nhiễu tốt. Biến đổi Wavelet kết hợp với một số
phương pháp mã hoá như mã hoá Huffman hay mã hoá số học có thể thực hiện
được cả hai điều trên. Vì thế sự sử dụng biến đổi Wav elet trong mã hoá nguồn
và mã hoá kênh là rất thích hợp.

1.2.3 Thuật Toán PCA
Mục tiêu của PCA là tìm một không gian mới (với số chiều nhỏ hơn không gian
cũ). Các trục tọa độ trong không gian mới được xây dựng sao cho trên mỗi trục, độ
biến thiên của dữ liệu trên đó là lớn nhất có thể.

21


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

Hình 1.7: Minh họa PCA:phép chiếu lên các trục tọa độ khác nhau có thể
cho cùng cách nhìn rất khác nhau về cùng một dữ liệu.
Một ví dụ kinh điển là hình ảnh về con lạc đà. Cùng là một con lạc đà nhưng nếu
nhìn từ bên hông thì ta có được đầy đủ thông tin nhất, trong khi nhìn từ phía trước thì
thật khó để nói nó là lạc đà.Một ví dụ thuyết phục hơn được minh họa trong hình sau:

Hình 1.8 Minh họa PCA Tìm các trục tọa độ mới sao cho dữ liệu có độ biến thiên cao

nhất.
Giả sử tập dữ liệu ban đầu (tập điểm màu xanh) được quan sát trong không gian
3 chiều (trục màu đen) như hình bên trái. Rõ ràng 3 trục này không biểu diễn được tốt
nhất mức độ biến thiên của dữ liệu. Do đó, PCA sẽ tìm hệ trục tọa độ mới (là hệ trục
màu đỏ trong hình bên trái). Sau khi tìm được không gian mới, dữ liệu sẽ được chuyển

22


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

sang không gian này để được biểu diễn như trong hình bên phải. Rõ ràng hình bên phải
chỉ cần 2 trục tọa độ nhưng biểu diễn tốt hơn độ biến thiên của dữ liệu so với hệ trục 3
chiều ban đầu. Một điểm rất tốt nữa của PCA là các trục tọa độ trong không gian mới
luôn đảm bảo trực giao đôi một với nhau, mặc dù trong không gian ban đầu, các trục có
thể không trực giao.
𝑥=

𝑎1
(𝑎….2 )
𝑎𝑛

→ 𝑔𝑖ả𝑚𝑐ℎ𝑖ề𝑢 → 𝑦 =

𝑏1
(𝑏….2 ) 𝑣ớ𝑖𝑘
𝑏𝑛

≪𝑛


Giả sử ta cần giảm số chiều của tập mẫu huấn luyện n chiều x xuống còn k chiều
y với k<→ 𝑥 = 𝑎1 𝑣1 + 𝑎2 𝑣2 + ⋯ + 𝑎𝑛 𝑣𝑛
(Với 𝑣1 , 𝑣2 , . . . , 𝑣𝑛 là cơ sở trong không gian n chiều)
→ 𝑦 = 𝑏1 𝑢1 + 𝑏2 𝑢2 + ⋯ + 𝑏𝑘 𝑢𝑘
(Với𝑢1 , 𝑢2 , . . . , 𝑢𝑘 là cơ sở trong không gian k chiều)
Nghĩa là ta cần tìm một ánh xạ từ không gian n chiều xuống không gian nhỏ hơn
chỉ có k chiều (k<y = T*x với T là ma trận k x n.
Nhận xét về phương pháp PCA
 Ưu điểm:
- Tìm được các đặc tính tiêu biểu cho một động tác mà không cần phải xác định
các thành phần và mối liên hệ giữa chúng trên động tác đó.
- Đối với các ảnh đầu vào có độ phân giải cao, thuật toán vẫn thực hiện tốt do
ảnh đầu vào được PCA thu gọn thành một ảnh mới có kích thước rất nhỏ.
- Khối lượng tính toán không nhiều.
- PCA có thể kết hợp với các phương pháp khác (như mạng nơ-ron…) để mang
lại hiệu quả nhận dạng cao hơn.
23


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

- PCA làm giảm đáng kể lượng thông tin thừa của dữ liệu.
 Nhược điểm:
- PCA phân loại theo chiều phân bố lớn nhất của tập vector. Tuy nhiên, không
phải bao giờ chiều phân bố lớn nhất đều mang lại hiệu quả cao nhất cho nhận
dạng.
- PCA rất nhạy với nhiễu.
1.2.4 Ma trận đồng hiện mức xám (GLCM)

Ma trận đồng hiện mức xám Co-Ocurrence (GLCM) của ảnh f(x,y) có kích
thước M×M và có G mức độ xám là một ma trận hai chiều C(i,j). Mỗi phần tử của ma
trận thể hiện xác suất xảy ra cùng giá trị cường độ sáng i và j tại một khoảng cách d
và một góc xác định. Do đó, có thể có nhiều ma trận GLCM khác nhau phụ thuộc
vào cặp giá trị d và . GLCM được tính toán như sau [4]:

Haralick đã đề nghị một tập hợp gồm 14 đặc trưng có thể tính toán được từ ma
trận đồng hiện mức xám GLCM có thể được sử dụng để phân lớp kết cấu hình ảnh.
Một số tính năng quan trọng có thể kể đến như năng lượng (energy), độ tương phản
(contrast), entropy, độ tương đồng (correlation), tính đồng nhất (homogeneity).
 Đặc trưng năng lượng: Đặc trưng năng lượng F1 được tính toán như sau:

Công thức này đo lường tính đồng nhất cục bộ trong ảnh. Giá trị của công thức F 1
là cao khi ảnh có tính đồng đều về giá trị mức độ xám và nó sẽ có giá trị thấp nếu ảnh

24


ĐỒ ÁN TỐT NGHIỆP – CHUYÊN NGÀNH KĨ THUẬT MÁY TÍNH

không đồng đều về mức độ xám. Giá trị của F1 nằm trong khoảng từ 0 đến 1. Nếu F1 =
1 thì ảnh có giá trị mức xám đều.
 Độ tương phản: Độ tương phản F2 được tính như sau:

Công thức này cho chúng ta biết được số lượng điểm ảnh có mức độ xám biến đổi
cục bộ trong ảnh.Vì vậy, giá trị của F2 cao thường tập trung dọc theo đường chéo của
ma trận GLCM. Đối với ảnh có giá trị mức xám đều thì giá trị độ tương phản là bằng 0,
đây là giá trị tối thiểu của độ tương phản. Nếu ảnh không có sự đồng đều về giá trị mức
xám càng nhiều thì giá trị độ tương phản càng tăng. Giá trị F2 nằm trong khoảng [0
(size(GLCM,1)-1)2] có giá trị cao tương đối khi những giá trị cao của ma trận gần với

đường chéo chính
 Độ tương đồng: độ tương quan đo tương quan giữa các phần tử của ma trận, khi
giá trị này cao thì ảnh phức tạp hơn

Trong đó, i, j và i, jlần lượt là giá trị trung bình và độ lệch chuẩn của tổng hàng và
cột trong ma trận. i, j và i, j được tính như sau:
Tham số này phân tích sự phụ thuộc tuyến tính mức độ xám của các điểm ảnh lân cận
nhau. Công thức F3 là một thước đo tuyến tính sự phụ thuộc tông màu xám trong ảnh.
Giá trị của F3 nằm trong khoảng từ -1 đến 1.
 Entropy: Entropy F4 được tính toán như sau:

25


×