Tải bản đầy đủ (.pdf) (63 trang)

Trích xuất đặc trưng não người dựa trên biến đổi contourlet

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.64 MB, 63 trang )

1
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN



Trần Anh Tuấn




Đề tài :
TRÍCH XUẤT ĐẶC TRƯNG NÃO NGƯỜI DỰA
TRÊN BIẾN ĐỔI CONTOURLET






LUẬN VĂN THẠC SĨ TOÁN HỌC











Thành Phố Hồ Chí Minh 09-2009
2
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN



TRẦN ANH TUẤN



TÊN ĐỀ TÀI LUẬN VĂN
TRÍCH XUẤT ĐẶC TRƯNG NÃO NGƯỜI DỰA
TRÊN BIẾN ĐỔI CONTOURLET



Chuyên ngành: Đảm Bảo Toán Học Cho Máy Tính và Hệ Thống Tính Toán
Mã số: 60.46.35



LUẬN VĂN THẠC SĨ TOÁN HỌC



NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. Trần Nam Dũng






Thành phố Hồ Chí Minh - 2009
9
LỜI GIỚI THIỆU

Ngày nay việc chuẩn đoán bệnh đóng một vai trò quan trọng trong quá
trình điều trị bệnh cho các bệnh nhân. Việc chuẩn đoán bệnh càng chính xác
bao nhiêu thì quá trình chữa bệnh càng dễ dàng và thuận lợi bấy nhiêu. Có rất
nhiều kỹ thuật chụp ảnh các bộ phận cơ thể nhưng phổ biến nhất vẫn là kỹ
thuật scanning CT. Qua đó các ảnh đầu ra là những ảnh có chất lượng rất cao
và dung lượng cũng tương đối lớn. Tuy nhiên với khoảng 200 CT ảnh trong
mỗi lần chụp và phải chụp nhiều lần để theo dõi bệnh tình thì dữ liệu ảnh chuẩn
đoán sẽ trở nên khá lớn. Một bệnh viện với hàng ngàn bệnh nhân thì vấn đề lưu
trữ chắc chắn sẽ càng trở nên khó khăn hơn nhiều. Do vậy bài toán về trích
xuất các đặc trưng cần thiết để chuẩn đoán bệnh trước khi lưu trữ luôn được
các bệnh viên quan tâm như là một giải pháp hữu hiệu.
Trước yêu cầu thực tế đó và hiện cũng đang là một chương trình hợp tác
khoa học của khoa Toán trường Đại Học Khoa Học Tự Nhiên với bệnh viện
Chonnam Hàn Quốc. Bài toán “Trích xuất đặc trưng não người trong ảnh y
khoa“ là một yêu cầu thực tế của bệnh viện đưa ra cho chúng tôi tìm các giải
pháp thực hiện. Như được biết ảnh não người là ảnh chụp các thông tin về
xương và mạch máu não mà trong đó thông tin về mạch máu não là cực kỳ
quan trọng để chuẩn đoán các bệnh liên quan đến não. Có nhiều phương pháp
để trích đặc trưng mạch máu não như phân ngưỡng ,hay K-mean, nhưng kết
quả thực nghiệm cho thấy các phương pháp này chỉ cho kết quả tương đối.
Bên cạnh việc thực nghiệm các phương pháp cơ bản, chúng tôi tiến
hành áp dụng biến đổi Contourlet trên các ảnh y khoa. Và chúng tôi nhận thấy
với biến đổi Contourlet không chỉ trích xuất được các thông tin mạch máu với

thông tin các biên rõ ràng hơn so với phương pháp phân ngưỡng mà còn qua
đó các thông tin mạch máu được xác định nhiều hơn.
Trong luận văn chúng tôi sẽ tiếp cận cả hai phương pháp trích xuất bằng
K-mean , với biến đổi Contourlet và sau đó là so sánh các kết quả thực nghiệm
về kết quả thu được từ hai phương pháp.
3
MỤC LỤC

Trang phụ bìa
Mục lục
Danh mục các hình vẽ
LỜI GIỚI THIỆU

Chương 1 – TỔNG QUAN 10

1.1. Các vấn đề về ảnh y khoa 10
1.1.1. Tổng quan về lợi ích của ảnh Y Khoa 10
1.1.2. Việc tổ chức lưu trữ ảnh Y Khoa 12
1.1.3. Việc phục hồi ảnh và chuẩn đoán bệnh 14
1.2. Ảnh Y Khoa Não Người 14
1.2.1. Giới thiệu các thành phần của ảnh khoa não người 14
1.2.2. Các bài toán liên quan đến ảnh y khoa não người 15
1.3. Các hướng giải quyết cho bài toán 16

Chương 2 – CƠ SỞ LÝ THUYẾT 17
2.1. Phương pháp Kmeans 17
2.1.1. Giới thiệu 17
2.1.2. Sơ đồ thuật toán 17
2.1.3. Áp dụng 19
2.1.4. Một số ứng dụng và hạn chế của thuật toán K-mean 22

2.2. Biến đổi Contourlet 23
2.2.1. Giới thiệu sơ lược về Contourlet 23
2.2.2. Mô hình xây dựng biến đổi Contourlet 25
2.2.2.1. Các tính chất của biến đổi Contourlet 26
2.2.2.2. Mô hình xây dựng 26
4
2.2.2.3. Laplace Pyramids - Multiscale Decompostion 27
2.2.2.4. Directional Filter Banks - Directional Decomposition 29
2.2.2.5. Multiscale and directional Decomposition ( Contourlet )
2.2.3. Mô hình xây dựng biến đổi Contourlet cải tiến 35
2.2.3.1. Nonsubsampled Pyramids 35
2.2.3.2. Nonsubsampled Directional Filter Banks 37
2.2.3.3. Nonsubsampled Contourlet 38

Chương 3 – XÂY DỰNG THUẬT GIẢI 39
3.1. Tổng quan về các phương pháp áp dụng 39
3.1.1. Phân tích một số thuộc tính ảnh y khoa não người 39
3.1.2.Các bước tiến hành trích xuất đặc trưng não người dựa trên
phương pháp gom nhóm Kmeans 41
3.1.3.Các bước tiến hành trích xuất đặc trưng não người dựa trên biến
đổi Nonsubsampled Contourlet 42
3.2. Thuật toán trích xuất đặc trưng não người dựa trên Kmeans 44
3.2.1. Tiền xử lý 44
3.2.2. Gom nhóm và phân loại vùng 44
3.2.3. Phân loại xương và mạch máu 47
3.2.4. Xuất ảnh kết quả 50
3.3. Thuật toán trích xuất đặc trưng não người dựa trên biến đổi
Nonsubsampled Contourlet 50
3.3.1. Xây dựng cấu trúc dữ liệu lưu trữ bộ ảnh CT não người 50
3.3.2. Xây dựng bộ hệ số trích xuất ảnh dựa trên biến đổi

Nonsubsampled Contourlet 51
3.3.3. Lựa chọn và trích xuất đặc trưng mạch máu dựa trên mối quan hệ
2D và 3D mạch máu 54
3.3.4. Xuất ảnh kết quả 58
Chương 4 – KẾT LUẬN 59
4.1. Kết quả thực nghiệm trích xuất đặc trưng 59
5
4.1.1. Môi trường thực nghiệm 59
4.1.2. Phương pháp Phân ngưỡng 59
4.1.3. Phương pháp Contourlet 59
4.1.4. So sánh và đánh giá kết quả 60
4.2.Hướng Phát Triển 63


TÀI LIỆU THAM KHẢO 64


6
DANH MỤC CÁC HÌNH VẼ TRONG LUẬN VĂN

Hình 1.1 Ảnh chụp CT các bộ phận trong cơ thể người 10
Hình 1.2 Máy CT Scanner 11
Hình 1.3 Chuẩn đoán bệnh dựa theo ảnh chụp CT 11
Hình 1.4 Lớp các ảnh CT chụp vùng đầu của người 12
Hình 1.5 Xây dựng ảnh 3D từ một dãy các ảnh CT chụp 12
Hình 1.6 Mô hình tổ chức lưu và xử lý ảnh y khoa 13
Hình 1.7 Ảnh y khoa chụp não người theo chiều ngang 14
Hình 1.8 Phần thịt , xương và mạch máu trong ảnh CT 15
Hình 1.9 Các dạng phức tạp của mạch máu người 16
Hình 2.1 Thuật toán gom nhóm K-mean 17

Hình 2.2 Sơ đồ thuật toán K-mean 18
Hình 2.3 Bước hội tụ của thuật toán K-mean 19
Hình 2.4 Các bước lặp của thuật toán K-mean (abcdef) 22
Hình 2.5 Sự phân rã hình tháp 24
Hình 2.6 So sánh khả năng lưu trữ thông tin biên của Contourlet với
Wavelet 24
Hình 2.7 Mô hình cấu trúc của phép biến đổi Contourlet 25
Hình 2.8 Vẽ đường cong bằng Wavelet và nằng phương pháp tiếp cận
mới 25
Hình 2.9 Bộ lọc Laplacian Pyramid và bộ lọc Directional Filter Bank 27
Hình 2.10 Ví dụ về phân tích ảnh dùng Laplacian Pyramids 28
Hình 2.11 Ví dụ về tổng hợp ảnh dùng Laplacian Pyramids 29
Hình 2.12 Bộ lọc tổng hợp tín hiệu 29
Hình 2.13 Mặt phẳng chia miền tần số theo các hướng 30
Hình 2.14 Two-channel quincunx filter bank 30
Hình 2.15 Phép toán Shearing ảnh 31
Hình 2.16 Cấu trúc cây của DFB chia ảnh làm các hướng 31
Hình 2.17 Biên ảnh khôi phục trơn hơn so với wavelet 32
Hình 2.18 : Mô hình chia 4 và 8 hướng dùng Contourlet 33
7
Hình 2.19 Cấu trúc phân tích hình cây của Contourlet 33
Hình 2.20 Ví dụ về biến đổi Contourlet 34
Hình 2.21 Bộ lọc nonsubsampled hai kênh 35
Hình 2.22 Nonsubsampled pyramid 36
Hình 2.23 Mặt phẳng miền tần số được phân tích 36
Hình 2.24 Nonsubsampled DFB 37
Hình 2.25 Đáp ứng tần số cỏa hai bộ lọc sau khi đã lấy mẫu lên 37
Hình 2.26 Vi dụ 4 hướng miền tần số 38
Hình 2.27 Nonsubsampled Contourlet 38
Hình 3.1 Cấu trúc xương và mạch máu 39

Hình 3.2 Vùng Nhiễu 40
Hình 3.3 Vùng mạch máu 40
Hình 3.4 Phân ngường mức xám 200 đến 255 41
Hình 3.5 Biến đổi Contourlet thông thường 43
Hình 3.6 Tiền Xử Lý 44
Hình 3.7 Phân biệt các vùng Xương , Thịt , Mạch máu trên ảnh 45
Hình 3.8 Ví dụ về gom nhóm K-mean 46
Hình 3.9 Phân biệt xương và mạch máu trong ảnh CT 47
Hình 3.10 Vì dụ vể công thức tính độ tròn của các vật thể 49
Hình 3.11 Tổng quan thật toán trích xuất dùng K-mean 49
Hình 3.12 Ảnh xuất kết quả 50
Hình 3.13 Tiền xử lý 51
Hình 3.14 Ảnh đầu vào 52
Hình 3.15 Hệ số mức 2 của Contourlet 53
Hình 3.16 Hệ số mức 3 của Contourlet 53
Hình 3.17 Hệ số mức 4 của Contourlet 54
Hình 3.18 Hệ số mức 2 được chọn để trích xuất đặc trưng 55
Hình 3.19 Trích xuất đối tượng nhỏ mức xám cao 56
Hình 3.20 Trích xuất đối tượng lớn mức xám vùng biên cao 56
Hình 3.21 Mô hình Cấu Trúc Dữ Liệu 2D 57
Hình 3.22 Mô hình Cấu Trúc Dữ Liệu 3D 58
8
Hình 3.23 Ảnh trích xuất kết quả 58
Hình 4.1 So sánh kết qủa giữa Ảnh gốc - Ảnh trích xuất bằng Contourlet 60
Hình 4.2
Số liệu trên 20 ảnh so sánh độ lệnh giữa hai phương pháp K-means và
Contourlet
61
Hình 4.3 So sánh độ chính xác dựa trên tiêu chuẩn mạch máu theo đánh giá và số
mạch máu được trích xuất………………………………………………………….63









10
Chương 1 – TỔNG QUAN


1.1 Các vấn đề về ảnh y khoa
1.1.1 Tổng quan về lợi ích của ảnh Y Khoa


Ảnh y khoa là ảnh các dạng ảnh chụp về các bộ phận của con người như
não , tim , xương , phổi v.v giúp cho việc chuẩn đoán bệnh và tìm ra các
phương pháp điều trị bệnh

Hình 1.1 Ảnh chụp CT các bộ phận trong cơ thể người
Kỹ thuật chụp , lưu ảnh và chuẩn đoán bệnh hiện hay đều dưới dạng ảnh
CT (hay còn gọi là Computed Tomography). CT Scan là một quá trình ghi
nhận ảnh của bệnh nhân bằng cách kết hợp x-rays với các chức năng tạo ảnh
nhiều tầng lớp theo chiều ngang và dọc.
Trong CT Scanning , các tia X quang sẽ di chuyển theo quỹ đạo tròn
quanh cơ thể. Nhờ vậy cho ta rất nhiều hướng quan sát khi chuẩn đoán bệnh.
Các thông tin X quang đó sẽ được gửi cho máy tính phân tích dữ liệu và hiển
thị nó dưới dạng ảnh hai chiều. Ngày nay có nhiều kỹ thuật hiện đại hơn được
áp dụng để có thể hiển thị dưới dạng trực quan hơn là ba chiều.

11


Hình 1.2 Máy CT Scanner
Nhờ có các ảnh CT , các bác sĩ có thể chuẩn đoán bệnh, xác định chảy
máu trong , kiểm tra các chấn thương hay các bộ phận bị hủy hoại trong cơ thể.


Hình 1.3 Chuẩn đoán bệnh dựa theo ảnh chụp CT
Với một tập các ảnh thu được từ ảnh chụp CT, có rất nhiều các nhà khoa
học tìm cách mô hình hóa chúng dưới dang 3D sao cho đạt được độ chính xác
tốt nhất để giúp cho việc chuẩn đoán hiệu quả các loại bệnh. Hiện đây còn là
12
vấn đề mở để các nhà khoa học và các bác sĩ làm việc với nhau tìm các giải
pháp
.

Hình 1.4 Lớp các ảnh CT chụp vùng đầu của người

Hình 1.5 Xây dựng ảnh 3D từ một dãy các ảnh CT chụp

1.1.2
Việc tổ chức lưu trữ ảnh Y Khoa
Ngày nay các ảnh CT chụp đều có kích thước lớn trên mỗi bức ảnh.
Trong khi mỗi lần chụp để chuẩn đoán bệnh cần rất nhiều slides ảnh. Như vậy
đối với một bệnh nhân mỗi lần chụp và lưu trữ thông tin để xem xét bệnh mất
hết khoảng vài trăm MB.
13
Con số này nếu đem xem xét trên cả trăm ngàn bệnh nhân và luôn luôn
các bác sĩ phải chụp để chuẩn đoán bệnh và lưu trữ thông tin qua nhiều năm thì

chắc chắn các bệnh viện sẽ gặp phải hai vấn đề chính sau :
1. Làm sao để lưu trữ hết tất cả ảnh cho các bệnh nhân ?
2. Liệu có tốn kém không khi thông tin cần chuẩn đoán bệnh chỉ nằm
trên các đặc trưng có trong ảnh còn các thông tin khác thì không? (Ví dụ :chuẩn
đoán bệnh liên quan đến mạch máu não thì không cần lắm thông tin về xương
sọ v.v )
Ngày nay việc tổ chức lưu ảnh y khoa hầu như vẫn là lưu trữ trên các
máy vi tính riêng có dung lượng nhớ lớn. Từ máy vi tính này nếu Bác sĩ muốn
xem lại bệnh án thì phải in ra hay gửi dữ liệu ảnh đi nếu muốn chuẩn đoán
bệnh từ xa. Với một nguồn dữ liệu ngày càng lớn như vậy của các bệnh nhân rõ
ràng việc cải tiến cách lưu trữ (nén ảnh) không chỉ giúp giảm dung lượng ảnh
mà con giúp cho việc truy vấn ảnh nhanh hơn , chuẩn đoán bệnh chính xác hơn.


Hình 1.6 Mô hình tổ chức lưu và xử lý ảnh y khoa
Như vậy bài toán nén ảnh y khoa dựa theo đặc trưng là một bài toán rất
cấp thiết đối với các bệnh viện ngày nay.

14
1.1.3
Việc phục hồi ảnh và chuẩn đoán bệnh
Việc chuẩn đoán bệnh của các bác sĩ hiện nay hầu hết là nhìn vào các
bức ảnh. Rồi từ đó theo kinh nghiệm họ sẽ tự phân tích , chuẩn đoán bệnh.
Nghĩa là chưa có sự giúp đỡ nào được máy tính tự động làm để hỗ trợ các bác
sĩ. Vì vậy ngoài việc nén ảnh y khoa dựa trên các đặc trưng , bài toán khôi phục
lại ảnh sao cho hiển thị lại đầy đủ các tiêu chuẩn đánh giá bệnh và mô hình hóa
lại các bộ phân cơ thể cũng là một vấn đề cần giải quyết

1.2 Ảnh Y Khoa Não Người
1.2.1

Giới thiệu các thành phần của ảnh y khoa não người.
Ảnh y khoa về não người gồm nhiều lớp chụp cắt lớp từ cuống họng cho
đến đỉnh đầu của một bệnh nhân.



Hình 1.7 Ảnh y khoa chụp não người theo chiều ngang
Các ảnh này có thứ tự và thể hiện được mối liên hệ giữa các mạch máu ,
xương và phần cơ. Phần thịt là phần có màu tương đối xám trong ảnh. Phần
mạch máu và xương cũng như và viền hộp sọ đều có màu trắng. Nhưng bằng
mắt thường ta có thể dễ sàng nhận ra các mạch máu não. Mạch máu não sẽ có
hình tương đối tròn và diện tích miền nhỏ hơn so với xương.

15



Hình 1.8 Phần thịt , xương và mạch máu trong ảnh CT
1.2.2
Các bài toán liên quan của ảnh y khoa não người
Đối với việc chuẩn đoán bệnh liên quan đến não như viêm màng não ,
chảy máu não hay nghẽn mạch máu v.v thì thông tin về các mạch máu (gồm
hình dạng , màu sắc , vị trí ) là rất quan trọng. Các yếu tố khác như cơ và
xương là những yếu tố kém quan trọng hơn.
Do vậy bài toán yêu cầu về trích ra các mạch máu trong một lớp các ảnh
CT , nén chúng lại để lưu trữ cũng như phục hồi dễ dàng là yêu cầu cần thiết.
Nó không những giúp giảm chi phí lưu trữ , truy vấn và chuẩn đoán dễ dàng
mà còn giúp cho việc mô hình hóa đối tương 3D mà nhờ đó các bác sĩ sẽ có cai
nhìn trực quan hơn.
Bài toán sẽ trở nên phức tạp và khó khăn hơn nhiều khi có thêm các yêu

cầu sau : phân biệt và trích các mạch máu lẫn trong xương , các mạch máu kết
hợp với nhau hay nội suy các mạch máu còn thiếu v.v
16


Hình 1.9 Các dạng phức tạp của mạch máu người
1.3 Các hướng giải quyết cho bài toán
Bài toán nén ảnh y khoa dựa trên đặc trưng não người được chia làm các
yêu cầu cụ thể sau : Trích xuất các thông tin về mạch máu não , lựa chọn
phương pháp nén hiệu quả ảnh với các thông tin đặc trưng này , khôi phục lại
ảnh gốc và mô hình hóa mạch máu giúp cho việc chuẩn đoán bệnh
Trong thông tin của các mạch máu thì đường biên của chúng đóng một
vai trò quan trọng trong chuẩn đoán bệnh. Vì vậy chúng tôi áp dụng phép biến
đổi Contourlet để có thể trích xuất các đối tượng mạch máu rõ ràng hơn so
với các thuật toán phân ngưỡng thông thường.
Cũng phép biến đổi Contourlet chúng tôi thực hiện nén các ảnh dựa trên
các đặc trưng vừa trích xuất được. Hiệu xuất nén và phục hồi ảnh bằng
contourlet cũng như wavelet nhưng các thông tin lưu trữ có tính chất đa hướng.
Do vậy khi phục hồi ảnh các đường biên được rõ nét hơn so với biến đổi
wavelet.
Cuối cùng sẽ là những kết quả thực nghiệm để so sánh hiệu quả giữa
trích xuất đặc trưng mạch máu não dựa trên phép biến đổi contourlet với
phương pháp Kmeans, so sánh tỉ lệ nén và phục hồi giữa phép biến đổi wavelet
và contourlet,


17
Chương 2 – CƠ SỞ LÝ THUYẾT

2.1 Phương pháp Kmeans

2.1.1 Giới thiệu
Thuật toán gom nhóm K-mean được phát triển bởi J.MacQueen (1967)
và sau đó là J. A. Hartigan and M. A. Wong khoảng những năm 1975.
Thuật toán Kmeans dùng để phân loại hay nhóm các đối tượng dựa trên
các thuộc tính hay các đặc điểm riêng thành K nhóm các đối tượng.
Việc gom nhóm dựa trên nguyên tắc cực tiểu hóa tổng bình phương
khoảng cách giữa dữ liệu và trọng tâm của các nhóm tương ứng. Do đó mục
đích của việc gom nhóm K-mean chính là phân loại dữ liệu.

Hình 2.1 Thuật toán gom nhóm K-mean
2.1.2 Sơ đồ thuật toán
Thuật toán K-mean là một quá trình lặp cho đến khi nào phân hoạch
được dữ liệu thành K nhóm theo một cấu trúc hoặc sự phân bố nào đó.
18

Hình 2.2 Sơ đồ thuật toán K-mean
Sau đây là đoạn mã giả của thuật toán K-mean.

Bước 1 : Xác định giá trị K sẽ phân chia số nhóm dữ liệu. Trong đó K phải là
một số nguyên dương.
19
Bước 2 : Ban đầu bạn sẽ đặt chia bất kỳ một số điểm dữ liệu nào đó để phân
loại thành K nhóm bất kỳ. Ở bước này bạn có thể nhóm các điểm dữ liệu một
cách ngẫu nhiên hoặc có thể dùng phương pháp sau :
1. Lấy k điểm dữ liệu đầu tiên đặt làm k nhóm
2. Đối với N-k điểm còn lại so sánh để đưa vào k nhóm ban đầu nếu dữ
liệu đó gần trọng tâm nhóm nhất. Rồi sau đó tính lại trọng tâm của k nhóm đã
thu được.
Bước 3 : Lần lượt lấy từng điểm dữ liệu và tính toán khoảng cách của chúng
đến trọng tâm mỗi nhóm. Nếu điểm dữ liệu vừa tính toán mà gần trọng tâm của

một nhóm khác nhất, ta sẽ chuyển điểm dữ liệu này đến nhóm đó và tính toán
lại trọng tâm của các nhóm dữ liệu nhận và mất dữ liệu.
Bước 4 : Lập lại bước 3 cho đến khi nào điều kiện hội tụ đạt được. Nghĩa là khi
bước 3 được lặp lại mà vẫn không có sự thay đổi nhóm của các điểm dữ liệu.



Hình 2.3 Bước hội tụ của thuật toán K-mean
2.1.3 Áp dụng
Cho tám điểm trong mặt phẳng 2D gồm
20
A1(2, 10) A2(2, 5) A3(8, 4) A4(5, 8) A5(7, 5) A6(6, 4) A7(1, 2) A8(4, 9)
Áp dụng thuật toán K-mean để phân chia tám điểm này thành 3 nhóm.

Bước 1 : Chọn K = 3 (nhóm)
Bước 2 : Ta chọn ngẫu nhiên 3 điểm làm 3 nhóm đại diện là A1(2, 10),
A4(5, 8) and A7(1, 2).
Sau đó ta lập một bảng như sau


(2, 10) (5, 8) (1, 2)
Điểm Trọng Tâm 1 Trọng Tâm 2 Trọng Tâm 3 Nhóm
A1

(2, 10)
A2

(2, 5)
A3


(8, 4)
A4

(5, 8)
A5

(7, 5)
A6

(6, 4)
A7

(1, 2)
A8

(4, 9)

Nhìn vào bảng này ta thấy tám điểm được liệt kê thành 8 dòng trong cột
1. Và các trọng tâm của 3 nhóm là ba cột ở dòng 1. Cột cuối cùng sẽ dùng để
phân loại 8 điểm sẽ thuộc nhóm nào trong 3 nhóm.
Áp dụng công thức tính khoảng cách ρ(a, b) = |x2 – x1| + |y2 – y1|. Ta
sẽ tính toán được các ô còn trống trong bảng như sau :
(2, 10) (5, 8) (1, 2)
Điểm Trọng Tâm
1
Trọng Tâm
2
Trọng Tâm 3 Nhóm
A1


(2, 10) 0 5 9 1
A2

(2, 5) 5 6 4 3
A3

(8, 4) 12 7 9 2
21
A4

(5, 8) 5 0 10 2
A5

(7, 5) 10 5 9 2
A6

(6, 4) 10 5 7 2
A7

(1, 2) 9 10 0 3
A8

(4, 9) 3 2 10 2
Ta sẽ có 3 nhóm ban đầu được phân hoạch như sau :
Nhóm 1 Nhóm 2 Nhóm 3
(2, 10) (8, 4) (2, 5)
(5, 8) (1, 2)
(7, 5)
(6, 4)
(4, 9)

Bước 3 :
Ta tính toán lại trọng tâm của các nhóm 1,2,3
Trọng tâm Nhóm 1 : (2/1,10/1) = (2,10)
Trọng tâm Nhóm 2 : ((8+5+7+6+4)/5, (4+8+5+4+9)/5) = (6, 6)
Trọng tâm Nhóm 3 : ((2+1)/2, (5+2)/2) = (1.5, 3.5)
Lặp lại các bước tính khoảng cách từng điểm đến trọng tâm và cập nhật lại các
Nhóm 1,2,3 ta sẽ có kết quả theo hình sau :

22



Hình 2.4 Các bước lặp của thuật toán K-mean (abcdef)
Kết quả của thuật toán :
Nhóm 1 Nhóm 2 Nhóm 3
A1 A3 A2
A4 A5 A7
A8 A6

2.1.4 Một số ứng dụng và hạn chế của thuật toán K-mean
Ứng dụng :
Thuật toán K-mean có rất nhiều ứng dụng từ mạng Neural network ,
nhận dạng mẫu , trí tuệ nhân tạo cho đến các lĩnh vực xử lý ảnh.
Về cơ bản bất cứ bài toán nào dạng , dữ liệu gồm nhiều loại và mỗi loại
có nhiều thuộc tính riêng. Nếu muốn phân loại chúng dựa trên các thuốc tính
23
này thì bạn có thể áp dụng thuật toán K-mean với K là số nhóm (loại) bạn
muốn phân chia
Hạn chế :


Bên cạnh những thuận lợi mà thuật toán K-mean mang lại cho bài toán
phân loại vẫn còn nhiều điểm hạn chế cần phải khắc phục như :
1. Khi số lượng điểm dữ liệu không nhiều thì việc gom nhóm lúc
đầu sẽ là kết quả của thuật toán.
2. Số lượng các nhóm K phải được xác định trước bằng tay
3. Với số lượng dữ liệu ít thì với cùng một nguồn dữ liệu nếu
thứ tự nhập vào khác sẽ có thể cho kết quả gom nhóm khác
nhau.
4. Các thuộc tính của mỗi điểm dữ liệu đều có mức đánh giá là
như nhau không phân biệt được thuộc tính nào quan trọng hơn
thuộc tính nào.
5. Đối với các điểm dữ liệu mà khoảng cách quá xa trọng tâm
nếu gom nhóm sẽ dẫn đến việc tính lại trọng tâm không còn
chính xác.

2.2 Biến đổi Contourlet
2.2.1
Giới thiệu sơ lược về Contourlet
Nén ảnh thì rất cần thiết cho các ảnh y khoa và các hệ thống liên lạc
trong việc lưu trữ và truyền dữ liệu y khoa. Mục đích chính của nén ảnh là
giảm bit rate cho việc thông tin liên lạc mà vẫn đảm bảo được chất lượng ảnh
chấp nhận được.
Rất nhiều các phương pháp nén đã được đề xuất cho các ảnh y khoa dựa
trên JPEG và DCT. Tuy nhiên kết quả nén tốt nhất vẫn là sử dụng biến đổi
wavelet DWT. Biến đổi Wavelet rời rạc 2D là một phép biến đổi tối ưu trong
việc trích xuất ra được các điểm không liên tục trên các cạnh theo trục ngang
và dọc.
Trong biến đổi DWT, một tín hiệu được đi qua hai bộ lọc thông thấp và
thông cao lần lượt dọc theo các trục x và y. Sau quá trình này ảnh được phân
24

tích thành 4 ảnh subbands LL, HL, LH, HH . Quá trình này có thể được tiếp tục
và được gọi là sự phân rã hình tháp

Hình 2.4 Sự phân rã hình tháp

Mặc dù biến đổi wavelet là một công cụ rất mạnh trong việc biểu diễn
ảnh có các vùng trơn được tách biệt bởi các cạnh. Tuy nhiên nó lại không xử lý
tốt khi các cạnh là những đường cong trơn.


Hình 2.5 So sánh khả năng lưu trữ thông tin biên của Contourlet với Wavelet

Để đáp ứng yêu cầu về các cạnh có độ cong trơn ( đây là một thông tin
quan trọng cần phải giữ trong các ảnh y khoa). Một phép biến đổi mới có tên là
Contourlet được giới thiệu gần đây bởi Minh Do và Vetterli. Đó là một biến
đổi ảnh có tính chất hình học để biểu diễn ảnh mà trong đó các thông tin về ngữ
cảnh và biên được bảo toàn.
Phép biến đổi contourlet có tính chất xấp xỉ tốt đối với các hàm 2D và
xây dựng được một cấu trúc không gian rời rạc tốt giúp cho việc tính toán một
cách hiệu quả. Biến đổi là sự phân rã tín hiệu có hướng và đa phân dải dựa trên
sự kết hợp giữa hai phương pháp : Laplace Pyramid (LP ) và Directional Filter
25
Bank (DFB). Trong đó LP sẽ có nhiệm vụ phân chia ảnh thành các subbands và
DFB sẽ phân tích ảnh chi tiết để giữ lại các thông tin về hướng của ảnh.

Hình 2.6 Mô hình cấu trúc của phép biến đổi Contourlet

2.2.2
Mô hình xây dựng biến đổi Contourlet [2]
Một bức ảnh tự nhiên luôn chứa đựng trong nó các cấu trúc hình học

như là các thông tin đặc trưng chính mà mắt người có thể nhìn thấy được. Biến
đổi Wavelet 2D tách các điểm không liên tục trên các cạnh rất tốt nhưng lại
không nhìn thấy được tính trơn dọc theo biên. Hơn nữa wavelet chỉ có thể nắm
bắt được thông tin về hướng một cách có giới hạn.
Chúng ta có thể xem một ví dụ để so sánh wavelet với contourlet. Giả sử
có một đường cong cần hai người vẽ dùng kỹ thuật tinh chế sao cho tăng độ
phân giải từ thô đến tinh. Một người vẽ đường theo hướng wavelet còn người
còn lại theo hướng contourlet.

Wavelet Contourlet
Hình 2.7 Vẽ đường cong bằng Wavelet và nằng phương pháp tiếp cận
mới

×