Tải bản đầy đủ (.docx) (64 trang)

Báo cáo chuyên đề tổng quan unsupervised learning

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.13 MB, 64 trang )

BÁO CÁO CHUYÊN ĐỀ

1


TEAM PRESENTATION

Lê Thị Hồng
Đào
1951052033

Trần Nguyễn Duy An
1951052006

2

Võ Thị Thu
Minh
1951052120

Nguyễn Văn Phúc
1951052157


Y TẾ

GIÁO DỤC

3



Tổng quan
Unsupervised
Learning


Định nghĩa
Unsupervised Learning là một
nhóm thuật tốn hay phương
pháp kỹ thuật cho phép máy tự
học hỏi và tìm ra một mơ hình hay
cấu trúc nào đó bên trong dữ liệu
một cách tự động và độc lập.
Bộ dữ liệu được cung cấp khơng
có output cụ thể, hoặc hồn tồn
khơng sử dụng các label.

5


Cách thức học của mơ hình
Dựa trên các quan hệ tương tự, sự
đồng xuất hiện, hay các phép biến
đổi ma trận.

6


Một số phương pháp của
Unsupervised Learning





Clustering: Phân nhóm dữ liệu thành các
nhóm dựa trên sự tương đồng hoặc khoảng
cách giữa các điểm dữ liệu từ tập dữ liệu
ban đầu.
Dimensionality reduction: Giảm số chiều
của dữ liệu để tạo ra một biểu diễn dữ liệu
mới nhưng vẫn giữ được các tính chất quan
trọng của dữ liệu ban đầu.

7


Một số phương pháp của
Unsupervised Learning
 Anomaly detection: Phát hiện các điểm dữ liệu bất thường hoặc không tuân
theo các
quy tắc hay đặc điểm chung của tập dữ liệu.
 Density estimation: Ước tính mật độ xác
suất của dữ liệu.


Association rule learning: Phương pháp
này tìm kiếm các mối quan hệ tương quan
giữa các điểm dữ liệu.

8



Một số thuật toán phổ biến


K-Means: Phân loại các điểm dữ liệu vào các nhóm dựa trên khoảng cách giữa
chúng.



Hierarchical clustering: Xây dựng cây



Density-based clustering algorithms:
Các thuật toán dựa trên mật độ như
DBSCAN và HDBSCAN được sử dụng để
phân cụm dữ liệu dựa trên mật độ của
các điểm dữ liệu.

phân cấp để phân loại các điểm dữ liệu.


Một số thuật toán phổ biến
 t-SNE: Giảm số chiều của dữ liệu và biểu diễn các điểm dữ liệu trong khơng
gian
hai chiều hoặc ba chiều để hình dung dữ
liệu.
 Principal Component Analysis (PCA):

Giảm số chiều của dữ liệu bằng cách tìm

các thành phần chính có trọng số cao
nhất trong tập dữ liệu.

10


Những lợi ích
Unsupervised Learning


Nó có thể xử lý một lượng lớn dữ liệu khơng
được gắn nhãn và khơng có cấu trúc

▹ Khám phá thông tin từ các mẫu ẩn: sử dụng
nhiều thuật toán khác nhau để khám phá
những điểm tương đồng, khác biệt hoặc mối
quan hệ giữa các điểm và tập hợp dữ liệu
khác nhau
▹ Điều chỉnh dữ liệu: giúp chúng ta kiểm tra và
điều chỉnh dữ liệu để phù hợp với mơ hình
học máy hoặc bộ phân loại, đặc biệt là trong
trường hợp dữ liệu bị thiếu hoặc có nhiễu.

11


PHÂN ĐOẠN HÌNH ẢNH
TRONG Y TẾ

12



1.

THUẬT TOÁN
K-MEANS


THUẬT TỐN K-MEANS
K-means trong phân đoạn hình ảnh y tế
Ví dụ:
 Phân đoạn các cấu trúc trong ảnh MRI,
như não, gan, phổi, tim,…
 Phân đoạn các mạch máu trong ảnh y tế 
Phân đoạn các vùng ung thư trong ảnh y tế
→ Giúp việc chẩn đốn và điều trị bệnh
chính xác, hiệu quả hơn

14


CÁCH HOẠT ĐỘNG
▹Để áp dụng thuật
tốn K-means vào
phân đoạn hình ảnh
y tế, ta thực hiện
các bước như sau:

Sơ đồ thuật toán K-mean



Thuật toán K-means: phương pháp phân cụm dựa trên việc tìm các
trung tâm cụm (centroid) sao cho tổng bình phương khoảng cách giữa
các điểm dữ liệu và trung tâm cụm tương ứng là nhỏ nhất.


Chọn ngẫu nhiên k điểm bất kì làm trung tâm



Nhóm mỗi điểm dữ liệu vào 1 cụm có điểm trung tâm gần nhất với

16



Cập nhập trung tâm

Sau khi đã tính tốn được trung tâm cụm, chúng ta có thể sử dụng
chúng để phân đoạn hình ảnh y tế bằng cách gán mỗi pixel vào cụm có
trung tâm cụm gần nhất.


THUẬT TỐN K-MEANS
▹Sau khi hồn thành các bước trên, các vùng
cần phân đoạn trong hình ảnh y tế sẽ được phân
thành các cụm dữ liệu tương ứng. Các vùng cùng
một cụm dữ liệu có đặc điểm tương tự nhau, giúp
cho việc phân đoạn hình ảnh trở nên dễ dàng và
chính xác hơn.


17


Một số phương pháp tiền xử lý

Chuyển đổi không gian màu: Cải thiện khả năng phân đoạn của thuật
toán.

Cân bằng độ sáng: Giảm thiểu ảnh
hưởng của độ sáng không đồng đều.


Lọc ảnh: Giảm thiểu nhiễu trong ảnh và
cải thiện khả năng phân đoạn của thuật
toán.

Phát hiện biên: Giúp tách riêng các vùng có độ tương đồng khác nhau và
cải thiện khả năng phân đoạn của thuật tốn.

Phép biến đổi hình thái học: Giúp loại bỏ các vùng nhỏ không quan trọng
và cải thiện khả năng phân đoạn của thuật toán.


2.
THUẬT TOÁN
Fuzzy C-means


Thuật toán Fuzzy C-means

Fuzzy C-means (FCM) là phương pháp phân cụm dựa
trên việc tìm các trung tâm cụm và mức độ thuộc về
cụm của các điểm dữ liệu. Các bước áp dụng thuật
tốn vào phân đoạn hình ảnh y tế:





Tiền xử lý ảnh: Giảm nhiễu và cân bằng độ sáng.
Các bước tiền xử lý bao gồm: chuyển đổi không
gian màu, cân bằng độ sáng, làm mịn ảnh.
Khởi tạo trọng số: Mỗi pixel khởi tạo 1 giá trị trọng
số.
Thiết lập ma trận trọng số: Thiết lập dựa trên các
giá trị trọng số của mỗi pixel ,tính tốn bằng cách
lấy giá trị trọng số của mỗi pixel nhân với giá trị
trọng số của các pixel khác trong ảnh.

20



×