MẠNG NƠ RON NHÂN TẠO
VÀ ỨNG DỤNG
Nhóm thực hiện: Nhóm7 – KHMT 2011
Lê Văn Hòa Nguyễn Hoàng Long
Ngô Minh Tiến
Hồ Hải Quân
1
Nội dung trình bày
1. Phát biểu bài toán
2. Mô tả dữ liệu
3. Thiết kế và cài đặt
4. Kết quả và phân tích
5. Kết luận
2
1. Phát biểu bài toán
Bài toán: Bệnh viện đại học Billings Chicago đã tiến hành nghiên cứu về sự sống còn của những
bệnh nhân đã trải qua phẫu thuật ung thư vú. Người ta đã thấy rằng dựa vào 3 chỉ số, tuổi của bệnh
nhân tại thời điểm tiến hành phẩu thuật, năm bênh nhân tiến hành phẩu thuật, số hạch dương
tính được phát hiện, thì ta có thể xác định được bệnh nhân có thế sống dưới 5 năm hay trên 5 năm.
Dữ liệu được lấy tại địa chỉ sau: http:// archive.ics.uci.edu/ml/datasets/Haberman%27s+Survival
tên của tập dữ liệu là: Haberman's Survival
3
1. Phát biểu bài toán
Các đặc trưng
ages: Tuổi của bệnh nhân tại thời điểm phẩu thuật.
year: Năm bệnh nhân tiến hành phẩu thuật
nodes: Số hạch dương tính được phát hiện.
Quá trình phân lớp (classification)
1: Khả năng sống sót của bệnh nhân từ 5 năm trở lên.
-1: Khả năng sống sót của bệnh nhân dưới 5 năm.
4
2. Mô tả tập dữ liệu
Dữ liệu vào: Ta có các giá trị đầu vào ages, year, nodes được chuyển về đoạn [0, 1].
Dữ liệu ra: Với 2 giá trị
1: Khả năng sống sót từ 5 năm trở lên.
-1: Khả năng sống sót dưới 5 năm.
Tiến hành 2 thử nghiệm
5
2. Mô tả tập dữ liệu
Thử nghiệm 1: Dữ liệu có thể phân tách tuyến tính
Dữ liệu huấn luyện 115 mẫu, 80 mẩu 1, 35 mẫu -1
Dữ liệu test 50 mẫu 30 mẫu 1 và 20 mẫu -1
6
2. Mô tả tập dữ liệu
Thử nghiệm 2: Dữ liệu không thể phân tách tuyến tính
Dữ liệu huấn luyện 256 mẫu, 80 mẫu -1, 176 mẫu 1
Dữ liệu test 50 mẫu, 12 mẫu -1, 38 mẫu 1
7
3. Thiết kế và cài đặt
Với mạng Perceptron 1 lớp:
Hàm kích hoạt: hardlim
Số vòng huấn luyện: 100
8
3. Thiết kế và cài đặt
Với mạng Adaline
Loại mạng: linear layer (train)
Số vòng huấn luyện: 1000
Ngưỡng 0,01
9
3. Thiết kế và cài đặt
Với mạng perceptron 2 lớp
Số vòng huấn luyện: 100
Hàm kích hoạt: tansig
10
4. Kết quả và phân ch
Thử nghiệm 1:
Độ chính xác của 3 mạng
Đối với dữ liệu huấn luyện:
11
Loại mạng Số mẫu phân lớp sai Số mẫu phân lớp đúng Tổng số mẫu Tỉ lệ lỗi phân lớp sai Tỉ lệ phân lớp đúng
adaline 0 115 115 0% 100%
Perceptron 1 lớp 0 115 115 0% 100%
Perceptron 2 lớp 0 115 115 0% 100%
4. Kết quả và phân ch
Đối với dữ liệu test: dữ liệu test không phân tách tuyến tính
Nhận xét: Đối với dữ liệu phân tách tuyến tính khi huấn luyện cả 3 đều cho kết quả huấn luyện 100%.
Nhưng khi test với dữ liệu không phân tách tuyến tính thì mạng perceptron 2 lớp cho kết quả tốt nhât.
12
Loại mạng Số mẫu phân lớp
sai
Số mẫu phân lớp đúng Tổng số mẫu Tỉ lệ lỗi phân lớp sai Tỉ lệ phân lớp đúng
adaline 1 49 50 2% 98%
Perceptron 1 lớp 20 30 50 40% 60%
Perceptron 2 lớp 0 50 50 0% 100%
4. Kết quả và phân ch
Tốc độ hội tụ của hàm lỗi (MSE)
Adaline Perceptron 1 lớp Perceptron 2 lớp
Nhận xét: Độ hội tự hàm lỗi Perceptron 2 lớp là nhỏ nhất rồi đến Adaline.
13
4. Kết quả và phân ch
Tổng lỗi bình phương với dữ liệu test
Nhận xét: Mạng perceptron 2 lớp có tổng lỗi bình phương thấp nhất, rồi đến mạng adaline.
14
Loại mạng Số phân lớp sai/tổng số E
Adaline 1/50 4
Perceptron 1 lớp 20/50 80
Perceptron 2 lớp 0/50 0
4. Kết quả và phân ch
Thử nghiệm 2
Độ chính xác của 3 mạng
Đối với dữ liệu huấn luyện
15
Loại mạng Số mẫu phân lớp sai Số mẫu phân lớp đúng Tổng số mẫu Tỉ lệ lỗi phân lớp sai Tỉ lệ phân lớp đúng
adaline 256 0 256 100% 0%
Perceptron 1 lớp 47 209 256 18,4% 81,6%
Perceptron 2 lớp 0 256 256 0% 100%
4. Kết quả và phân ch
Đối với dữ liệu test: dữ liệu test không phân tách tuyến tính
Nhận xét: Đối với dữ liệu huấn luyện và test mạng perceptron 2 lớp thực hiện tốt nhất rồi đến perceptron
1 lớp.
16
Loại mạng Số mẫu phân lớp sai Số mẫu phân lớp đúng Tổng số mẫu Tỉ lệ lỗi phân lớp sai Tỉ lệ phân lớp đúng
adaline 50 0 50 100% 0%
Perceptron 1 lớp 24 26 50 48% 52%
Perceptron 2 lớp 0 50 50 0% 100%
4. Kết quả và phân ch
Tốc độ hội tụ của hàm lỗi (MSE)
Adaline Perceptron 1 lớp Perceptron 2 lớp
Nhận xét: ta thấy độ hội tụ hàm lỗi của mạng perceptron 2 lớp là nhỏ nhất rồi đến perceptron 1 lớp
17
4. Kết quả và phân ch
Tổng lỗi bình phương đối với dữ liệu test
Nhận xét: Tổng lỗi bình phương đối với mạng perceptron 2 lớp là thấp nhất, rồi đến mạng perceptron 1
lớp.
18
Loại mạng Số phân lớp sai/tổng số E
Adaline 50/50 200
Perceptron 1 lớp 24/50 96
Perceptron 2 lớp 0/50 0
5. Kết luận
Mạng perceptron 2 lớp cho kết quả tốt hơn hẵn so với mạng perceptron 1 lớp và mạng adaline.
Trong trương hợp phân tách tuyến tính thì mạng perceptron 1 lớp và mạng adaline thực hiện phân lớp
tốt. Nhưng với dữ liệu không phân tách tuyến tính thì 2 mạng này khi thực hiện phân lớp là không
tốt.
Vì vậy đối với dữ liệu cần đưa vào như thế nào thì ta có thể chọn lựa mô hình cho phù hợp.
19
CÁM ƠN THẦY VÀ CÁC BẠN ĐÃ CHÚ Ý LẮNG
NGHE
20