Ứng dụng vào bài tốn dự đốn
Hồi quy tuyến tính
SINH VIÊN THỰC HIỆN
Nguyễn Cơng Trung
Phạm Đồn Minh Hậu
09DHBM2
09DHBM2
Giảng viên hướng dẫn: Huỳnh Thị Châu Lan
Tổng quan về
Phần 1
Phần 2
Hồi Quy Tuyến Tính
Vẽ đường hồi quy
Áp dụng vào
Phần 3
bài toán dự đoán
Hồi quy tuyến tính là gì?
•
Hồi quy tuyến tính ( linear regression): là một thuật tốn có
giám sát. Nghĩa là từ dữ liệu đầu vào ta sẽ cho ra một dữ
liệu có liên quan đến dữ liệu đầu ra.
•
Mục tiêu của giải thuật hồi quy tuyến tính là dự đốn giá trị
của một hoặc nhiều biến mục tiêu liên tục (continuous target
variable).
Vẽ đường hồi quy
•
Đường hồi quy đơn giản
y = a + bx
•
Đường hồi quy phức tạp
y = a0 + a1x1 + a2x2 + ... + anxn
Về cơ bản thì ta sẽ có một tập huấn luyện chứa các cặp (x i,yi) tương ứng và nhiệm
vụ của ta là phải tìm giá trị y ứng với một đầu x mới vào. Để làm điều này ta cần
tìm được quan hệ giữa (xi,yi) để từ đó đưa ra được dự đốn. Hay nói cách trừu
tượng hơn là ta cần vẽ được một đường quan hệ thể hiện mối quan hệ trong tập dữ
liệu.
•
Mơ hình trên ta sẽ đi tìm một đường thưởng y = ax + b có liên
quan đến các điểm trên.
•
Chúng ta khơng thể tìm một đường thẳng đi qua tất cả điểm trên.
Nhưng chúng ta có thể tìm được một đường thẳng tương đối nằm
giữa các điểm.
•
Đường thẳng làm sao để gọi là tương đối chính xác. Tìm dùng
phương pháp bình phương sai nhỏ nhất hay gọi là hàm lỗi (cost).
Tức từ một đường thẳng bất kỳ ta sẽ tính tổng bình phương các
điểm đến đường thẳng sao cho nhỏ nhất thì đường thẳng đó được
coi là đường tương đối chính xác
•Thank you for listening