TIN HỌC ỨNG DỤNG
TRONG KINH DOANH
GV: Nguyễn Phương Tâm
Nguyễn Phương Tâm
2
Chương 7: Hồi quy, dự báo và tìm kiếm mục tiêu
7.1 Dự báo kinh tế
7.2 Hồi quy tuyến tính
7.3 Hồi quy mũ
7.4 Tìm kiếm mục tiêu
Nguyễn Phương Tâm
3
7.1 DỰ BÁO KINH TẾ
7.1.1 Ý nghĩa của dự báo kinh tế
Dự báo là phán đoán những sự kiện sẽ xảy ra trong
tương lai trên cơ sở phân tích khoa học các dữ liệu
của quá khứ và hiện tại nhờ một số mô hình toán học.
Dự báo kinh tế là việc đưa ra các dự báo những sự
kiện kinh tế sẽ xảy ra trong tương lai dựa trên cơ sở
phân tích khoa học các số liệu kinh tế của quá khứ và
hiện tại.
Nguyễn Phương Tâm
4
7.1 DỰ BÁO KINH TẾ
7.1.2 Phương pháp dự báo hồi quy tương quan
Mô hình hồi quy tuyến tính:
y = a
1
x
1
+ a
2
x
2
+ … + a
n
x
n
+ b
Trong đó:
x
1
, x
2
, . . . , x
n
là các biến độc lập.
y là biến phụ thuộc,
các hệ số a
1
, a
2
, …, a
n
, b là các hệ số cần xác
định.
Nguyễn Phương Tâm
5
7.1 DỰ BÁO KINH TẾ
7.1.2 Phương pháp dự báo hồi quy tương quan
Mô hình hồi quy phi tính:
là các dạng mô hình hồi quy phi tuyến nói lên
mức phụ thuộc của một biến phụ thuộc với một
hay nhiều biến độc lập mà phương trình của mô
hình hồi quy có dạng phi tính đối với các hệ số.
Chẳng hạn như hồi quy mũ, hàm sản xuất Cobb
Douglas, hồi quy Parabol, hồi quy Hyperbol…
Nguyễn Phương Tâm
6
7.1 DỰ BÁO KINH TẾ
7.1.3 Phân tích tương quan
Phụ thuộc hàm: (mối liên hệ hàm số): Hai biến
ngẫu nhiên X và Y được gọi là phụ thuộc hàm số
nếu tồn tại f sao cho Y=f(X) tức là khi đại lượng X
biến đổi thì theo một quy tắc nào đó có thể xác định
được giá trị tương ứng đại lượng Y. Đây là sự phụ
thuộc hoàn toàn chặt chẽ.
Nguyễn Phương Tâm
7
7.1 DỰ BÁO KINH TẾ
7.1.3 Phân tích tương quan
Phụ thuộc thống kê (mối liên hệ tương quan):
Hai biến ngẫu nhiên X và Y được gọi là phụ
thuộc thống kê nếu mỗi giá trị của X ta đều có
thể xác định được quy luật phân phối xác suất có
điều kiện của Y: F(y/X=x) = P(Y>y/X=x). Đây
là sự phụ thuộc không hoàn toàn chặt chẽ tức là
khi một hiện tượng biến đổi thì làm cho hiện
tượng liên quan biến đổi nhưng nó không có ảnh
hưởng hoàn toàn quyết định đến sự biến đổi này.
Nguyễn Phương Tâm
8
7.2 HỒI QUY TUYẾN TÍNH
7.2.1 Hàm Trend
Ý nghĩa: Hàm Trend dùng để trả về giá trị dọc
theo đường hồi quy (theo phương pháp bình
phương nhỏ nhất)
Cú pháp:
=TREND(known_y’s, known_x’s, new_x’s,
const)
Nguyễn Phương Tâm
9
7.2 HỒI QUY TUYẾN TÍNH
7.2.1 Hàm Trend
Trong đó:
known_y’s, known_x’s, new_x’s là các giá trị
hoặc vùng địa chỉ chứa giá trị đã biết của x, y
tương ứng và giá trị mới của x.
const là hằng số. Ngầm định nếu const = 1
(True) thì hồi quy theo hàm y = ax + b, nếu
const = 0 (False) thì hồi quy theo hàm y = ax.
Nguyễn Phương Tâm
10
7.2 HỒI QUY TUYẾN TÍNH
7.2.2 Hàm FORECAST
Ý nghĩa: Hàm Forecast tính, ước lượng giá trị
tương lai căn cứ vào giá trị hiện tại.
Cú pháp:
=FORECAST(x, known_y’s, known_x’s)
Nguyễn Phương Tâm
11
7.2 HỒI QUY TUYẾN TÍNH
7.2.2 Hàm FORECAST
Trong đó:
x là giá trị dùng để dự báo.
known_y’s là các giá trị hoặc vùng địa chỉ của
tập số liệu phụ thuộc quan sát được
known_x’s là các giá trị hoặc vùng địa chỉ của
tập số liệu độc lập quan sát được.
Nguyễn Phương Tâm
12
7.2 HỒI QUY TUYẾN TÍNH
7.2.3 Hàm SLOPE và INTERCEPT
Ý nghĩa: Hàm SLOPE để tính hệ số góc a và hàm
INTERCEPT để tính hệ số tự do b của hàm hồi quy
tuyến tính đơn y=ax+b. Thay các hệ số a, b này vào
hàm số với giá trị đã biết của x hoặc y ta sẽ tìm ra
giá trị còn lại cần dự báo.
Cú pháp:
= SLOPE(known_y’s, known_x’s)
= INTERCEPT(known_y’s, known_x’s)
Nguyễn Phương Tâm
13
7.2 HỒI QUY TUYẾN TÍNH
7.2.3 Hàm SLOPE và INTERCEPT
Trong đó:
known_y’s là các giá trị hoặc vùng địa chỉ của
tập số liệu phụ thuộc quan sát được
known_x’s là các giá trị hoặc vùng địa chỉ của
tập số liệu độc lập quan sát được.
Nguyễn Phương Tâm
14
7.2 HỒI QUY TUYẾN TÍNH
7.2.4 Hàm CORREL
Ý nghĩa: Hàm Correl trả về hệ số tương quan của
mảng array1 và array2. Sử dụng hệ số tương quan
để xác định mối quan hệ giữa hai thuộc tính.
Cú pháp:
= CORREL(array1,array2)
Trong đó:
array1, array2: là 2 mảng dữ liệu.
Nguyễn Phương Tâm
15
7.2 HỒI QUY TUYẾN TÍNH
7.2.5 Hàm COVAR
Hàm Covar tính tích số các độ lệch của mỗi cặp
điểm dữ liệu, rồi tính trung bình các tích số đó.
Cú pháp:
= COVAR(array1,array2)
Nguyễn Phương Tâm
16
7.2 HỒI QUY TUYẾN TÍNH
7.2.6 Hàm LINEST
Ta có thể sử dụng hàm LINEST cho phương pháp
dự báo mô hình hồi quy tuyến tính đơn y = ax + b
và mô hình hồi quy tuyến tính bội y = a1x1 +
a2x2 +…+ anxn + b.
Cú pháp:
=LINEST(known_y’s, known_x’s, const, stats)
Nhập xong được kết thúc bằng tổ hợp phím Ctrl +
Shift + Enter.
Nguyễn Phương Tâm
17
7.2 HỒI QUY TUYẾN TÍNH
7.2.6 Hàm LINEST
Trong đó:
known_y’s, known_x’s, là các giá trị hoặc vùng địa
chỉ chứa giá trị đã biết của x và y tương ứng.
const là hằng số. Ngầm định nếu const = 1
(True) thì tính toán hệ số tự do b, nếu const = 0
(False) bỏ qua b (b = 0).
stats là các tham số thống kê.
Nguyễn Phương Tâm
18
7.2 HỒI QUY TUYẾN TÍNH
7.2.7 Sử dụng chức năng Regression để tính hồi quy và
dự báo.
Ta có thể sử dụng trình cài thêm Regression trong
bộ phân tích dữ liệu Data Analysis.
Quy trình lập bảng hồi quy tuyến tính trong Excel:
Nhập số liệu vào bảng tính đồng thời theo từng
cột hoặc đồng thời theo từng dòng.
Chọn Tools\ Data Analysis\ Regression, OK,
xuất hiện hộp thoại.
Nguyễn Phương Tâm
19
7.2 HỒI QUY TUYẾN TÍNH
7.2.7 Sử dụng chức năng Regression để tính hồi quy và
dự báo.
Nguyễn Phương Tâm
20
7.2 HỒI QUY TUYẾN TÍNH
7.2.7 Sử dụng chức năng Regression để tính hồi quy và
dự báo.
Trong đó:
Phần Input (dữ liệu đầu vào):
Input Y Range: nhập khối ô chứa giá trị quan sát
của biến Y.
Input X Range: nhập khối ô chứa giá trị quan sát
của biến X (x1,x2 …xn).
Nguyễn Phương Tâm
21
7.2 HỒI QUY TUYẾN TÍNH
7.2.7 Sử dụng chức năng Regression để tính hồi quy và
dự báo.
Label: nếu tick vào mục này, trong khối chọn có
nhãn (tiêu đề)
Confidence Level: độ tin cậy để tìm khoảng tin
cậy của các hệ số hồi quy.
Nguyễn Phương Tâm
22
7.2 HỒI QUY TUYẾN TÍNH
7.2.7 Sử dụng chức năng Regression để tính hồi quy và
dự báo.
Output options (tùy chọn đầu ra):
Output Range: Nhập khối ô chứa dữ liệu ra
(thông thường nhập địa chỉ ô góc trên bên trái của
khối ô này).
New Worksheet Ply: Xuất dữ liệu ra một sheet
mới.
New Workbook: Xuất dữ liệu ra một tập tin
Ecxel mới.
Nguyễn Phương Tâm
23
7.3 HỒI QUY MŨ
Phương trình hồi quy mũ là
(*)
Nếu chỉ có một biến độc lập phương trình sẽ là
Hàm Logest dùng để ước lượng các hệ số của
phương trình (*), nó làm việc giống như hàm
Linest (các đối số và mảng kết quả hoàn toàn
giống).
Cú pháp:
= LOGEST( known_y's, known_x's, const, stats ).
n
x
n
xx
mmmby * ***
21
21
=
Nguyễn Phương Tâm
24
7.3 HỒI QUY MŨ
Hàm Growth dùng để tính các giá trị y theo (*)
với các bộ giá trị (x1, x2, … , xn) cho trước, làm
việc hoàn toàn giống hàm Trend.
Cú pháp:
= GROWTH( known_y's, known_x's, new_x's,
const ).
Nguyễn Phương Tâm
25
7.4 TÌM KiẾM MỤC TIÊU VỚI GOAL SEEK
Goal seek là một phần nằm trong tập hợp các
công cụ thường được gọi là What-if analysis
(What-if analysis là một tiến trình thay đổi giá trị
trong một ô thông qua việc xem xét sự thay đổi
của các ô liên quan dựa trên kết quả tính toán của
các ô này). Khi biết kết quả mong muốn của một
công thức nhưng giá trị đầu vào của công thức
quyết định kết quả này, chúng ta có thể sử dụng
Goal Seek để thực hiện.