Tải bản đầy đủ (.pdf) (35 trang)

Ứng dụng phần mềm microsoft excel để giải bài toán thông kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (860.73 KB, 35 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC VINH
……………………………

MAI THỊ HOA

ỨNG DỤNG PHẦN MỀM MICROSOFT EXCEL
ĐỂ GIẢI BÀI TOÁN THỐNG KÊ

KHĨA LUẬN CỬ NHÂN KHOA HỌC
NGÀNH TỐN – TIN ỨNG DỤNG

VINH 2011


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC VINH
……………………………

MAI THỊ HOA

ỨNG DỤNG PHẦN MỀM MICROSOFT EXCEL
ĐỂ GIẢI BÀI TOÁN THỐNG KÊ

NGƢỜI HƢỚNG DẪN KHOA HỌC
Th S. NGUYỄN THỊ THANH HIỀN

VINH 2011


MỤC LỤC



Trang
Mở đầu ................................................................................................................... 1
Chƣơng 1. Kiến thức cơ sở ................................................................................... 3
1.1. Mơ hình hồi quy tuyến tính ....................................................................... 3
1.2. Mơ hình hồi quy phi tuyến ......................................................................... 8
Chƣơng 2. Giải các bài toán thống kê trên Microsoft Office Excel ................ 10
2.1. Công cụ Data Analysis .............................................................................. 10
2.2. Giải các bài toán thống kê trên Microsoft Office Excel ........................... 11
2.3. Một số phương pháp giải khác ................................................................. 25
Kết luận ................................................................................................................. 31
Tài liệu tham khảo ................................................................................................ 32


1
MỞ ĐẦU
Các yếu tố trong mỗi hoạt động sản xuất kinh doanh ln có mối liên hệ mật
thiết với nhau. Xác định tính chất chặt chẽ của các mối liên hệ giữa các yếu tố
và sử dụng các số liệu đã biết để dự báo sẽ giúp nhà quản lý rất nhiều trong việc
hoạch định các kế hoạch sản xuất kinh doanh hiện tại cũng như tương lai. Thực
hiện được điều đó là ta đã đi tìm lời giải cho bài toán thống kê. Thống kê là thu
thập dữ liệu, nghiên cứu định lượng, tóm tắt thơng tin nhằm hỗ trợ tìm hiểu về
một vấn đề hay một đối tượng nào đó, đưa ra những kết luận dựa trên những số
liệu, ước lượng hiện tại hoặc dự báo tương lai. Việc chọn lựa phương pháp để
giải các bài toán thống kê sao cho các dự báo gần đúng nhất là một việc hết sức
quan trọng. Trong đó phương pháp hồi quy tương quan đã được Francis Galton
sử dụng vào năm 1886. Trong một bài báo nổi tiếng của mình, ơng đã cho rằng
một xu hướng về chiều cao của những đứa trẻ do cha mẹ cao khơng bình thường
hoặc thấp khơng bình thường sinh ra, người ta gọi xu hướng này là luật Galton.
Trong bài báo của mình Galton dùng cụm từ “regression to mediocrity” qui về

trung bình. Từ đó, vấn đề hồi quy được nhiều người quan tâm và hồn thiện, các
ứng dụng của phân tích hồi quy đã có nội dung rộng hơn nhiều.
Phân tích hồi quy nghiên cứu mối phụ thuộc của một biến (gọi là biến phụ
thuộc hay biến được giải thích) với một hay nhiều biến khác (được gọi là (các)
biến độc lập hay biến giải thích có giá trị đã biết) nhằm ước lượng và dự báo
trung bình của biến phụ thuộc với các giá trị đã biết của (các) biến độc lập.
Để giải quyết các bài tốn thống kê một cách nhanh chóng, thuận lợi cho
những đối tượng quan tâm đến nó, trong phần mềm ứng dụng Microsoft Office
Excel có sử dụng các hàm và sử dụng thêm cơng cụ phân tích dữ liệu Data
Analysis. Data Analysis là một chức năng tính tốn trong Microsoft Office
Excel, là công cụ hữu hiệu trong việc giải các bài toán thống kê. Data Analysis
là sự kết hợp của một số lượng rất nhiều các chương trình. Các chương trình
chức năng của nó bao gồm giao diện người dùng đồ họa, một số ngơn ngữ mơ
hình đại số. Data Analysis thực sự là một công cụ mạnh mẽ có thể giải quyết tốt , nhanh


2
chóng các bài tốn thống kê. Để hiểu biết rõ hơn về phương pháp cũng như cách thức
giải quyết một bài toán thống kê trên phần mềm Microsoft Office Excel, chúng
tôi lựa chọn đề tài luận văn Ứng dụng phần mềm Microsoft Office Excel để
giải bài toán thống kê. Việc sử dụng phần mềm Microsoft Excel để giải các bài
toán thống kê đã được nhiều nhà toán học, nhà kinh tế quan tâm và nhiều tài liệu
đề cập đến.
Nội dung khóa luận được trình bày thành hai chương.
Chương 1: Kiến thức cơ sở.
Chương 2: Giải các bài toán thống kê trên Microsoft Office Excel.
Khóa luận được trình bày dựa trên những tài liệu giải các bài toán thống kê,
các bài toán dự báo kinh tế và những webside về phần mềm Microsoft Excel
trên internet . Tuy nhiên, do trình độ bản thân cịn hạn chế nên khóa luận khơng
tránh khỏi những thiếu sót hoặc chưa hiểu sâu vấn đề. Bản thân tác giả rất mong

được sự góp ý, giúp đỡ của các thầy cô giáo và bạn đọc để tác giả có thể hồn
thiện hơn bài khóa luận của mình.
Tác giả xin chân thành cảm ơn sự giúp đỡ, hướng dẫn tận tình của các thầy
cơ giáo trong tổ Xác suất thống kê và Toán ứng dụng – Khoa Toán, đặc biệt là
PGS. TS Trần Xuân Sinh và cô giáo Nguyễn Thị Thanh Hiền đã giúp đỡ tác giả
hoàn thành khóa luận này.
Vinh, tháng 05 năm 2011.
Tác giả


3

Chƣơng 1
KIẾN THỨC CƠ SỞ
1.1. Mơ hình hồi quy tuyến tính
1.1.1. Định nghĩa. Là mơ hình hồi quy nói lên mức phụ thuộc tuyến tính của
một biến phụ thuộc với một hay nhiều biến độc lập mà phương trình của mơ
hình hồi quy có dạng tuyến tính đối với các hệ số.
1.1.2 Hồi quy tuyến tính bội
1.1.2.1. Mơ hình
Xét đồng thời biến phụ thuộc y với nhiều biến độc lập x1, x2, …, xk. Giả sử ta
có bộ số liệu có kích thước n (yi, xi1, …, xik), i = 1, n . Kí hiệu X là ma trận số
liệu của các biến x1, x2 , …, xk
1

1
X= 


1


x11 

x1 j



x21 

x2 j



   
xn1  xnj 

x1k 

x2 k 
,
 

xnk 

còn y,  , và m là véc tơ tương ứng với các biến yi,  i, mj (i = 1, n , j = 0, k ).
Phương trình hồi quy tuyến tính bội có dạng:
yi = m0 + m1xi1 + m2xi2 + . . . +mkxik +  i, i= 1, n .
hay

y = m0 + m1x1 + m2x2+ . . . + mkxk +  .


(1)

Trong đó x1, x2, . . ., xk là các biến độc lập, y là biến phụ thuộc, các hệ số m0,
m1, m2, . . ., mk, là hệ số cần xác định.
Các  i là các biến ngẫu nhiên liên quan trực tiếp và gây ra sự bất định của yi.
Ta yêu cầu  i thỏa mãn 2 điều kiện:
(i)

E(  i ) = 0  i= 1, n .

(ii)

E(  i  j ) =  2 ij , i, j = 1, n .


4
và  i được gọi là các nhiễu trắng (ký hiệu  ii = 0 nếu i ≠ j và =1 nếu i = j). Giả
thiết (i) cho thấy  i có dạng sai số ngẫu nhiên , cịn (ii) yêu cầu chúng ta tạo dãy
không tương quan.
Các giá trị quan sát của các biến có thể bố trí theo dạng cột hoặc dạng hàng.
1.1.2.2. Ƣớc lƣợng tham số hồi quy
Sử dụng phương pháp bình phương cực tiểu
n

Min Q(m0, m1, …, mk) = Min  ( yi  m0  m1 xi1  ...  mk xik ) 2 .
i 1

Dưới dạng ma trận, ta có thể viết hàm mục tiêu
Q(m) = (y-Xm)t (y-Xm) = yty – mtXty – ytXm + mtXtXm


(2)

(dấu t chỉ phép chuyển vị). Như vậy, nếu kí hiệu û là véc tơ các ước lượng của
m0, m1, m2, . . ., mk. Lấy đạo hàm (2) theo véc tơ m và cho bằng 0 ta được :
-2Xty + 2XtXm = 0.

(3)

û = (XtX)-1Xty.

(4)

Từ đó
Giả sử ma trận XtX khơng suy biến, với k =2 việc tính m0, m1, …, mk đưa về
giải hệ phương trình đại số tuyến tính gồm 3 phương trình 3 ẩn. Ta đưa về dạng
sau :
m0  xi 2  m1  xi1 xi 2  m2  xi22   xi 2 yi


2
m0  xi1  m1  xi1  m2  xi1 xi 2   xi1 yi
m n  m
1  xi1  m2  xi 2   yi

 0

với các tổng lấy theo i từ 1 đến n.
Các hàm sử dụng.
+ Hàm LINEST dùng để tính các hệ số m0, m1, m2, ..., mk của phương trình

hồi quy tuyến tính, cú pháp :
=LINEST(know_y’s, know_x’s, const, stats).
Trong đó know_y’s là vùng địa chỉ chứa giá trị đã biết của y, know_x’s là
vùng địa chỉ chứa giá trị đã biết của biến x, const là hằng số. Ngầm định nếu
const = 1 (True) thì tính tốn hệ số tự do m0, nếu const = 0 (False) bỏ qua m0
(m0 = 0). Stats là các tham số thống kê. Ngầm định stats = 1(True) thì tính các


5
tham số thống kê, nếu stats = 0 (False) thì bỏ qua. Các tham số thống kê nếu
được tính bao gồm:
+ Các hệ số của đa thức được sắp xếp theo thứ tự giảm dần theo chỉ số mk, mk-1, . . .,
m2, m1, m0.
+ Các sai số chuẩn của các hệ số sek, sek-1, . . ., se2 ,se1, se0( se0 = #N/A khi
const = 0 (False)).
+ Hệ số xác định r2 thuộc [0, 1] nếu r2=1 thì có quan hệ hồn hảo trong mẫu,
nếu r2 = 0 thì phương trình hồi quy khơng có tác dụng dự đốn y, sai số của giá
trị y sey.
+ Hệ số F là thống kê F, dùng để xác định liệu giữa biến phụ thuộc và các
biến độc lập có quan hệ với nhau hay đó chỉ là thể hiện của tác động ngẫu nhiên.
Hệ số df là bậc tự do, dùng để xác định mức tin cậy của mơ hình hồi quy.
+ Các hệ số ssreg (regression sum of square) tổng bình phương giá trị hồi quy
và ssresid (residual sum of square ) tổng bình phương độ lệch.
+ Hàm TREND dùng để tính giá trị y theo hàm ước lượng (1) với các bộ giá
trị cho trước ( x1, x2, . . ., xk ), các bộ giá trị này có thể là các quan sát cũ hoặc
các dự báo mới. Cú pháp hàm:
=TREND( know_y’s, know_x’s, new_x’s, const).
+ Trong đó know_y’s, know_x’s là vùng chỉ chứa giá trị tương ứng đã biết
của y, x, new_x’s là giá trị mới của x. Const là hằng số có giá trị logic. Ngầm
định nếu const =1 (True) thì tính tốn hệ số tự do m0, nếu const =0 (False) thì

m0 = 0.
1.1.3. Hồi quy tuyến tính đơn
Khi hai biến x và y phụ thuộc, ta quan tâm đầu tiên đến quan hệ hàm y = f(x).
Nếu hàm f tùy ý, đây là quan hệ rất phức tạp. Trong phần này ta giới hạn f có
dạng tuyến tính
y = mx + b,

(5)

trong đó m, b là các hằng số thực cần xác định, x là biến độc lập (để đơn giản ta
tất định hóa biến X và chuyển cách viết thành x), y là biến phụ thuộc và là biến


6
ngẫu nhiên thể hiện của nó yi là đáp ứng đối với giá trị xi. Ta vẫn có bộ mẫu cặp
kích thước n là (xi, yi), i = 1, n . Ta thiết lập mơ hình tuyến tính
yi = mxi + b +  i, i = 1, n ,

(6)

với  i là nhiễu trắng thỏa mãn 2 giả thiết ở mục 1.1.2.1.
1.1.3.1. Ƣớc lƣợng tham số hồi quy
Sử dụng phương pháp bình phương cực tiểu
n

Min Q(m,b) = Min

 ( yi  mxi  b) 2 .
i 1


Việc tìm cực tiểu hàm Q(m,b) là đưa về giải hệ hai phương trình
Q
= 0, suy ra
b

Q
= 0 và
m

m X  b  Y

m x 2  b x  x y
 i  i i
i
 
i
i
i

Ta sẽ có

 ( xi  X )( yi  Y )
m=

i

 ( xi  X ) 2

.


i

b = Y  mX .
Ví dụ. Kết quả nghiên cứu thực nghiệm trên 8 người đàn ông như sau :
Trọng lượng (kg) 58

70

74

63,5

62

70,5

71

66

Huyết tương

2,86

3,37

2,76

2,62


3,49

3,05

3,12

2,75

Hãy xây dựng đường hồi quy tuyến tính mẫu của huyết tương với trọng
lượng.


7
Bài giải . Gọi X là trọng lượng cơ thể, Y là lượng huyết tương. Ở đây n = 8
và các tổng lấy theo i = 1,8 :

 xi = 535;  yi = 24,02;

 xi2 = 35983,5;  yi2

X = 66,875; Y = 3,0025.

= 72,798;

 xi yi = 1615,295.

Từ đó

 ( xi  X )( yi  Y ) = 1615,295 – 535.24,02/8 = 8,96;
 ( xi  X ) 2


= 35983,5 – 5352/8 = 205,38.

 ( yi  Y ) 2 = 72,798 – 20,022/8

= 0,678.


m=

8,96
= 0,043615.
205,38

b = 3,0025 – 0,043615.66,875 = 0,0857.
Vậy sự phụ thuộc của lượng huyết tương vào trọng lượng cơ thể được mô tả bằng
y = 0,0436x + 0,0857.
Hồi quy tuyến tính đơn là trường hợp riêng của hồi quy tuyến tính bội (1) với n=1.
Do đó, các hàm và lệnh đã trình bày với hồi quy tuyến tính bội cũng đúng với
hồi quy tuyến tính đơn. Song hồi tuyến tính đơn có thêm các hàm.
+ Hàm SLOPE ước lượng giá trị m của phương trình (2). Cú pháp:
= SLOPE( known_y’s, known_x’s).
Trong đó, known_y’s, known_x’s là vùng địa chỉ chứa giá trị tương ứng y, x.
+ Hàm INTERCEPT ước lượng giá trị của b. Cú pháp:
=INTERCEPT( known_y’s, known_x’s).
Trong đó, known_y’s, known_x’s là vùng địa chỉ chứa giá trị tương ứng y, x.
+ Hàm FORECAST ước lượng giá trị y khi biết x. Cú pháp:
=FORECAST( x, known_ y’s, known_x’s).
Trong đó: x là giá trị dùng để dự báo.



8
known_ y’s, known_x’s là vùng địa chỉ chứa giá trị tương ứng y, x.
1.2. Mơ hình hồi quy phi tuyến
1.2.1. Định nghĩa. Là các dạng mơ hình hồi quy phi tuyến nói lên mức phụ
thuộc của một biến phụ thuộc với một hay nhiều biến độc lập mà phương trình
của mơ hình hồi quy có dạng phi tính đối với các hệ số. Chẳng hạn, như hàm
sản xuất CobbDouglas, hồi quy Parabol, hồi quy Hyperbol,…
Trong thực tế nếu ta gặp phải những trường hợp mà mức độ phụ thuộc giữa
hai biến là khá chặt nhưng chủ yếu là phi tuyến, thì khi đó việc dùng hồi quy
trung bình tuyến tính để xấp xỉ sẽ khó chấp nhận được, song việc đi tìm quan hệ
hàm phi tuyến cho phù hợp để xấp xỉ lại là vấn đề khó khăn. Trong phạm vi
phần này ta chỉ đề cập đến các trường hợp phụ thuộc phi tuyến nhưng có thể đưa
về tuyến tính được.
1.2.2. Hồi quy mũ
Phương trình hồi quy mũ là :
y= b * m1x1 m2x2 * . . . * mnxn .

(7)

Nếu chỉ có một biến độc lập phương trình sẽ là y= b*mx .
Hàm sử dụng :
Hàm LOGEST dùng để ước lượng các hệ số của phương trình (3), nó làm
việc giống như hàm LINEST (các đối số và mảng kết quả hoàn toàn giống nhau).
Cú pháp :
=LOGEST( known_y’s, known_x’s, const, stats ).
Trong đó, known_y’s, known_x’s là các giá trị hoặc vùng địa chỉ chứa giá trị
đã biết của y, x tương ứng. Const là hằng số. Nếu const =1 (True) tính hệ số tự
do, nếu const = 0 (False) bỏ qua hệ số b. Stats có giá trị logic nếu không in các
thống kê hồi quy, nhập True hoặc bỏ trống thì hàm sẽ in các thống kê hồi quy

giống hàm LINEST.
+ Hàm GROWTH dùng để tính các giá trị y theo (3) với các bộ giá trị (x1, x2, ..., xn)
cho trước làm việc hoàn toàn giống hàm TREND. Cú pháp :
=GROWTH( known_y’s, known_x’s, new_x’s, const ).


9
Trong đó, known_y’s, known_x’s, new_x’s, là các giá trị hoặc vùng địa chỉ đã
biết của y, x tương ứng và giá trị mới của x.
Const là hằng số. Nếu const =1 (True) tính hệ số tự do b, nếu const = 0
(False) bỏ qua hệ số b.


10

Chƣơng 2
GIẢI CÁC BÀI TOÁN THỐNG KÊ TRÊN
MICROSOFT OFFICE EXCEL
2.1. Cơng cụ Data Analysis
Trình cài đặt thêm Analysis thường có trong gói phần mềm Microsoft Office.
Khi cài đặt với lựa chọn Complete (đầy đủ) hoặc khi lựa chọn Custom (theo ý
người sử dụng) với lựa chọn cho Excel là Run all from my computer (cài đặt
Excel với đầy đủ các thành phần).
Để cài thêm công cụ Data Analysis, ta tiến hành các bước sau:
Bƣớc 1: Mở một file Excel.
Bƣớc 2: Vào thực đơn Tools, chọn Add-Ins (xem hình 2.1).

Hình 2.1. Menu Tools trên thanh công cụ chọn Add-Ins.
Xuất hiện hộp thoại Add-Ins tích vào mục Analysis ToolPak và Analysis
ToolPak –VBA sau đó chọn OK (xem hình 2.2):



11

Hình 2.2. Hộp thoại Add-Ins chứa các chức năng mở rộng của Excel.
Trong trường hợp Microsoft Excel chưa cài đặt công cụ Data Analysis sẽ
xuất hiện thông báo, chọn Yes (xem hình 2.3).

Hình 2.3.
Lúc này, trên thanh menu dọc của thực đơn Tools đã xuất hiện mục Data
Analysis.
2.2. Giải bài toán thống kê trong Microsoft Excel
2.2.1. Sử dụng các hàm
2.2.1.1. Hàm hồi quy tuyến tính bội
Ví dụ : Lợi nhuận của doanh nghiệp (y) (đơn vị 1 triệu đồng) phụ thuộc vào
giá thành sản phẩm (x1), chi phí quản lý (x2), chi phí bán hàng (x3) được cho ở
bảng sau.


12

Hãy tính hàm hồi quy tuyến tính bội dự báo lợi nhuận của doanh nghiệp và
ước lượng giá trị lợi nhuận của doanh nghiệp khi giá thành x1 = 0,6 (triệu đồng),
chi phí quản lý x2 = 35(triệu đồng), chi phí bán hàng x3 =25(triệu đồng).
Các bước thực hiện để giải bài toán :
Bƣớc 1: Nhập dữ liệu bài toán vào bảng tính dưới dạng sau:

Hình 2.4. Tổ chức bài tốn trên bảng tính.
Bƣớc 2: Đánh dấu khối vùng từ C15: F19 để đưa kết quả ra bảng tính bằng
cách nhập công thức:

=LINEST(B5:B13,C5:E13,1,1).


13
Sau đó, kết thúc bằng tổ hợp phím Ctrl + Shift + Enter.
Hàm LINEST dùng để tính hệ số của hàm hồi quy tuyến tính bội.Ta được kết
quả ở bảng sau:

Hình 2.5. Xuất kết quả.
Sử dụng hàm TREND để ước lượng giá trị lợi nhuận y.
Bƣớc 3: Tính lợi nhuận y tại ơ B14 bằng cơng thức:
=TREND(B5:B13,C5:E13,C14:E14,1).
Sau đó, kết thúc bằng tổ hợp phím Ctrl + Shift + Enter:


14

Hình 2.6. Xuất kết quả.
Vậy hàm hồi quy dự báo lợi nhuận thu được của doanh nghiệp là:
y= 204,214x1 + 3,321x2 +0,482x3 + 322,917.
Nhận xét: Lợi nhuận sẽ đạt 573,731 (triệu đồng) khi giá thành x1 = 0,6 (triệu
đồng), x2 = 35 (triệu đồng), x3 = 25 (triệu đồng).
2.2.1.2. Hàm hồi quy tuyến tính đơn
Ví dụ. Cho số liệu sau đây về năng suất (tạ/ha) của một loai cây trồng và
mức phân bón (tạ/ha) cho loại cây này tính trên một ha trong 10 năm liên tiếp.
Hãy ước lượng mô hình hồi quy của năng suất phụ thuộc mức phân bón và dự
báo năng suất đạt được khi mức phân bón là 20 tạ/ ha.
X

6


10

12

14

16

18

22

24

26

32

Y

40

44

46

48

52


58

60

68

74

80

Các bước thực hiện giải bài tốn:
Buớc 1: Nhập dữ liệu vào bảng tính ở dạng sau:


15

Hình 2.7. Tổ chức bài tốn trên bảng tính.
Bƣớc 2: Tính hệ số m của phương trình (5) tại ơ B15 bằng cơng thức:
=SLOPE(C3:C12,B3:B12).
Tính hệ số tự do b của phương trình (2) tại ơ C15 bằng cơng thức:
=INTERCEPT(C3:C12,B3:B12).
Sau đó, kết thúc bằng tổ hợp phím Ctrl + Shift +Enter ta được kết quả ở
bảng sau:


16

Hình 2.8. Xuất kết quả.
Bƣớc 3: Sử dụng hàm FORECAST ước lượng giá trị Y.

Tính năng suất Y tại ơ C13 bằng cơng thức:
=FORECAST(B13,C3:C12,B3:B12).
Sau đó, kết thúc bằng tổ hợp phím Ctrl + Shift + Enter ta được kết quả ở
bảng sau:


17

Hình 2.9. Xuất kết quả.
Vậy hàm hồi quy tuyến tính đơn ước lượng năng suất phụ thuộc vào mức
phân bón là:
Y = 1,66X + 27,125.
Nhận xét: Nếu mức phân bón là 20 tạ/ha thì năng suất đạt được là 60,3194
tạ/ha.
2.2.1.3. Hàm hồi quy mũ
Ví dụ. Trong 10 tháng liên tiếp lượng hàng bán ra của một công ty rất thấp,
sau đó cơng ty đưa ra thị trường một sản phẩm mới và nhận thấy lượng hàng bán
ra theo hàm mũ. Số đơn vị hàng bán ra Y trong 6 tháng tiếp theo X cho trong
bảng sau:
X

11

12

13

14

15


16

Y

33100

47300

69000

10200

15000

22000

0
Hãy ước lượng hàm hồi quy mũ.

0

0


18
Các bước thực hiện để giải bài toán:
Bƣớc 1: Nhập dữ liệu vào bảng tính như hình 2.10.

Hình 2.10. Tổ chức bài tốn trên bảng tính.

Bƣớc 2: Đánh dấu khối vùng từ C10:D14 để đưa kết quả ra bảng tính bằng
cách nhập cơng thức:
=LOGEST(C3:C8,B3:B8,1,1).
Sau đó kết thúc bằng tổ hợp phím Ctrl + Shift + Enter ta được kết quả ở
bảng sau:


19

Hình 2.11. Xuất kết quả.
Vậy hàm hồi quy mũ dự báo lượng hàng bán ra trong các tháng tiếp theo là:
y = 495,3048.1,463276x.
Để dự báo hồi quy tuyến tính trong Excel ngoài việc sử dụng các hàm của
Excel ta sử dụng trình cài thêm Regression.
2.2.2. Sử dụng trình cài thêm Regression để hồi quy và dự báo
Chọn Tool / Data Analysis / Regression / OK. Các hộp thoại lần lượt xuất
hiện như hình sau:

Hình 2.11. Hộp thoại chứa các cơng cụ phân tích dữ liệu.


20

Hình 2.12. Hộp thoại Regression chứa các thơng số của mơ hình hồi quy.
2.2.2.1. Một số thuật ngữ trong bảng hộp thoại Regression
 Các lựa chọn nhập dữ liệu vào Input.
Input Y Range

Vùng địa chỉ chứa biến phụ thuộc Y.


Input X Range

Vùng địa chỉ chứa các biến độc lập X.

Labels

Tích vào mục này để khắng định ô (các ô) đầu tiên
khơng chứa dữ liệu hồi quy.

Constant is Zero

Tích vào mục này để khẳng định hệ số tự do của
hàm hồi quy tuyến tính b=0.
Độ tin cậy của hồi quy (mặc định là 95%) bằng 1-

Confidence Level

a với a là mức ý nghĩa hay xác suất mắc sai lầm
loại một bác bỏ H0 trong khi H0 đúng.


21
 Các lựa chọn kết xuất kết quả Output Option.
Output Range

Vùng hoặc ơ phía trên bên trái của vùng chứa kết quả.

New Worksheet Ply

In kết quả ra một sheet khác.


New Workbook

In kết quả ra một file Excel.

Residuals

Sai số do ngẫu nhiên.

Standardarlized Residuals

Chuẩn hóa sai số

Residual plots

Đồ thị sai số

Line fit plots

Đồ thị hàm hồi quy tuyến tính

Normal Probability Plots

Đồ thị xác suất phân phối chuẩn

Ví dụ. Tính hàm hồi quy tuyến tính bội với số liệu cho trong bảng dưới :
Y

X1


X2

X3

X4

733,300

3,089

76,200

283,500

15,844

750,900

3,503

79,400

274,500

19,835

747,600

3,817


77,000

268,000

21,797

727,600

3,870

74,000

265,700

24,759

694,400

3,706

64,400

259,600

28,093

702,600

3,851


63,100

256,800

31,121

714,000

4,170

66,300

259,300

32,759

717,630

4,378

62,900

263,400

34,556

750,000

5,000


66,700

273,100

36,788

Trong đó, Y là thu nhập quốc dân, X1 là sản lượng điện. X2 là sản lượng than,
X3 là sản lượng lương thực, X4 là sản lượng thép. Sử dụng lệnh Tool / Data
Anylysis.
Các bước thực hiện để giải bài toán :
Bƣớc 1 : Nhập dữ liệu bài toán vào bảng tính dưới dạng sau :


22

Hình 2.13. Tổ chức bài tốn trên bảng tính.
Bƣớc 2 : Chọn Tool / Data Analysis / Regression / OK. Bảng hộp thoại
Regression xuất hiện ta điền các thông tin như trong hình sau:

Hình 2.14. Khai báo các thơng số của mơ hình.


×