Tải bản đầy đủ (.doc) (35 trang)

Ứng dụng phần mềm Microsoft Excel để giải bài toán thông kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (627.1 KB, 35 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC VINH
……………………………

MAI THỊ HOA

ỨNG DỤNG PHẦN MỀM MICROSOFT EXCEL
ĐỂ GIẢI BÀI TOÁN THỐNG KÊ

KHÓA LUẬN CỬ NHÂN KHOA HỌC
NGÀNH TOÁN – TIN ỨNG DỤNG

VINH 2011


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC VINH
……………………………

MAI THỊ HOA

ỨNG DỤNG PHẦN MỀM MICROSOFT EXCEL
ĐỂ GIẢI BÀI TOÁN THỐNG KÊ

NGƯỜI HƯỚNG DẪN KHOA HỌC
Th S. NGUYỄN THỊ THANH HIỀN

VINH 2011


MỤC LỤC


Tra
ng
Mở đầu ...................................................................................................................
1
Chương 1. Kiến thức cơ sở...................................................................................
3
1.1. Mô hình hồi quy tuyến tính .......................................................................
3
1.2. Mô hình hồi quy phi tuyến.........................................................................
8
Chương 2. Giải các bài toán thống kê trên Microsoft Office Excel .................
10
2.1. Công cụ Data Analysis ..............................................................................
10
2.2. Giải các bài toán thống kê trên Microsoft Office Excel ............................
11
2.3. Một số phương pháp giải khác .................................................................
25
Kết luận .................................................................................................................
31
Tài liệu tham khảo ................................................................................................
32


4
MỞ ĐẦU
Các yếu tố trong mỗi hoạt động sản xuất kinh doanh luôn có mối liên hệ mật
thiết với nhau. Xác định tính chất chặt chẽ của các mối liên hệ giữa các yếu tố
và sử dụng các số liệu đã biết để dự báo sẽ giúp nhà quản lý rất nhiều trong việc
hoạch định các kế hoạch sản xuất kinh doanh hiện tại cũng như tương lai. Thực

hiện được điều đó là ta đã đi tìm lời giải cho bài toán thống kê. Thống kê là thu
thập dữ liệu, nghiên cứu định lượng, tóm tắt thông tin nhằm hỗ trợ tìm hiểu về
một vấn đề hay một đối tượng nào đó, đưa ra những kết luận dựa trên những số
liệu, ước lượng hiện tại hoặc dự báo tương lai. Việc chọn lựa phương pháp để
giải các bài toán thống kê sao cho các dự báo gần đúng nhất là một việc hết sức
quan trọng. Trong đó phương pháp hồi quy tương quan đã được Francis Galton
sử dụng vào năm 1886. Trong một bài báo nổi tiếng của mình, ông đã cho rằng
một xu hướng về chiều cao của những đứa trẻ do cha mẹ cao không bình thường
hoặc thấp không bình thường sinh ra, người ta gọi xu hướng này là luật Galton.
Trong bài báo của mình Galton dùng cụm từ “regression to mediocrity” qui về
trung bình. Từ đó, vấn đề hồi quy được nhiều người quan tâm và hoàn thiện, các
ứng dụng của phân tích hồi quy đã có nội dung rộng hơn nhiều.
Phân tích hồi quy nghiên cứu mối phụ thuộc của một biến (gọi là biến phụ
thuộc hay biến được giải thích) với một hay nhiều biến khác (được gọi là (các)
biến độc lập hay biến giải thích có giá trị đã biết) nhằm ước lượng và dự báo
trung bình của biến phụ thuộc với các giá trị đã biết của (các) biến độc lập.
Để giải quyết các bài toán thống kê một cách nhanh chóng, thuận lợi cho
những đối tượng quan tâm đến nó, trong phần mềm ứng dụng Microsoft Office
Excel có sử dụng các hàm và sử dụng thêm công cụ phân tích dữ liệu Data
Analysis. Data Analysis là một chức năng tính toán trong Microsoft Office
Excel, là công cụ hữu hiệu trong việc giải các bài toán thống kê. Data Analysis
là sự kết hợp của một số lượng rất nhiều các chương trình. Các chương trình
chức năng của nó bao gồm giao diện người dùng đồ họa, một số ngôn ngữ mô
hình đại số. Data Analysis thực sự là một công cụ mạnh mẽ có thể giải quyết tốt , nhanh


5
chóng các bài toán thống kê. Để hiểu biết rõ hơn về phương pháp cũng như cách thức
giải quyết một bài toán thống kê trên phần mềm Microsoft Office Excel, chúng
tôi lựa chọn đề tài luận văn Ứng dụng phần mềm Microsoft Office Excel để

giải bài toán thống kê. Việc sử dụng phần mềm Microsoft Excel để giải các bài
toán thống kê đã được nhiều nhà toán học, nhà kinh tế quan tâm và nhiều tài liệu
đề cập đến.
Nội dung khóa luận được trình bày thành hai chương.
Chương 1: Kiến thức cơ sở.
Chương 2: Giải các bài toán thống kê trên Microsoft Office Excel.
Khóa luận được trình bày dựa trên những tài liệu giải các bài toán thống kê,
các bài toán dự báo kinh tế và những webside về phần mềm Microsoft Excel
trên internet . Tuy nhiên, do trình độ bản thân còn hạn chế nên khóa luận không
tránh khỏi những thiếu sót hoặc chưa hiểu sâu vấn đề. Bản thân tác giả rất mong
được sự góp ý, giúp đỡ của các thầy cô giáo và bạn đọc để tác giả có thể hoàn
thiện hơn bài khóa luận của mình.
Tác giả xin chân thành cảm ơn sự giúp đỡ, hướng dẫn tận tình của các thầy
cô giáo trong tổ Xác suất thống kê và Toán ứng dụng – Khoa Toán, đặc biệt là
PGS. TS Trần Xuân Sinh và cô giáo Nguyễn Thị Thanh Hiền đã giúp đỡ tác giả
hoàn thành khóa luận này.
Vinh, tháng 05 năm 2011.
Tác giả


6

Chương 1
KIẾN THỨC CƠ SỞ
1.1. Mô hình hồi quy tuyến tính
1.1.1. Định nghĩa. Là mô hình hồi quy nói lên mức phụ thuộc tuyến tính của
một biến phụ thuộc với một hay nhiều biến độc lập mà phương trình của mô
hình hồi quy có dạng tuyến tính đối với các hệ số.
1.1.2 Hồi quy tuyến tính bội
1.1.2.1. Mô hình

Xét đồng thời biến phụ thuộc y với nhiều biến độc lập x1, x2, …, xk. Giả sử ta
có bộ số liệu có kích thước n (yi, xi1, …, xik), i = 1, n . Kí hiệu X là ma trận số
liệu của các biến x1, x2 , …, xk
1

1
X= 


1

x11 

x1 j



x21 

x2 j



 
xn1 

 
xnj 

x1k 


x2 k 
,
 

xnk 

còn y, ε , và m là véc tơ tương ứng với các biến yi, ε i, mj (i = 1, n , j = 0, k ).
Phương trình hồi quy tuyến tính bội có dạng:
yi = m0 + m1xi1 + m2xi2 + . . . +mkxik + ε i, i= 1, n .
hay

y = m0 + m1x1 + m2x2+ . . . + mkxk + ε .

(1)

Trong đó x1, x2, . . ., xk là các biến độc lập, y là biến phụ thuộc, các hệ số m0,
m1, m2, . . ., mk, là hệ số cần xác định.
Các ε i là các biến ngẫu nhiên liên quan trực tiếp và gây ra sự bất định của y i.
Ta yêu cầu ε i thỏa mãn 2 điều kiện:
(i)

E( ε i ) = 0 ∀ i= 1, n .

(ii)

2
E( ε i ε j ) = σ δ ij , i, j = 1, n .



7
và ε i được gọi là các nhiễu trắng (ký hiệu δ ii = 0 nếu i ≠ j và =1 nếu i = j). Giả
thiết (i) cho thấy ε i có dạng sai số ngẫu nhiên , còn (ii) yêu cầu chúng ta tạo dãy
không tương quan.
Các giá trị quan sát của các biến có thể bố trí theo dạng cột hoặc dạng hàng.
1.1.2.2. Ước lượng tham số hồi quy
Sử dụng phương pháp bình phương cực tiểu
n

2
Min Q(m0, m1, …, mk) = Min ∑ ( yi − m0 − m1 xi1 − ... − mk xik ) .
i =1

Dưới dạng ma trận, ta có thể viết hàm mục tiêu
Q(m) = (y-Xm)t (y-Xm) = yty – mtXty – ytXm + mtXtXm

(2)

(dấu t chỉ phép chuyển vị). Như vậy, nếu kí hiệu û là véc tơ các ước lượng của
m0, m1, m2, . . ., mk. Lấy đạo hàm (2) theo véc tơ m và cho bằng 0 ta được :
-2Xty + 2XtXm = 0.

(3)

û = (XtX)-1Xty.

(4)

Từ đó
Giả sử ma trận XtX không suy biến, với k =2 việc tính m0, m1, …, mk đưa về

giải hệ phương trình đại số tuyến tính gồm 3 phương trình 3 ẩn. Ta đưa về dạng
sau :
m0 ∑ xi 2 + m1 ∑ xi1 xi 2 + m2 ∑ xi22 = ∑ xi 2 yi


2
m0 ∑ xi1 + m1 ∑ xi1 + m2 ∑ xi1 xi 2 = ∑ xi1 yi
m n + m
1 ∑ xi1 + m2 ∑ xi 2 = ∑ yi

 0

với các tổng lấy theo i từ 1 đến n.
Các hàm sử dụng.
+ Hàm LINEST dùng để tính các hệ số m0, m1, m2, ..., mk của phương trình hồi
quy tuyến tính, cú pháp :
=LINEST(know_y’s, know_x’s, const, stats).
Trong đó know_y’s là vùng địa chỉ chứa giá trị đã biết của y, know_x’s là
vùng địa chỉ chứa giá trị đã biết của biến x, const là hằng số. Ngầm định nếu
const = 1 (True) thì tính toán hệ số tự do m0, nếu const = 0 (False) bỏ qua m0
(m0 = 0). Stats là các tham số thống kê. Ngầm định stats = 1(True) thì tính các


8
tham số thống kê, nếu stats = 0 (False) thì bỏ qua. Các tham số thống kê nếu
được tính bao gồm:
+ Các hệ số của đa thức được sắp xếp theo thứ tự giảm dần theo chỉ số mk, mk-1, . . .,
m2, m1, m0.
+ Các sai số chuẩn của các hệ số sek, sek-1, . . ., se2 ,se1, se0( se0 = #N/A khi
const = 0 (False)).

+ Hệ số xác định r2 thuộc [0, 1] nếu r2=1 thì có quan hệ hoàn hảo trong mẫu,
nếu r2 = 0 thì phương trình hồi quy không có tác dụng dự đoán y, sai số của giá
trị y sey.
+ Hệ số F là thống kê F, dùng để xác định liệu giữa biến phụ thuộc và các
biến độc lập có quan hệ với nhau hay đó chỉ là thể hiện của tác động ngẫu nhiên.
Hệ số df là bậc tự do, dùng để xác định mức tin cậy của mô hình hồi quy.
+ Các hệ số ssreg (regression sum of square) tổng bình phương giá trị hồi quy
và ssresid (residual sum of square ) tổng bình phương độ lệch.
+ Hàm TREND dùng để tính giá trị y theo hàm ước lượng (1) với các bộ giá
trị cho trước ( x1, x2, . . ., xk ), các bộ giá trị này có thể là các quan sát cũ hoặc các
dự báo mới. Cú pháp hàm:
=TREND( know_y’s, know_x’s, new_x’s, const).
+ Trong đó know_y’s, know_x’s là vùng chỉ chứa giá trị tương ứng đã biết
của y, x, new_x’s là giá trị mới của x. Const là hằng số có giá trị logic. Ngầm
định nếu const =1 (True) thì tính toán hệ số tự do m0, nếu const =0 (False) thì
m0 = 0.
1.1.3. Hồi quy tuyến tính đơn
Khi hai biến x và y phụ thuộc, ta quan tâm đầu tiên đến quan hệ hàm y = f(x).
Nếu hàm f tùy ý, đây là quan hệ rất phức tạp. Trong phần này ta giới hạn f có
dạng tuyến tính
y = mx + b,

(5)

trong đó m, b là các hằng số thực cần xác định, x là biến độc lập (để đơn giản ta
tất định hóa biến X và chuyển cách viết thành x), y là biến phụ thuộc và là biến


9
ngẫu nhiên thể hiện của nó yi là đáp ứng đối với giá trị xi. Ta vẫn có bộ mẫu cặp

kích thước n là (xi, yi), i = 1, n . Ta thiết lập mô hình tuyến tính
yi = mxi + b + ε i, i = 1, n ,

(6)

với ε i là nhiễu trắng thỏa mãn 2 giả thiết ở mục 1.1.2.1.
1.1.3.1. Ước lượng tham số hồi quy
Sử dụng phương pháp bình phương cực tiểu
n

Min Q(m,b) = Min

∑ ( yi − mxi − b) 2 .
i =1

Việc tìm cực tiểu hàm Q(m,b) là đưa về giải hệ hai phương trình
∂Q
= 0, suy ra
∂b

∂Q
= 0 và
∂m

m X + b = Y

m x 2 + b x = x y
∑ i ∑ i i
i
 ∑

i
i
i
Ta sẽ có

m=

∑ ( xi − X )( yi − Y )
i

∑ ( xi − X ) 2

.

i

b = Y − mX .
Ví dụ. Kết quả nghiên cứu thực nghiệm trên 8 người đàn ông như sau :
Trọng lượng (kg) 58

70

74

63,5

62

70,5


71

66

Huyết tương

2,86

3,37

2,76

2,62

3,49

3,05

3,12

2,75

Hãy xây dựng đường hồi quy tuyến tính mẫu của huyết tương với trọng
lượng.
Bài giải . Gọi X là trọng lượng cơ thể, Y là lượng huyết tương. Ở đây n = 8
và các tổng lấy theo i = 1,8 :


10


∑ xi = 535; ∑ yi = 24,02;
∑ xi2 = 35983,5; ∑ yi2

X = 66,875; Y = 3,0025.

= 72,798;

∑ xi yi = 1615,295.

Từ đó

∑ ( xi − X )( yi − Y ) = 1615,295 – 535.24,02/8 = 8,96;
∑ ( xi − X ) 2

= 35983,5 – 5352/8 = 205,38.

∑ ( yi − Y ) 2 = 72,798 – 20,022/8

= 0,678.


m=

8,96
= 0,043615.
205,38

b = 3,0025 – 0,043615.66,875 = 0,0857.
Vậy sự phụ thuộc của lượng huyết tương vào trọng lượng cơ thể được mô tả bằng
y = 0,0436x + 0,0857.

Hồi quy tuyến tính đơn là trường hợp riêng của hồi quy tuyến tính bội (1) với n=1.
Do đó, các hàm và lệnh đã trình bày với hồi quy tuyến tính bội cũng đúng
với hồi quy tuyến tính đơn. Song hồi tuyến tính đơn có thêm các hàm.
+ Hàm SLOPE ước lượng giá trị m của phương trình (2). Cú pháp:
= SLOPE( known_y’s, known_x’s).
Trong đó, known_y’s, known_x’s là vùng địa chỉ chứa giá trị tương ứng y, x.
+ Hàm INTERCEPT ước lượng giá trị của b. Cú pháp:
=INTERCEPT( known_y’s, known_x’s).
Trong đó, known_y’s, known_x’s là vùng địa chỉ chứa giá trị tương ứng y, x.
+ Hàm FORECAST ước lượng giá trị y khi biết x. Cú pháp:
=FORECAST( x, known_ y’s, known_x’s).
Trong đó: x là giá trị dùng để dự báo.
known_ y’s, known_x’s là vùng địa chỉ chứa giá trị tương ứng y, x.
1.2. Mô hình hồi quy phi tuyến


11
1.2.1. Định nghĩa. Là các dạng mô hình hồi quy phi tuyến nói lên mức phụ
thuộc của một biến phụ thuộc với một hay nhiều biến độc lập mà phương trình
của mô hình hồi quy có dạng phi tính đối với các hệ số. Chẳng hạn, như hàm
sản xuất CobbDouglas, hồi quy Parabol, hồi quy Hyperbol,…
Trong thực tế nếu ta gặp phải những trường hợp mà mức độ phụ thuộc giữa
hai biến là khá chặt nhưng chủ yếu là phi tuyến, thì khi đó việc dùng hồi quy
trung bình tuyến tính để xấp xỉ sẽ khó chấp nhận được, song việc đi tìm quan hệ
hàm phi tuyến cho phù hợp để xấp xỉ lại là vấn đề khó khăn. Trong phạm vi
phần này ta chỉ đề cập đến các trường hợp phụ thuộc phi tuyến nhưng có thể đưa
về tuyến tính được.
1.2.2. Hồi quy mũ
Phương trình hồi quy mũ là :
y= b * m1x1 m2x2 * . . . * mnxn .


(7)

Nếu chỉ có một biến độc lập phương trình sẽ là y= b*mx .
Hàm sử dụng :
Hàm LOGEST dùng để ước lượng các hệ số của phương trình (3), nó làm
việc giống như hàm LINEST (các đối số và mảng kết quả hoàn toàn giống nhau).
Cú pháp :
=LOGEST( known_y’s, known_x’s, const, stats ).
Trong đó, known_y’s, known_x’s là các giá trị hoặc vùng địa chỉ chứa giá trị
đã biết của y, x tương ứng. Const là hằng số. Nếu const =1 (True) tính hệ số tự
do, nếu const = 0 (False) bỏ qua hệ số b. Stats có giá trị logic nếu không in các
thống kê hồi quy, nhập True hoặc bỏ trống thì hàm sẽ in các thống kê hồi quy
giống hàm LINEST.
+ Hàm GROWTH dùng để tính các giá trị y theo (3) với các bộ giá trị (x1, x2, ..., xn)
cho trước làm việc hoàn toàn giống hàm TREND. Cú pháp :
=GROWTH( known_y’s, known_x’s, new_x’s, const ).
Trong đó, known_y’s, known_x’s, new_x’s, là các giá trị hoặc vùng địa chỉ đã
biết của y, x tương ứng và giá trị mới của x.


12
Const là hằng số. Nếu const =1 (True) tính hệ số tự do b, nếu const = 0
(False) bỏ qua hệ số b.


13

Chương 2
GIẢI CÁC BÀI TOÁN THỐNG KÊ TRÊN

MICROSOFT OFFICE EXCEL
2.1. Công cụ Data Analysis
Trình cài đặt thêm Analysis thường có trong gói phần mềm Microsoft Office.
Khi cài đặt với lựa chọn Complete (đầy đủ) hoặc khi lựa chọn Custom (theo ý
người sử dụng) với lựa chọn cho Excel là Run all from my computer (cài đặt
Excel với đầy đủ các thành phần).
Để cài thêm công cụ Data Analysis, ta tiến hành các bước sau:
Bước 1: Mở một file Excel.
Bước 2: Vào thực đơn Tools, chọn Add-Ins (xem hình 2.1).

Hình 2.1. Menu Tools trên thanh công cụ chọn Add-Ins.
Xuất hiện hộp thoại Add-Ins tích vào mục Analysis ToolPak và Analysis
ToolPak –VBA sau đó chọn OK (xem hình 2.2):


14

Hình 2.2. Hộp thoại Add-Ins chứa các chức năng mở rộng của Excel.
Trong trường hợp Microsoft Excel chưa cài đặt công cụ Data Analysis sẽ
xuất hiện thông báo, chọn Yes (xem hình 2.3).

Hình 2.3.
Lúc này, trên thanh menu dọc của thực đơn Tools đã xuất hiện mục Data
Analysis.
2.2. Giải bài toán thống kê trong Microsoft Excel
2.2.1. Sử dụng các hàm
2.2.1.1. Hàm hồi quy tuyến tính bội
Ví dụ : Lợi nhuận của doanh nghiệp (y) (đơn vị 1 triệu đồng) phụ thuộc vào
giá thành sản phẩm (x1), chi phí quản lý (x2), chi phí bán hàng (x3) được cho ở
bảng sau.



15

Hãy tính hàm hồi quy tuyến tính bội dự báo lợi nhuận của doanh nghiệp và
ước lượng giá trị lợi nhuận của doanh nghiệp khi giá thành x 1 = 0,6 (triệu đồng),
chi phí quản lý x2 = 35(triệu đồng), chi phí bán hàng x3 =25(triệu đồng).
Các bước thực hiện để giải bài toán :
Bước 1: Nhập dữ liệu bài toán vào bảng tính dưới dạng sau:

Hình 2.4. Tổ chức bài toán trên bảng tính.
Bước 2: Đánh dấu khối vùng từ C15: F19 để đưa kết quả ra bảng tính bằng
cách nhập công thức:
=LINEST(B5:B13,C5:E13,1,1).


16
Sau đó, kết thúc bằng tổ hợp phím Ctrl + Shift + Enter.
Hàm LINEST dùng để tính hệ số của hàm hồi quy tuyến tính bội.Ta được kết
quả ở bảng sau:

Hình 2.5. Xuất kết quả.
Sử dụng hàm TREND để ước lượng giá trị lợi nhuận y.
Bước 3: Tính lợi nhuận y tại ô B14 bằng công thức:
=TREND(B5:B13,C5:E13,C14:E14,1).
Sau đó, kết thúc bằng tổ hợp phím Ctrl + Shift + Enter:


17


Hình 2.6. Xuất kết quả.
Vậy hàm hồi quy dự báo lợi nhuận thu được của doanh nghiệp là:
y= 204,214x1 + 3,321x2 +0,482x3 + 322,917.
Nhận xét: Lợi nhuận sẽ đạt 573,731 (triệu đồng) khi giá thành x 1 = 0,6 (triệu
đồng), x2 = 35 (triệu đồng), x3 = 25 (triệu đồng).
2.2.1.2. Hàm hồi quy tuyến tính đơn
Ví dụ. Cho số liệu sau đây về năng suất (tạ/ha) của một loai cây trồng và
mức phân bón (tạ/ha) cho loại cây này tính trên một ha trong 10 năm liên tiếp.
Hãy ước lượng mô hình hồi quy của năng suất phụ thuộc mức phân bón và dự
báo năng suất đạt được khi mức phân bón là 20 tạ/ ha.
X
Y

6
40

10
44

12
46

14
48

16
52

18
58


Các bước thực hiện giải bài toán:
Buớc 1: Nhập dữ liệu vào bảng tính ở dạng sau:

22
60

24
68

26
74

32
80


18

Hình 2.7. Tổ chức bài toán trên bảng tính.
Bước 2: Tính hệ số m của phương trình (5) tại ô B15 bằng công thức:
=SLOPE(C3:C12,B3:B12).
Tính hệ số tự do b của phương trình (2) tại ô C15 bằng công thức:
=INTERCEPT(C3:C12,B3:B12).
Sau đó, kết thúc bằng tổ hợp phím Ctrl + Shift +Enter ta được kết quả ở
bảng sau:


19


Hình 2.8. Xuất kết quả.
Bước 3: Sử dụng hàm FORECAST ước lượng giá trị Y.
Tính năng suất Y tại ô C13 bằng công thức:
=FORECAST(B13,C3:C12,B3:B12).
Sau đó, kết thúc bằng tổ hợp phím Ctrl + Shift + Enter ta được kết quả ở
bảng sau:


20

Hình 2.9. Xuất kết quả.
Vậy hàm hồi quy tuyến tính đơn ước lượng năng suất phụ thuộc vào mức
phân bón là:
Y = 1,66X + 27,125.
Nhận xét: Nếu mức phân bón là 20 tạ/ha thì năng suất đạt được là 60,3194
tạ/ha.
2.2.1.3. Hàm hồi quy mũ
Ví dụ. Trong 10 tháng liên tiếp lượng hàng bán ra của một công ty rất thấp,
sau đó công ty đưa ra thị trường một sản phẩm mới và nhận thấy lượng hàng bán
ra theo hàm mũ. Số đơn vị hàng bán ra Y trong 6 tháng tiếp theo X cho trong
bảng sau:
X
Y

11
33100

12
47300


13
69000

14
10200
0

Hãy ước lượng hàm hồi quy mũ.

15
15000
0

16
220000


21
Các bước thực hiện để giải bài toán:
Bước 1: Nhập dữ liệu vào bảng tính như hình 2.10.

Hình 2.10. Tổ chức bài toán trên bảng tính.
Bước 2: Đánh dấu khối vùng từ C10:D14 để đưa kết quả ra bảng tính bằng
cách nhập công thức:
=LOGEST(C3:C8,B3:B8,1,1).
Sau đó kết thúc bằng tổ hợp phím Ctrl + Shift + Enter ta được kết quả ở
bảng sau:


22


Hình 2.11. Xuất kết quả.
Vậy hàm hồi quy mũ dự báo lượng hàng bán ra trong các tháng tiếp theo là:
y = 495,3048.1,463276x.
Để dự báo hồi quy tuyến tính trong Excel ngoài việc sử dụng các hàm của
Excel ta sử dụng trình cài thêm Regression.
2.2.2. Sử dụng trình cài thêm Regression để hồi quy và dự báo
Chọn Tool / Data Analysis / Regression / OK. Các hộp thoại lần lượt xuất
hiện như hình sau:

Hình 2.11. Hộp thoại chứa các công cụ phân tích dữ liệu.


23

Hình 2.12. Hộp thoại Regression chứa các thông số của mô hình hồi quy.
2.2.2.1. Một số thuật ngữ trong bảng hộp thoại Regression
• Các lựa chọn nhập dữ liệu vào Input.
Input Y Range
Input X Range
Labels

Vùng địa chỉ chứa biến phụ thuộc Y.
Vùng địa chỉ chứa các biến độc lập X.
Tích vào mục này để khắng định ô (các ô) đầu tiên

Constant is Zero

không chứa dữ liệu hồi quy.
Tích vào mục này để khẳng định hệ số tự do của

hàm hồi quy tuyến tính b=0.
Độ tin cậy của hồi quy (mặc định là 95%) bằng 1-

Confidence Level

a với a là mức ý nghĩa hay xác suất mắc sai lầm
loại một bác bỏ H0 trong khi H0 đúng.


24
• Các lựa chọn kết xuất kết quả Output Option.
Output Range

Vùng hoặc ô phía trên bên trái của vùng chứa kết quả.

New Worksheet Ply
New Workbook
Residuals
Standardarlized Residuals
Residual plots
Line fit plots
Normal Probability Plots

In kết quả ra một sheet khác.
In kết quả ra một file Excel.
Sai số do ngẫu nhiên.
Chuẩn hóa sai số
Đồ thị sai số
Đồ thị hàm hồi quy tuyến tính
Đồ thị xác suất phân phối chuẩn


Ví dụ. Tính hàm hồi quy tuyến tính bội với số liệu cho trong bảng dưới :
Y
X1
X2
X3
X4
733,300
3,089
76,200
283,500
15,844
750,900
3,503
79,400
274,500
19,835
747,600
3,817
77,000
268,000
21,797
727,600
3,870
74,000
265,700
24,759
694,400
3,706
64,400

259,600
28,093
702,600
3,851
63,100
256,800
31,121
714,000
4,170
66,300
259,300
32,759
717,630
4,378
62,900
263,400
34,556
750,000
5,000
66,700
273,100
36,788
Trong đó, Y là thu nhập quốc dân, X 1 là sản lượng điện. X2 là sản lượng than,
X3 là sản lượng lương thực, X 4 là sản lượng thép. Sử dụng lệnh Tool / Data
Anylysis.
Các bước thực hiện để giải bài toán :
Bước 1 : Nhập dữ liệu bài toán vào bảng tính dưới dạng sau :


25


Hình 2.13. Tổ chức bài toán trên bảng tính.
Bước 2 : Chọn Tool / Data Analysis / Regression / OK. Bảng hộp thoại
Regression xuất hiện ta điền các thông tin như trong hình sau:

Hình 2.14. Khai báo các thông số của mô hình.


×