Tải bản đầy đủ (.doc) (17 trang)

Bài tập thống kê trong kinh doanh – tối ưu tuyến tính

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (250.3 KB, 17 trang )

BÀI TẬP THỐNG KÊ TRONG KINH DOANH – TỐI ƯU TUYẾN
TÍNH
Đề Bài:
CÂU 1: TỐI ƯU TUYẾN TÍNH (LP)
Công ty hoá dầu Riverside Oil ở bang Kentcky, Hoa kỳ, sản xuất hai loại xăng dùng
cho động cơ là xăng thường (regular-A90) và xăng cao cấp (supreme-A97). Mỗi
thùng xăng A90 được bán với giá $21 và phải đạt chỉ số octane tối thiểu là 90. Mỗi
thùng xăng A97 được bán với giá $25 và phải có chỉ số octane tối thiểu là 97. Mỗi
loại xăng này được sản xuất bằng cách trộn ba nguyên liệu sau đây theo các số
lượng khác nhau.
Bảng sau cung cấp các thong tin liên quan đến nguyên liệu phối trộn:

Nguyên liệu
1
2
3

Đơn Giá
($/thùng)
17,25
15,75
17,75

Chỉ số Octane
100
87
110

Số thùng sẵn có
(1000 thùng)
150


350
300

Riverside có các đơn đặt hàng cho 300.000 thùng xăng A90 và 450.000 thùng A97.
Công ty nên phân bổ các nguyên liệu sẵn có của mình như thế nào để sản xuất hai
loại xăng A90 và A97 nếu nó muốn tối đa hoá lợi nhuận?
1. Hãy xây dựng một mô hình LP cho bài toán này
2. Tạo một mô hình trên bảng tính cho bài toán này và giải nó bằng Solver
3. Phương án tối ưu của bài toán là gì?
4. Có các phương án thay thế cho bài toán này không?
5. Chỉ số octane cao nhất có thể được cho xăng thường A90 là bao nhiêu, biết rằng
công ty này muốn tối đa hoá lợi nhuận. Trong trường hợp này chỉ số octane của
xăng cao cấp A97 là bao nhiêu?
6. Chỉ số octane cao nhất có thể được cho xăng cao cấp A97 là bao nhiêu, biết rằng
công ty này muốn tối đa hoá lợi nhuận. Trong trường hợp này chỉ số octane của
xăng thường A90 là bao nhiêu?

1


7. Với hai phương án tối ưu đã được xác định trong câu (5) và (6), bạn sẽ đề nghị
công ty thực hiện phương án nào? Tại sao?
8. Nếu công ty có thể mua them 150 thùng nguyên liệu 2, với mức giá là $17/thùng.
Học nên mua không, tại sao?
CÂU 3: PHÂN TÍCH HỒI QUY (Regression Analysis)
Roger Gallagher sở hữu một salon ô tô cũ chuyên về mẫu xe thể thao Corvettes. Anh
ta muốn xây dựng một mô hình hồi quy giúp dự đoán về giá bán của các chiếc xe
anh ta sở hữu. Anh ấy thu thập dữ liệu về các chiếc xe và trình bày nó trong Bảng
Dat9-8.xls. Dữ liệu bao gồm: số mile mà chiếc xe đã đi (mileage), năm SX (model
year), có hay không có T-top trên xe (T-top), và giá bán của một số chiếc xe mà anh

ấy đã bán trong những tháng gần đây. Hãy đặt Y là giá bán của chiếc xe, X1 là số
mile chiếc xe đã đi, X2 là năm SX, và X3 là sự hiện diện của T-top trên chiếc xe
(1=có, 0=không).
1- Nếu Roger muốn sử dụng một hàm hồi quy tuyến tính đơn giản để ước lượng giá
bán của một chiếc xe, biến X nào bạn đề nghị Roger nên sử dụng? Giải thích tại sao,
và nêu kỳ vọng về dấu của các hệ số ước lượng.
2- Hãy ước lượng các tham số trong hàm hồi quy sau:
Yi^ = b0 + b1X1 i + b2 X2 i (MH1)
Hàm hồi quy ước lượng là gì? Biến X2 có giải thích giá bán của xe không nếu X1
cũng có trong mô hình? Lý do có thể có của vấn đề này là gì?
3- Thiết lập biến nhị phân (dummy) (X3) cho biết chiếc xe có hay không có T-top. Hãy
ước lượng các tham số của mô hình:
Yi^ = b0 + b1X1 i + b3 X3 i (MH2)
Biến X3 có giúp giải thích cho giá bán của một chiếc xe không nếu X1 cũng có
trong mô hình? Giải thích.
4- Theo mô hình trên, trung bình một bộ kit T-top làm tăng thêm giá trị của chiếc xe
bao nhiêu?
5- Hãy ước lượng các tham số của mô hình sau:
Yi^ = b0 + b1X1 i + b2 X2 i + b3X3i

(MH3)

Viết phương trình hàm hồi quy trên.
6- Trong số tất cả các hàm hồi quy trên, bạn đề nghị Roger nên sử dụng hàm nào?

2


7- Vẽ đồ thị Scatter Plot của Y lần lượt với các biến X1 và X2.
8- Dựa vào các đồ thị phân bố rãi trên, hãy nhận xét về mối quan hệ giữa Y với X1 và

X2, tuyến tính hay không tuyến tính.
9- Hãy ước lượng mô hình sau:
Yi^ = Yi^ = b0 + b1X1 i + b2 X2 i + b3X3i + b4 X4 i

(MH4)

Trong đó X4i = X2i2.
Viết phương trình đường hồi quy cho mô hình này.
10- Hãy xem xét p-value cho mỗi bi trong (MH4). Các giá trị này có chỉ ra biến độc lập
nào nên được loại bỏ ra khỏi mô hình không?

Nội dung bài làm:
CÂU 1: TỐI ƯU TUYẾN TÍNH (LP)
1. Giới thiệu:

Lập trình tuyến tính (LP, hay tối ưu tuyến tính) là một phương pháp toán học để xác
định cách đạt được một kết quả tốt nhất (như tối đa lợi nhuận hay chi phí thấp nhất)
bằng một mô hình toán học được đưa ra từ một số yêu cầu được thể hiện dưới dạng
những mối quan hệ tuyến tính. Lập trình tuyến tính là một trường hợp cụ thể của lập
trình toán học (sự tối ưu toán học).
Nói một cách chính thức hơn, lập trình tuyến tính là một kỹ thuật cho việc tối ưu hóa
của một hàm số tuyến tính có mục tiêu, mục tiêu cho đẳng thức tuyến tính và bất
đẳng thức tuyến tính. Vùng khả thi của nó là một đa giác lồi, nó được định nghĩa
như sự giao nhau của nhiều nữa khoảng cách có giới hạn, mỗi sự giao nhau đó được
định nghĩa như một bất phuong trình tuyến tính. Hàm số mục tiêu là một hàm số mô
phỏng giá trị thực được định nghĩa dựa trên đa giác này. Thuật toán lập trình tuyến
tính xác định một điểm trong đa giác lồi nơi mà hàm số này có giá trị nhỏ nhất (hay
lớn nhất) khi có nhiều điểm cùng tồn tại.
Lập trình tuyến tính là những bài toán có thể được biểu hiện dưới dạng công thức
kinh điển:


3


Trong đó X đại diện cho vector của các biến (được xác định), c và b là nhữnng
vector hệ số (được biết đến), A là một ma trận (được biết đến) của các hệ số, và là
ma trận chuyển vị. Các biểu hiện được tối đa hóa hay giảm thiểu được gọi là hàm
mục tiêu (cTx trong trường hợp này). Sự bất bình đẳng Ax ≤ b là những khó khăn
trong đó xác định một hàm mục tiêu lồi nhiều vùng là để được tối ưu hóa. Trong nội
dung này, có thể so sánh hai vector khi chúng cùng kích thước. Nếu tất cả các mục
tiêu trong lần đầu tiên là ít hơn hoặc bằng các mục tiêu tương ứng trong lần thứ hai
sau đó, chúng ta có thể nói rằng các vector đầu tiên là ít hơn hoặc bằng các vector
đầu tiên.
Lập trình tuyến tính có thể được áp dụng cho các lĩnh vực nghiên cứu. Nó được sử
dụng trong kinh doanh và kinh tế, nhưng cũng có thể được sử dụng trong một số
lĩnh vực kỹ thuật. Các ngành công nghiệp sử dụng các mô hình lập trình tuyến tính
bao gồm giao thông vận tải, năng lượng, viễn thông và sản xuất. Nó đã chứng tỏ
được tính hữu ích trong việc mô hình hóa trong việc lập kế hoạch, lập tuyến, lập lịch
trình, phân công và thiết kế.
2. Áp dụng cho việc giải quyết vấn đề:
2.1. Đặt các ẩn số:
Nguyên liệu được sử dụng để sản xuất A90: A, B, C
Nguyên liệu được sử dụng để sản xuất A97: X, Y, Z
2.2. Hàm mục tiêu
Để tối đa hóa lợi nhuận, chúng ta cần tối thiểu hóa chi phí khi chúng ta trộn các
nguyên liệu để sản xuất ra những sản phẩm, nói cách khác, hàm mục tiêu là:
Min: 17.25 (A+ X) + 15.75 (B+ Y) + 17.75 (C+ Z)
2.3. Các điều kiện khống chế như là một hệ thống bất đẳng thức:
a.. Ràng buộc về nguồn lực
Nguyên liệu mà chúng ta sẽ sử dụng cho sản xuất ra sản phẩm cho mỗi loại không

nhiều hơn nguyên liệu sẳn có
Cho chỉ số Octane 100: A+X <= 150 (1)
4


Cho chỉ số Octane 87: B+Y <= 350 (2)
Cho chỉ số Octane 110: C+Z <= 300 (3)
b. Ràng buộc về nhu cầu kinh doanh
Chúng ta cần sản xuất số lượng đủ để cung cấp cho nhu cầu kinh doanh, do đó,
chúng ta có những hạn chế như bên dưới:
Cho A90: A+B+C = 300.000 (4)
Cho A97: X+Y+Z = 400.000 (5)
c. Ràng buộc kỹ thuật
Việc trộn ba loại nguyên liệu nên thỏa yêu cầu về kỹ thuật, sau đó chúng ta có
(100A+87B+110C) /( A+B+C) >= 90
Khi chúng ta có hạn chế thứ 4 100A+87B+110C > = 27. 000.000
(100X+87Y+110Z)/(X+Y+Z) >= 97
Khi chúng ta có hạn chế thứ 5 100X+87Y+110Z > = 38.800.000
d. Sau đó có những ràng buộc A, B, C, X, Y, Z > 0
2.4. Áp dụng những thông tin này vào những công cụ Solver như dưới đây
a. Thiết lập hàm mục tiêu trong Excel
Ro
ws

Column B

Col
C

4 Petrol with octane e 100

5 Petrol with octane e 87
6 Petrol with octane e 110

Column D
A90

Column E
Column F Column G
A97
Cost
Total cost
0
150000
$17.25
260869.565 89130.4348
$15.75
39130.434
8 210869.565
$17.75 $12,537,500.00

 Hàm mục tiêu sẽ là: =(D4+E4)*F4+(D5+E5)*F5+(D6+E6)*F6
b. Thiết lập các ràng buộc
Những ràng buộc đã được thiết lập trong công cụ Solver như bên dưới
Row

10
11
12
13
14

15
16

Column B

Constraints
* Resource
Petrol with octane e 100
Petrol with octane e 87
Petrol with octane e 110
* Demand
Barrel of A90
Barrel of A97

Col C

Column D

100
87
110

Column E

Column F

Column G

Usage
Available

150000
150000
350000
350000
250000
300000
300000
450000

300000
450000

5


17
18
19
20
21
22
23
24
25
26
27
28
29

* Octane e e number

A90
A97
* None negative
A
B
C
X
Y
Z
Available
Needed

300000
300000

90
102.111111

90
97

0
260869.565
39130.4348
150000
89130.4348
210869.565

0
0

0
0
0
0

450000
450000

2.5
. Kết quả khi chúng ta chạy Solver, sau đó chúng ta có hai báo cáo như
sau:
a. Báo cáo trả lời (kết quả):
Objective Cell (Min)
Cell

Name
Petrol with octane 110
$F$5 Total cost
Variable Cells
Cell

Name

Original
Value
$12,537,50
0.00

Final Value
$12,537,50

0.00

Original
Value

Final Value

Integer

6


$C$ Petrol with octane 100
3
A90: A
$D$ Petrol with octane 100
3
A97: X
$C$ Petrol with octane 87
4
A90: B
$D$ Petrol with octane 87
4
A97: Y
$C$ Petrol with octane 110
5
A90: C
$D$ Petrol with octane 110
5
A97: Z

Constraints
Cell
Name
$E$ Petrol with octane 87
10
Usage
$E$
16
A90 Usage
$E$1 Petrol with octane 110
1
Usage
$E$
21
C Usage
$E$
19
A Usage
$E$
20
B Usage
$E$
14
Barrel of A97 Usage
$E$
22
X Usage
$E$
23
Y Usage

$E$
17
A97 Usage
$E$
24
Z Usage
$E$
13
Barrel of A90 Usage
$E$ Petrol with octane 100
9
Usage

69230.7692
3
80769.2307
7
230769.230
8
119230.769
2

150000 Contin
0 Contin
150000 Contin
200000 Contin

0

0 Contin


250000

250000 Contin

Cell Value
350000
93.5
250000
0
150000
150000
450000
0
200000
99.7777777
8
250000
300000
150000

Formula
$E$10<=$F
$10
$E$16>=$F
$16
$E$11<=$F
$11
$E$21>=$F
$21

$E$19>=$F
$19
$E$20>=$F
$20
$E$14>=$F
$14
$E$22>=$F
$22
$E$23>=$F
$23
$E$17>=$F
$17
$E$24>=$F
$24
$E$13>=$F
$13
$E$9<=$F$
9

Status
Binding
Not
Binding
Not
Binding

Slack
0
3.5
50000


Binding
Not
Binding
Not
Binding

0
150000

Binding

0

Binding
Not
Binding
Not
Binding
Not
Binding

0
200000
2.777777
778

Binding

0


Binding

0

150000

250000

 Các giải pháp tối ưu để có LP có giá trị 12.537.500 Usd. Sau đó chúng ta có
thể nhìn vào bảng variables cell để thấy giá trị A, B, C, X, Y, Z và những ràng
buộc và không ràng buộc trong bản Constraints Cell
b. Báo cáo về độ nhạy
Variable
Cells
Cell

Name

Final
Valu

Reduc
ed
Cost

Objecti
ve
Coeffici


Allowabl
e
Increase

Allowabl
e
Decreas

7


$C$3
$D$3
$C$4
$D$4
$C$5
$D$5

e
1500
00

Petrol with octane e
100 A90: A
Petrol with octane e
100 A97: X
Petrol with octane e 87
A90: B
Petrol with octane e 87
A97: Y

Petrol with octane e
110 A90: C
Petrol with octane e
110 A97: Z

ent

e

0

17.25

0
1500
00
2000
00

0

17.25

0

15.75

0

15.75


0
2500
00

0

17.75

0

17.75

4.44089E
-16
1E+30
8.88178E
-16
4.44089E
-16
1E+30
8.88178E
-16

1E+30
4.44089E
-16
4.44089E
-16
8.88178E

-16
8.88178E
-16
0.5

Constraints

Cell
$E$
10
$E$
14
$E$
16
$E$
11
$E$
9
$E$
17
$E$
20
$E$
19
$E$
21
$E$
23
$E$
22

$E$
13
$E$
24

Constr
aint
R.H.
Side

Allowabl
e

Allowabl
e
Decreas
e

Final

Shadow

Name
Petrol with octane e e
87 Usage

Value

Price


350000

-2

350000

Increase
54347.82
609

Barrel of A97 Usage

450000

17.75

450000

50000

50000
11363.63
636

A90 Usage
Petrol with octane e
110 Usage
Petrol with octane e
100 Usage


93.5

0

90

3.5

1E+30

250000

0

300000

50000

150000
99.77777
778

-0.5

150000

0

97


1E+30
54347.82
609
2.777777
778

1E+30

B Usage

150000

0

0

150000

1E+30

A Usage

150000

0

C Usage

0


0
8.88178
E-16

150000
54347.82
609

1E+30
45652.17
391

Y Usage

200000

0

X Usage

0

0
4.44089
E-16

0

200000
80769.23

077

Barrel of A90 Usage

300000

17.75

300000

50000

1E+30
96153.84
615
12068.96
552

Z Usage

250000

0

0

250000

1E+30


A97 Usage

0

50000

Báo cáo về độ nhạy cung cấp cho chúng ta những thông tin liên quan đến
* Thay đổi hàm mục tiêu cho một biến
Để minh họa điều này, giả sử chúng ta thay đổi hàm hệ số A, B, Y, Z trong hàm mục
tiêu. Giải pháp tối ưu trong LP sẽ thay đổi như thế nào?

8


Giá trị giải pháp hiện tại cho A là 150.000 trong ô C3 và hệ số hàm mục tiêu cho A
là 17.25. Cột tăng/ giảm cho phép chúng ta biết điều đó, với hệ số A trong hàm mục
tiêu nằm giữa 17.25 + 0 = 17.25 và không có giới hạn cho giảm, giá trị của các biến
trong giải pháp tối ưu LP sẽ không thay đổi. Có thể rút ra các kết luận tương tự về B,
Y, và Z.
* Thay đổi phía bên tay phải của một ràng buộc
Để hạn chế cột đầu Shadow Price cho chúng ta biết chính xác hàm mục tiêu sẽ thay
đổi như thế nào nếu chúng ta thay đổi phía bên phải của các ràng buột tương ứng
trong những giới hạn cho phép được đưa ra trong cột Tăng/ Giảm cho phép
Ví dụ cho các Barrel A97, cách sử dụng ràng buột ở $E$1, cung cấp bên tay phải
của ràng buộc đó vẫn còn giữa 450.000 + 50.000 = 500.000 và 450.000 - 11.363,64
= 438.636,36, sự thay đổi hàm mục tiêu sẽ chính xác 17.75 [sự thay đổi bên tay phải
từ 450.000]
CÂU 3:
1. Nếu Roger muốn sử dụng một hàm hồi quy tuyến tính đơn giản để ước lượng
giá bán của một chiếc xe, biến X nào bạn đề nghị Roger nên sử dụng? Giải

thích tại sao, và nêu kỳ vọng về dấu của các hệ số ước lượng.
- Xét trên góc độ tuổi thọ (khả năng sử dụng) còn lại của xe, chúng ta thấy rõ là biến
X1 (quãng đường đã chạy, có thể được hiểu như thời gian đã sử dụng thực tế) là
biến ảnh hưởng lớn nhất tới giá bán của xe, bởi vì xét về mặt công năng, chiếc xe
được mua để chạy, mà khả năng chạy của nó phụ thuộc vào độ bền còn lại của các
chi tiết máy hay toàn bộ chiếc xe (một cách tổng thể). Độ bền này lại được tính bằng
thời gian sử dụng và về mặt lý thuyết có thể coi là cố định đối với mỗi loại vật liệu
được sử dụng và công nghệ, kỹ thuật chế tạo ra chúng. Cho nên, một khi đã được
chạy (sử dụng thực tế) cang nhiều bao nhiêu thì thời gian còn lại để có thể sử dụng
chúng còn ít bấy nhiêu, cho nên giá trị của chúng – và từ đó là giá trị cả chiếc xe –
sẽ giảm dần theo thời gian sử dụng thực tế.
- Biến X2 (năm sản xuất) lại có chiều ảnh hưởng ngược lại và cũng thể hiện mối
tương quan nhất định so với biến X1 nói trên: xe càng mới (X2 càng lớn) thì khả
năng thời gian đã sử dụng của nó càng ít (trong điều kiện cường độ sử dụng xe
không thay đổi), cho nên xe càng mới thì giá càng cao. Tuy nhiên, trên thực tế, mức

9


độ sử dụng xe hoàn toàn tùy thuộc vào mỗi chủ sử dụng, nên năm sản xuất không
phản ánh được chính xác mức độ đã sử dụng của xe do đó, sẽ không thuyết phục nếu
chỉ sử dụng một yếu tố (biến) này để xác định giá bán xe. Hơn nữa, năm sản xuất
còn liên quan tới dòng xe với các ứng dụng khác nhau về công nghệ, kỹ thuật, kiểu
dáng thiết kế, v.v…, do đó “biến” X2 (năm sản xuất) về thực chất lại bao hàm nhiều
biến khác có ảnh hưởng tới giá xe. Chính vì vậy mà nếu cần lựa chọn 1 biến thì việc
sử dụng biến X1 sẽ thuyết phục hơn
- Với biến X3 (mối tương quan của các trang bị phụ trợ T-top lên giá xe), về nguyên
tắc, sự ảnh hưởng của biến này lên xe là có, nhưng xét trên tổng thể về giá trị của
một chiếc xe, như một phương tiện giao thông, thì mức độ ảnh hưởng của T-top lên
giá bán của xe sẽ phải thấp hơn so với mức độ ảnh hưởng của biến phản ánh khả

năng sử dụng còn lại của xe (X1).
- Bên cạnh đó, dựa vào số liệu thống kê, ta có thể xây dựng đồ thị Scatter của giá xe
(Y) theo số dặm đã chạy (X1) và năm sản xuất (X2) như sau:

Nhìn vào đổ thị, ta có thể dự đoán sự phụ thuộc của Y theo X1 và Y theo X2 đều
có dạng tuyến tính – trong đó, khi X1 tăng thì Y giảm và khi X2 tăng thì Y tăng.

10


Tóm lại, dựa trên những phân tích trên, kết hợp với biểu đồ kèm theo, chúng tôi
sẽ đề nghị Roger sử dụng biến X1.
Hệ số ước lượng của b1 sẽ là âm, do khi X1 tăng thì Y (giá) sẽ giảm
Hệ số ước lượng của b2 là dương, do khi X2 tăng thì Y tăng
 Kiểm chứng bằng cách lập mô hình của Y theo X1 và Y theo X2:
* Mô hình của Y theo X1:
Y ^ = bo+b1 X1
Xác định bo, b1, kỳ vọng b1 <0 vì đối với xe cũ, xe càng sử dụng nhiều (X1 lớn) thì
giá bán càng thấp. Nhìn đồ thị thì đường thẳng có dạng dốc xuống, cũng chứng tỏ hệ
số góc <0.
Dùng phương pháp phân tích Regression cho ra kết quả như sau:
Regression Statistics
Multiple R
0.917906217
R Square
0.842551823
Adjusted R Square
0.828238352
Standard Error
2696.148841

Observations
13

Intercept
X Variable 1

Coefficients
Standard Error
30237.23544
1886.846913
-178.8654873
23.31313696

t Stat
16.02527223
-7.672304571

P-value
5.67E-09
9.7E-06

Từ kết quả trên cho thấy:
bo = 30237.23544, giá trị tuyệt đối của t Stat >2 nên hệ số bo có ý nghĩa và được
chấp nhận trong mô hình
b1 = -178.8654873 giá trị tuyệt đối của t Stat >2 nên hệ số b1 có ý nghĩa và được
chấp nhận trong mô hình
Vậy phương trình hồi quy: MH (x1): Yt = b0 + b1x1
Yt

=

R=

30237.23544
16.02527223
0.842551823

+
R2=

-178.865
-7.6723
0.828238

X1

* Mô hình của Y theo X2:
Y ^ = bo+b2 X2
Xác định bo, b2, kỳ vọng b2>0 vì đối với xe, năm sản xuất càng gần hiện tại thì xe
càng giá trị, giá bán sẽ tăng. Trên đồ thị thì đường thẳng có dạng đi lên, cũng chứng
tỏ hệ số góc >0.
Dùng phương pháp phân tích Regression cho ra kết quả như sau:

11


Regression Statistics
Multiple R
0.840679
R Square
0.706741

Adjusted R Square
0.680081
Standard Error
3679.604
Observations
13

Intercept
X Variable 1

Coefficients
-1430812
731.3331

Standard Error
281189.2
142.0414

t Stat
-5.08843
5.148732

P-value
0.00035
0.000319

Từ kết quả trên cho thấy:
bo = -1430812, giá trị tuyệt đối của t Stat >2 nên hệ số bo có ý nghĩa và được chấp
nhận trong mô hình
b2 = 731.3331giá trị tuyệt đối của t Stat >2 nên hệ số b2 có ý nghĩa và được chấp

nhận trong mô hình
Vậy phương trình hồi quy: MH (x2): Yt = b0 + b1x2

Yt =
R=

-1430812
-5.08843
0.706741

+
R2=

731.3331
5.148732
0.680081

X1

* Lựa chọn giữa 2 mô hình
So sánh R2 (X1) = 0.842551823 > R2 (X2) = 0.706741. Chứng tỏ biến X1 có ảnh
hưởng lớn hơn và giá bán Y theo X1 của mô hình ít khác biệt với giá trị thống kê
hơn, nên sẽ chọn biến X1 để ước lượng giá bán.
2. Hãy ước lượng các tham số trong hàm hồi quy sau:
Yi^ = b0 + b1X1i + b2 X2i
(MH1)
Hàm hồi quy ước lượng là gì?
Biến X2 có giải thích giá bán của xe không nếu X1 cũng có trong mô hình? Lý do
có thể có của vấn đề này là gì?
Việc ước lượng các tham số của hàm hồi qui đã được thực hiện ở trên (kỳ vọng b1

<0 và b2>0)
Regression Statistics
Multiple R
0.920033287
R Square
0.84646125
Adjusted R Square
0.8157535
Standard Error
2792.417738
Observations
13

12


Coefficients
-201829.3496
-155.8233362
116.3631975

Intercept
X Variable 1
X Variable 2

Standard Error
459905.8832
51.65484743
230.6046602


t Stat
-0.43885
-3.01663
0.5046

P-value
0.670101
0.01297
0.624772

Từ kết quả trên cho thấy:
bo = -201829.3496, giá trị tuyệt đối của t Stat <2 nên hệ số bo không có ý nghĩa và
không được chấp nhận trong mô hình
b1 = -155.8233362 giá trị tuyệt đối của t Stat >2 nên hệ số b1 có ý nghĩa và được
chấp nhận trong mô hình
b2 = 116.3631975, giá trị tuyệt đối của t Stat <2 nên hệ số b2 không có ý nghĩa và
không được chấp nhận trong mô hình
Vậy phương trình hồi quy: MH (x1.x2): Yt = b0 + b1X1+b2X2
Yt

=
R=

-155.823
-3.01663
0.846461

X1
R2 =


0.815753

Điều đó có nghĩa là X2 không tham gia vào giá bán của xe nếu đã có X1 trong
mô hình. Lý do là X1 - tức là số mile đã đi - là yếu tố quan trọng nhất quyết định
giá của xe cũ, mà không cần so sánh thêm xe sản xuất năm nào. Điều này cũng phù
hợp thực tế vì nếu xe đời mới nhưng đi quá nhiều thì xe vẫn hao mòn nhiều và sẽ có
giá thấp hơn chiếc xe đời cũ hơn nhưng đi ít, ít hao mòn.
3. Thiết lập biến nhị phân (dummy) (X3) cho biết chiếc xe có hay không có T-top.
Hãy ước lượng các tham số của mô hình:
Yi^ = b0 + b1X1 i + b3 X3 i(MH2)
Biến X3 có giúp giải thích cho giá bán của một chiếc xe không nếu X1 cũng có
trong mô hình? Giải thích.
Xác định bo, b1, b3 bằng Regression, kỳ vọng b1 <0 và b3>0.
Regression Statistics
Multiple R
0.946643
R Square
0.896134
Adjusted R Square
0.875361
Standard Error
2296.722
Observations
13

Intercept
X Variable 1
X Variable 2

Coefficients

28770.2
-177.162
2904.274

Standard Error
1732.24
19.87352
1278.689

t Stat
16.60866
-8.91446
2.27129

P-value
1.31E-08
4.51E-06
0.046469

T Stat của các hệ số bo, b1, b3 đều >2, nên chấp nhận tất cả các hệ số trong mô hình.
13


Vậy phương trình hồi quy: MH (x1.x3): Yt = b0 + b1X1+b3X3
Yt

=

28770.2
16.60866


+

R=

0.896134

R2=

-177.162
-8.91446
0.87536
1

X1

+

2904.274
2.27129

X3

X3 làm tăng thêm giá bán của xe, có T-Top nghĩa là thêm tính năng cho xe nên sẽ
tăng giá trị hơn, trong điều kiện xe đã qua sử dụng ở 1 mức độ như nhau.
4. Theo mô hình trên, trung bình một bộ kit T-top làm tăng thêm giá trị của chiếc
xe bao nhiêu?
Trung bình, 1 bô T-top làm tăng thêm 2904.274 đơn vị theo mô hình MH2
5. Hãy ước lượng các tham số của mô hình sau:
Yi^ = b0 + b1X1 i + b2 X2 i + b3X3i

(MH3)
Viết phương trình hàm hồi quy trên.
-

Ước lượng các tham số của mô hình
Y^ = bo + b1 X1+ b2X2 + b3X3
(MH3)
Xác định bo, b1, b2, b3 bằng Regression, kỳ vọng b1 <0 và b2, b3>0.
Regression Statistics
Multiple R
0.950623
R Square
0.903684
Adjusted R Square
0.871579
Standard Error
2331.302
Observations
13

Intercept
X Variable 1
X Variable 2
X Variable 3

Coefficients
-295530.694
-144.9008067
162.582803
3017.461022


Standard Error
386093.3753
43.38293118
193.5594184
1304.918045

t Stat
-0.76544
-3.34004
0.839963
2.312376

P-value
0.46361
0.00866
0.422681
0.046057

Nhận thấy điều kiện t Stat > 2 chỉ được đáp ứng bởi b1, b3 còn b0 và b2 không đáp
ứng, nên chỉ có b1, b3 có ý nghĩa và được chấp nhận trong mô hình.
Vậy phương trình hồi quy: MH (x1.x2): Yt = b0 + b1X1+b2X2
Yt

=
R=

-295531 +
-0.76544
0.903684 R2=


-144.901 X1
-3.34004
0.871579

+ 162.5828 X2 +
0.839963

3017.461 x3
2.312376

6. Trong số tất cả các hàm hồi quy trên, bạn đề nghị Roger nên sử dụng hàm nào?
So sánh các mô hình dựa trên các thông số thống kê T stat, R2, R2-adj để lựa chọn:

14


MH
X1
X2

X1,X2

bi

R2

R2-adj
0.828238


b0

30237.235

t stat b0

16.02527

0.842552

b1

-178.8655

t stat b1

-7.6723

0.828238

b0

-1430812

t stat b0

-5.08843

0.706741


b2

731.3331

t stat b1

5.148732

0.680081

b0

-201829.3

t stat b0

-0.43885

0.706741

b1

-155.8233

t stat b1

-3.01663

0.815753


b2

116.3632

t stat b2

0.5046

b0

28770.199

t stat b0

16.60866

0.896134

b1

-177.1617

t stat b1

-8.91446

0.875361

2904.2739


t stat b2

2.27129

b0

-295530.7

t stat b0

-0.76544

0.903684

b1

-144.9008

t stat b1

-3.34004

0.871579

b2

162.5828

t stat b2


0.839963

b3

3017.461

t stat b3

2.312376

X1,X3

X1,X2,X3

t stat bi

0.680081
0.815753

0.875361

0.871579

Ta thấy mô hình 3 (x1 x2 x3) chỉ có 2 bi (trong số 4 bi) có ý nghĩa và được chấp
nhận trong mô hình nên ta không chọn.
Xét 3 mô hình (X1), mô hình (X2), mô hình 2 (x1, x3) các hệ số bi đều có nghĩa (T
stat > 2). Riêng mô hình 2 (x1,x3) có R2, R2-adj tăng và lớn hơn so với 2 mô hình
còn lại nên sẽ chọn mô hình này (x1, x3).
7. Vẽ đồ thị Scatter của Y lần lượt với X1, X2 Đồ thị scatter của Y theo X1:
Đồ thị scatter của Y theo X1:


Đồ thị scatter của Y theo X2:

15


8- Dựa vào các đồ thị phân bố rãi trên, hãy nhận xét về mối quan hệ giữa Y với X1

và X2, tuyến tính hay không tuyến tính.
Based on the above charts, please comment on the relationships between Y and
X1 and X2, linear or non-linear?
Nhìn vào đổ thị, Y được dự đoán là phụ thuộc tuyến tính với X1 và X2. Trong đó, Y
sẽ giảm khi X1 tăng và Y tăng khi X2 tăng.
 Kiểm tra nhận định bằng cách dùng công cụ Regression
Mô hình của Y theo X1: Y ^ = bo+b1 X1
- Xác định bo, b1, kỳ vọng b1 <0 vì đối với xe cũ, xe càng sử dụng nhiều (X1 càng
lớn) thì giá bán càng thấp. Nhìn đồ thị thì đường thẳng có dạng dốc xuống, cũng
chứng tỏ hệ số góc <0.
- Phương trình hồi quy: MH (x1): Yt = b0 + b1x1
Yt = 30237.23544 + -178.865X1
16.02527223 - 7.6723
R = 0.842551823; R2 = 0.828238

-

Mô hình của Y theo X2: Y ^ = bo+b2 X2
Xác định bo, b2, kỳ vọng b2>0 vì đối với xe, năm sản xuất càng lớn thì xe càng mới
và giá bán càn cao. Trên đồ thị, đường thẳng có hướng đi lên, chứng tỏ hệ số góc >0.
Phương trình hồi quy MH (x2): Yt = b0 + b2x2
Yt = -1430812 +

731.3331X1
-5.08843
5.148732
R = 0.706741; R2 = 0.680081

9- Hãy ước lượng mô hình sau:
16


Yi^ = Yi^ = b0 + b1X1 i + b2 X2 i + b3X3i + b4 X4 i
Trong đó X4i = X2i2.
Viết phương trình đường hồi quy cho mô hình này.

(MH4)

Xác định bo, b1, b2, b3, b4 bằng Regression, kỳ vọng b1 <0 và b2, b3, b4 >0.
Regression Statistics
Multiple R
0.987579068
R Square
0.975312416
Adjusted R Square 0.962968624
Standard Error
1251.888606
Observations
13

Intercept
X Variable 1
X Variable 2

X Variable 3
X Variable 4

Coefficients
Standard Error
t Stat
155680168.5
32375649.5 4.808557
-107.0932306
24.58248318 -4.35649
-157574.1811
32740.68479 -4.81279
2452.087517
710.487867 3.451273
39.87821398
8.27729327 4.817784

P-value
0.001341
0.002424
0.001334
0.008679
0.001325

Kết quả cho thấy các hệ số bi đều có nghĩa do t Stat >2.
Vậy phương trình hồi quy: MH (x1.x2): Yt = b0 + b1X1+b2X2 +b3X3 + b4 X4

Yt

=

R=

15568016
8
4.8085574
0.9753124

+
R2=

-107
-4.36
0.963

X1

+

-157574
-4.81279

X2

+

2452.088
3.451273

X3


+

39.87821398
4.81778435

10- Hãy xem xét p-value cho mỗi bi trong (MH4). Các giá trị này có chỉ ra biến độc
lập nào nên được loại bỏ ra khỏi mô hình không?
Phân tích Regression của Excel là kiểm định 2 đuôi. Giá trị P-value của mỗi bi chỉ
có ý nghĩa khi P-value < α/2 = 0.025. P-value bi của MH4 đều thỏa mãn điều kiện
này nên không có biến nào nên loại bỏ khỏi mô hình. Kết quả này cũng phù hợp với
điều kiện T-Stat.
2. />
17

X4



×