Tải bản đầy đủ (.pdf) (20 trang)

TIỂU LUẬN môn THỐNG kê ỨNG DỤNG CASE 4 FINDING THE BEST CAR VALUE

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.22 MB, 20 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÍ

-------o0o-------

TIỂU LUẬN MƠN :
THỐNG KÊ ỨNG DỤNG

CASE 4: FINDING THE BEST CAR VALUE
Giáo viên hướng dẫn: Hà Thị Thư Trang
Nhóm 12:
HA và tên

MSSV

Hà Nơi,Dtháng 1 năm 2022


LỜI CẢM ƠN
Bản tiu luâ n được hoàn thành trên cơ sở đóng góp của các thành viên với vốn
kiến thức được đúc kết ra từ quá trình học và nghiên cứu môn Thống Kê -ng
D/ng. Đây cũng là một cơ hội thực hành khiến chúng em có th hiu rõ hơn về các
phân tích và kim định đặc trưng có liên quan, áp d/ng kiến thức trên giảng đường
đ làm quen và rút ra được nhưng kết luận bổ ích về những hiện tượng trong những
mối tương quan khác nhau và sự ảnh hưởng lẫn nhau giữa các nhân tố. Chúng em
xin gửi lời cảm ơn sâu sắc tới cô Hà Thị Thư Trang, Viện Kinh tế và Quản lý,
Trường Đại học Bách khoa Hà Nội đã đồng hành cùng chúng em suốt quá trình
nghiên cứu và học tập, cảm ơn cơ đã tận tình giảng dạy và truyền th/ kiến thức,
kinh nghiệm cũng như phong cách trình bày, đ chúng em có thêm những bài học
quý báu.
Do vốn kiến thức và kĩ năng còn hạn chế nên chắc hẳn bài tiu ln này khơng th


tránh khỏi sai sót, chúng em rất mong nhận được sự góp ý động viên của cơ đ
chúng em có th hồn thiện hơn, áp d/ng tốt hơn trong các công việc sau này.
Chúng em xin chân thành cảm ơn Cô.

H Nô i, ngày 13/01/2022
Nhóm thực hiê n

2


MỤC LỤC
L^I C`M ƠN..............................................................................................................2
ĐcNG GcP CfA ChC THiNH VIÊN.....................................................................3
I. ĐĂT
 VlN ĐÊ..........................................................................................................5
1. Đề bài...................................................................................................................5
2. Xây dựng mơ hình................................................................................................6
II. PHÂN TrCH...........................................................................................................8
1. Thống kê mơ tả các biến.......................................................................................8
1.1 Tóm tắt dữ liêu................................................................................................8

1.2 Bảng tần số và đồ thị của dữ liệu....................................................................8
2. Phân tích theo các câu hỏi được gợi ý trong Case-Problems.............................13
2.1 Giá ( Price)....................................................................................................13
2.2 Chi Phí Năm Năm Của Chủ Sở Hữu ( Cost/Mile ).......................................14
2.3 Đim Kim Tra Đương Bô  ( Road-Test Score )............................................14
2.4 Dự Đốn Đơ  Tin Câ y ( Predicted Reliability )..............................................16
3. Kết luâ n dựa trên các phân tích trên...................................................................16
4. Ước lượng mơ hình hồi quy bơ i.........................................................................17
4.1. Giải thích hàm hồi quy mẫu nhận được :.....................................................17

4.2 Kim định sự phù hợp của mơ hình..............................................................18
III. K~T LUÂN.........................................................................................................21

3


I. ĐĂDT VJN ĐÊ
1. ĐL bài
Khi quyết định mua mô t chiếc xe nào đó, giá trị thực khơng nhất thiết được
xác định bởi số tiền bạn chi cho lần mua ban đầu. Thay vào đó, những chiếc xe đáng
tin câ y và khơng tốn nhiều chi phí đ sở hữu thường đại diên cho những giá trị tốt
nhất. Tuy nhiên cho dù sở hữu môt chiếc ô tô đáng tin cây hay r€ tiền đến đâu nó
cũng phải hoạt đô ng tốt.
Đ đo lường giá trị, Consumer Reports đã phát trin môt hê  thống gọi là đim
giá trị ( Value Score ). Đim giá trị dựa trên chi phí năm năm của chủ sở hữu
( Cost/Mile ), đim kim tra đường bôtổng
th ( Road-Test Score ) và xếp hạng đơ 

tin câ y được dự đốn ( Predicted Reliability ). Chi phí chủ sở hữu trong năm năm
đầu tiên sở hữu, bao gồm khấu hao, nhiên liêu,
 bảo trì và sửa chữa,v.v. Sử d/ng mức
trung bình quốc gia là 12.000 dă m mơ t năm, chi phí trung bình cho m•i dăm
 lái xe
được sử d/ng làm thước đo chi phí của chủ sở hữu trong năm năm. Đim kim tra
đường bô  là kết quả của hơn 50 bài kim tra và đánh giá dựa trên thang đim 100,
với đim số cao hơn cho thấy hiêu suất tốt hơn, sự thoải mái, tiên lợi và tiêt kiêm

nhiên liêu.
 Đim số kim tra đường bô  cao nhất đạt được trong các bài kim tra do
Consumer Reports thực hiên được là 99 đối với Lexus LS 460L. Xếp hạng dự đốn

về đơ  tin câ y (1 = K„m, 2 = Khá, 3 = Tốt, 4 = Rất tốt, 5 = Xuất sắc) dựa trên dữ liêu
từ Khảo sát tự đô ng hàng năm của Consumer Reports.
Mô t chiếc xe có đim giá trị là 1,0 được coi là “giá trị trung bình”. Mơt chiếc
xe có đim giá trị là 2,0 được coi là co giá trị tốt gấp đơi mơt  chiếc xe có đim giá trị
là 1,0; mơt chiếc xe có đim giá trị 0,5 được coi là tốt bˆng mô t nửa so với mức
trung bình; và như thế. Dữ liêu về 20 chiếc sedans gia đình, bao gồm cả giá ($) của
m•i chiếc được kim tra ở bảng dưới đây:
Car

Price ($)

Cost/Mile

RoadTest

Predicted
Reliability

Value
Score
4


Score
Nissan Altima 2.5 S (4-cyl.)
Kia Optima LX (2.4)
Subaru Legacy 2.5i Premium
Ford Fusion Hybrid
Honda Accord LX-P (4-cyl.)
Mazda6 i Sport (4-cyl.)

Hyundai Sonata GLS (2.4)
Ford Fusion SE (4-cyl.)
Chevrolet Malibu LT (4-cyl.)
Kia Optima SX (2.0T)
Ford Fusion SEL (V6)
Nissan Altima 3.5 SR (V6)
Hyundai Sonata Limited (2.0T)
Honda Accord EX-L (V6)
Mazda6 s Grand Touring (V6)
Ford Fusion SEL (V6, AWD)
Subaru Legacy 3.6R Limited
Chevrolet Malibu LTZ (V6)
Chrysler 200 Limited (V6)
Chevrolet Impala LT (3.6)

23,970.00
21,885.00
23,830.00
32,360.00
23,730.00
22,035.00
21,800.00
23,625.00
24,115.00
29,050.00
28,400.00
30,335.00
28,090.00
28,695.00
30,790.00

30,055.00
30,094.00
28,045.00
27,825.00
28,995.00

0.59
0.58
0.59
0.63
0.56
0.58
0.56
0.57
0.57
0.72
0.67
0.69
0.66
0.67
0.74
0.71
0.71
0.67
0.70
0.67

91
81
83

84
80
73
89
76
74
84
80
93
89
90
81
75
88
83
52
63

4
4
4
5
4
4
3
4
3
4
4
4

3
3
4
4
3
3
5
3

1.75
1.73
1.73
1.70
1.62
1.60
1.58
1.55
1.48
1.43
1.42
1.42
1.39
1.36
1.34
1.32
1.29
1.20
1.20
1.05


2. Xây d[ng mô h\nh

 Xác định dạng mơ hình
Đ phân tích những tác động của các nhân tố ảnh hưởng đến đim giá trị của
xe nhóm em đã chọn sử d/ng phân tích hồi quy với mơ hình hồi quy tuyến tính đ
đưa ra những ước lượng và kết luận về biến ph/ thuộc của mô hình.
Các biến được sử d/ng đ đưa vào trong bài là:
Bi^n ph` thcDY
Bi^n đơcDlâpDXi



Value Score
Price

Đơn vị
Đim
Đơ la

Cost/Mile

cost/mile

Road-Test Score

Đim

Predicted Reliability

Mức


Mơ hình hồi quy tổng th mô tả mối quan hệ biến ph/ thuộc Y và các biến
5


độc lập có dạng :
Value Score = β1 + β2 * Price + β3 * Cost/Mile + β4 * Road-Test Score + β5 *
Predicted Reliability + µi
Trong đó :
-

β1: là hệ số chặn.

-

β2, β3, β4, β5: là các hệ số góc tương ứng với các biến độc lập.

-

µi : là sai số ngẫu nhiên.



Kỳ vọng về dấu của các biến độc lập :

-

Theo đề bài đim giá trị không ph/ th
c vào
giá, nhưng theo mong muốn


của khách hàng nói chung kì vọng giá mua xe s— đồng biến với đim giá trị –
dấu (+).

-

Chi phí năm năm của chủ sở hữu càng nhiều thì đim giá trị s— càng nhỏ –
dấu (-).

-

Đim đường bôcàng
cao chứng tỏ chiếc xe càng nhiều giá trị – dấu (+).


-

Mức xếp hạng về đôtin
 cây càng cao xe càng giá trị – dấu (+).

II. PHÂN TÍCH

6


1. Thdng kê mơ tf các bi^n
1.1 Tóm tgt dh liê uD

1.2 Bfng tần sd và đồ thị của dh liệu
1.2.1 Đimm Giá Trị ( Value Score )

Value
tần số tích
score Frequency tần số(%)
lũy(%)
1
0
0%
0%
1,2
3
15%
15%
1,4
5
25%
40%
1,6
7
35%
75%
1,8
5
25%
100%

7


Nhâ n x!t: số đim chủ yếu là 1.4; 1.6; 1.8 những xe được đánh giá hầu hết là có
đi€m trên giá trị trung bình từ khá đến tốt

1.2.2 Giá ( Price )
Price($)
21000
21000-23300
23300-25600
25600-27900
27900-30200
30200-32500

Frequenc
T(n s) t+ch
y
T(n s) (%)
l,y %
0%
0
0.00%
15%
3
15.00%
25%
5
40.00%
5%
1
45.00%
40%
8
85.00%
15%

3
100.00%

Histogram
9

120.00%
8

8

100.00%
100.00%
7
85.00%

Frequency

6

80.00%

5

5

60.00%

4
3


3

45.00%

40.00%

3

2

0

0.00%
0
21000
23300

40.00%
20.00%

1

15.00%

1

Price
Frequency


0.00%
25600

27900

30200

32500

Price($)

Nhâ n x!t: dữ liêu về giá xe tâ p trung ở giữa, giá xe được khảo sát quá cao và quá
thấp không nhiều
1.2.3 Chi Pho Năm Năm Của Chủ Sp Hhu ( Cost/Mile )
Cost/Mile

Frequency
0,55
0,6
0,65
0,7

tần số(%)
0
8
1
7

tần số tích lũy(%)
0%

40%
5%
35%

0%
40%
45%
80%
8


0,75

4

20%

100%

Nhâ n x!t: chi phí năm năm của chủ sở hữu có 0.6 và 0.7 chiếm phần lớn lần lượt là
40% và 35% trong tổng dữ liêu.

1.2.4 Đimm Kimm Tra Đương Bơ
( Road-Test
Score )
D
Road-test Score
50
55
60

65
70
75
80
85
90
95
100

Frequency tần số(%)
tần số tích lũy(%)
0
0%
0%
1
5%
5%
0
0%
5%
1
5%
10%
0
0%
10%
3
15%
25%
3

15%
40%
6
30%
70%
4
20%
90%
2
10%
100%
0
0%
100%

9


Nhâ n x!t: Đim kim tra đường bô  của các xe trong dữ liê u mẫu tâp trung chủ yếu
trên 80 đim là mức đim cao.
1.2.5 Đô D
tin câyDđưrc d[ đốn ( Predicted Reliability )
Predicte
d
reliabilit
y
3
4
5


Frequenc
y
7
11
2

tần số(%)
35%
55%
10%

tần số tích
lũy(%)
35%
90%
100%

Histogra m
12
10
8
6
4
2
0

11
90%

7

35%
3

100%

100%

2
4

5

More
0

120%
100%
80%
60%
40%
20%
0%

Predicted reliability
Frequency

Cumulative %

Nhâ n x!t: Đô  tin cây được dự đoán chủ yếu là Tốt và Rất Tốt.
10



2. Phân toch theo các câu hsi đưrc gri t trong Case-Problems
Sử d/ng phần mềm excel đ ước lượng mô hình hồi quy tuyến tính đơn bˆng
phương pháp OLS, ta có kết quả về sự ph/ th c của biến Value Score với các biến
khác như sau:
2.1 Giá ( Price)

- Có R2 = 0.3277 có nghĩa là biến Price giải thích được 32.77% sự biến động
của biến Value Score.
 Hàm hồi quy mẫu nhân được là:
= 2.3587 - 0.0000334 * Price
- Giải thích : β1 = -0.0000334 cho biết khi giá xe tăng 1$ thì trung bình đim giá trị
giảm 0.0000334 đim.
- Kim định giả thiết với tham số :
 H0 : β1 = 0
H1 : β1 ≠ 0
Với mức ý nghĩa 5% ta thấy :
P – Value = 0.0083 < α = 0,05. Ta bác bỏ giả thiết H0. Vây biến Price có tác đơ n g
đến biến Value Score.

11


2.2 Chi Pho Năm Năm Của Chủ Sp Hhu ( Cost/Mile )

- Có R2 = 0.5132 có nghĩa là biến Cost/Mile giải thích được 51.32% sự biến động
của biến Value Score.
 Hàm hồi quy mẫu nhân được là:
= 2.9422 – 2.3119 * (Cost/Mile)

- Giải thích : β1 = -2.3119 cho biết khi Chi Phí Năm Năm Của Chủ Sở Hữu tăng 1$
thì trung bình Dim Giá Trị giảm 2.3119 đim.
- Kim định giả thiết với tham số :
 H0 : β1 = 0
H1 : β1 ≠ 0
Với mức ý nghĩa 5% ta thấy :
P – Value = 0.000381 < α = 0,05. Ta bác bỏ giả thiết H0. Vâ y biến Cost/Mile có tác
đơng
 đến biến Value Score.
2.3 Đimm Kimm Tra Đương Bô
( Road-Test
Score )
D

12


- Có R2 = 0.1694 có nghĩa là biến Road-Test Score giải thích được 16.94% sự biến
động của biến Value Score.
 Hàm hồi quy mẫu nhân được là:
= 0.7978 + 0.0082 * Road-Test Score
- Giải thích : β1 = 0.0082 cho biết khi Đim Kim Tra Đương Bô  tăng 1 đim thì
trung bình Dim Giá Trị tăng 0.0082 đim.
- Kim định giả thiết với tham số :
 H0 : β1 = 0
H1 : β1 ≠ 0
Với mức ý nghĩa 5% ta thấy :
P – Value = 0.0715 > α = 0,05. Ta chấp nhân giả thuyết H0. Vâ y biến Road-Test
Score khơng có tác đơ ng đến biến Value Score.


13


2.4 D[ Đốn Đơ D
Tin Câ yD( Predicted Reliability )

- Có R2 = 0.1229 có nghĩa là biến Predicted Reliability giải thích được 12.29% sự
biến động của biến Value Score.
 Hàm hồi quy mẫu nhân được là:
= 1.0515 + 0.1084 * Predicted Reliability
- Giải thích : β1 = 0.1084 cho biết khi Dự Đốn ĐơTin
 Câ y tăng 1 mức thì trung
bình Đim Giá Trị tăng 0.1084 đim.
- Kim định giả thiết với tham số :
 H0 : β1 = 0
H1 : β1 ≠ 0
Với mức ý nghĩa 5% ta thấy :
P – Value = 0.1294 > α = 0,05. Ta chấp nhân giả thuyết H0. Vâ y biến Predicted
Reliability khơng có tác đơng
 đến biến Value Score.
3. K^t lnDd[a trên các phân toch trên
Sau khi thực hiê n phân tích hồi quy đơn biến Value Score theo các biến cịn
lại ta có th tổng hợp lại như sau:
Biến Price, Cost/Mile có tác đơng
 tiêu cực đến biến ph/ th c, trong đó biến
Cost/Mile giải thích được 51.32% sự biến động của biến Value Score là khá cao.
14


Biến Road-Test Score, Predicted Reliability có quan hêcùng

chiều nhưng

khơng có tác đô ng đến biến ph/ thuôc
=> Viêc thực hiê n phân tích hồi quy đơn các biến cho kết quả về kì vọng dấu của
các biến là chính xác, nhưng theo đề bài đã cho là khơng chính xác. Nhóm s— tiếp
t/c thực hiê n hồi quy bơ i đ đánh giá tồn diên hơn về sự tác đơ ng của các biến đô c
lâ p đến biến ph/ thuô c.
4. Ước lưrng mô h\nh hồi quy bô iD
Sử d/ng phần mềm excel ta ước lượng mơ hình trên bˆng phương pháp OLS,
ta có kết quả thu được ở bảng sau :

B5ng 1

Qua kết quả chạy từ ứng d/ng excel, chúng ta thấy rˆng R2 hiêu chžnh là
0.9126, có nghĩa là mơ hình giải thích được 91.26% sự thay đổi của Value Score có
ph/ thuộc vào các biến trong mơ hình.
 Hàm hồi quy mẫu nhâ n được là:
Value Score^ = 1.2695 - 0.000014 * Price – 1.5815 * Cost/Mile + 0.0114 *
Road-Test Score + 0.1791 * Predicted Reliability
4.1. Gifi thoch hàm hồi quy mẫu nhận đưrc :
- β2 = -0.000014 cho biết khi giá tăng 1 đô la thì đim giá trị trung bình giảm
15


0.000014 đim với điều kiê n các yếu tố khác khơng đổi
- β3 = 1.5815 cho biết khi chi phí năm năm của chủ sở hữu tăng 1 cost/mile thì
đim giá trị trung bình giảm 1.5815 đim với điều kiên các yếu tố khác
không đổi
- β4 = 0.0114 cho biết khi đim kim tra đường bơtăng
1 đim thì đim giá trị


trung bình tăng 0.0114 đim với điều kiên các yếu tố khác không đổi
- β5 = 0.1791 cho biết khi mức đơtin
 câ y dự đốn tăng 1 mức thì trung bình
đim giá trị tăng 0.1719 đim với điều kiên các yếu tố khác không đổi
4.2 Kimm định s[ phw hrp của mơ h\nh
 Kiểm định ý nghĩa mơ hình
Kim định các cặp giả thiết :
H0 : β2 = β3 = β4 = β5 = 0
H1 : Có ít nhất 1 trong các giá trị β không bˆng
Từ bảng 4 ta có :
F = 50.6046 và mức ý nghĩa của F, PF = 0,000000016< < 0,05 do đó ta có th kết
luật mơ hình trên là có ý nghĩa.
 Kiểm định gi5 thiết với các tham s).
H0 : β2 = 0
H1 : β2 ≠ 0
Với mức ý nghĩa 5% ở bảng 2 ta thấy :
P – Value = 0.1002 > α = 0,05
→ Biến Price không ảnh hưởng đến biến Value Score ở mức ý nghĩa 5%.
Tương tự lần lượt kim định với các cặp giả thiết khác :
H0 : βj = 0
H1 : βj ≠ 0 (3 ÷ 5 )

16


→ Các biến Cost/Mile, Road-Test Score, Predicted Reliability có ảnh hưởng
đến biến Value Score ở mức ý nghĩa 5%.

 Loại b? biến không cA ý nghĩa ( Price)

Thực hiê n hồi quy với dữ liêu cũ đã loại bỏ biến Price, thu được kết quả sau :

B5ng 2

Nhâ n x!t : Hê số R2 hiê u chžnh mới là 0.9013 < 0.9126 – hê  số R2 hiêu chžnh cũ
(Bảng 1). Nên viê c bỏ bớt biến Price trong mô hình là khơng phù hợp.

 Kiểm định hiên tưFng đa cơ ng tuyến
Sử d/ng phần mềm SPSS đ tính thừa số phóng đại phương sai VIF, ta thu
được kết quả sau :

17


Nhâ n x!t : các giá trị VIF nˆm trong khoảng từ 1 đến 5 cho thấy rˆng có mơt
mối tương quan vừa phải giữa các biến nhưng không quá nghiêm trọng nên
có th bỏ qua

 Kiểm định gi5 định không cA tG tương quan giIa các ph(n dư.
Dùng kim định Durbin Waston trên SPSS thu được kết quả :

Nhâ n x!t : 1 < D = 1.710 <3. Vây mơ hình khơng có hiên tượng tự tương quan
giữa các phần dư.
 Kim định phần dư tuân theo phân phối chu£n
Thực hiê n kim định phân phối chu£n cho phần dư trong SPSS có kết quả
sau :

Nhâ n x!t :
- Với kim định Kolmogorow-Smirnov, p-value = 0.200 > 0.05
- Với kim định Shapiro-Wilk, p-value = 0.283 > 0.05

Vâ y cả hai kim định đều cho kết quả phần dư tuân theo phân phối chu£n

 Kiểm định phương sai sai s) thay đLi
Dùng Eviews đ thực hiên kim định White thu được bảng kết quả dưới đây :

18


Nhâ n x!t : Nhìn vào bảng trên ta thấy giá trị p-value = 0.1337 > 0.05. Vâ
y  mô hình
khơng có phương sai sai số thay đổi.

19


III. KẾT LDN
Vấn đề biến Price khơng có tác đơ ng tới biến ph/ th c có th do c¥ mẫu
không đủ lớn. Do viêc bỏ biến Price không làm tăng mức đơ  giải thích của mơ hình
nên nhóm em vẫn dữ ngun mơ hình ban đầu
Sau khi tiến hành kim định các giả thuyết của mơ hình, khơng phát hiên mơ
hình đã ước lượng vi phạm các giả định và kì vọng về dấu so với ban đầu. Có th
nói rˆng mơ hình:
Value Score = 1.2695 - 0.000014 * Price – 1.5815 * Cost/Mile + 0.0114 * Road-Test
Score + 0.1791 * Predicted Reliability
là mơ t mơ hình tốt.

20




×