TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÍ
-------o0o-------
TIỂU LUẬN MƠN :
THỐNG KÊ ỨNG DỤNG
CASE 4: FINDING THE BEST CAR VALUE
Giáo viên hướng dẫn: Hà Thị Thư Trang
Nhóm 12:
HA và tên
MSSV
Hà Nơi,Dtháng 1 năm 2022
LỜI CẢM ƠN
Bản tiu luâ n được hoàn thành trên cơ sở đóng góp của các thành viên với vốn
kiến thức được đúc kết ra từ quá trình học và nghiên cứu môn Thống Kê -ng
D/ng. Đây cũng là một cơ hội thực hành khiến chúng em có th hiu rõ hơn về các
phân tích và kim định đặc trưng có liên quan, áp d/ng kiến thức trên giảng đường
đ làm quen và rút ra được nhưng kết luận bổ ích về những hiện tượng trong những
mối tương quan khác nhau và sự ảnh hưởng lẫn nhau giữa các nhân tố. Chúng em
xin gửi lời cảm ơn sâu sắc tới cô Hà Thị Thư Trang, Viện Kinh tế và Quản lý,
Trường Đại học Bách khoa Hà Nội đã đồng hành cùng chúng em suốt quá trình
nghiên cứu và học tập, cảm ơn cơ đã tận tình giảng dạy và truyền th/ kiến thức,
kinh nghiệm cũng như phong cách trình bày, đ chúng em có thêm những bài học
quý báu.
Do vốn kiến thức và kĩ năng còn hạn chế nên chắc hẳn bài tiu ln này khơng th
tránh khỏi sai sót, chúng em rất mong nhận được sự góp ý động viên của cơ đ
chúng em có th hồn thiện hơn, áp d/ng tốt hơn trong các công việc sau này.
Chúng em xin chân thành cảm ơn Cô.
H Nô i, ngày 13/01/2022
Nhóm thực hiê n
2
MỤC LỤC
L^I C`M ƠN..............................................................................................................2
ĐcNG GcP CfA ChC THiNH VIÊN.....................................................................3
I. ĐĂT
VlN ĐÊ..........................................................................................................5
1. Đề bài...................................................................................................................5
2. Xây dựng mơ hình................................................................................................6
II. PHÂN TrCH...........................................................................................................8
1. Thống kê mơ tả các biến.......................................................................................8
1.1 Tóm tắt dữ liêu................................................................................................8
1.2 Bảng tần số và đồ thị của dữ liệu....................................................................8
2. Phân tích theo các câu hỏi được gợi ý trong Case-Problems.............................13
2.1 Giá ( Price)....................................................................................................13
2.2 Chi Phí Năm Năm Của Chủ Sở Hữu ( Cost/Mile ).......................................14
2.3 Đim Kim Tra Đương Bô ( Road-Test Score )............................................14
2.4 Dự Đốn Đơ Tin Câ y ( Predicted Reliability )..............................................16
3. Kết luâ n dựa trên các phân tích trên...................................................................16
4. Ước lượng mơ hình hồi quy bơ i.........................................................................17
4.1. Giải thích hàm hồi quy mẫu nhận được :.....................................................17
4.2 Kim định sự phù hợp của mơ hình..............................................................18
III. K~T LUÂN.........................................................................................................21
3
I. ĐĂDT VJN ĐÊ
1. ĐL bài
Khi quyết định mua mô t chiếc xe nào đó, giá trị thực khơng nhất thiết được
xác định bởi số tiền bạn chi cho lần mua ban đầu. Thay vào đó, những chiếc xe đáng
tin câ y và khơng tốn nhiều chi phí đ sở hữu thường đại diên cho những giá trị tốt
nhất. Tuy nhiên cho dù sở hữu môt chiếc ô tô đáng tin cây hay r€ tiền đến đâu nó
cũng phải hoạt đô ng tốt.
Đ đo lường giá trị, Consumer Reports đã phát trin môt hê thống gọi là đim
giá trị ( Value Score ). Đim giá trị dựa trên chi phí năm năm của chủ sở hữu
( Cost/Mile ), đim kim tra đường bôtổng
th ( Road-Test Score ) và xếp hạng đơ
tin câ y được dự đốn ( Predicted Reliability ). Chi phí chủ sở hữu trong năm năm
đầu tiên sở hữu, bao gồm khấu hao, nhiên liêu,
bảo trì và sửa chữa,v.v. Sử d/ng mức
trung bình quốc gia là 12.000 dă m mơ t năm, chi phí trung bình cho m•i dăm
lái xe
được sử d/ng làm thước đo chi phí của chủ sở hữu trong năm năm. Đim kim tra
đường bô là kết quả của hơn 50 bài kim tra và đánh giá dựa trên thang đim 100,
với đim số cao hơn cho thấy hiêu suất tốt hơn, sự thoải mái, tiên lợi và tiêt kiêm
nhiên liêu.
Đim số kim tra đường bô cao nhất đạt được trong các bài kim tra do
Consumer Reports thực hiên được là 99 đối với Lexus LS 460L. Xếp hạng dự đốn
về đơ tin câ y (1 = K„m, 2 = Khá, 3 = Tốt, 4 = Rất tốt, 5 = Xuất sắc) dựa trên dữ liêu
từ Khảo sát tự đô ng hàng năm của Consumer Reports.
Mô t chiếc xe có đim giá trị là 1,0 được coi là “giá trị trung bình”. Mơt chiếc
xe có đim giá trị là 2,0 được coi là co giá trị tốt gấp đơi mơt chiếc xe có đim giá trị
là 1,0; mơt chiếc xe có đim giá trị 0,5 được coi là tốt bˆng mô t nửa so với mức
trung bình; và như thế. Dữ liêu về 20 chiếc sedans gia đình, bao gồm cả giá ($) của
m•i chiếc được kim tra ở bảng dưới đây:
Car
Price ($)
Cost/Mile
RoadTest
Predicted
Reliability
Value
Score
4
Score
Nissan Altima 2.5 S (4-cyl.)
Kia Optima LX (2.4)
Subaru Legacy 2.5i Premium
Ford Fusion Hybrid
Honda Accord LX-P (4-cyl.)
Mazda6 i Sport (4-cyl.)
Hyundai Sonata GLS (2.4)
Ford Fusion SE (4-cyl.)
Chevrolet Malibu LT (4-cyl.)
Kia Optima SX (2.0T)
Ford Fusion SEL (V6)
Nissan Altima 3.5 SR (V6)
Hyundai Sonata Limited (2.0T)
Honda Accord EX-L (V6)
Mazda6 s Grand Touring (V6)
Ford Fusion SEL (V6, AWD)
Subaru Legacy 3.6R Limited
Chevrolet Malibu LTZ (V6)
Chrysler 200 Limited (V6)
Chevrolet Impala LT (3.6)
23,970.00
21,885.00
23,830.00
32,360.00
23,730.00
22,035.00
21,800.00
23,625.00
24,115.00
29,050.00
28,400.00
30,335.00
28,090.00
28,695.00
30,790.00
30,055.00
30,094.00
28,045.00
27,825.00
28,995.00
0.59
0.58
0.59
0.63
0.56
0.58
0.56
0.57
0.57
0.72
0.67
0.69
0.66
0.67
0.74
0.71
0.71
0.67
0.70
0.67
91
81
83
84
80
73
89
76
74
84
80
93
89
90
81
75
88
83
52
63
4
4
4
5
4
4
3
4
3
4
4
4
3
3
4
4
3
3
5
3
1.75
1.73
1.73
1.70
1.62
1.60
1.58
1.55
1.48
1.43
1.42
1.42
1.39
1.36
1.34
1.32
1.29
1.20
1.20
1.05
2. Xây d[ng mô h\nh
Xác định dạng mơ hình
Đ phân tích những tác động của các nhân tố ảnh hưởng đến đim giá trị của
xe nhóm em đã chọn sử d/ng phân tích hồi quy với mơ hình hồi quy tuyến tính đ
đưa ra những ước lượng và kết luận về biến ph/ thuộc của mô hình.
Các biến được sử d/ng đ đưa vào trong bài là:
Bi^n ph` thcDY
Bi^n đơcDlâpDXi
•
Value Score
Price
Đơn vị
Đim
Đơ la
Cost/Mile
cost/mile
Road-Test Score
Đim
Predicted Reliability
Mức
Mơ hình hồi quy tổng th mô tả mối quan hệ biến ph/ thuộc Y và các biến
5
độc lập có dạng :
Value Score = β1 + β2 * Price + β3 * Cost/Mile + β4 * Road-Test Score + β5 *
Predicted Reliability + µi
Trong đó :
-
β1: là hệ số chặn.
-
β2, β3, β4, β5: là các hệ số góc tương ứng với các biến độc lập.
-
µi : là sai số ngẫu nhiên.
•
Kỳ vọng về dấu của các biến độc lập :
-
Theo đề bài đim giá trị không ph/ th
c vào
giá, nhưng theo mong muốn
của khách hàng nói chung kì vọng giá mua xe s— đồng biến với đim giá trị –
dấu (+).
-
Chi phí năm năm của chủ sở hữu càng nhiều thì đim giá trị s— càng nhỏ –
dấu (-).
-
Đim đường bôcàng
cao chứng tỏ chiếc xe càng nhiều giá trị – dấu (+).
-
Mức xếp hạng về đôtin
cây càng cao xe càng giá trị – dấu (+).
II. PHÂN TÍCH
6
1. Thdng kê mơ tf các bi^n
1.1 Tóm tgt dh liê uD
1.2 Bfng tần sd và đồ thị của dh liệu
1.2.1 Đimm Giá Trị ( Value Score )
Value
tần số tích
score Frequency tần số(%)
lũy(%)
1
0
0%
0%
1,2
3
15%
15%
1,4
5
25%
40%
1,6
7
35%
75%
1,8
5
25%
100%
7
Nhâ n x!t: số đim chủ yếu là 1.4; 1.6; 1.8 những xe được đánh giá hầu hết là có
đi€m trên giá trị trung bình từ khá đến tốt
1.2.2 Giá ( Price )
Price($)
21000
21000-23300
23300-25600
25600-27900
27900-30200
30200-32500
Frequenc
T(n s) t+ch
y
T(n s) (%)
l,y %
0%
0
0.00%
15%
3
15.00%
25%
5
40.00%
5%
1
45.00%
40%
8
85.00%
15%
3
100.00%
Histogram
9
120.00%
8
8
100.00%
100.00%
7
85.00%
Frequency
6
80.00%
5
5
60.00%
4
3
3
45.00%
40.00%
3
2
0
0.00%
0
21000
23300
40.00%
20.00%
1
15.00%
1
Price
Frequency
0.00%
25600
27900
30200
32500
Price($)
Nhâ n x!t: dữ liêu về giá xe tâ p trung ở giữa, giá xe được khảo sát quá cao và quá
thấp không nhiều
1.2.3 Chi Pho Năm Năm Của Chủ Sp Hhu ( Cost/Mile )
Cost/Mile
Frequency
0,55
0,6
0,65
0,7
tần số(%)
0
8
1
7
tần số tích lũy(%)
0%
40%
5%
35%
0%
40%
45%
80%
8
0,75
4
20%
100%
Nhâ n x!t: chi phí năm năm của chủ sở hữu có 0.6 và 0.7 chiếm phần lớn lần lượt là
40% và 35% trong tổng dữ liêu.
1.2.4 Đimm Kimm Tra Đương Bơ
( Road-Test
Score )
D
Road-test Score
50
55
60
65
70
75
80
85
90
95
100
Frequency tần số(%)
tần số tích lũy(%)
0
0%
0%
1
5%
5%
0
0%
5%
1
5%
10%
0
0%
10%
3
15%
25%
3
15%
40%
6
30%
70%
4
20%
90%
2
10%
100%
0
0%
100%
9
Nhâ n x!t: Đim kim tra đường bô của các xe trong dữ liê u mẫu tâp trung chủ yếu
trên 80 đim là mức đim cao.
1.2.5 Đô D
tin câyDđưrc d[ đốn ( Predicted Reliability )
Predicte
d
reliabilit
y
3
4
5
Frequenc
y
7
11
2
tần số(%)
35%
55%
10%
tần số tích
lũy(%)
35%
90%
100%
Histogra m
12
10
8
6
4
2
0
11
90%
7
35%
3
100%
100%
2
4
5
More
0
120%
100%
80%
60%
40%
20%
0%
Predicted reliability
Frequency
Cumulative %
Nhâ n x!t: Đô tin cây được dự đoán chủ yếu là Tốt và Rất Tốt.
10
2. Phân toch theo các câu hsi đưrc gri t trong Case-Problems
Sử d/ng phần mềm excel đ ước lượng mô hình hồi quy tuyến tính đơn bˆng
phương pháp OLS, ta có kết quả về sự ph/ th c của biến Value Score với các biến
khác như sau:
2.1 Giá ( Price)
- Có R2 = 0.3277 có nghĩa là biến Price giải thích được 32.77% sự biến động
của biến Value Score.
Hàm hồi quy mẫu nhân được là:
= 2.3587 - 0.0000334 * Price
- Giải thích : β1 = -0.0000334 cho biết khi giá xe tăng 1$ thì trung bình đim giá trị
giảm 0.0000334 đim.
- Kim định giả thiết với tham số :
H0 : β1 = 0
H1 : β1 ≠ 0
Với mức ý nghĩa 5% ta thấy :
P – Value = 0.0083 < α = 0,05. Ta bác bỏ giả thiết H0. Vây biến Price có tác đơ n g
đến biến Value Score.
11
2.2 Chi Pho Năm Năm Của Chủ Sp Hhu ( Cost/Mile )
- Có R2 = 0.5132 có nghĩa là biến Cost/Mile giải thích được 51.32% sự biến động
của biến Value Score.
Hàm hồi quy mẫu nhân được là:
= 2.9422 – 2.3119 * (Cost/Mile)
- Giải thích : β1 = -2.3119 cho biết khi Chi Phí Năm Năm Của Chủ Sở Hữu tăng 1$
thì trung bình Dim Giá Trị giảm 2.3119 đim.
- Kim định giả thiết với tham số :
H0 : β1 = 0
H1 : β1 ≠ 0
Với mức ý nghĩa 5% ta thấy :
P – Value = 0.000381 < α = 0,05. Ta bác bỏ giả thiết H0. Vâ y biến Cost/Mile có tác
đơng
đến biến Value Score.
2.3 Đimm Kimm Tra Đương Bô
( Road-Test
Score )
D
12
- Có R2 = 0.1694 có nghĩa là biến Road-Test Score giải thích được 16.94% sự biến
động của biến Value Score.
Hàm hồi quy mẫu nhân được là:
= 0.7978 + 0.0082 * Road-Test Score
- Giải thích : β1 = 0.0082 cho biết khi Đim Kim Tra Đương Bô tăng 1 đim thì
trung bình Dim Giá Trị tăng 0.0082 đim.
- Kim định giả thiết với tham số :
H0 : β1 = 0
H1 : β1 ≠ 0
Với mức ý nghĩa 5% ta thấy :
P – Value = 0.0715 > α = 0,05. Ta chấp nhân giả thuyết H0. Vâ y biến Road-Test
Score khơng có tác đơ ng đến biến Value Score.
13
2.4 D[ Đốn Đơ D
Tin Câ yD( Predicted Reliability )
- Có R2 = 0.1229 có nghĩa là biến Predicted Reliability giải thích được 12.29% sự
biến động của biến Value Score.
Hàm hồi quy mẫu nhân được là:
= 1.0515 + 0.1084 * Predicted Reliability
- Giải thích : β1 = 0.1084 cho biết khi Dự Đốn ĐơTin
Câ y tăng 1 mức thì trung
bình Đim Giá Trị tăng 0.1084 đim.
- Kim định giả thiết với tham số :
H0 : β1 = 0
H1 : β1 ≠ 0
Với mức ý nghĩa 5% ta thấy :
P – Value = 0.1294 > α = 0,05. Ta chấp nhân giả thuyết H0. Vâ y biến Predicted
Reliability khơng có tác đơng
đến biến Value Score.
3. K^t lnDd[a trên các phân toch trên
Sau khi thực hiê n phân tích hồi quy đơn biến Value Score theo các biến cịn
lại ta có th tổng hợp lại như sau:
Biến Price, Cost/Mile có tác đơng
tiêu cực đến biến ph/ th c, trong đó biến
Cost/Mile giải thích được 51.32% sự biến động của biến Value Score là khá cao.
14
Biến Road-Test Score, Predicted Reliability có quan hêcùng
chiều nhưng
khơng có tác đô ng đến biến ph/ thuôc
=> Viêc thực hiê n phân tích hồi quy đơn các biến cho kết quả về kì vọng dấu của
các biến là chính xác, nhưng theo đề bài đã cho là khơng chính xác. Nhóm s— tiếp
t/c thực hiê n hồi quy bơ i đ đánh giá tồn diên hơn về sự tác đơ ng của các biến đô c
lâ p đến biến ph/ thuô c.
4. Ước lưrng mô h\nh hồi quy bô iD
Sử d/ng phần mềm excel ta ước lượng mơ hình trên bˆng phương pháp OLS,
ta có kết quả thu được ở bảng sau :
B5ng 1
Qua kết quả chạy từ ứng d/ng excel, chúng ta thấy rˆng R2 hiêu chžnh là
0.9126, có nghĩa là mơ hình giải thích được 91.26% sự thay đổi của Value Score có
ph/ thuộc vào các biến trong mơ hình.
Hàm hồi quy mẫu nhâ n được là:
Value Score^ = 1.2695 - 0.000014 * Price – 1.5815 * Cost/Mile + 0.0114 *
Road-Test Score + 0.1791 * Predicted Reliability
4.1. Gifi thoch hàm hồi quy mẫu nhận đưrc :
- β2 = -0.000014 cho biết khi giá tăng 1 đô la thì đim giá trị trung bình giảm
15
0.000014 đim với điều kiê n các yếu tố khác khơng đổi
- β3 = 1.5815 cho biết khi chi phí năm năm của chủ sở hữu tăng 1 cost/mile thì
đim giá trị trung bình giảm 1.5815 đim với điều kiên các yếu tố khác
không đổi
- β4 = 0.0114 cho biết khi đim kim tra đường bơtăng
1 đim thì đim giá trị
trung bình tăng 0.0114 đim với điều kiên các yếu tố khác không đổi
- β5 = 0.1791 cho biết khi mức đơtin
câ y dự đốn tăng 1 mức thì trung bình
đim giá trị tăng 0.1719 đim với điều kiên các yếu tố khác không đổi
4.2 Kimm định s[ phw hrp của mơ h\nh
Kiểm định ý nghĩa mơ hình
Kim định các cặp giả thiết :
H0 : β2 = β3 = β4 = β5 = 0
H1 : Có ít nhất 1 trong các giá trị β không bˆng
Từ bảng 4 ta có :
F = 50.6046 và mức ý nghĩa của F, PF = 0,000000016< < 0,05 do đó ta có th kết
luật mơ hình trên là có ý nghĩa.
Kiểm định gi5 thiết với các tham s).
H0 : β2 = 0
H1 : β2 ≠ 0
Với mức ý nghĩa 5% ở bảng 2 ta thấy :
P – Value = 0.1002 > α = 0,05
→ Biến Price không ảnh hưởng đến biến Value Score ở mức ý nghĩa 5%.
Tương tự lần lượt kim định với các cặp giả thiết khác :
H0 : βj = 0
H1 : βj ≠ 0 (3 ÷ 5 )
16
→ Các biến Cost/Mile, Road-Test Score, Predicted Reliability có ảnh hưởng
đến biến Value Score ở mức ý nghĩa 5%.
Loại b? biến không cA ý nghĩa ( Price)
Thực hiê n hồi quy với dữ liêu cũ đã loại bỏ biến Price, thu được kết quả sau :
B5ng 2
Nhâ n x!t : Hê số R2 hiê u chžnh mới là 0.9013 < 0.9126 – hê số R2 hiêu chžnh cũ
(Bảng 1). Nên viê c bỏ bớt biến Price trong mô hình là khơng phù hợp.
Kiểm định hiên tưFng đa cơ ng tuyến
Sử d/ng phần mềm SPSS đ tính thừa số phóng đại phương sai VIF, ta thu
được kết quả sau :
17
Nhâ n x!t : các giá trị VIF nˆm trong khoảng từ 1 đến 5 cho thấy rˆng có mơt
mối tương quan vừa phải giữa các biến nhưng không quá nghiêm trọng nên
có th bỏ qua
Kiểm định gi5 định không cA tG tương quan giIa các ph(n dư.
Dùng kim định Durbin Waston trên SPSS thu được kết quả :
Nhâ n x!t : 1 < D = 1.710 <3. Vây mơ hình khơng có hiên tượng tự tương quan
giữa các phần dư.
Kim định phần dư tuân theo phân phối chu£n
Thực hiê n kim định phân phối chu£n cho phần dư trong SPSS có kết quả
sau :
Nhâ n x!t :
- Với kim định Kolmogorow-Smirnov, p-value = 0.200 > 0.05
- Với kim định Shapiro-Wilk, p-value = 0.283 > 0.05
Vâ y cả hai kim định đều cho kết quả phần dư tuân theo phân phối chu£n
Kiểm định phương sai sai s) thay đLi
Dùng Eviews đ thực hiên kim định White thu được bảng kết quả dưới đây :
18
Nhâ n x!t : Nhìn vào bảng trên ta thấy giá trị p-value = 0.1337 > 0.05. Vâ
y mô hình
khơng có phương sai sai số thay đổi.
19
III. KẾT LDN
Vấn đề biến Price khơng có tác đơ ng tới biến ph/ th c có th do c¥ mẫu
không đủ lớn. Do viêc bỏ biến Price không làm tăng mức đơ giải thích của mơ hình
nên nhóm em vẫn dữ ngun mơ hình ban đầu
Sau khi tiến hành kim định các giả thuyết của mơ hình, khơng phát hiên mơ
hình đã ước lượng vi phạm các giả định và kì vọng về dấu so với ban đầu. Có th
nói rˆng mơ hình:
Value Score = 1.2695 - 0.000014 * Price – 1.5815 * Cost/Mile + 0.0114 * Road-Test
Score + 0.1791 * Predicted Reliability
là mơ t mơ hình tốt.
20