MS – EXCEL TRONG
THỐNG KÊ
Nhóm 2
•
•
•
•
•
•
•
•
•
Vũ Cao Ân
Quan Ứng Biêu
Lê Anh Dũng
Lê Thị Mỹ Hiền
Bùi Phương Lan
Thái Chí Luân
Nguyễn Phan Duy Nguyên
Đặng Hải Thành
Phan Thương
60700108
60700152
60700417
60700785
60701224
60701404
60701633
60702198
60702428
Cơ sở lí thuyết
Bài 1
• Một nghiên cứu được tiến hành ở thành phố
công nghiệp X để xác định tỉ lệ những người đi
làm bằng xe máy, xe đạp và xe buýt.Việc điều
tra được tiến hành trên hai nhóm. Kết quả như
sau:
• Với mức ý nghĩa α=5%, hãy nhận định xem có
sự khác nhau về cơ cấu sử dụng các phương
tiện giao thông đi làm trong 2 nhóm công nhân
nam và nữ hay không?
THỰC NGHIỆM Xe máy
Nữ
25
Nam
75
Tổng hàng
100
Buýt
Xe đạp Tổng cột
100
125
250
120
205
400
220
330
650
LÍ THUYẾT
Nữ
Nam
38.46154 84.61538 126.9231
61.53846 135.3846 203.0769
P
0.002189
Kết luận
• P (X>χ2) = 0.002189 > α = 0.05
• Bác bỏ giả thiết Ho
⇒ Cơ cấu sử dụng phương tiện giao thông đi làm
trong hai nhóm công nhân nam và nữ là khác
nhau
Kết luận
• FR=8.33 < Fcrit=18.51
• Bác bỏ giả thiết H0 ⇒ giữa nam và nữ không có
sự khác nhau về cơ cấu sử dụng phương tiện
giao thông
Bài 2
• Một cửa hàng lớn có bán 3 loại giày A, B và C.
Theo dõi số khách hàng mua các loại giày này
trong 5 ngày, người quản lí thu được bảng số
liệu sau
• Với mức ý nghĩa α=1%, hãy so sánh lượng tiêu
thụ trung bình của 3 loại giày nói trên
Anova: Single Factor
SUMMARY
Groups
A
B
C
ANOVA
Source of Variation
Between Groups
Within Groups
Total
Count
5
5
5
SS
447.6
354
801.6
Sum
Average Variance
110
22
14.5
161
32.2
45.7
173
34.6
28.3
df
2
12
14
MS
F
P-value
F crit
223.8 7.586441 0.007418 6.926608
29.5
Kết luận
• F=7.59 < Fcrit=6.93
• Bác bỏ giả thiết H0
⇒ có sự khác biệt giữa lượng tiêu thụ trung bình
của 3 loại giày nói trên
Bài 3
• Tính tỉ số tương quan của Y đối với X và hệ số
xác định của tập số liệu sau đây:
X
Y
15
13
25
22
10
6
15
17
20
21
X
Y
10
10
20
25
25
18
30
14
30
10
• Có nhận xét gì về mối quan hệ giữa X và Y?
Correlation
X
X
Y
1
0.319844
Intercept
X
Coefficients
10.4
0.26
Y
1
Kết luận
• Tỉ số tương quan: R = 0.32
• Hệ số xác định: a = 0.26, b = 10.4
• Do R < 0.7 nên mức độ liên quan của Y đối với
X là nghèo nàn
Bài 4
• Bảng sau đây cho ta một mẫu gồm 11 quan sát
(xi,yi) từ tập hợp chính các giá trị của cặp đại
lượng ngẫu nhiên (X,Y)
X
Y
0.9
-0.3
1.22
0.1
1.32
0.7
0.77
-0.28
1.3
-0.25
X
Y
1.2
0.02
1.32
0.37
0.95
-0.7
1.45
0.55
1.3
0.35
1.2
0.32
a. Tìm đường hồi quy của Y đối với X
b. Tính sai số tiêu chuẩn của đường hồi quy
c. Tính tỉ số F để kiểm định sự đúng đắn của giả
thiết: có hồi quy tuyến tính của Y theo X
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.764225758
R Square
0.584041009
Adjusted R Square 0.537823343
Standard Error
0.289645139
Observations
11
ANOVA
Regression
Residual
Total
Intercept
X
df
1
9
10
SS
MS
F
Significance F
1.060151239 1.060151239 12.6367483 0.006169123
0.755048761 0.083894307
1.8152
Coefficients Standard Error
t Stat
P-value
-1.739476701 0.519230619 -3.350104244 0.008522131
1.547892012 0.435434656 3.554820432 0.006169123
Kết luận
a. Đường hồi quy: y = 1.55x – 1.74
b. Sai số tiêu chuẩn của đường hồi quy: 0.29
c. F = 12.64
Fs = 0.006 < 0.05 nên bác bỏ giả thiết H0
⇒ X và Y có mối quan hệ tuyến tính với nhau