BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
BÀI THẢO LUẬN
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN
NHÓM: 01
HÀ NỘI – 2020
1
MỤC LỤC
DANH SÁCH THÀNH VIÊN NHÓM 1
STT
1
2
3
4
5
6
7
8
9
10
Mã sinh viên
18D250181
18D190061
17D220181
18D220122
17D180072
18D150122
18D250002
17D190001
16D250211
18D150183
Họ và tên
Bùi Hoài Anh
Đặng Thị Vân Anh
Đinh Thị Lan Anh
Dương Thị Ngọc Anh
Lê Quỳnh Anh
Lê Thị Mai Anh
Lê Thị Phương Anh
Lưu Quỳnh Anh
Nguyễn Phương Anh
Nguyễn Thị Hải Anh
Đánh giá
Chương I: Cơ sở lý thuyết
1. Ước lượng bằng khoảng tin cậy
Giả sử cần ước lượng tham số θ của ĐLNN X trên đám đông.
• Chọn mẫu ngẫu nhiên W = (X1 ,X2 , …, Xn ),
• Từ ước lượng điểm tốt nhất của θ xây dựng thống kê: G = f(X1 ,X2 , …, Xn , θ) sao
cho G có quy luật xác định và có biểu thức chứa θ.
Với cho trước, xác định thỏa mãn
Từ đó xác định các phân vị và :
P() =
P () =
Trong đó: Xác suất được gọi là độ tin cậy
Khoảng () được gọi là khoảng tin cậy
1= - được gọi là độ dài của khoảng tin cậy
Ước lượng kì vọng toán của ĐLNN
Giả sử ĐLNN X trên đám đông có E(X) = µ và Var(X) = trong đó µ chưa biết.
ĐLNN X có phân phối chuẩn, phương sai đã biết.
Vì X ~ N(µ;) nên
Xác suất
P
P
P(
Hai phía
Trái
Phải
Khoảng tin cậy
(
2. Kiểm định giả thuyết thống kê
- Định nghĩa: Việc đưa ra kết luận về tính thừa nhận được hay bác bỏ một giả thuyết
-
được gọi là kiểm định giả thuyết thống kê.
Nguyên lý xác suất nhỏ: “ Một biến cố có xác suất khá bé thì trong thực hành ta có thể
coi nó không xảy ra trong một lần thực hiện phép thử.”
Kiểm định giả thuyết về tỷ lệ của đám đông:
Khi n đủ lớn ta có
Xây dựng tiêu chuẩn kiểm định
Nếu H0 đúng thi
H0
H1
Chương II: Nội dung
Tiến hành điều tra số liệu các ca nhiễm, ca nhiễm mới, ca tử vong, ca tử vong mới
do COVID-19 gây ra ở 3 nước gồm Việt Nam, Hàn Quốc, Trung Quốc. Thời gian điều
tra: 3 tháng từ 01/03/2020 – 31/05/2020.
1. Biểu đồ so sánh các nước
Hàn Quốc
Trung Quốc
Việt Nam
2. Các bài toán ước lượng
Hàn Quốc
Bài toán 1: Số ca lây nhiễm
Điều tra 92 ngày liên tiếp về số ca nhiễm Covid 19 của quốc gia Hàn Quốc được số ca
lây nhiễm trung bình là 9787.68 ca và độ lệch chuẩn mẫu điều chỉnh là 1711.15 ca .
Với độ tin cậy 95% hãy ước lượng số ca nhiễm ở quốc gia trên.
Gọi X là số ca lây nhiễm COVID-19 của
Hàn Quốc
Số ca
lây
nhiễm
Trung
bình
Sai số
trung
bình
Trung
vị
Độ
lệch
chuẩn
Phươn
g sai
Mean
9787.68478
3
Standard
Error
178.399809
7
Median
Mode
Standard
Deviatio
n
Sample
Variance
10602
8320
1711.15086
2
2928037.27
3
Gọi là số ca lây nhiễm COVID-19 trung
bình của Hàn Quốc trên mẫu.
Gọi µ là số ca lây nhiễm COVID-19
trung bình của Hàn Quốc trên đám đông.
Do n = 92 > 30 nên ≃ N(µ, ) . Ta có
thống kê U= ≃ �(0,1)
Ta tìm được u sao cho: � ( - u <� < u )
=1−�
Thay biểu thức U vào công thức trên ta
có � ( – < µ < + ) = 1 − �
với = u .
Ta có khoảng tin cậy đối xứng:
Ta lấy 1711,15
Khoảng tin cậy đối xứng của số ca lây
nhiễm là (9787,68 – 349,66; 9787,68 +
349,66) hay (9438,02; 10137,34)
Bài toán 2: Số ca lây nhiễm mới
Điều tra 92 ngày liên tiếp về số ca nhiễm Covid 19 mới của quốc gia Hàn Quốc được
số ca lây nhiễm mới trung bình là 91,54 ca và độ lệch chuẩn mẫu điều chỉnh là 137,64
ca . Với độ tin cậy 95% hãy ước lượng số ca nhiễm mới ở quốc gia trên.
Gọi X là số ca lây nhiễm mới COVID-19
của Hàn Quốc
Số ca
lây
nhiễm
mới
Trung
bình
Sai số
trung
bình
Trung
vị
Gọi là số ca lây nhiễm mới COVID-19
trung bình của Hàn Quốc trên mẫu.
Mean
91.5434782
6
Standard
Error
14.3502149
8
Median
Mode
Độ
Standard
lệch Deviatio
chuẩn n
Phươn Sample
g sai
Variance
33
27
137.642426
8
18945.4376
5
Gọi µ là số ca lây nhiễm mới COVID-19
trung bình của Hàn Quốc trên đám đông.
Do n = 92 > 30 nên ≃ N(µ, ) . Ta có
thống kê U= ≃ �(0,1)
Ta tìm được u sao cho: � ( - u <� < u )
=1−�
Thay biểu thức U vào công thức trên ta
có � ( – < µ < + ) = 1 − �
với = u .
Ta có khoảng tin cậy đối xứng:
Ta lấy 137,64
Khoảng tin cậy đối xứng của số ca lây
nhiễm mới là (91,54 – 28,13; 91,54+
28,13) hay (63,41; 119,67)
Bài toán 3: Số ca tử vong mới
Điều tra 92 ngày liên tiếp về số ca nhiễm Covid-19 mới của quốc gia Hàn Quốc được
số ca tử vong mới trung bình là 2.79 ca và độ lệch chuẩn mẫu điều chỉnh là 2.53 ca.
Với độ tin cậy 95% hãy ước lượng số ca tử vong mới ở quốc gia trên.
Giải
Số ca tử
vong
mới
Trung
bình
Sai số
trung
bình
Trung
vị
Gọi X là số ca tử vong mới COVID-19
của Hàn Quốc
Mean
2.79347826
1
Gọi là số ca tử vong mới COVID-19
trung bình của Hàn Quốc trên mẫu.
Standard
Error
0.26345223
8
Gọi µ là số ca tử vong mới COVID-19
trung bình của Hàn Quốc trên đám đông.
Median
Mode
Độ
Standard
lệch Deviatio
chuẩn n
Phươn Sample
g sai
Variance
2
0
2.52694509
3
6.38545150
5
Do n = 92 > 30 nên
≃ N(µ, ) .
U= ≃ �(0,1)
Ta có � ( – < µ < + ) = 1 − � với = .
Ta có khoảng tin cậy đối xứng:
Khoảng tin cậy đối xứng (2,27;
3,31)
Vậy với độ tin cậy 95% ta có thể nói
rằng khoảng tin cậy đối xứng số ca tử
vong mới ở Hàn Quốc là (2,27; 3,31)
Bài toán 4: Số ca tử vong
Điều tra 92 ngày liên tiếp về số ca tử vong Covid 19 của quốc gia Hàn Quốc được số
ca tử vong trung bình là 186.79 ca và độ lệch chuẩn mẫu điều chỉnh là 81.53 ca . Với
độ tin cậy 95% hãy ước lượng số ca tử vong ở quốc gia trên.
Bài giải:
Số ca tử
vong
Trung
bình
Sai số
trung
bình
Trung
vị
Mean
186.793478
3
Standard
Error
8.49963516
3
Median
Mode
Độ
Standard
lệch Deviatio
chuẩn n
Phươn Sample
g sai
Variance
227
256
81.5256365
1
6646.42940
8
Gọi X là số ca tử vong do COVID-19
của Hàn Quốc
Gọi là số ca tử vong do COVID-19
trung bình của Hàn Quốc trên mẫu.
Gọi µ là số ca tử vong do COVID-19
trung bình của Hàn Quốc trên đám đông.
Do n = 92> 30 nên ≃ N(µ, ) . Ta có
thống kê U= ≃(0,1)
Ta tìm được u sao cho: � (< u ) = 1 –
�=
Khoảng tin cậy đối xứng:
Khoảng tin cậy đối xứng của số ca tử
vong là:
(+ )
µ ( 170.13;203.45)
Kết luận: Vậy với độ tin cậy 95% ta có
thể nói rằng khoảng tin cậy đối xứng số
ca tử vong ở Hàn Quốc là (170.13;
203.45)
Bài toán 5: Tỷ lệ tử vong/lây nhiễm
Điều tra 92 ngày liên tiếp về số ca nhiễm Covid 19 mới của quốc gia Hàn Quốc được
tỉ lệ tử vong/lây nhiễm mới trung bình là 0,018 ca và độ lệch chuẩn mẫu điều chỉnh là
0,006 ca. Với độ tin cậy 95% hãy ước lượng tỉ lệ tử vong/lây nhiễm ở quốc gia trên.
Giải
Tỷ lệ tử
vong/lây
nhiễm
Trung
bình
Sai số
trung
bình
Trung
vị
Mean
Standard
Error
Median
Mode
Độ
Standard
lệch Deviatio
chuẩn n
Phươn Sample
g sai
Variance
Gọi X là tỉ lệ tử vong/lây nhiễm COVID-19
của Hàn Quốc
0.01805118
4
Gọi là tỉ lệ tử vong/lây nhiễm COVID-19
trung bình của Hàn Quốc trên mẫu.
0.00066197
6
0.02141088
2
0.00973557
7
Gọi µ là tỉ lệ tử vong/lây nhiễm COVID-19
trung bình của Hàn Quốc trên đám đông.
0.00634944
8
4.03155E05
Ta có � ( – < µ < + ) = 1 − � với = .
Do n = 92 > 30 nên
≃ N(µ, ) .
U= ≃ �(0,1)
Ta có khoảng tin cậy đối xứng:
Khoảng tin cậy đối xứng (0,017;
0,019)
Vậy tỉ lệ tử vong/lây nhiễm COVID-19 trung
bình của Hàn Quốc từ 0,017 đến 0,019
Bài toán 6: Tỷ lệ tử vong/lây nhiễm mới
Điều tra 92 ngày liên tiếp về số ca nhiễm Covid 19 mới của quốc gia Hàn Quốc được
tỉ lệ tử vong/lây nhiễm mới trung bình là 0,079 ca và độ lệch chuẩn mẫu điều chỉnh là
0,104 ca. Với độ tin cậy 95% hãy ước lượng tỉ lệ tử vong/lây nhiễm mới ở quốc gia
trên.
Giải
Tỷ lệ tử
vong
mới/lây
nhiễm
mới
Trung
bình
Sai số
trung
bình
Trung
vị
Mean
Standard
Error
Median
Mode
Độ
Standard
lệch Deviatio
chuẩn n
Phươn Sample
g sai
Variance
Gọi X là tỉ lệ tử vong/lây nhiễm mới
COVID-19 của Hàn Quốc
0.07945294
7
0.01092925
2
0.05352667
4
0
0.10482969
8
0.01098926
6
Gọi là tỉ lệ tử vong/lây nhiễm mới
COVID-19 trung bình của Hàn Quốc
trên mẫu.
Gọi µ là tỉ lệ tử vong/lây nhiễm mới
COVID-19 trung bình của Hàn Quốc
trên đám đông.
Do n = 92 > 30 nên
≃ N(µ, ) .
U= ≃ �(0,1)
Ta có � ( – < µ < + ) = 1 − � với = .
Ta có khoảng tin cậy đối xứng:
Khoảng tin cậy đối xứng (0,058;
0,1)
Vậy tỉ lệ tử vong/lây nhiễm mới COVID19 trung bình của Hàn Quốc từ 0,058
đến 0,1
Làm các bài toán ước lượng tương tự với Việt Nam và Trung Quốc, nhóm đã thu
được bảng số liệu sau:
Bảng ước lượng
Số ca nhiễm
Số ca nhiễm
mới
Số ca tử
vong
Số ca tử
vong mới
Tỷ lệ tử
vong
Tỷ lệ tử
vong mới
Hàn Quốc
9438 – 101137 ca
63 – 119 ca
Việt Nam
189 ca – 232 ca
2 – 4 ca
Trung Quốc
82826 - 83436 ca
40 – 72 ca
170 – 203 ca
3776 – 4069 ca
2 – 3 ca
0 - 47,2144 ca
0,017 - 0,019
0,0454 - 0,0486
0,058 - 0,1
0,072 - 0,248
3. Bài toán kiểm định
Bài toán kiểm định: Trong 3 tháng ( 01/03/2020 – 31/05/2020) thấy rằng tỷ lệ số ca
tử vong trên số ca lây nhiễm của Hàn Quốc là 0,0325 ( n=7732, nA=252 ). Trong cùng
3 tháng đó, ở Trung Quốc, tỷ lệ số ca tử vong trên số ca lây nhiễm là 0,385 (nA=1772,
n=4602) . Với mức ý nghĩa 5%, có thể kết luận rằng tỷ lệ tử vong của Hàn Quốc là cao
hơn so với Trung Quốc hay không?
Bài làm
Gọi f là tỷ lệ số ca lây nhiễm trên mẫu
p là tỷ lệ số ca lây nhiễm trên đám đông
Vì n khá lớn nên f có phân phối xấp xỉ chuẩn
Với mức ý nghĩa 5% = 0,05 ta cần kiểm định
Xây dựng tiêu chuẩn kiểm định: Nếu H0 đúng thì
Ta tìm được giá trị phân vị sao cho:
Theo nguyên lý xác suất nhỏ ta có miền bác bỏ:
Vậy ta có
=> Chưa có cơ sở bác bỏ H0
Vậy với mức ý nghĩa 5%, không thể kết luận rằng tỷ lệ tử vong của Hàn Quốc là cao
hơn so với Trung Quốc.
Bài toán kiểm định: Trong 3 tháng ( 01/03/2020 – 31/05/2020) thấy rằng tỷ lệ số ca
tử vong trên số ca lây nhiễm của Hàn Quốc là 0,0325 ( n=7732, nA=252 ). Trong cùng
3 tháng đó, trên thế giới, tỷ lệ số ca tử vong trên số ca lây nhiễm là 0,0638
(n=5184046, nA=330761) . Với mức ý nghĩa 5%, có thể kết luận rằng tỷ lệ tử vong
của Hàn Quốc là cao hơn so với thế giới hay không?
Bài làm
Gọi f là tỷ lệ số ca lây nhiễm trên mẫu
p là tỷ lệ số ca lây nhiễm trên đám đông
Vì n khá lớn nên f có phân phối xấp xỉ chuẩn
Với mức ý nghĩa 5% = 0,05 ta cần kiểm định
Xây dựng tiêu chuẩn kiểm định: Nếu H0 đúng thì
Ta tìm được giá trị phân vị sao cho:
Vì khá bé nên theo nguyên lý xác suất nhỏ ta có miền bác bỏ:
Vậy ta có
=> Chưa có cơ sở bác bỏ H0
Vậy với mức ý nghĩa 5%, không thể kết luận rằng tỷ lệ tử vong của Hàn Quốc là cao
hơn so với thế giới.