BỘ GIÁO DỤC VÀ ĐÀO TẠO
BÀI THẢO LUẬN
HP: LÝ THUYẾT XÁC XUẤT VÀ THỐNG KÊ TOÁN
Đề tài: Khảo sát về tình hình dịch bệnh Covid-19 ở Pháp. Sau đó so sánh với Việt
Nam và Trung Quốc
Thực hiện: Nhóm 8
Hà Nội -2021
MỤC LỤC
PHẦN MỞ ĐẦU
PHẦN CƠ SỞ LÝ THUYẾT
I.
Lý thuyết về ước lượng
II. Lý thuyết về kiểm định
PHẦN NỘI DUNG
Biểu đồ thống kê tình hình dịch bệnh của các quốc
gia II. Các bài toán ước lượng
1. Bài toán: Ước lượng về dịch Covid-19 tại Pháp
1.1. Bài toán: Ước lượng về số ca lây nhiễm tại Pháp
1.2. Bài toán: Ước lượng về số tử vong tại Pháp
1.3. Bài toán: Ước lượng về số tỷ lệ tử vong/ lây nhiễm tại Pháp
1.4. Bài toán: Ước lượng về số ca lây nhiễm mới tại Pháp
1.5. Bài toán: Ước lượng về số tử vong mới tại Pháp
1.6. Bài toán: Ước lượng về số tử vong mới/ lây nhiễm mới tại Pháp
2. Bài toán: Ước lượng về dịch Covid-19 tại Việt Nam
2.1. Bài toán: Ước lượng về số ca lây nhiễm tại Việt Nam
2.2. Bài toán: Ước lượng về số tử vong tại Việt Nam
2.3. Bài toán: Ước lượng về số tỷ lệ tử vong/ lây nhiễm tại Việt Nam
2.4. Bài toán: Ước lượng về số ca lây nhiễm mới tại Việt Nam
2.5. Bài toán: Ước lượng về số tử vong mới tại Việt Nam
2.6. Bài toán: Ước lượng về số tử vong mới/ lây nhiễm mới tại Việt Nam
3. Bài toán: Ước lượng về dịch Covid-19 tại Trung Quốc
3.1. Bài toán: Ước lượng về số ca lây nhiễm tại Trung Quốc
3.2. Bài toán: Ước lượng về số tử vong tại Trung Quốc
3.3. Bài toán: Ước lượng về số tỷ lệ tử vong/ lây nhiễm tại Trung Quốc
3.4. Bài toán: Ước lượng về số ca lây nhiễm mới tại Trung Quốc
3.5. Bài toán: Ước lượng về số tử vong mới tại Trung Quốc
3.6. Bài toán: Ước lượng về số tử vong mới/ lây nhiễm mới tại Trung Quốc
BI.
Các bài toán kiểm
định 1.
I.
PHẦN KẾT LUẬN
PHẦN MỞ ĐẦU
PHẦN CƠ SỞ LÝ THUYẾT
I.
Lý thuyết về ước lượng
1. Ước lượng các tham số của đại lượng ngẫu nhiên
1.1. Ước lượng bằng khoảng tin cậy
* Khái niệm
Để ước lượng tham số θ của ĐLNN X trước hết từ đám đông ta lấy ra mẫu ngẫu
nhiên W = (X1,X2…Xn)
Tiếp đến ta xây dựng thống kê G = f(X 1, X2…Xn,θ), sao cho quy luật phân phối
xác suất của G hồn tồn xác định (khơng phụ thuộc vào tham số θ). Với xác suất γ = 1
- α cho trước, ta xác định cặp giá trị α 1, α2 thỏa mãn các điều kiện α 1≥ 0 ,α2≥ 0và α1 +
α2 = α. Vì quy luật phân phối xác suất của G đã biết, ta tìm được phân vị g 1-α1 và gα2
sao cho:
P(G > g1-α1) = 1 – α1 và P(G > gα2) = α2
Khi đó P(g1-α1< G < gα2) = 1 – α1 – α2 = 1 – α = γ
Biến đổi tương đương ta có:
P(θ*1<θ<θ*2) =1–α=γ
Nhận xét:
Nếu thống kê G có hàm mật độ phân phối là đối xứng thì khoảng tin cậy 2 phía
(α1 = α2 =
α
2 ) được gọi là khoảng tin cậy đối xứng
Nếu ước lượng giá trị tối đa hoặc tối thiểu của tham số θ thì ta chọn α1=0 hoặc
α2=0 (khoảng tin cậy 1 phía)
Sai lầm của ước lượng hiệu quả bằng α
1.1.1. Ước lượng kì vọng tốn của ĐLNN
Để ước lượng kì vọng tốn E(X) = μ của ĐLNN X, từ đám đông ta lấy ra mẫu
ngẫu nhiên W = (X1, X2…Xn). Từ mẫu này ta tìm được trung bình mẫu X và phương
sai mẫu điều chỉnh S’2.
Trường hợp chưa biết quy luật phân phối của X trên đám đơng, nhưng
kích thước mẫu n >30, cần ước lượng khoảng tin cậy đối xứng.
Khi n >30 ĐLNN trung bình mẫu X´ có phân phối xấp xỉ chuẩn với các
tham số:
E(X´ )¿ μ và Var(X´ )¿
G≡U=
σ
2
n . Do đó:
X´− μ
σ ≃N(0;1)
√n
Khi đó ta có thể tìm được phân vị Uα /2 sao cho:
´
σ
P(|X −μ|< √ n U α / 2)=¿1-α
Thay (7.17) vào (7.18) và biến đổ ta được
Hay:
P(X −ε <μ
Ta có khoảng tin cậy đối xứng củaμ là
1.1.2. Ước lượng tỷ lệ:
Giả sử ta cần nghiên cứu một đám đông kích thước N, trong đó có M phần tử
mang dấu hiệu A. Khi đó P(A)=M/N=p là tỷ lệ phần tử mang dấu hiệu A trên đám
đơng. Vì khơng điều tra cả đám đông nên thường chưa biết p. Từ đám đơng ta lấy ra
mẫu kích thước n, điều tra trên mẫu này thấy cónA phần tử mang dấu hiệu A. Khi đó
n
tần suất xuất hiện dấu hiệu A trên mẫu là f = nA . Ta đi ước lượng p thơng qua f. Khi n
khá lớn thì f ≃ N
XDTK:
* Trường hợp khoảng tin cậy đối xứng với α1=α2=
Chọn phân vị U1−α /2=−U α/ 2 sao cho
( √pqn
Thay U vào ta có P f −
P −U
(
α2
.U
Lấy p≈ f ⇒q≈ 1−f ⇒ khoảng tin cậy của p:
(
f −√pqn . U α
2
;f
+
√pqn . U
α2
)
Với p . q≈ f (1−f ).
AI.
Lý thuyết về kiểm định
1. Khái niệm
1.1. Giả thuyết thống kê
Định nghĩa: Giả thuyết về dạng phân phối xác suất của ĐLNN, về các tham số
đặc trưng của ĐLNN hoặc về tính độc lập của các ĐLNN được gọi là giả thuyết
thống kê, ký hiệu là H0.
Giả thuyết Ho được đưa ra kiểm định gọi là giả thuyết gốc, đó là giả thuyết ta
đang nghi ngờ. Một giả thuyết trái với giả thuyết gốc được gọi là đối thuyết, kí
hiệu là H1. Ta quy ước khi đã chọn cặp giả thuyết H0 và H1 thì việc bác bỏ H0
tức là chấp nhận H1 và ngược lại.H0 và H1 thành lập 1 cặp giả thuyết thống kê.
1.2.Tiêu chuẩn kiểm định :
Giả sử ta có giả thuyết H0 : θ=θ1
Lấy mẫu: W= {X 1 ; X2 ;… ; Xn }→ XDTK: G = f( X 1 ; X2 ; … ; X n ;θ0 )
Nếu giả thuyết H0 đúng thì G có quy luật phân phối hồn tồn xác định; khi đó
G được gọi là tiêu chuẩn kiểm định
1.3. Miền bác bỏ:
Với giả thuyết H0 trên và với tiêu chuẩn kiểm định G xác định ta ln tìm được
1 miền W ∝ thỏa mãn P(G ∈W ∝ / H0 ) = ∝ ( W ∝ : miền bác bỏ)
Thật vậy: do ∝ là bé theo ý nguyên lý xác xuất nhỏ (G ∈W ∝ / H0) được coi là
không xảy ra → G∉W ∝
Trong lần lấy mẫu nào đó, ta tìm được:
gtn=f (x1; ….; xn θ0 ) mà gtn ∈W ∝ → vô lý → H 0 tỏ ra vô lý → bác bỏ H0
Quy tắc kiểm định : gtn ∈W ∝ → Bác bỏ H0 ;Chấp
nhận H1 gtn ∈W
∝
→chấp nhận H0 ; bácbỏ H1
1.4. Các loại sai lầm:
H0khi bản thân H 0là đúng thì khả
Sai lầm loại 1: là loại sai lầm mà ta bác bỏ năng mắc
phải sai lầm loại 1: P(G∈W ∝/ H0 ¿
Sai lầm loại 2: là loại sai lầm mà ta chấp nhận
năng mắc phải sai lầm loại 2: P( G ∉W ∝/ H1 ¿=β
H0khi bản thân H0là sai thì khả
Nhận xét: Thông thường người ta thường cố định sai lầm loại 1 làm cực tiểu hóa sai
lầm loại 2 để lực kiểm định 1−β là tốt nhất; ∝và β ln ln biến đổi ngược chiều
nhau thường thì ∝+ β=1
2. So sánh kỳ vọng của hai đại lượng ngẫu nhiên.
Xét hai ĐLNN X1,X2. Ký hiệu E(X1)=μ1, E(X2)=μ2 , Var(X1)=σ12, Var(X2))=σ 22 .
Trong đó μ1và μ2 chưa biết.
Với mức ý nghĩa αcho trước ta cần kiểm định giả thuyết H0 :μ1=μ2,
Chọn từ đám đơng thứ nhất ra mẫu kích thước n1: W1=(X11,X12,…,X1n). Từ đó ta
Tương tự với đám đơng thứ hai.
Với trường hợp chưa biết quy luật phân phối xác suất của X1, X2 nhưng n1>30,
n2>30
´
Vì n1 > 30, n2 > 30 nên X 1 ≃ N ¿) và X
´
2
≃ N ¿).
Do đó ta có tiêu chuẩn kiểm đinh: U=
Tùy thuộc vào đối thuyết H1 ta có những bài tốn sau:
H0
μ=μ0
μ
μ
μ
´x−μ0
Utn=
σ /√n
Kết luận: Nếu utn∈ Wαthì bác bỏ H0, chấp nhận H1.
Nếu utn∉ Wαthì bác bỏ H1, chấp nhận H0.
PHẦN NỘI DUNG
I. Biểu đồ thống kê tình hình dịch bệnh của các quốc gia
1. Biểu đồ của Pháp
3500000
3000000
2500000
2000000
1500000
1000000
500000
0
Số ca lây nhiễm
0
0
2
2
0
0
2
0
2
/
2
/
1
/
6
/
1
1
1
3
/
1
/
1
1
/
80000
Số ca tử vong
70000
60000
50000
40000
30000
20000
10000
0
0
2
0
2
/
1
1
/
6
1
/
1
1
Số ca tử vong
Số ca nh
100000
90000
80000
70000
60000
50000
40000
30000
20000
10000
0
2
0
2
/
1
/
1
1
/
1
1
Số ca nhiễm mới
2000
1500
1000
500
0
1
/
1
1
Thu thập số liệu về tình
hình Covid-19 tại Pháp từ
ngày 01/01/2020 đến ngày
31/01/2021 được kết quả.
-Tổng số ca lây nhiễm là:
3.126.351 ca
-Tổng số ca tử vong là:
75.466 ca
-Tỷ lệ tử vong/ lây nhiễm
là: 0.024138684
2. Biểu đồ của Việt Nam
2000
Số ca lây nhiễm
1800
1600
1400
1200
1000
800
600
400
200
0
0
0
2
0
2
/
2
/
/
1
5
/
1
1
/
1
1
1
Số ca tử
vong
40
35
30
25
20
15
10
1
0
.
5
0
1
/
1
1
1
100
80
60
40
20
0
/
1
1/
1/1 1/ 2/
1
Số ca lây nhiễm mới
2
.
5
3
.
5
2
3
1
.
5
số ca tử vong mới
2
2
/
/
1
5
/
1
1
2
/
/
1
1
Thu thập số liệu về tình hình Covid-19 tại
Việt Nam từ ngày 01/01/2020 đến ngày
31/01/2021 được kết quả.
-Tổng số ca lây nhiễm là: 1.781 ca
-Tổng số ca tử vong là: 35 ca
-Tỷ lệ tử vong/ lây nhiễm là: 0.019651881
3. Biểu đồ của Trung Quốc
100000
80000
60000
40000
20000
0
2
0
2
1
1
Số ca lây nhiễm
3000
6000
5000
4000
2000
1000
0
1
/
1
/
/
0
0
2
Số ca
tử
vong
0
2
/
2
/
/
1
5
/
1
1
/
1
1
/
1
1200
1000
800
600
400
200
0
0
0
2
2
0
0
2
/
2
0
2
2
/
/
1
5
/
9
1
1
2
2
/
1
/
1
/
1
2
1
số ca tử vong mới
16000
Số ca nhiễm mới
14000
12000
10000
8000
6000
4000
2000
0
2
/
0
5
2
/
1
9
1
2
/
1
/
1
/
1
Thu thập số liệu về tình hình Covid-19 tại Trung Quốc từ ngày 01/01/2020 đến
ngày 31/01/2021 được kết quả.
-Tổng số ca lây nhiễm là: 100.877 ca
-Tổng số ca tử vong là: 4.823 ca
-Tỷ lệ tử vong/ lây nhiễm là: 0.0478107
AI.
Các bài toán ước lượng
1. Bài toán: Ước lượng về dịch Covid-19 tại Pháp
1.1. Bài toán: Ước lượng về số ca lây nhiễm tại Pháp
Điều tra 397 ngày liên tiếp (từ 01/01/2020 -31/01/2021) về số ca nhiễm Covid
19 của quốc gia Pháp được số ca lây nhiễm trung bình là 692646,70 ca và độ lệch
chuẩn mẫu điều chỉnh là 950294,51 ca . Với độ tin cậy 95% hãy ước lượng số ca lây
nhiễm ở quốc gia trên.
Trung bình
Sai số trung bình
Trung vị
Mode
Độ lệch chuẩn
Phương sai
Bài làm
Gọi X là số ca lây nhiễm Covid-19 của Pháp
Gọi X´ là số ca lây nhiễm Covid-19 trung bình của Pháp trên mẫu.
Gọi µ là số ca lây nhiễm Covid-19 trung bình của Pháp trên đám đơng.
Vì n = 397 đủ lớn nên
Ta xây dựng thống kê: U=
Với độ tin cậy γ= 1 −
Thay biểu thức U vào cơng thức, ta có:
P( |X−µ|<
(X–ε
Khoảng tin cậy đối xứng của µ:
Trong đó:
Vì: 1- α= 0,95
α=0,05
u
0,05
2
=u
0,025
=1,96
Theo giả thiết, ta có n= 397. Vì n đủ lớn nên σ ≈ s'=950294,51
ε=
σ
950294,51
. uα =
√n 2 √397
.1,96=93480,08
Khoảng tin cậy 0.95 của µ đối với mẫu cụ thể là
(692646,70 93480,08; 692646,70 +93480,08) hay (599166,62; 786126,78)
Kết luận: Vậy với độ tin cậy 95% ta có thể nói rằng số ca lây nhiễm ở Pháp
nằm trong khoảng (599166,62 ca; 786126,78 ca)
1.2.Bài toán: Ước lượng về số ca tử vong tại Pháp
Điều tra 397 ngày liên tiếp (từ 01/01/2020 -31/01/2021) về số ca tử vong do
mắc Covid -19 của Pháp thấy số ca tử vong trung bình là 28508,79 ca và độ lệch tiêu
chuẩn mẫu điều chỉnh là 20662,55 ca . Với độ tin cậy 95% hãy ước lượng số ca từ
vong do mắc Covid-19 của Pháp.
Trung bình
Sai số trung bình
Trung vị
Mode
Độ lệch chuẩn
Phương sai
Bài làm
Gọi X là số ca tử vong Covid-19 của Pháp
Gọi X´ là số ca tử vong Covid-19 trung bình của Pháp trên mẫu.
Gọi µ là số ca tử vong Covid-19 trung bình của Pháp trên đám đơng.
Vì n = 397 đủ lớn nên
Ta xây dựng thống kê: U=
Với độ tin cậy γ= 1 −
Thay biểu thức U vào cơng thức, ta có:
P( |X−µ|<
´
ε
´
´
Khoảng tin cậy đối xứng của µ: ( X −ε ; X + ε )
Trong đó:
ε =
σ
√ n2
.u
α
Vì: 1- α= 0,95
α=0,05
u
=u
0,05
2
0,025
=1,96
Theo giả thiết, ta có n= 397. Vì n đủ lớn nên σ ≈ s'=20662,55
σ
20662,55
σ
ε=
√n
. uα =
2
.1,96=2032,57ε =uα ×
√397√n√922
=1,96×
2,53
=0,52
Khoảng tin cậy 0.95 của µ đối với mẫu cụ thể là :
(28508,79 2032,57; 28508,79+2032,57) hay (26476,22; 30541,36).
Kết luận: Vậy với độ tin cậy 95% ta có thể nói rằng số ca tử vong ở Pháp
nằm trong khoảng (26476,22 ca ; 30541,36 ca).
1.2. Bài toán: Ước lượng về số tỷ lệ tử vong/ lây nhiễm tại Pháp
Điều tra 397 ngày liên tiếp (từ 01/01/2020 -31/01/2021) về tỷ lệ tử vong/lây
nhiễm Covid -19 của Pháp thấy tỷ lệ tử vong/lây nhiễm trung bình là 0,088 và độ
lệch tiêu chuẩn mẫu điều chỉnh là 0,074. Với độ tin cậy 95% hãy ước lượng tỷ lệ tử
vong/lây nhiễm Covid-19 của Pháp
Trung bình
Sai số trung bình
Trung vị
Mode
Độ lệch chuẩn
Phương sai
Bài làm
Gọi X là tỉ lệ tử vong/lây nhiễm Covid -19 của Pháp
Gọi X´ là tỉ lệ tử vong/lây nhiễm Covid -19 trung bình của Pháp trên mẫu.
Gọi µ là tỉ lệ tử vong/lây nhiễm Covid -19 trung bình của Pháp trên đám đơng.
Vì n = 397 đủ lớn nên X ≃´
Ta xây dựng thống kê: U=
Với độ tin cậy γ= 1 − cho trước, ta tìm được phân vị
u
α
P( |U|
Thay biểu thức U vào cơng thức, ta có:
P( |X−µ|<
´ ε
´
´
Khoảng tin cậy đối xứng của µ: ( X −ε ; X + ε )
Trong đó:
ε =
σ
√ n2
.u
α
Vì: 1- α= 0,95
α=0,05
u
=u
0,05
0,025
2
=1,96
Theo giả thiết, ta có n= 397. Vì n đủ lớn nên σ ≈ s'=0,074
ε=
σ
0,074
. uα =
.1,96=0,0073
√n 2 √397
Khoảng tin cậy 0.95 của µ đối với mẫu cụ thể là:
(0,088- 0,0073; 0,088+0,0073) hay (0,0807; 0,0953)
Kết luận: Vậy với độ tin cậy 95% ta có thể nói rằng tỷ lệ tử vong/ lây nhiễm ở
Pháp nằm trong khoảng (0,0807; 0,0953)
1.3. Bài toán: Ước lượng về số ca lây nhiễm mới tại Pháp
Điều tra 397 ngày liên tiếp (từ 01/01/2020 -31/01/2021) về số ca lây nhiễm Covid
-19 mới trong 1 ngày của Pháp thấy số ca lây nhiễm mới trung bình là 7890,05 ca và
độ lệch tiêu chuẩn mẫu điều chỉnh là 11998,38 ca. Với độ tin cậy 95% hãy ước lượng
số ca lây nhiễm Covid-19 mới trong 1 ngày của Pháp.
Trung bình
Sai số trung bình
Trung vị
Mode
Độ lệch chuẩn
Phương sai
Bài làm
Gọi X là số ca lây nhiễm mới COVID-19 của Pháp
Gọi X là số ca lây nhiễm mới COVID-19 trung bình của Pháp trên mẫu
Gọi
µ
là số ca lây nhiễm mới COVID-19 trung bình của Pháp trên đám đông
≃
2
Ta xây dựng thống kê: U=
√n
Với độ tin cậy γ= 1 − cho trước, ta tìm được phân vị
u
α2
sao cho:
P( |U|
Thay biểu thức U vào công thức, ta có:
P( |X−µ|<
(X–ε
Khoảng tin cậy đối xứng của µ:
Trong đó:
Vì: 1- α= 0,95
α=0,05
u
=u
0,05
0,025
2
=1,96
Theo giả thiết, ta có n= 397. Vì n đủ lớn nên σ ≈ s'=11998,38
ε=
σ
11998,38
. uα =
√n 2 √397
.1,96=1180,28
Khoảng tin cậy 0.95 của µ đối với mẫu cụ thể là :
(7890,05 1180,28; 7890,05 + 1180,28) hay (6709,77;9070,33)
Kết luận: Vậy với độ tin cậy 95% ta có thể nói rằng số ca lây nhiễm mới ở Pháp
nằm trong khoảng (6709,77 ca;9070,33 ca).
1.4. Bài toán: Ước lượng về số tử vong mới tại Pháp
Điều tra 397 ngày liên tiếp (từ 01/01/2020 -31/01/2021) về số ca tử vong mới trong
1 ngày do mắc Covid -19 của Pháp thấy số ca tử vong mới trung bình là 190,34 ca và
độ lệch tiêu chuẩn mẫu điều chỉnh là 281,03 ca . Với độ tin cậy 95% hãy ước lượng số
ca tử vong mới do mắc Covid-19 của Pháp
Trung bình
Sai số trung bình
Trung vị
Mode
Độ lệch chuẩn
Phương sai
Bài làm
Gọi X là số ca tử vong mới COVID-19 của Pháp
Gọi X là số ca tử vong mới COVID-19 trung bình của Pháp trên mẫu
Gọi µ là số ca tử vong mới COVID-19 trung bình của Pháp trên đám đơng
Vì n = 397 đủ lớn nên
Ta xây dựng thống kê: U=
Với độ tin cậy γ= 1 −
Thay biểu thức U vào cơng thức, ta có:
P( |X−µ|<
´
(X–
´
´
Khoảng tin cậy đối xứng của µ: ( X −ε ; X + ε )
Trong đó:
ε =
σ
√ n2
.u
α
Vì: 1- α= 0,95
α=0,05
u
=u
0,05
0,025
2
=1,96
Theo giả thiết, ta có n= 397. Vì n đủ lớn nên σ ≈ s'=281,03
ε=
σ
281,03
. uα =
√n 2 √397
.1,96=27,64
Khoảng tin cậy 0.95 của µ đối với mẫu cụ thể là :
(190,34– 27,64; 190,34+27,64) hay (162,7;217,98)
Kết luận: Vậy với độ tin cậy 95% ta có thể nói rằng số ca tử vong mới ở Pháp
nằm trong khoảng (162,7 ca ;217,98 ca)
1.5. Bài toán: Ước lượng về số tử vong mới/ lây nhiễm mới tại Pháp
Điều tra 397 ngày liên tiếp (từ 01/01/2020 -31/01/2021) về tỷ lệ tử vong mới/lây
nhiễm mới do mắc Covid -19 của Pháp thấy tỷ lệ tử vong mới/lây nhiễm mới trung
bình là 0,0868 và độ lệch tiêu chuẩn mẫu điều chỉnh là 0,2145 . Với độ tin cậy 95%
hãy ước lượng tỷ lệ tử vong mới/lây nhiễm mới do Covid-19 của Pháp