Tải bản đầy đủ (.docx) (55 trang)

THẢO LUẬN HP lý THUYẾT xác XUẤT và THỐNG kê TOÁN đề tài khảo sát về tình hình dịch bệnh covid 19 ở pháp sau đó so sánh với việt nam và trung quốc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (532.15 KB, 55 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

BÀI THẢO LUẬN
HP: LÝ THUYẾT XÁC XUẤT VÀ THỐNG KÊ TOÁN
Đề tài: Khảo sát về tình hình dịch bệnh Covid-19 ở Pháp. Sau đó so sánh với Việt
Nam và Trung Quốc

Thực hiện: Nhóm 8

Hà Nội -2021


MỤC LỤC
PHẦN MỞ ĐẦU
PHẦN CƠ SỞ LÝ THUYẾT
I.

Lý thuyết về ước lượng

II. Lý thuyết về kiểm định

PHẦN NỘI DUNG
Biểu đồ thống kê tình hình dịch bệnh của các quốc
gia II. Các bài toán ước lượng
1. Bài toán: Ước lượng về dịch Covid-19 tại Pháp
1.1. Bài toán: Ước lượng về số ca lây nhiễm tại Pháp
1.2. Bài toán: Ước lượng về số tử vong tại Pháp
1.3. Bài toán: Ước lượng về số tỷ lệ tử vong/ lây nhiễm tại Pháp
1.4. Bài toán: Ước lượng về số ca lây nhiễm mới tại Pháp
1.5. Bài toán: Ước lượng về số tử vong mới tại Pháp
1.6. Bài toán: Ước lượng về số tử vong mới/ lây nhiễm mới tại Pháp


2. Bài toán: Ước lượng về dịch Covid-19 tại Việt Nam
2.1. Bài toán: Ước lượng về số ca lây nhiễm tại Việt Nam
2.2. Bài toán: Ước lượng về số tử vong tại Việt Nam
2.3. Bài toán: Ước lượng về số tỷ lệ tử vong/ lây nhiễm tại Việt Nam
2.4. Bài toán: Ước lượng về số ca lây nhiễm mới tại Việt Nam
2.5. Bài toán: Ước lượng về số tử vong mới tại Việt Nam
2.6. Bài toán: Ước lượng về số tử vong mới/ lây nhiễm mới tại Việt Nam
3. Bài toán: Ước lượng về dịch Covid-19 tại Trung Quốc
3.1. Bài toán: Ước lượng về số ca lây nhiễm tại Trung Quốc
3.2. Bài toán: Ước lượng về số tử vong tại Trung Quốc
3.3. Bài toán: Ước lượng về số tỷ lệ tử vong/ lây nhiễm tại Trung Quốc
3.4. Bài toán: Ước lượng về số ca lây nhiễm mới tại Trung Quốc
3.5. Bài toán: Ước lượng về số tử vong mới tại Trung Quốc
3.6. Bài toán: Ước lượng về số tử vong mới/ lây nhiễm mới tại Trung Quốc
BI.
Các bài toán kiểm
định 1.
I.

PHẦN KẾT LUẬN


PHẦN MỞ ĐẦU
PHẦN CƠ SỞ LÝ THUYẾT
I.

Lý thuyết về ước lượng
1. Ước lượng các tham số của đại lượng ngẫu nhiên

1.1. Ước lượng bằng khoảng tin cậy

* Khái niệm
Để ước lượng tham số θ của ĐLNN X trước hết từ đám đông ta lấy ra mẫu ngẫu
nhiên W = (X1,X2…Xn)
Tiếp đến ta xây dựng thống kê G = f(X 1, X2…Xn,θ), sao cho quy luật phân phối
xác suất của G hồn tồn xác định (khơng phụ thuộc vào tham số θ). Với xác suất γ = 1
- α cho trước, ta xác định cặp giá trị α 1, α2 thỏa mãn các điều kiện α 1≥ 0 ,α2≥ 0và α1 +
α2 = α. Vì quy luật phân phối xác suất của G đã biết, ta tìm được phân vị g 1-α1 và gα2
sao cho:
P(G > g1-α1) = 1 – α1 và P(G > gα2) = α2
Khi đó P(g1-α1< G < gα2) = 1 – α1 – α2 = 1 – α = γ
Biến đổi tương đương ta có:
P(θ*1<θ<θ*2) =1–α=γ
Nhận xét:
Nếu thống kê G có hàm mật độ phân phối là đối xứng thì khoảng tin cậy 2 phía
(α1 = α2 =

α
2 ) được gọi là khoảng tin cậy đối xứng

Nếu ước lượng giá trị tối đa hoặc tối thiểu của tham số θ thì ta chọn α1=0 hoặc
α2=0 (khoảng tin cậy 1 phía)
Sai lầm của ước lượng hiệu quả bằng α
1.1.1. Ước lượng kì vọng tốn của ĐLNN
Để ước lượng kì vọng tốn E(X) = μ của ĐLNN X, từ đám đông ta lấy ra mẫu
ngẫu nhiên W = (X1, X2…Xn). Từ mẫu này ta tìm được trung bình mẫu X và phương
sai mẫu điều chỉnh S’2.
Trường hợp chưa biết quy luật phân phối của X trên đám đơng, nhưng
kích thước mẫu n >30, cần ước lượng khoảng tin cậy đối xứng.
Khi n >30 ĐLNN trung bình mẫu X´ có phân phối xấp xỉ chuẩn với các
tham số:



E(X´ )¿ μ và Var(X´ )¿
G≡U=

σ

2
n . Do đó:

X´− μ
σ ≃N(0;1)
√n

Khi đó ta có thể tìm được phân vị Uα /2 sao cho:

´

σ

P(|X −μ|< √ n U α / 2)=¿1-α
Thay (7.17) vào (7.18) và biến đổ ta được

Hay:

P(X −ε <μ
Ta có khoảng tin cậy đối xứng củaμ là

1.1.2. Ước lượng tỷ lệ:

Giả sử ta cần nghiên cứu một đám đông kích thước N, trong đó có M phần tử
mang dấu hiệu A. Khi đó P(A)=M/N=p là tỷ lệ phần tử mang dấu hiệu A trên đám
đơng. Vì khơng điều tra cả đám đông nên thường chưa biết p. Từ đám đơng ta lấy ra
mẫu kích thước n, điều tra trên mẫu này thấy cónA phần tử mang dấu hiệu A. Khi đó
n
tần suất xuất hiện dấu hiệu A trên mẫu là f = nA . Ta đi ước lượng p thơng qua f. Khi n
khá lớn thì f ≃ N

XDTK:

* Trường hợp khoảng tin cậy đối xứng với α1=α2=

Chọn phân vị U1−α /2=−U α/ 2 sao cho

( √pqn

Thay U vào ta có P f −

P −U

(

α2

.U

Lấy p≈ f ⇒q≈ 1−f ⇒ khoảng tin cậy của p:


(


f −√pqn . U α

2

;f

+

√pqn . U

α2

)


Với p . q≈ f (1−f ).

AI.

Lý thuyết về kiểm định
1. Khái niệm

1.1. Giả thuyết thống kê
Định nghĩa: Giả thuyết về dạng phân phối xác suất của ĐLNN, về các tham số
đặc trưng của ĐLNN hoặc về tính độc lập của các ĐLNN được gọi là giả thuyết
thống kê, ký hiệu là H0.
Giả thuyết Ho được đưa ra kiểm định gọi là giả thuyết gốc, đó là giả thuyết ta
đang nghi ngờ. Một giả thuyết trái với giả thuyết gốc được gọi là đối thuyết, kí
hiệu là H1. Ta quy ước khi đã chọn cặp giả thuyết H0 và H1 thì việc bác bỏ H0

tức là chấp nhận H1 và ngược lại.H0 và H1 thành lập 1 cặp giả thuyết thống kê.
1.2.Tiêu chuẩn kiểm định :
Giả sử ta có giả thuyết H0 : θ=θ1
Lấy mẫu: W= {X 1 ; X2 ;… ; Xn }→ XDTK: G = f( X 1 ; X2 ; … ; X n ;θ0 )
Nếu giả thuyết H0 đúng thì G có quy luật phân phối hồn tồn xác định; khi đó
G được gọi là tiêu chuẩn kiểm định
1.3. Miền bác bỏ:
Với giả thuyết H0 trên và với tiêu chuẩn kiểm định G xác định ta ln tìm được
1 miền W ∝ thỏa mãn P(G ∈W ∝ / H0 ) = ∝ ( W ∝ : miền bác bỏ)
Thật vậy: do ∝ là bé theo ý nguyên lý xác xuất nhỏ (G ∈W ∝ / H0) được coi là
không xảy ra → G∉W ∝
Trong lần lấy mẫu nào đó, ta tìm được:
gtn=f (x1; ….; xn θ0 ) mà gtn ∈W ∝ → vô lý → H 0 tỏ ra vô lý → bác bỏ H0
Quy tắc kiểm định : gtn ∈W ∝ → Bác bỏ H0 ;Chấp
nhận H1 gtn ∈W



→chấp nhận H0 ; bácbỏ H1

1.4. Các loại sai lầm:
H0khi bản thân H 0là đúng thì khả
Sai lầm loại 1: là loại sai lầm mà ta bác bỏ năng mắc
phải sai lầm loại 1: P(G∈W ∝/ H0 ¿

Sai lầm loại 2: là loại sai lầm mà ta chấp nhận
năng mắc phải sai lầm loại 2: P( G ∉W ∝/ H1 ¿=β

H0khi bản thân H0là sai thì khả



Nhận xét: Thông thường người ta thường cố định sai lầm loại 1 làm cực tiểu hóa sai
lầm loại 2 để lực kiểm định 1−β là tốt nhất; ∝và β ln ln biến đổi ngược chiều
nhau thường thì ∝+ β=1
2. So sánh kỳ vọng của hai đại lượng ngẫu nhiên.
Xét hai ĐLNN X1,X2. Ký hiệu E(X1)=μ1, E(X2)=μ2 , Var(X1)=σ12, Var(X2))=σ 22 .
Trong đó μ1và μ2 chưa biết.
Với mức ý nghĩa αcho trước ta cần kiểm định giả thuyết H0 :μ1=μ2,
Chọn từ đám đơng thứ nhất ra mẫu kích thước n1: W1=(X11,X12,…,X1n). Từ đó ta

Tương tự với đám đơng thứ hai.
Với trường hợp chưa biết quy luật phân phối xác suất của X1, X2 nhưng n1>30,
n2>30

´

Vì n1 > 30, n2 > 30 nên X 1 ≃ N ¿) và X

´
2

≃ N ¿).

Do đó ta có tiêu chuẩn kiểm đinh: U=
Tùy thuộc vào đối thuyết H1 ta có những bài tốn sau:
H0
μ=μ0

μ


μ

μ
´x−μ0
Utn=

σ /√n

Kết luận: Nếu utn∈ Wαthì bác bỏ H0, chấp nhận H1.
Nếu utn∉ Wαthì bác bỏ H1, chấp nhận H0.


PHẦN NỘI DUNG
I. Biểu đồ thống kê tình hình dịch bệnh của các quốc gia
1. Biểu đồ của Pháp
3500000
3000000
2500000
2000000
1500000
1000000
500000
0

Số ca lây nhiễm


0

0


2

2

0

0

2

0

2

/

2

/

1

/

6

/

1


1

1

3

/

1

/

1

1
/


80000

Số ca tử vong

70000
60000
50000
40000
30000
20000
10000

0
0

2
0
2
/

1

1

/

6

1

/

1

1

Số ca tử vong

Số ca nh

100000
90000

80000
70000
60000
50000
40000
30000
20000
10000
0

2
0
2
/

1
/

1

1

/

1
1

Số ca nhiễm mới



2000

1500

1000

500

0

1
/
1

1

Thu thập số liệu về tình
hình Covid-19 tại Pháp từ
ngày 01/01/2020 đến ngày
31/01/2021 được kết quả.
-Tổng số ca lây nhiễm là:
3.126.351 ca
-Tổng số ca tử vong là:
75.466 ca
-Tỷ lệ tử vong/ lây nhiễm
là: 0.024138684
2. Biểu đồ của Việt Nam


2000


Số ca lây nhiễm

1800
1600
1400
1200
1000

800
600
400
200
0
0

0

2
0
2
/

2
/

/

1


5

/

1

1

/

1

1

1

Số ca tử
vong
40

35

30

25

20

15


10


1
0
.
5

0

1

/

1

1

1

100
80
60
40
20
0

/

1


1/

1/1 1/ 2/
1

Số ca lây nhiễm mới
2
.
5

3
.
5

2
3

1
.
5

số ca tử vong mới


2

2

/


/

1

5

/

1

1

2

/

/

1

1

Thu thập số liệu về tình hình Covid-19 tại
Việt Nam từ ngày 01/01/2020 đến ngày
31/01/2021 được kết quả.
-Tổng số ca lây nhiễm là: 1.781 ca
-Tổng số ca tử vong là: 35 ca
-Tỷ lệ tử vong/ lây nhiễm là: 0.019651881
3. Biểu đồ của Trung Quốc


100000
80000
60000
40000
20000
0

2
0
2
1

1

Số ca lây nhiễm
3000
6000

5000

4000

2000

1000

0

1


/

1

/

/


0

0

2

Số ca
tử
vong

0
2
/

2
/

/

1


5

/

1

1

/

1

1

/

1


1200
1000
800
600
400
200
0
0

0


2

2

0

0

2
/

2
0

2

2

/

/

1

5

/

9


1

1

2

2

/

1

/

1

/

1

2

1

số ca tử vong mới

16000

Số ca nhiễm mới


14000
12000
10000
8000
6000
4000
2000
0

2

/

0

5

2
/

1

9

1

2

/


1

/

1


/

1

Thu thập số liệu về tình hình Covid-19 tại Trung Quốc từ ngày 01/01/2020 đến
ngày 31/01/2021 được kết quả.
-Tổng số ca lây nhiễm là: 100.877 ca
-Tổng số ca tử vong là: 4.823 ca
-Tỷ lệ tử vong/ lây nhiễm là: 0.0478107


AI.

Các bài toán ước lượng

1. Bài toán: Ước lượng về dịch Covid-19 tại Pháp

1.1. Bài toán: Ước lượng về số ca lây nhiễm tại Pháp
Điều tra 397 ngày liên tiếp (từ 01/01/2020 -31/01/2021) về số ca nhiễm Covid
19 của quốc gia Pháp được số ca lây nhiễm trung bình là 692646,70 ca và độ lệch
chuẩn mẫu điều chỉnh là 950294,51 ca . Với độ tin cậy 95% hãy ước lượng số ca lây
nhiễm ở quốc gia trên.

Trung bình
Sai số trung bình
Trung vị
Mode
Độ lệch chuẩn
Phương sai

Bài làm
Gọi X là số ca lây nhiễm Covid-19 của Pháp
Gọi X´ là số ca lây nhiễm Covid-19 trung bình của Pháp trên mẫu.
Gọi µ là số ca lây nhiễm Covid-19 trung bình của Pháp trên đám đơng.

Vì n = 397 đủ lớn nên
Ta xây dựng thống kê: U=

Với độ tin cậy γ= 1 −

Thay biểu thức U vào cơng thức, ta có:
P( |X−µ|<

 (X–ε
Khoảng tin cậy đối xứng của µ:

Trong đó:

Vì: 1- α= 0,95


α=0,05





u

0,05

2

=u

0,025

=1,96


Theo giả thiết, ta có n= 397. Vì n đủ lớn nên σ ≈ s'=950294,51
 ε=

σ

950294,51

. uα =
√n 2 √397

.1,96=93480,08

Khoảng tin cậy 0.95 của µ đối với mẫu cụ thể là
(692646,70 93480,08; 692646,70 +93480,08) hay (599166,62; 786126,78)

Kết luận: Vậy với độ tin cậy 95% ta có thể nói rằng số ca lây nhiễm ở Pháp
nằm trong khoảng (599166,62 ca; 786126,78 ca)
1.2.Bài toán: Ước lượng về số ca tử vong tại Pháp
Điều tra 397 ngày liên tiếp (từ 01/01/2020 -31/01/2021) về số ca tử vong do
mắc Covid -19 của Pháp thấy số ca tử vong trung bình là 28508,79 ca và độ lệch tiêu
chuẩn mẫu điều chỉnh là 20662,55 ca . Với độ tin cậy 95% hãy ước lượng số ca từ
vong do mắc Covid-19 của Pháp.

Trung bình
Sai số trung bình
Trung vị
Mode
Độ lệch chuẩn
Phương sai

Bài làm
Gọi X là số ca tử vong Covid-19 của Pháp
Gọi X´ là số ca tử vong Covid-19 trung bình của Pháp trên mẫu.
Gọi µ là số ca tử vong Covid-19 trung bình của Pháp trên đám đơng.

Vì n = 397 đủ lớn nên
Ta xây dựng thống kê: U=

Với độ tin cậy γ= 1 −

Thay biểu thức U vào cơng thức, ta có:

P( |X−µ|<




´

ε


´

´

Khoảng tin cậy đối xứng của µ: ( X −ε ; X + ε )
Trong đó:

ε =

σ

√ n2

.u

α

Vì: 1- α= 0,95



α=0,05
u
=u

0,05

2

0,025

=1,96

Theo giả thiết, ta có n= 397. Vì n đủ lớn nên σ ≈ s'=20662,55
σ
20662,55
σ
 ε=

√n

. uα =
2

.1,96=2032,57ε =uα ×
√397√n√922

=1,96×

2,53

=0,52

Khoảng tin cậy 0.95 của µ đối với mẫu cụ thể là :
(28508,79 2032,57; 28508,79+2032,57) hay (26476,22; 30541,36).

Kết luận: Vậy với độ tin cậy 95% ta có thể nói rằng số ca tử vong ở Pháp
nằm trong khoảng (26476,22 ca ; 30541,36 ca).
1.2. Bài toán: Ước lượng về số tỷ lệ tử vong/ lây nhiễm tại Pháp
Điều tra 397 ngày liên tiếp (từ 01/01/2020 -31/01/2021) về tỷ lệ tử vong/lây
nhiễm Covid -19 của Pháp thấy tỷ lệ tử vong/lây nhiễm trung bình là 0,088 và độ
lệch tiêu chuẩn mẫu điều chỉnh là 0,074. Với độ tin cậy 95% hãy ước lượng tỷ lệ tử
vong/lây nhiễm Covid-19 của Pháp
Trung bình
Sai số trung bình
Trung vị
Mode
Độ lệch chuẩn
Phương sai

Bài làm
Gọi X là tỉ lệ tử vong/lây nhiễm Covid -19 của Pháp
Gọi X´ là tỉ lệ tử vong/lây nhiễm Covid -19 trung bình của Pháp trên mẫu.
Gọi µ là tỉ lệ tử vong/lây nhiễm Covid -19 trung bình của Pháp trên đám đơng.

Vì n = 397 đủ lớn nên X ≃´

Ta xây dựng thống kê: U=

Với độ tin cậy γ= 1 − cho trước, ta tìm được phân vị

u
α


P( |U|

Thay biểu thức U vào cơng thức, ta có:

P( |X−µ|<



´ ε

´

´

Khoảng tin cậy đối xứng của µ: ( X −ε ; X + ε )
Trong đó:

ε =

σ

√ n2

.u

α

Vì: 1- α= 0,95
α=0,05
u
=u





0,05

0,025

2

=1,96

Theo giả thiết, ta có n= 397. Vì n đủ lớn nên σ ≈ s'=0,074
 ε=

σ

0,074
. uα =
.1,96=0,0073
√n 2 √397

Khoảng tin cậy 0.95 của µ đối với mẫu cụ thể là:
(0,088- 0,0073; 0,088+0,0073) hay (0,0807; 0,0953)
Kết luận: Vậy với độ tin cậy 95% ta có thể nói rằng tỷ lệ tử vong/ lây nhiễm ở
Pháp nằm trong khoảng (0,0807; 0,0953)
1.3. Bài toán: Ước lượng về số ca lây nhiễm mới tại Pháp
Điều tra 397 ngày liên tiếp (từ 01/01/2020 -31/01/2021) về số ca lây nhiễm Covid
-19 mới trong 1 ngày của Pháp thấy số ca lây nhiễm mới trung bình là 7890,05 ca và
độ lệch tiêu chuẩn mẫu điều chỉnh là 11998,38 ca. Với độ tin cậy 95% hãy ước lượng
số ca lây nhiễm Covid-19 mới trong 1 ngày của Pháp.

Trung bình
Sai số trung bình
Trung vị
Mode
Độ lệch chuẩn
Phương sai

Bài làm
Gọi X là số ca lây nhiễm mới COVID-19 của Pháp
Gọi X là số ca lây nhiễm mới COVID-19 trung bình của Pháp trên mẫu
Gọi

µ

là số ca lây nhiễm mới COVID-19 trung bình của Pháp trên đám đông


2


Ta xây dựng thống kê: U=

√n
Với độ tin cậy γ= 1 − cho trước, ta tìm được phân vị

u
α2

sao cho:


P( |U|Thay biểu thức U vào công thức, ta có:

P( |X−µ|<

 (X–ε
Khoảng tin cậy đối xứng của µ:

Trong đó:

Vì: 1- α= 0,95



α=0,05
u
=u
0,05

0,025

2

=1,96

Theo giả thiết, ta có n= 397. Vì n đủ lớn nên σ ≈ s'=11998,38
 ε=

σ


11998,38

. uα =
√n 2 √397

.1,96=1180,28

Khoảng tin cậy 0.95 của µ đối với mẫu cụ thể là :
(7890,05 1180,28; 7890,05 + 1180,28) hay (6709,77;9070,33)
Kết luận: Vậy với độ tin cậy 95% ta có thể nói rằng số ca lây nhiễm mới ở Pháp
nằm trong khoảng (6709,77 ca;9070,33 ca).
1.4. Bài toán: Ước lượng về số tử vong mới tại Pháp
Điều tra 397 ngày liên tiếp (từ 01/01/2020 -31/01/2021) về số ca tử vong mới trong
1 ngày do mắc Covid -19 của Pháp thấy số ca tử vong mới trung bình là 190,34 ca và
độ lệch tiêu chuẩn mẫu điều chỉnh là 281,03 ca . Với độ tin cậy 95% hãy ước lượng số
ca tử vong mới do mắc Covid-19 của Pháp


Trung bình
Sai số trung bình
Trung vị
Mode
Độ lệch chuẩn
Phương sai


Bài làm
Gọi X là số ca tử vong mới COVID-19 của Pháp
Gọi X là số ca tử vong mới COVID-19 trung bình của Pháp trên mẫu
Gọi µ là số ca tử vong mới COVID-19 trung bình của Pháp trên đám đơng

Vì n = 397 đủ lớn nên
Ta xây dựng thống kê: U=

Với độ tin cậy γ= 1 −

Thay biểu thức U vào cơng thức, ta có:
P( |X−µ|<



´

(X–

´

´

Khoảng tin cậy đối xứng của µ: ( X −ε ; X + ε )
Trong đó:

ε =

σ

√ n2

.u

α


Vì: 1- α= 0,95



α=0,05
u
=u
0,05

0,025

2

=1,96

Theo giả thiết, ta có n= 397. Vì n đủ lớn nên σ ≈ s'=281,03
 ε=

σ

281,03

. uα =
√n 2 √397

.1,96=27,64

Khoảng tin cậy 0.95 của µ đối với mẫu cụ thể là :
(190,34– 27,64; 190,34+27,64) hay (162,7;217,98)

Kết luận: Vậy với độ tin cậy 95% ta có thể nói rằng số ca tử vong mới ở Pháp
nằm trong khoảng (162,7 ca ;217,98 ca)
1.5. Bài toán: Ước lượng về số tử vong mới/ lây nhiễm mới tại Pháp
Điều tra 397 ngày liên tiếp (từ 01/01/2020 -31/01/2021) về tỷ lệ tử vong mới/lây
nhiễm mới do mắc Covid -19 của Pháp thấy tỷ lệ tử vong mới/lây nhiễm mới trung
bình là 0,0868 và độ lệch tiêu chuẩn mẫu điều chỉnh là 0,2145 . Với độ tin cậy 95%
hãy ước lượng tỷ lệ tử vong mới/lây nhiễm mới do Covid-19 của Pháp


×