Tải bản đầy đủ (.pdf) (27 trang)

Báo cáo xác suất thống kê thầy Huy đề số 2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.69 MB, 27 trang )

BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ

MỤC LỤC
1. ĐỀ BÀI TẬP – ĐỀ SỐ 2 ............................................................................... 3
2. PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL ........................ 5
2.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK
2015 (N.Đ.HUY). .............................................................................................. 5
2.1.1 Ví dụ 10 trang 172 ................................................................................. 5
2.1.2 Ví dụ 12 trang 181 ................................................................................. 8
2.2 Bài tập 2 .................................................................................................... 15
2.3 Bài tập 3 .................................................................................................... 18
2.4 Bài tập 4 .................................................................................................... 20
2.5 Bài tập 5 .................................................................................................... 24

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 2


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

1. ĐỀ BÀI TẬP – ĐỀ SỐ 2
1.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015
(N.Đ.HUY).
1.2 Kiểm tra sức khỏe của 29 công nhân ở 5 phân xưởng của nhà máy sản xuất pin ắc
quy người ta đo được mật độ nhiễm chì của họ như sau:
Số thứ tự
Mức nhân tố
quan sát
F1


F2
F3
F4
F5
1
2
3
4
5
6
7

0,25
0,28
0,32
0,22
0,22

0,22
0,25
0,24
0,28
0,31
0,21
0,22

0,25
0,26
0,28
0,25

0,22
0,28
0,31

0,31
0,33
0,30
0,29
0,25

0,22
0,28
0,28
0,25
0,30

So sánh mức độ nhiễm chì đối với công nhân ở các phân xưởng của nhà máy nói trên.
Mức ý nghĩa  = 3%.
1.3 Bảng sau đây cho ta phân bố thu nhập ở 2 nhóm tuổi: Nhóm từ 40-50 tuổi và
nhóm từ 50-60 tuổi trong số các công nhân lành nghề ở Thụy Điển năm 1930.
Nhóm
tuổi

Thu nhập
0– 1 1– 2

2– 3

3– 4


4– 6

6

40 –
50

71

430

1072

1609

1178

158

50 –
60

54

324

894

1202


903

112

Có sự khác nhau về phân bố thu nhập giữa 2 nhóm tuổi này trong số các công nhân
lành nghề hay không? Mức ý nghĩa  = 5%.

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 3


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

1.4 Theo dõi số học sinh đến lớp muộn của năm trường PTTH vào các ngày khác
nhau trong tuần người ta thu được số liệu về số lượng học sinh trung bình đến lớp
muộn của các trường đó vào một ngày tiêu biểu trong tuần như sau:

Ngày trong tuần Trường PTTH
Thứ hai
Thứ tư
Thứ sáu
Thứ bảy

A

B

C


D

5
4
4
4

4
5
3
4

5
3
4
3

7
2
5
2

Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của các trường. Có sự
khác biệt gì về số lượng học sinh đến lớp muộn vào các ngày khác nhau trong
tuần? Mức ý nghĩa  = 1%.
1.5 Trong một thí nghiệm khoa học người ta nghiên cứu độ dày của lớp mạ kền khi
dùng ba loại bể mạ khác nhau. Sau một thời gian mạ, người ta đo độ dày của lớp mạ
nhận được ở các bể:
Độ dày lớp mạ kền

tính bằng µm

Số lần đo ở bể mạ
A

B

C

4-8

32

51

68

8 - 12

123

108

80

12 - 16

10

26


26

16 - 20

41

24

28

20 - 24

19

20

28

Với mức ý nghĩa  = 0,05, hãy kiểm định giả thiết: độ dày lớp mạ sau khoảng
thời gian nói trên không phục thuộc loại bể mạ được dùng.

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 4


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2


2. PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL

2.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015
(N.Đ.HUY).
2.1.1 Ví dụ 10 trang 172: Hiệu suất phần trăm (%) của một phản ứng hóa
học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được
trình bày trong bảng sau:
Yếu tố
Yếu tố
B
A
B1
B2
B3
B4
A1
C1
9
C2
14
C3
16
C4
12
A2
C2
12
C3
15
C4

12
C1
10
A3
C3
13
C4
14
C1
11
C2
14
A4
C4
10
C1
11
C2
13
C3
13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?

Bài làm:
 Dạng bài: Phân tích phương sai ba yếu tố.
 Ta giả thiết:
H0: Các giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác
(C) bằng nhau.
Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA để kết
luận ảnh hưởng của các yếu tố đến hiệu suất của phản ứng.

 Cơ sở lý thuyết:
Khi phân tích phương sai ba yếu tố ta thường dung mô hình vuông La tinh có dạng
như sau:
Yếu tố
A
A1
A2
A3
A4
T.i.

B1
C1
C2
C3
C4

B2
Y111
Y212
Y313
Y414
T.1.

C2
C3
C4
C1

GVHD: PGS.TS NGUYỄN ĐÌNH HUY


Y122
Y223
Y324
Y421
T.2.

Yếu tố
B
B3
C3
C4
C1
C2

B4
Y133
Y234
Y331
Y432
T.3.

C4
C1
C2
C3

Y144
Y241
Y342

Y443
T.4.

Ti..
T1..
T2..
T3..
T4..

Page 5


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Bảng ANOVA:
Nguồn
sai số
Yếu tố
A
(hàng)

Bậc tự do

r-1

Yếu tố B
(cột)

r-1


Yếu tố
C

r-1

Sai số

(r-1)(r-2)

Tổng
cộng

2

r -1

Tổng số bình phương
SSR =

𝑟

𝑇2


𝑖..

𝑖=1 𝑟

SSF =


...

𝑟2

2
𝑇
𝑗 ..
𝑟
𝑗 =1 𝑟
𝑇 2.
𝑟

SSC =

𝑇2

𝑘.




𝑘=1 𝑟

𝑇...2
𝑟2
𝑇.2
..

𝑟2


SSE = SST – (SSF + SSR +
SSC)
𝑌2 −

SST =
𝑖

𝑗

𝑘 𝑖𝑗𝑘

Bình phương
trung bình

Giá trị thống


MSR = SSR / (r 1)

FR = MSR /
SSE

MSC = SSC / (r 1)

FC = MSC
/SSE

MSF = SSF / (r 1)


F = MSF / SSE

MSE =

SSE

(r − 1)(r−2)

𝑇2

𝑟2

Giải toán trên Excel:
Nhập dữ liệu vào bảng như sau:

 Tính các giá trị Ti… T.j. T..k và T
Các giá trị Ti..
Chọn ô B7 và nhập biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 6


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2










Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến E8
Các giá trị T..k
Chọn ô B9 và nhập biểu thức =SUM(B2;C5;D4;E3)
Chọn ô C9 và nhập biểu thức =SUM(B3;C2;D5;E4)
Chọn ô D9 và nhập biểu thức =SUM(B4;C3;D2;E5)
Chọn ô E9 và nhập biểu thức =SUM(B5;C4;D3;E2)
Giá trị T…
Chọn ô B10 và nhập biểu thức =SUM(B2:E5)
Tính các giá trị 𝐺 và 𝐺
Các giá trị 𝑮và 𝑮
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9
Giá trị 𝑮
Chọn ô G10 và nhập biểu thức =POWER(B10,2)
Giá trị 𝑮
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tính các giá trị SSR, SSC, SSF, SST và SSE
Các giá trị SSR, SSC và SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9

Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF, và MSE
Các giá trị MSR, MSC và MSF
Chọn ô K7 và nhập biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9
Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính giá trị G và F
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
 Kết quả và biện luận:
FR = 3,1 < F0.05(3.6) =4,76 => Chấp nhận H0 (pH)
Fc = 11,95 < F0.05(3.6) =4,76 => Bác bỏ H0 (Nhiệt độ)
F = 30,05 < F0.05(3.6) =4,76 => Bác bỏ H0 (Chất xúc tác)

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 7


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng tới hiệu suất.
2.1.2 Ví dụ 12 trang 181: Người ta dung ba mức nhiệt độ gồm 105, 120 và
135 C kết hợp với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một
phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình bày trong bảng

sau đây:
o

Thời gian
(phút)
X1
15
30
60
15
30
60
15
30
60

Nhiệt độ (oC)
X2

Hiệu suất (%)
Y

105
105
105
120
120
120
135
135

135

1.87
2.02
3.28
3.05
4.07
5.54
5.03
6.45
7.26

Hãy cho biết yếu tố nhiệt độ hoặc yếu tố thời gian có liên quan tính tuyến với
hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115oC trong
vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
Bài làm:
 Dạng bài: Hồi quy tuyến tính đa tham số.
 Ta giả thiết:
H0: Phương trình hồi quy không thích hợp.
Ta tìm phương trình hồi quy tính tuyến đa tham số để chỉ ra sự phụ thuộc hoặc
không phụ thuộc giữa yếu tố thời gian (X1) và nhiệt độ (X2) với hiệu suất phản ứng
tổng hợp (Y).
 Cơ sở lý thuyết:
Phương trình tổng quát cho biến phụ thuộc Y có liên quan đến k biến số độc
lập Xi (i=1,2,...,k):
𝑌𝑋1,𝑋2,…,𝑋𝑘 = B0 + B1X1 + B2X2 + … + BkXk

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 8



BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Bảng ANOVA:
Nguồn
sai số

Bậc tự do

Tổng số bình phương

Bình phương trung
bình

Giá trị thống


Hồi quy

k

SSR

MSR = SSR / k

F = MSR /
MSE


Sai số

N-k-1

SSE

MSE = SSE / (N - k 1)

Tổng
cộng

N-1

SST = SSR + SSE

Giá trị thống kê:
 Giá trị R-bình phương:
Giá trị R2:
𝑹𝟐 =

𝑺𝑺𝑹
𝑺𝑺𝑻

𝒌𝑭

=

𝑵−𝒌−𝟏 +𝒌𝑭

(R3 ≤ 0.81 là khá tốt)


Giá trị R2 được hiệu chỉnh (Adjusted R Square)
𝟐

𝑹𝒊𝒊 =

𝑵 − 𝟏 𝑹𝟐
𝒌(𝟏 − 𝑹𝟐)
= 𝑹𝟐 −
𝑵−𝒌−𝟏
𝑵−𝒌−𝟏

𝑹𝟐𝒊𝒊 sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ
 Độ lệch chuẩn:
𝑺=

𝑺𝑺𝑵

(S ≤ 0.30 là khá tốt)

(𝑵−𝒌−𝟏)

Trắc nghiệm thống kê:
 Trắc nghiệm t:
Bậc tự do của t: 𝜸 = N - k - 1
𝒕 =

𝑩𝒊−𝜷𝒊
𝟐
𝑺𝒏


;

𝑺𝒏 =

𝑺𝟐
(𝑿𝒊−𝑿)𝟐

 Trắc nghiệm F:
Bậc tự do của giá trị F: v1 = 1, v2 = N -k – 1
 Giải toán trên Excel:
Nhập dữ liệu theo cột:

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 9


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Sử dụng Regression: Data -> Data Analysis

Trong cửa sổ Data Analysis chọn Regression:

Hồi quy theo Thời gian (X1):
Các thông số:
- Input Y Range: Phạm vi biến số Y
- Input X Range: Phạm vi biến số X
- Labels: Dữ liệu bao gồm nhãn

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 10


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

- Confidence Level: Mức tin cậy (chọn 95%)
- Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời gian)

Kết quả:

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 11


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Phương trình hồi quy:
ŶX1 = f(X1) = 2.7667 + 0.0445X1 với R2 = 0.2139 và S = 1.8112
t0 = 2.1290 < t0.05 = 2.365 (tra bảng VII với n = 7, α = 0.025) hay 𝑃𝑉2 =
0.0708 > α = 0.05
 Nên chấp nhận giả thiết H0.
t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05
 Nên chấp nhận giả thiết H0.
F = 1.9049 < 𝐹3


0.05

= 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay 𝐹4 =
𝑆

0.2100 > α = 0.05
 Nên chấp nhận giả thiết H0.
Vậy phương trình hồi quy trên không có ý nghĩa thống kê. Nói 1 cách khác,
phương trình hồi quy này không thích hợp.
Kết luận: Yếu tố thời gian không có liên quan tính tuyến với hiệu suất của
phản ứng tổng hợp.
Hồi quy theo Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là
$B$1:$B$10
Kết quả:

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 12


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Phương trình hồi quy:
ŶX2 = f(X2) = -11.1411 + 0.1286X2 với R2 = 0.7638 và S = 0.9929
t0 = 3.4179 > t0.05 = 2.365 hay 𝑃𝑉2 = 0.0112 < α = 0.05
 Nên bác bỏ giả thiết H0.
t1 = 4.7572 > t0.05 = 2.365 hay PV = 0.0021 < α = 0.05
 Nên bác bỏ giả thiết H0.

F = 22.6309 > 𝐹3 = 5.590 hay 𝐹4 = 0.0021 < α = 0.05
0.05

𝑆

 Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê. Nói 1 cách khác, phương
trình hồi quy này thích hợp.
Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất của phản ứng
tổng hợp.
Hồi quy theo Thời gian (X1) và Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là
$A$1:$B$10
Kết quả:

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 13


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Phương trình hồi quy:
ŶX1, X2 = f(X1,X2) = -12.7000 + 0.0445X1 + 0.1286X2 với R2 = 0.9777 và S
= 0.3297
t0 = 11.5283 > t0.05 = 2.365 hay 𝑃𝑉2 = 2.5607E-05 < α = 0.05
 Nên bác bỏ giả thiết H0.
t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05
 Nên bác bỏ giả thiết H0.

t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05
 Nên bác bỏ giả thiết H0.
F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS =
0.0021 < α = 0.05
 Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê. Nói 1 cách khác, phương
trình hồi quy này thích hợp.
Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là thời
gian và nhiệt độ.
Dữ liệu với hàm hồi quy Y = -12.7000 + 0.0445X1 + 0.1286X2:

Vẽ biểu đồ: chọn ô C2, vào Insert -> Scatter -> Scatter with only Maker
Sự tính tuyến của phương trình hồi quy YX1, X2 = -12.7000 + 0.0445X1 + 0.1286X2
có thể được trình bày trên biểu đồ phân tán:
GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 14


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ

Hàm lượng dự đoán (Y’)

NHÓM 2

Hàm lượng thực nghiệm (Y)

Dự đoán hiệu suất của phản ứng bằng phương trình hồi quy tại nhiệt thời gian (X1)
50 phút, nhiệt độ (X2) 115oC:


2.2 Kiểm tra sức khỏe của 29 công nhân ở 5 phân xưởng của nhà máy sản xuất pin ắc quy
người ta đo được mật độ nhiễm chì của họ như sau:
Số thứ tự
Mức nhân tố
quan sát
F1
F2
F3
F4
F5
1
2
3
4
5
6
7

0,25
0,28
0,32
0,22
0,22

0,22
0,25
0,24
0,28
0,31
0,21

0,22

0,25
0,26
0,28
0,25
0,22
0,28
0,31

0,31
0,33
0,30
0,29
0,25

0,22
0,28
0,28
0,25
0,30

So sánh mức độ nhiễm chì đối với công nhân ở các phân xưởng của nhà máy nói trên.
Mức ý nghĩa  = 3%.

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 15



BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Bài làm:
 Dạng bài: Phân tích phương một yếu tố.
 Ta giả thiết:
H0: Các giá trị trung bình mức độ nhiễm chì của các công nhân của năm phân
xưởng bằng nhau.
Ta tiến hành phân tích phương sai một yếu tố trên và dựa trên bảng ANOVA để so
sánh mức độ nhiễm chì của các công nhân của nhà máy nói trên.
 Cơ sở lý thuyết:
Khi phân tích phương sai một nhân tố ta tiến hành dựng mô hình:

 Giải toán trên Excel:
Nhập dữ liệu vào bảng như sau:

GVHD: PGS.TS NGUYỄN ĐÌNH HUY

Page 16


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Vào Data/Data Analysis.
Chọn Anova: Single
Factor.
Trong hộp thoại Anova Single Factor điền dữ liệu vào: Chọn vùng dữ liệu,
chỉnh lại chỉ
số Alpha: 0,03.


Sau đó bấm OK để cho ra kết quả:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 17


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

 Phân tích kết quả: F = 1.58278429 < F0.03 = 3.21831


Chấp nhận giả thiết Ho

 Kết luận: Vậy mức độ nhiễm chì ở mỗi phân xưởng là như nhau.
2.3 Bảng sau đây cho ta phân bố thu nhập ở 2 nhóm tuổi: Nhóm từ 40-50 tuổi và
nhóm từ 50-60 tuổi trong số các công nhân lành nghề ở Thụy Điển năm 1930.
Nhóm
tuổi

Thu nhập
0– 1 1– 2

2– 3

3– 4

4– 6


6

40 –
50

71

430

1072

1609

1178

158

50 –
60

54

324

894

1202

903


112

Có sự khác nhau về phân bố thu nhập giữa 2 nhóm tuổi này trong số các công nhân
lành nghề hay không? Mức ý nghĩa  = 5%.
Bài làm
 Dạng bài: So sánh 2 tỉ số.
 Ta giả thiết:
H0: Sự phân bố thu nhập giữa hai nhóm tuổi này trong số các công nhân lành nghề
là giống nhau.
Ta tiến hành tính toán các tỉ số và so sánh để có thể kết luận phân bố thu nhập giữa
2 nhóm tuồi này trong số các công nhân lành nghề có khác nhau hay không.
 Giải toán trên Excel:
Nhập dữ liệu và tính tổng ni và mj vào bảng như sau:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 18


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

ni = SUM (hàng)
mj = SUM (cột)

Tính dữ liệu kỳ vọng ij theo công thức ij = ni* mj /n ta được bảng sau:

Tính P(X > ²) = CHITEST (Bảng thực tế, Bảng kỳ vọng)
= CHITEST (C3:H4,C9:H10)

= 0.5116

 Phân tích kết quả:

P(X > ²) = 0.5116 >  = 0.05
Do đó giả thuyết Ho được chấp nhận.

 Kết luận: Vậy mức thu nhập giữa 2 nhóm tuổi 40 - 50 và 50 - 60 là như nhau.

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 19


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

2.4 Theo dõi số học sinh đến lớp muộn của năm trường PTTH vào các ngày khác
nhau trong tuần người ta thu được số liệu về số lượng học sinh trung bình đến lớp
muộn của các trường đó vào một ngày tiêu biểu trong tuần như sau:

Ngày trong tuần Trường PTTH
A

B

C

D


5
4
4
4

4
5
3
4

5
3
4
3

7
2
5
2

Thứ hai
Thứ tư
Thứ sáu
Thứ bảy

Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của các trường. Có sự
khác biệt gì về số lượng học sinh đến lớp muộn vào các ngày khác nhau trong
tuần? Mức ý nghĩa  = 1%.
Bài làm
 Dạng bài: Phân tích phương sai 2 yếu tố không lặp.

 Ta giả thiết:
H01 : Số lượng học sinh đi muộn theo ngày là như nhau.
H02 : Số lượng học sinh đi muộn theo trường là như nhau.
 Cơ sở lí thuyết:
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan
sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
Mô hình:

Yếu tố A
1
2

r
Tổng
cộng
Trung
bình

Yr1

Yếu tố B
2


Y12
Y22



Yr2



T1
Y.1

T2
Y.2

1
Y11
Y21



GVHD: PGS.TS. NGUYỄN ĐÌNH HUY




c

Tổng
cộng

Trung bình

Y1c
Y2c

Y1

Y2

Y1
Y2



Yrc

Tc
Y. c





Yr

Yr

T…
Y…

Page 20


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Bảng ANOVA


Nguồn
sai số
Yếu tố A
(hàng)

Bậc tự
do

Tổng số bình
phương

(r–1)

SSB =

r

Yếu tố B
( cột )

( c -1 )

SSF =

c

Sai số

(r-1)(c1)


Tổng
cộng

T i2

i=1 c
T2j




j=1 r

( rc – 1)

Bình phương
trung bình

T..2

MSB =

( r−1)

rc
T2

r


i=1

c

( c−1)

rc

Y2
j=1 ij

-

SSF

MSF =

..

SSE = SST - (SSF
+ SSB)
SST =

SSB

MSB =

Giá trị thống

MSB


FR=

MSE

FC =

MSF
MSE

SSB
(r−1)

T2
..

r

Giả thuyết:
 “Các giá trị trung bình bằng nhau”
 “Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:

Biện luận:
Nếu
Nếu

=> Chấp nhận H0 (yếu tố A)
=> Chấp nhận H0 (yếu tố B).


 Giải toán trên Excel:
Nhập dữ liệu

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 21


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Áp dụng Anova: “Two-Factor Without Replication” trong hộp thoại Data
Analysis

Vào Data->DataAnalysis. Chọn mục Anova: Two-Factor Without
Replication. Chọn OK.

Trong hộp thoại Anova: Two-Factor Without Replicationlần lượt ấn định các
chi tiết:
Phạm vi đầu vào (Input Range): $A$2:$E$6
Nhãn dữ liệu (Labels in First Row/Column)
Ngưỡng tin cậy (Alpha): 0.01 (mức ý nghĩa = 1%)

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 22


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2


Nhấn OK. Ta được bảng sau:

 Phân tích kết quả: FR = 2.0357 < F0.01 = 6.9919 => Chấp
nhận H01 (Ngày trong tuần).
Vậy số lượng học sinh đến lớp muộn vào các ngày khác nhau trong tuần là như
nhau.
 Phân tích kết quả: FC = 0.1071 < F0.01 = 6.9919 => Chấp
nhận H02 (Trường THPT).
Vậy Số lượng học sinh đến lớp muộn của các trường là như nhau.
 Kết luận: Số lượng học sinh đến muộn của các trường là như nhau.

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 23


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ

2.5 Trong một thí nghiệm khoa học người ta nghiên cứu độ dày của lớp mạ kền khi dùng
ba loại bể mạ khác nhau. Sau một thời gian mạ, người ta đo độ dày của lớp mạ nhận
được ở các bể:
Độ dày lớp mạ kền
tính bằng µm

Số lần đo ở bể mạ
A

B


C

4-8

32

51

68

8 - 12

123

108

80

12 - 16

10

26

26

16 - 20

41


24

28

20 - 24

19

20

28

Với mức ý nghĩa  = 0,05, hãy kiểm định giả thiết: độ dày lớp mạ sau khoảng
thời gian nói trên không phục thuộc loại bể mạ được dùng.

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 24


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ

Bài làm
 Dạng bài: Kiểm Định Tính Độc Lập
 Ta giả thiết:
H0: Độ dày lớp mạ không phụ thuộc vào bể mạ được dùng.
Ta tiến hành tính toán các tỉ số và so sánh để có thể kết luận được rằng độ dày lớp
mạ không phụ thuộc vào bể mạ được dùng.
 Giải toán trên Excel:
Nhập dữ liệu và tính tổng ni và mj vào bảng như sau:

ni = SUM (hàng)
mj = SUM (cột)

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 25


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ

Tính dữ liệu kỳ vọng ij theo công thức ij = ni* mj /n ta được bảng sau:

Tính P(X > ²) = CHITEST (Bảng thực tế, Bảng kỳ vọng)
= CHITEST (C3:E7,C13:E17)
= 8.67E-06

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 26


×