Tải bản đầy đủ (.docx) (26 trang)

Bài tập lớn XSTK Nhóm 2 Nguyễn Đình Huy ĐHBK TPHCM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (718.71 KB, 26 trang )

1

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HCM
KHOA: KHOA HỌC ỨNG DỤNG
BỘ MƠN: TỐN ỨNG DỤNG.

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ.

Nhóm: 2
GVHD: Nguyễn Đình Huy
SVTH: Lê Hải Đăng
MSSV: 1410857

Tp HCM, tháng 7 năm 2016.

LÊ HẢI ĐĂNG – MSSV:1410857

1


2

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

BÀI 1: Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015
(N.Đ.HUY).
Ví dụ 10: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH
(A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Yếu tố


A
A1
A2
A3
A4

Yếu tố
B
B1
C1
C2
C3
C4

B2
9
12
13
10

C2
C3
C4
C1

B3
14
15
14
11


C3
C4
C1
C2

B4
16
12
11
13

C4
C1
C2
C3

12
10
14
13

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
Bài làm:





Dạng bài: Phân tích phương sai ba yếu tố.

Ta giả thiết:
H0: Các giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) bằng nhau.

Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA để kết luận ảnh hưởng
của các yếu tố đến hiệu suất của phản ứng.
Cơ sở lý thuyết:
Khi phân tích phương sai ba yếu tố ta thường dung mơ hình vng La tinh có dạng như sau:

Yếu tố
A
A1
A2
A3
A4
T.i.

Yếu tố
B
B1
C1
C2
C3
C4

B2
Y111
Y212
Y313
Y414
T.1.


LÊ HẢI ĐĂNG – MSSV:1410857

C2
C3
C4
C1

B3
Y122
Y223
Y324
Y421
T.2.

C3
C4
C1
C2

B4
Y133
Y234
Y331
Y432
T.3.

C4
C1
C2

C3

Y144
Y241
Y342
Y443
T.4.

Ti..
T1..
T2..
T3..
T4..

2


3

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

Bảng ANOVA:
Nguồn
sai số

Bậc tự do

Tổng số bình phương

Bình phương

trung bình

Giá trị thống kê

Yếu tố A
(hàng)

r-1

SSR =

MSR = SSR / (r 1)

FR = MSR / SSE

Yếu tố B
(cột)

r-1

SSC =

MSC = SSC / (r 1)

FC = MSC /SSE

Yếu tố C

r-1


SSF =

MSF = SSF / (r 1)

F = MSF / SSE

Sai số

(r-1)(r-2)

SSE = SST – (SSF + SSR +
SSC)

MSE =

Tổng
cộng

r2 - 1

SST =





Giải tốn trên Excel:
Nhập dữ liệu vào bảng như sau:

Tính các giá trị Ti… T.j. T..k và T

- Các giá trị Ti..
Chọn ô B7 và nhập biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
- Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến E8
- Các giá trị T..k
Chọn ô B9 và nhập biểu thức =SUM(B2;C5;D4;E3)
Chọn ô C9 và nhập biểu thức =SUM(B3;C2;D5;E4)
Chọn ô D9 và nhập biểu thức =SUM(B4;C3;D2;E5)
Chọn ô E9 và nhập biểu thức =SUM(B5;C4;D3;E2)

LÊ HẢI ĐĂNG – MSSV:1410857

3


4

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

Giá trị T…
Chọn ơ B10 và nhập biểu thức =SUM(B2:E5)
Tính các giá trị và
- Các giá trị và
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ơ G7 đến ơ G9
- Giá trị

Chọn ô G10 và nhập biểu thức =POWER(B10,2)
- Giá trị
Chọn ơ G11 và nhập biểu thức =SUMSQ(B2:E5)
Tính các giá trị SSR, SSC, SSF, SST và SSE
- Các giá trị SSR, SSC và SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9
- Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
- Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF, và MSE
- Các giá trị MSR, MSC và MSF
Chọn ô K7 và nhập biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ơ K7 đến ơ K9
- Giá trị MSE
Chọn ơ K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính giá trị G và F
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
-










Kết quả và biện luận:
FR = 3,1 < F0.05(3.6) =4,76 => Chấp nhận H0 (pH)
Fc = 11,95 < F0.05(3.6) =4,76 => Bác bỏ H0 (Nhiệt độ)
F = 30,05 < F0.05(3.6) =4,76 => Bác bỏ H0 (Chất xúc tác)
Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng tới hiệu suất.
Ví dụ 12: Người ta dung ba mức nhiệt độ gồm 105, 120 và 135oC kết hợp với ba khoảng thời
gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%)
được trình bày trong bảng sau đây:

Thời gian (phút)
X1
15
30
60
15
30
60
LÊ HẢI ĐĂNG – MSSV:1410857
15
30
60

Nhiệt độ (oC)
X2
105
105
105
120
120
120

135
135
135

Hiệu suất (%)
Y
1.87
2.02
3.28
3.05
4.07
5.54
5.03
6.45
7.26

4


5

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

Hãy cho biết yếu tố nhiệt độ hoặc yếu tố thời gian có liên quan tính tuyến với hiệu suất của phản
ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115oC trong vịng 50 phút thì hiệu suất phản ứng sẽ
là bao nhiêu?
Bài làm:




Dạng bài: Hồi quy tuyến tính đa tham số.
Ta giả thiết:
H0: Phương trình hồi quy khơng thích hợp.

Ta tìm phương trình hồi quy tính tuyến đa tham số để chỉ ra sự phụ thuộc hoặc không phụ thuộc
giữa yếu tố thời gian (X1) và nhiệt độ (X2) với hiệu suất phản ứng tổng hợp (Y).


Cơ sở lý thuyết:
Phương trình tổng qt cho biến phụ thuộc Y có liên quan đến k biến số độc lập Xi (i=1,2,...,k):
B0 + B1X1 + B2X2 + … + BkXk

Bảng ANOVA:
Nguồn
sai số

Bậc tự do

Tổng số bình phương

Bình phương trung
bình

Giá trị thống kê

Hồi quy

k

SSR


MSR = SSR / k

F = MSR / MSE

Sai số

N-k-1

SSE

MSE = SSE / (N - k 1)

Tổng
cộng

N-1

SST = SSR + SSE

Giá trị thống kê:


Giá trị R-bình phương:
Giá trị R2:
(R3 ≤ 0.81 là khá tốt)
Giá trị R2 được hiệu chỉnh (Adjusted R Square)

sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ
LÊ HẢI ĐĂNG – MSSV:1410857


5


6

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY



Độ lệch chuẩn:
(S ≤ 0.30 là khá tốt)

Trắc nghiệm thống kê:




Trắc nghiệm t:
Bậc tự do của t: = N - k - 1
;
Trắc nghiệm F:
Bậc tự do của giá trị F: v1 = 1, v2 = N -k - 1

Giải tốn trên Excel:
Nhập dữ liệu theo cột:



Sử dụng Data -> Data Analysis ->Regression


LÊ HẢI ĐĂNG – MSSV:1410857

6


7

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY



Hồi quy theo Thời gian (X1):
Các thơng số:
-

Input Y Range: Phạm vi biến số Y
Input X Range: Phạm vi biến số X
Labels: Dữ liệu bao gồm nhãn
Confidence Level: Mức tin cậy (chọn 95%)
Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời gian)

Kết quả:

LÊ HẢI ĐĂNG – MSSV:1410857

7


8


BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

Phương trình hồi quy:
ŶX1 = f(X1) = 2.7667 + 0.0445X1 với R2 = 0.2139 và S = 1.8112
t0 = 2.1290 < t0.05 = 2.365 (tra bảng VII với n = 7, α = 0.025) hay = 0.0708 > α = 0.05
 Nên chấp nhận giả thiết H0.

t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05
 Nên chấp nhận giả thiết H0.

F = 1.9049 < = 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay = 0.2100 > α = 0.05
 Nên chấp nhận giả thiết H0.

Vậy phương trình hồi quy trên khơng có ý nghĩa thống kê. Nói 1 cách khác, phương trình hồi
quy này khơng thích hợp.
Kết luận: Yếu tố thời gian khơng có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.
Hồi quy theo Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là $B$1:$B$10
Kết quả:

LÊ HẢI ĐĂNG – MSSV:1410857

8


9

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY


Phương trình hồi quy:
ŶX2 = f(X2) = -11.1411 + 0.1286X2 với R2 = 0.7638 và S = 0.9929
t0 = 3.4179 > t0.05 = 2.365 hay = 0.0112 < α = 0.05
 Nên bác bỏ giả thiết H0.

t1 = 4.7572 > t0.05 = 2.365 hay PV = 0.0021 < α = 0.05
 Nên bác bỏ giả thiết H0.

F = 22.6309 > = 5.590 hay = 0.0021 < α = 0.05
 Nên bác bỏ giả thiết H0.

Vậy phương trình hồi quy trên có ý nghĩa thống kê. Nói 1 cách khác, phương trình hồi quy này
thích hợp.
Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.
Hồi quy theo Thời gian (X1) và Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là $A$1:$B$10
Kết quả:

LÊ HẢI ĐĂNG – MSSV:1410857

9


10

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

Phương trình hồi quy:
ŶX1, X2 = f(X1,X2) = -12.7000 + 0.0445X1 + 0.1286X2 với R2 = 0.9777 và S = 0.3297
t0 = 11.5283 > t0.05 = 2.365 hay = 2.5607E-05 < α = 0.05

 Nên bác bỏ giả thiết H0.

t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05
 Nên bác bỏ giả thiết H0.

t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05
 Nên bác bỏ giả thiết H0.

F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS = 0.0021 < α = 0.05

LÊ HẢI ĐĂNG – MSSV:1410857

10


11

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

 Nên bác bỏ giả thiết H0.

Vậy phương trình hồi quy trên có ý nghĩa thống kê. Nói 1 cách khác, phương trình hồi quy này
thích hợp.
Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là thời gian và nhiệt độ.
Dữ liệu với hàm hồi quy Y = -12.7000 + 0.0445X1 + 0.1286X2

Vẽ biểu đồ: chọn ô C2, vào Insert -> Scatter -> Scatter with only Maker
Sự tính tuyến của phương trình hồi quy YX1, X2 = -12.7000 + 0.0445X1 + 0.1286X2 có thể được trình
bày trên biểu đồ phân tán:


Dự đốn hiệu suất của phản ứng bằng phương trình hồi quy tại nhiệt thời gian (X1) 50 phút, nhiệt độ
(X2) 115oC:
Cơng thức ơ E3:
=B1+B2*E1+B3*E2
Kết quả: 4.3109

BÀI 2: Kiểm tra sức khỏe của 29 công nhân ở năm phân xưởng của
nhà máy sản xuất pin–ắc quy người ta đo được mật độ nhiễm chì của
họ như sau:
Số thứ
tự quan
sát
LÊ HẢI ĐĂNG – MSSV:1410857

Mức nhân tố
F1

F2

F3

F4

F5

11


12


BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

1
2
3
4
5
6
7

0,25
0,28
0,32
0,22
0,22

0,22
0,25
0,24
0,28
0,31
0,21
0,22

0,25
0,26
0,28
0,25
0,22
0,28

0,31

0,31
0,33
0,30
0,29
0,25

0,22
0,28
0,28
0,25
0,30

So sánh mức độ nhiễm chì đối với công nhân ở các phân xưởng
của nhà máy nói trên.
Mức ý nghóa α = 3%.

Bài làm:



Dạng bài: Phân tích phương sai một yếu tố.
Ta giả thiết:
H0: Các giá trị trung bình mức độ nhiễm chì của các cơng nhân của năm phân xưởng bằng nhau.

Ta tiến hành phân tích phương sai một yếu tố trên và dựa trên bảng ANOVA để so sánh mức độ
nhiễm chì của các cơng nhân của nhà máy nói trên.



Cơ sở lý thuyết:

LÊ HẢI ĐĂNG – MSSV:1410857

12


13

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

Khi phân tích phương sai một nhân tố ta tiến hành dựng mơ hình:
Giải tốn trên Excel:

Nhập dữ liệu vào bảng như sau:
Vào Data/Data Analysis.
Chọn Anova: Single Factor.
Trong hộp thoại Anova Single Factor điền dữ liệu vào: Chọn vùng dữ liệu, chỉnh lại chỉ
số Alpha: 0,03.

LÊ HẢI ĐĂNG – MSSV:1410857

13


14

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

Sau đó bấm OK để cho ra kết quả:


Phân tích kết quả: F = 1.582784 < F0.03 = 3.21831
 Chấp nhận giả thiết Ho

Kết luận: Vậy mức độ nhiễm chì ở mỗi phân xưởng là như nhau.

LÊ HẢI ĐĂNG – MSSV:1410857

14


15

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

BÀI 3: Bảng sau đây cho ta phân bố thu nhập của 2 nhóm tuổi: Nhóm tuổi từ 40 – 50 và nhóm tuổi từ 50
– 60 trong số các công nhân lành nghề ở Thụy Điển năm 1930
Nhóm
tuổi

Thu nhập
0–
1

1–
2

2–3

3–4


4–6

≥6

40 –
50

71

430

1072

1609

1178

158

50 –
60

54

324

894

1202


903

112

Có sự khác nhau về phân bố thu nhập giữa 2 nhóm tuổi này trong số các công nhân lành nghề hay không ?
Mức ý nghĩa α = 5%.
Bài làm:



Dạng bài: Phân tích phương sai một yếu tố.
Ta giả thiết:
H0: Các giá trị trung bình mức độ nhiễm chì của các cơng nhân của năm phân xưởng bằng nhau.

Ta tiến hành phân tích phương sai một yếu tố trên và dựa trên bảng ANOVA để so sánh mức độ
nhiễm chì của các cơng nhân của nhà máy nói trên.


Cơ sở lý thuyết:

LÊ HẢI ĐĂNG – MSSV:1410857

15


16

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY


Khi phân tích phương sai một nhân tố ta tiến hành dựng mơ hình:
Giải tốn trên Excel:
Gỉa thiết: Khơng có sự khác nhau về phân bố thu nhập giữa hai nhóm tuổi này trong số các cơng
nhân lành nghề
Ta nhập bảng:

Vào Data /Data analysis,
chọnAnova: Single Factor seõ hiện lên hộp thoại bấm OK

LÊ HẢI ĐĂNG – MSSV:1410857

16


17

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

Trên màng hình sẽ hiện lên hộp thoại của chọnAnova: Single Factor
Ta nhập các thông số như hình dưới:
-Phạm vi của biến số Y(Input Range):ta kéo chuột từ ô B3 tới G4
-Mức ý nghĩa : α=0.05
-Tọa độ đầu ra (Output Range):kích chuột vào A9

Ta được kết quả nhö sau:

LÊ HẢI ĐĂNG – MSSV:1410857

17



18

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

Kết luận:
Ta thấy F =0.2856< F0.05 =4.964603=> chấp nhận H0
Vậy:sự phân bố thu nhập giữa hai nhóm tuổi này trong số các công nhân lành nghề là
bằng nhau
BÀI 4: Theo dõi số học sinh đến muộn của 5 trường PTTH vào các ngày khác nhau trong
tuần người ta thu được số liệu về số lượng học sinh trung bình đến lớp muộn của các trường đó
vào 1 ngày tiêu biểu trong tuần như sau:
Ngày
Trong
Tuần

Trường THPT
A

B

C

D

Thứ Hai
Thứ Ba
Thứ Tư
Thứ Năm


5
4
4
4

4
5
3
4

5
3
4
3

7
2
5
2

Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của các trường. Có sự khác biệt gì về số lượng học
sinh đến lớp muộn vào các ngày khác nhau trong tuần? Mức ý nghĩa α = 1%.
Bài làm:


Dạng bài: Phân tích phương sai 2 yếu tố không lặp.

LÊ HẢI ĐĂNG – MSSV:1410857

18



19

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY



Ta giả thiết:
H01 : Số lượng học sinh đi muộn theo ngày là như nhau.
H02 : Số lượng học sinh đi muộn theo trường là như nhau.



Cơ sở lí thuyết:

Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij (i=1,2…r:
yếu tố A; j=1,2…c: yếu tố B)
Mô hình:
Yếu tố A
1
2

r

Yếu tố B
1




Tổng cộng
Trung
bình
Bảng ANOVA

2












c

Tổng
cộng

Trung bình










Nguồn sai
số

Bậc tự do

Tổng số bình phương

Bình phương trung
bình

Giá trị thống kê

Yếu tố A
(hàng)

(r–1)

SSB =

MSB =

=

Yếu tố B
( cột )

( c -1 )


SSF =

Sai số

(r-1)(c-1)

SSE = SST - (SSF +
SSB)

Tổng cộng

( rc – 1)

SST = -

=
MSF =
MSB =

Giả thuyết:
 “Các giá trị trung bình bằng nhau”
 “Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:

LÊ HẢI ĐĂNG – MSSV:1410857

19



20

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

Biện luận:
Nếu => Chấp nhận H0 (yếu tố A)
Nếu => Chấp nhận H0 (yếu tố B).
Giải toán trên Excel:

Áp dụng Anova: “Two-Factor Without Replication”

Vào Data->DataAnalysis. Chọn mục Anova: Two-Factor Without Replication. Chọn OK.

Trong hộp thoại Anova: Two-Factor Without Replicationlần lượt ấn định các chi tiết:



Phạm vi đầu vào (Input Range): $A$2:$E$6
Nhãn dữ liệu (Labels in First Row/Column)

LÊ HẢI ĐĂNG – MSSV:1410857

20


21

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY




Ngưỡng tin cậy (Alpha): 0.01 (mức ý nghĩa = 1%)

Nhấn OK. Ta được bảng sau:

Phân tích kết quả: FR = 2.0357 < F0.01 = 6.9919 => Chấp nhận H01 (Ngày trong tuần).
Vậy số lượng học sinh đến lớp muộn vào các ngày khác nhau trong tuần là như nhau.

Phân tích kết quả: FC = 0.1071 < F0.01 = 6.9919 => Chấp nhận H02 (Trường THPT).
Vậy Số lượng học sinh đến lớp muộn của các trường là như nhau.
LÊ HẢI ĐĂNG – MSSV:1410857

21


22

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

Kết luận: Số lượng học sinh đến muộn của các trường là như nhau.
BÀI5: Trong một thí nghiệm khoa học, người ta nghiên cứu dộ dày của lớp mạ kền khi dùng ba loại bể
mạ khác nhau. Sau một thời gian mạ, người ta đo độ dày của lớp mạ nhận được ở các bể:
Số lần đo ở bể mạ

Độ dày lớp mạ kền
tính bằng µm

A

B


C

4-8

32

51

68

8 - 12

123

108

80

12 - 16

10

26

26

16 - 20

41


24

28

20 - 24

19

20

28

Với mức ý nghĩa α = 0.05, hãy kiểm định giả thiết: độ dày lớp mạ sau khoảng thời gian nói trên khơng
phụ thuộc loại bể mạ được dùng.
Bài làm:


Dạng bài: Kiểm Định Tính Độc Lập



Ta giả thiết:
H0: Độ dày lớp mạ khơng phụ thuộc vào bể mạ được dùng.

Ta tiến hành tính tốn các tỉ số và so sánh để có thể kết luận được rằng độ dày lớp mạ không phụ
thuộc vào bể mạ được dùng.
Giải toán trên Excel:
Nhập dữ liệu và tính tổng ni và mj vào bảng như sau:


LÊ HẢI ĐĂNG – MSSV:1410857

22


23

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

ni = SUM (hàng)
mj = SUM (cột)
Tính dữ liệu kỳ vọng γ ij theo công thức γ ij = ni* mj /n ta được bảng sau:

Tính P(X > χ²) = CHITEST (Bảng thực tế, Bảng kỳ vọng)
= CHITEST (C3:E7,C13:E17)
= 8.67E-06

LÊ HẢI ĐĂNG – MSSV:1410857

23


24

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY

Phân tích kết quả:

P(X > χ²) = 8.67E-06 < α = 0.05
Do đó giả thuyết Ho khơng được chấp nhận.


Kết luận: Vậy độ dày lớp mạ phụ thuộc vào bể mạ được dùng.

LÊ HẢI ĐĂNG – MSSV:1410857

24



×