1
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HCM
KHOA: KHOA HỌC ỨNG DỤNG
BỘ MƠN: TỐN ỨNG DỤNG.
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ.
Nhóm: 2
GVHD: Nguyễn Đình Huy
SVTH: Lê Hải Đăng
MSSV: 1410857
Tp HCM, tháng 7 năm 2016.
LÊ HẢI ĐĂNG – MSSV:1410857
1
2
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
BÀI 1: Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015
(N.Đ.HUY).
Ví dụ 10: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH
(A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Yếu tố
A
A1
A2
A3
A4
Yếu tố
B
B1
C1
C2
C3
C4
B2
9
12
13
10
C2
C3
C4
C1
B3
14
15
14
11
C3
C4
C1
C2
B4
16
12
11
13
C4
C1
C2
C3
12
10
14
13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
Bài làm:
•
•
•
Dạng bài: Phân tích phương sai ba yếu tố.
Ta giả thiết:
H0: Các giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) bằng nhau.
Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA để kết luận ảnh hưởng
của các yếu tố đến hiệu suất của phản ứng.
Cơ sở lý thuyết:
Khi phân tích phương sai ba yếu tố ta thường dung mơ hình vng La tinh có dạng như sau:
Yếu tố
A
A1
A2
A3
A4
T.i.
Yếu tố
B
B1
C1
C2
C3
C4
B2
Y111
Y212
Y313
Y414
T.1.
LÊ HẢI ĐĂNG – MSSV:1410857
C2
C3
C4
C1
B3
Y122
Y223
Y324
Y421
T.2.
C3
C4
C1
C2
B4
Y133
Y234
Y331
Y432
T.3.
C4
C1
C2
C3
Y144
Y241
Y342
Y443
T.4.
Ti..
T1..
T2..
T3..
T4..
2
3
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Bảng ANOVA:
Nguồn
sai số
Bậc tự do
Tổng số bình phương
Bình phương
trung bình
Giá trị thống kê
Yếu tố A
(hàng)
r-1
SSR =
MSR = SSR / (r 1)
FR = MSR / SSE
Yếu tố B
(cột)
r-1
SSC =
MSC = SSC / (r 1)
FC = MSC /SSE
Yếu tố C
r-1
SSF =
MSF = SSF / (r 1)
F = MSF / SSE
Sai số
(r-1)(r-2)
SSE = SST – (SSF + SSR +
SSC)
MSE =
Tổng
cộng
r2 - 1
SST =
•
•
Giải tốn trên Excel:
Nhập dữ liệu vào bảng như sau:
Tính các giá trị Ti… T.j. T..k và T
- Các giá trị Ti..
Chọn ô B7 và nhập biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
- Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến E8
- Các giá trị T..k
Chọn ô B9 và nhập biểu thức =SUM(B2;C5;D4;E3)
Chọn ô C9 và nhập biểu thức =SUM(B3;C2;D5;E4)
Chọn ô D9 và nhập biểu thức =SUM(B4;C3;D2;E5)
Chọn ô E9 và nhập biểu thức =SUM(B5;C4;D3;E2)
LÊ HẢI ĐĂNG – MSSV:1410857
3
4
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Giá trị T…
Chọn ơ B10 và nhập biểu thức =SUM(B2:E5)
Tính các giá trị và
- Các giá trị và
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ơ G7 đến ơ G9
- Giá trị
Chọn ô G10 và nhập biểu thức =POWER(B10,2)
- Giá trị
Chọn ơ G11 và nhập biểu thức =SUMSQ(B2:E5)
Tính các giá trị SSR, SSC, SSF, SST và SSE
- Các giá trị SSR, SSC và SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9
- Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
- Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF, và MSE
- Các giá trị MSR, MSC và MSF
Chọn ô K7 và nhập biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ơ K7 đến ơ K9
- Giá trị MSE
Chọn ơ K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính giá trị G và F
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
-
•
•
•
•
Kết quả và biện luận:
FR = 3,1 < F0.05(3.6) =4,76 => Chấp nhận H0 (pH)
Fc = 11,95 < F0.05(3.6) =4,76 => Bác bỏ H0 (Nhiệt độ)
F = 30,05 < F0.05(3.6) =4,76 => Bác bỏ H0 (Chất xúc tác)
Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng tới hiệu suất.
Ví dụ 12: Người ta dung ba mức nhiệt độ gồm 105, 120 và 135oC kết hợp với ba khoảng thời
gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%)
được trình bày trong bảng sau đây:
Thời gian (phút)
X1
15
30
60
15
30
60
LÊ HẢI ĐĂNG – MSSV:1410857
15
30
60
Nhiệt độ (oC)
X2
105
105
105
120
120
120
135
135
135
Hiệu suất (%)
Y
1.87
2.02
3.28
3.05
4.07
5.54
5.03
6.45
7.26
4
5
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Hãy cho biết yếu tố nhiệt độ hoặc yếu tố thời gian có liên quan tính tuyến với hiệu suất của phản
ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115oC trong vịng 50 phút thì hiệu suất phản ứng sẽ
là bao nhiêu?
Bài làm:
•
•
Dạng bài: Hồi quy tuyến tính đa tham số.
Ta giả thiết:
H0: Phương trình hồi quy khơng thích hợp.
Ta tìm phương trình hồi quy tính tuyến đa tham số để chỉ ra sự phụ thuộc hoặc không phụ thuộc
giữa yếu tố thời gian (X1) và nhiệt độ (X2) với hiệu suất phản ứng tổng hợp (Y).
•
Cơ sở lý thuyết:
Phương trình tổng qt cho biến phụ thuộc Y có liên quan đến k biến số độc lập Xi (i=1,2,...,k):
B0 + B1X1 + B2X2 + … + BkXk
Bảng ANOVA:
Nguồn
sai số
Bậc tự do
Tổng số bình phương
Bình phương trung
bình
Giá trị thống kê
Hồi quy
k
SSR
MSR = SSR / k
F = MSR / MSE
Sai số
N-k-1
SSE
MSE = SSE / (N - k 1)
Tổng
cộng
N-1
SST = SSR + SSE
Giá trị thống kê:
•
Giá trị R-bình phương:
Giá trị R2:
(R3 ≤ 0.81 là khá tốt)
Giá trị R2 được hiệu chỉnh (Adjusted R Square)
sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ
LÊ HẢI ĐĂNG – MSSV:1410857
5
6
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
•
Độ lệch chuẩn:
(S ≤ 0.30 là khá tốt)
Trắc nghiệm thống kê:
•
•
Trắc nghiệm t:
Bậc tự do của t: = N - k - 1
;
Trắc nghiệm F:
Bậc tự do của giá trị F: v1 = 1, v2 = N -k - 1
Giải tốn trên Excel:
Nhập dữ liệu theo cột:
•
Sử dụng Data -> Data Analysis ->Regression
LÊ HẢI ĐĂNG – MSSV:1410857
6
7
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
•
Hồi quy theo Thời gian (X1):
Các thơng số:
-
Input Y Range: Phạm vi biến số Y
Input X Range: Phạm vi biến số X
Labels: Dữ liệu bao gồm nhãn
Confidence Level: Mức tin cậy (chọn 95%)
Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời gian)
Kết quả:
LÊ HẢI ĐĂNG – MSSV:1410857
7
8
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Phương trình hồi quy:
ŶX1 = f(X1) = 2.7667 + 0.0445X1 với R2 = 0.2139 và S = 1.8112
t0 = 2.1290 < t0.05 = 2.365 (tra bảng VII với n = 7, α = 0.025) hay = 0.0708 > α = 0.05
Nên chấp nhận giả thiết H0.
t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05
Nên chấp nhận giả thiết H0.
F = 1.9049 < = 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay = 0.2100 > α = 0.05
Nên chấp nhận giả thiết H0.
Vậy phương trình hồi quy trên khơng có ý nghĩa thống kê. Nói 1 cách khác, phương trình hồi
quy này khơng thích hợp.
Kết luận: Yếu tố thời gian khơng có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.
Hồi quy theo Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là $B$1:$B$10
Kết quả:
LÊ HẢI ĐĂNG – MSSV:1410857
8
9
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Phương trình hồi quy:
ŶX2 = f(X2) = -11.1411 + 0.1286X2 với R2 = 0.7638 và S = 0.9929
t0 = 3.4179 > t0.05 = 2.365 hay = 0.0112 < α = 0.05
Nên bác bỏ giả thiết H0.
t1 = 4.7572 > t0.05 = 2.365 hay PV = 0.0021 < α = 0.05
Nên bác bỏ giả thiết H0.
F = 22.6309 > = 5.590 hay = 0.0021 < α = 0.05
Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê. Nói 1 cách khác, phương trình hồi quy này
thích hợp.
Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.
Hồi quy theo Thời gian (X1) và Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là $A$1:$B$10
Kết quả:
LÊ HẢI ĐĂNG – MSSV:1410857
9
10
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Phương trình hồi quy:
ŶX1, X2 = f(X1,X2) = -12.7000 + 0.0445X1 + 0.1286X2 với R2 = 0.9777 và S = 0.3297
t0 = 11.5283 > t0.05 = 2.365 hay = 2.5607E-05 < α = 0.05
Nên bác bỏ giả thiết H0.
t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05
Nên bác bỏ giả thiết H0.
t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05
Nên bác bỏ giả thiết H0.
F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS = 0.0021 < α = 0.05
LÊ HẢI ĐĂNG – MSSV:1410857
10
11
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê. Nói 1 cách khác, phương trình hồi quy này
thích hợp.
Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là thời gian và nhiệt độ.
Dữ liệu với hàm hồi quy Y = -12.7000 + 0.0445X1 + 0.1286X2
Vẽ biểu đồ: chọn ô C2, vào Insert -> Scatter -> Scatter with only Maker
Sự tính tuyến của phương trình hồi quy YX1, X2 = -12.7000 + 0.0445X1 + 0.1286X2 có thể được trình
bày trên biểu đồ phân tán:
Dự đốn hiệu suất của phản ứng bằng phương trình hồi quy tại nhiệt thời gian (X1) 50 phút, nhiệt độ
(X2) 115oC:
Cơng thức ơ E3:
=B1+B2*E1+B3*E2
Kết quả: 4.3109
BÀI 2: Kiểm tra sức khỏe của 29 công nhân ở năm phân xưởng của
nhà máy sản xuất pin–ắc quy người ta đo được mật độ nhiễm chì của
họ như sau:
Số thứ
tự quan
sát
LÊ HẢI ĐĂNG – MSSV:1410857
Mức nhân tố
F1
F2
F3
F4
F5
11
12
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
1
2
3
4
5
6
7
0,25
0,28
0,32
0,22
0,22
0,22
0,25
0,24
0,28
0,31
0,21
0,22
0,25
0,26
0,28
0,25
0,22
0,28
0,31
0,31
0,33
0,30
0,29
0,25
0,22
0,28
0,28
0,25
0,30
So sánh mức độ nhiễm chì đối với công nhân ở các phân xưởng
của nhà máy nói trên.
Mức ý nghóa α = 3%.
Bài làm:
•
•
Dạng bài: Phân tích phương sai một yếu tố.
Ta giả thiết:
H0: Các giá trị trung bình mức độ nhiễm chì của các cơng nhân của năm phân xưởng bằng nhau.
Ta tiến hành phân tích phương sai một yếu tố trên và dựa trên bảng ANOVA để so sánh mức độ
nhiễm chì của các cơng nhân của nhà máy nói trên.
•
Cơ sở lý thuyết:
LÊ HẢI ĐĂNG – MSSV:1410857
12
13
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Khi phân tích phương sai một nhân tố ta tiến hành dựng mơ hình:
Giải tốn trên Excel:
Nhập dữ liệu vào bảng như sau:
Vào Data/Data Analysis.
Chọn Anova: Single Factor.
Trong hộp thoại Anova Single Factor điền dữ liệu vào: Chọn vùng dữ liệu, chỉnh lại chỉ
số Alpha: 0,03.
LÊ HẢI ĐĂNG – MSSV:1410857
13
14
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Sau đó bấm OK để cho ra kết quả:
Phân tích kết quả: F = 1.582784 < F0.03 = 3.21831
Chấp nhận giả thiết Ho
Kết luận: Vậy mức độ nhiễm chì ở mỗi phân xưởng là như nhau.
LÊ HẢI ĐĂNG – MSSV:1410857
14
15
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
BÀI 3: Bảng sau đây cho ta phân bố thu nhập của 2 nhóm tuổi: Nhóm tuổi từ 40 – 50 và nhóm tuổi từ 50
– 60 trong số các công nhân lành nghề ở Thụy Điển năm 1930
Nhóm
tuổi
Thu nhập
0–
1
1–
2
2–3
3–4
4–6
≥6
40 –
50
71
430
1072
1609
1178
158
50 –
60
54
324
894
1202
903
112
Có sự khác nhau về phân bố thu nhập giữa 2 nhóm tuổi này trong số các công nhân lành nghề hay không ?
Mức ý nghĩa α = 5%.
Bài làm:
•
•
Dạng bài: Phân tích phương sai một yếu tố.
Ta giả thiết:
H0: Các giá trị trung bình mức độ nhiễm chì của các cơng nhân của năm phân xưởng bằng nhau.
Ta tiến hành phân tích phương sai một yếu tố trên và dựa trên bảng ANOVA để so sánh mức độ
nhiễm chì của các cơng nhân của nhà máy nói trên.
•
Cơ sở lý thuyết:
LÊ HẢI ĐĂNG – MSSV:1410857
15
16
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Khi phân tích phương sai một nhân tố ta tiến hành dựng mơ hình:
Giải tốn trên Excel:
Gỉa thiết: Khơng có sự khác nhau về phân bố thu nhập giữa hai nhóm tuổi này trong số các cơng
nhân lành nghề
Ta nhập bảng:
Vào Data /Data analysis,
chọnAnova: Single Factor seõ hiện lên hộp thoại bấm OK
LÊ HẢI ĐĂNG – MSSV:1410857
16
17
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Trên màng hình sẽ hiện lên hộp thoại của chọnAnova: Single Factor
Ta nhập các thông số như hình dưới:
-Phạm vi của biến số Y(Input Range):ta kéo chuột từ ô B3 tới G4
-Mức ý nghĩa : α=0.05
-Tọa độ đầu ra (Output Range):kích chuột vào A9
Ta được kết quả nhö sau:
LÊ HẢI ĐĂNG – MSSV:1410857
17
18
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Kết luận:
Ta thấy F =0.2856< F0.05 =4.964603=> chấp nhận H0
Vậy:sự phân bố thu nhập giữa hai nhóm tuổi này trong số các công nhân lành nghề là
bằng nhau
BÀI 4: Theo dõi số học sinh đến muộn của 5 trường PTTH vào các ngày khác nhau trong
tuần người ta thu được số liệu về số lượng học sinh trung bình đến lớp muộn của các trường đó
vào 1 ngày tiêu biểu trong tuần như sau:
Ngày
Trong
Tuần
Trường THPT
A
B
C
D
Thứ Hai
Thứ Ba
Thứ Tư
Thứ Năm
5
4
4
4
4
5
3
4
5
3
4
3
7
2
5
2
Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của các trường. Có sự khác biệt gì về số lượng học
sinh đến lớp muộn vào các ngày khác nhau trong tuần? Mức ý nghĩa α = 1%.
Bài làm:
•
Dạng bài: Phân tích phương sai 2 yếu tố không lặp.
LÊ HẢI ĐĂNG – MSSV:1410857
18
19
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
•
Ta giả thiết:
H01 : Số lượng học sinh đi muộn theo ngày là như nhau.
H02 : Số lượng học sinh đi muộn theo trường là như nhau.
•
Cơ sở lí thuyết:
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij (i=1,2…r:
yếu tố A; j=1,2…c: yếu tố B)
Mô hình:
Yếu tố A
1
2
…
r
Yếu tố B
1
…
Tổng cộng
Trung
bình
Bảng ANOVA
2
…
…
…
…
…
…
…
…
c
Tổng
cộng
Trung bình
…
…
…
…
Nguồn sai
số
Bậc tự do
Tổng số bình phương
Bình phương trung
bình
Giá trị thống kê
Yếu tố A
(hàng)
(r–1)
SSB =
MSB =
=
Yếu tố B
( cột )
( c -1 )
SSF =
Sai số
(r-1)(c-1)
SSE = SST - (SSF +
SSB)
Tổng cộng
( rc – 1)
SST = -
=
MSF =
MSB =
Giả thuyết:
“Các giá trị trung bình bằng nhau”
“Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
LÊ HẢI ĐĂNG – MSSV:1410857
19
20
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Biện luận:
Nếu => Chấp nhận H0 (yếu tố A)
Nếu => Chấp nhận H0 (yếu tố B).
Giải toán trên Excel:
Áp dụng Anova: “Two-Factor Without Replication”
Vào Data->DataAnalysis. Chọn mục Anova: Two-Factor Without Replication. Chọn OK.
Trong hộp thoại Anova: Two-Factor Without Replicationlần lượt ấn định các chi tiết:
•
•
Phạm vi đầu vào (Input Range): $A$2:$E$6
Nhãn dữ liệu (Labels in First Row/Column)
LÊ HẢI ĐĂNG – MSSV:1410857
20
21
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
•
Ngưỡng tin cậy (Alpha): 0.01 (mức ý nghĩa = 1%)
Nhấn OK. Ta được bảng sau:
Phân tích kết quả: FR = 2.0357 < F0.01 = 6.9919 => Chấp nhận H01 (Ngày trong tuần).
Vậy số lượng học sinh đến lớp muộn vào các ngày khác nhau trong tuần là như nhau.
Phân tích kết quả: FC = 0.1071 < F0.01 = 6.9919 => Chấp nhận H02 (Trường THPT).
Vậy Số lượng học sinh đến lớp muộn của các trường là như nhau.
LÊ HẢI ĐĂNG – MSSV:1410857
21
22
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Kết luận: Số lượng học sinh đến muộn của các trường là như nhau.
BÀI5: Trong một thí nghiệm khoa học, người ta nghiên cứu dộ dày của lớp mạ kền khi dùng ba loại bể
mạ khác nhau. Sau một thời gian mạ, người ta đo độ dày của lớp mạ nhận được ở các bể:
Số lần đo ở bể mạ
Độ dày lớp mạ kền
tính bằng µm
A
B
C
4-8
32
51
68
8 - 12
123
108
80
12 - 16
10
26
26
16 - 20
41
24
28
20 - 24
19
20
28
Với mức ý nghĩa α = 0.05, hãy kiểm định giả thiết: độ dày lớp mạ sau khoảng thời gian nói trên khơng
phụ thuộc loại bể mạ được dùng.
Bài làm:
•
Dạng bài: Kiểm Định Tính Độc Lập
•
Ta giả thiết:
H0: Độ dày lớp mạ khơng phụ thuộc vào bể mạ được dùng.
Ta tiến hành tính tốn các tỉ số và so sánh để có thể kết luận được rằng độ dày lớp mạ không phụ
thuộc vào bể mạ được dùng.
Giải toán trên Excel:
Nhập dữ liệu và tính tổng ni và mj vào bảng như sau:
LÊ HẢI ĐĂNG – MSSV:1410857
22
23
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
ni = SUM (hàng)
mj = SUM (cột)
Tính dữ liệu kỳ vọng γ ij theo công thức γ ij = ni* mj /n ta được bảng sau:
Tính P(X > χ²) = CHITEST (Bảng thực tế, Bảng kỳ vọng)
= CHITEST (C3:E7,C13:E17)
= 8.67E-06
LÊ HẢI ĐĂNG – MSSV:1410857
23
24
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY
Phân tích kết quả:
P(X > χ²) = 8.67E-06 < α = 0.05
Do đó giả thuyết Ho khơng được chấp nhận.
Kết luận: Vậy độ dày lớp mạ phụ thuộc vào bể mạ được dùng.
LÊ HẢI ĐĂNG – MSSV:1410857
24