ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA ĐIỆN – ĐIỆN TỬ
BÁO CÁO BÀI TẬP LỚN
XÁC SUẤT – THỐNG KÊ
Giảng viên hướng dẫn:
Sinh viên thực hiện:
MSSV:
Lớp:
PGS.TS Nguyễn Đình Huy
Lê Sỹ Hậu
41201040
DD12LT03
Nhóm 4
TP Hồ Chí Minh, ngày 9/5/2012
Báo cáo bài tập lớn Xác suất - Thống kê
MỤC LỤC
Câu 1 .................................................................................................................................. Trang 3
Ví dụ 3.4................................................................................................................. Trang 3
Ví dụ 4.2................................................................................................................. Trang 7
Câu 2 ................................................................................................................................ Trang 18
Câu 3 ................................................................................................................................ Trang 23
Câu 4 ................................................................................................................................ Trang 27
Câu 5 ................................................................................................................................ Trang 31
Nhóm 4
Trang 2
Báo cáo bài tập lớn Xác suất - Thống kê
1.
Ví dụ 3.4 (Trang 207 – SBT). Hiệu suất phần trăm (%) của một phản ứng hóa học
được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày
trong bảng sau:
Yếu tố
Yếu tố B
A
B1
B2
B3
B4
A1
C1
9
C2
14
C3
16
C4
12
A2
C2
12
C3
15
C4
12
C1
10
A3
C3
13
C4
14
C1
11
C2
14
A4
C4
10
C1
11
C2
13
C3
13
Hãy đánh giá sự ảnh hưởng của các yếu tố đến hiệu suất phản ứng.
I. Cơ sở lý thuyết
Đây là dạng tốn phân tích phương sai ba yếu tố.
Mơ hình
Yếu tố
Yếu tố B
A
B1
B2
B3
B4
Ti..
A1
C1
Y111
C2
Y122
C3
Y133
C4
Y144
T1..
A2
C2
Y212
C3
Y223
C4
Y234
C1
Y241
T2..
A3
C3
Y313
C4
Y324
C1
Y331
C2
Y342
T3..
A4
C4
Y414
C1
Y421
C2
Y432
C3
Y443
T4..
Tj
T.1.
T.2.
T.3.
T.4.
Bảng ANOVA
(Trang kế)
Nhóm 4
Trang 3
Báo cáo bài tập lớn Xác suất - Thống kê
Nguồ
n
sai số
Yếu tố
A
(hàng
)
Yếu tố
B
(cột)
Yếu tố
C
Sai số
Tổng
cộng
Bậc tự
do
Tổng số bình phương
r 1
r
T2 T2
SS R i... ...2
r
i 1 r
MS R
SS R
r 1
FR
MS R
SS E
r 1
T j2... T...2
SSC
2
r
j 1 r
MSC
SSC
r 1
FC
MSC
SS E
r 1
r
T2 T2
SS F k ... ...2
r
k 1 r
MS F
SS F
r 1
FF
MS F
SS E
r
r 1 r 2
r 1
2
SS E SST SS F SS R SSC
Bình phương
trung bình
MS E
Giá trị
thống kê
SS E
r 1 r 2
r
r
r
T2
SST Yijk2 ...2
r
i 1 j 1 k 1
Giả thiết
+ Giả thiết H: Các giá trị trung bình bằng nhau.
+ Giả thiết H0: Các giá trị trung bình khác nhau.
Các giá trị thống kê
MS R
SS E
MSC
+ FC
SS E
MS F
+ FF
SS E
+ FR
Biện luận
+ Nếu F FCritical thì bác bỏ giả thiết H.
Nhóm 4
Trang 4
Báo cáo bài tập lớn Xác suất - Thống kê
II. Áp dụng
Giả thiết
+ Giả thiết H(pH): Độ pH không ảnh hưởng đến hiệu suất phản ứng.
+ Giả thiết H(nhiệt độ): Nhiệt độ không ảnh hưởng đến hiệu suất phản ứng.
+ Giả thiết H(xúc tác): Chất xúc tác không ảnh hưởng đến hiệu suất phản ứng.
1. Nhập bảng dữ liệu như Hình 1.1
Hình 1.1 – Bảng dữ liệu
2. Tính các giá trị Ti.., T.j., T..k
Tính Ti..
+ B7: =SUM(B2:E2)
+ C7: =SUM(B3:E3)
+ D7: =SUM(B4:E4)
+ E7: =SUM(B5:E5)
Tính T.j.
+ B8: = SUM(B2:B5)
+ Kéo nút tự điền từ B8 đến E8.
Tính T..k
+ B9: =SUM(B2;C5;D4;E3)
+ C9: =SUM(B3;C2;D5;E4)
+ D9: =SUM(B4;C3;D2;E5)
+ E9: =SUM(B5;C4;D3;E2)
Nhóm 4
Trang 5
Báo cáo bài tập lớn Xác suất - Thống kê
Tính T
+ B10: =SUM(B2:E5)
Tính các giá trị ̇ và ̇
+ G7:
+ Dùng con trỏ kéo kí hiệu tự điền từ ơ G7 đến ơ G9.
Tính giá trị ̇
+ G10: =POWER(B10,2)
Tính giá trị ̇
+ G11: =SUMSQ(B2:E5)
Tính các giá trị SSR, SSC và SSF
+ I7: =G7/4-39601/POWER(4;2)
+ Dùng con trỏ kéo kí hiệu tự điền từ ơ I7 đến ơ I9.
Tính giá trị SST
+ I11: =G11-G10/POWER(4;2)
Tính giá trị SSE
+ I10: =I11-SUM(I7:I9)
Tính các giá trị MSR, MSC và MSF
+ K7: =I7/(4-1)
+ Dùng con trỏ kéo kí hiệu tự điền từ ơ K7 đến ơ K9.
Tính giá trị MSE
+ K10: =I10/((4-1)*(4-2))
Tính giá trị G và F
+ M7: =K7/0.3958
+ Dùng con trỏ kéo kí hiệu tự điền từ ơ M7 đến ơ M9
Nhóm 4
Trang 6
Báo cáo bài tập lớn Xác suất - Thống kê
Hình 1.4 – Các giá trị
3. Kết quả và biện luận
+ FR = 3,1 < F0,05(3,6) = 4,76 => Chấp nhận giả thiết H (pH).
+ Fc = 11,95 > F0,05(3,6) = 4,76 => Bác bỏ giả thiết H (nhiệt độ).
+ FF = 30,05 > F0,05(3,6) = 4,76 => Bác bỏ giả thiết H (chất xúc tác).
Vậy chỉ có nhiệt độ và chất xúc tác ảnh hưởng đến hiệu suất của phản ứng.
Ví dụ 4.2(Trang 216 - SBT). Người ta đã dùng ba mức nhiệt độ gồm 1050C, 1200C và
1350C kết hợp với ba khoảng thời gian là 15 phút, 30 phút và 60 phút để thực hiện
một phản ứng tổng hợp. Các hiệu suất phản ứng (%) được trình bày trong bảng sau
đây:
Thời gian
(phút)
X1
X2
Hiệu suất
(%)
Y
15
105
1,87
30
105
2,02
60
105
3,28
15
120
3,05
30
120
4,07
60
120
5,54
15
135
5,03
30
135
6,45
60
135
7,26
Nhiệt độ (0C)
Hãy cho bết yếu tố nhiệt độ và/hoặc thời gian có liên quan tuyến tính với hiệu suất
phản ứng tổng hợp hay khơng? Nếu có thì với điều kiện nhiệt độ 1150C trong vịng
50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
Nhóm 4
Trang 7
Báo cáo bài tập lớn Xác suất - Thống kê
I. Cơ sở lý thuyết
Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan
k biến số độc lập 𝑋𝑖 (𝑖=1,2,,…𝑘) thay vì chỉ có một như trong hồi quy tuyến tính đơn
giản.
Phương trình tổng quát: YˆX1 , X 2 ,..., X k B0 B1 X1 B2 X 2 ... Bk X k
Bảng ANOVA
Nguồn
sai số
Bậc tự
do
Tổng số bình phương
Hồi
quy
k
SS R Yi ' Y '
Sai số
n k 1
SS E Yi Y '
Tổng
cộng
n 1
SST Yi Yi ' SS R SS E
Bình
phương
trung bình
2
2
MS R SS R
MS E
Giá trị
thống
kê
F
MS R
MS E
SS E
n2
2
Giá trị thống kê
+ Giá trị R – bình phương: R
2
+ Giá trị R được hiệu chỉnh:
+ Độ lệch chuẩn: S
SS R
kF
SST n k 1 kF
k 1 R 2
n 1 R 2 k
2
R
R
n k 1
n k 1
2
ii
1
Yi Yi'
n2
2
Trắc nghiệm thống kê
1. Trắc nghiệm t
Giả thiết
Nhóm 4
Trang 8
Báo cáo bài tập lớn Xác suất - Thống kê
+ H: 𝛽𝑖=0 “Hệ số hồi quy khơng có ý nghĩa”
+ H0: 𝛽𝑖≠0 “Hệ số hồi quy có ý nghĩa”
Giá trị thống kê
+ t
+
Sn2
Bi i
Sn2
S2
Xi X
Phân bố Student
2
n2
Biện luận
+ Nếu t t n 2 thì chấp nhận giả thiết H.
2. Trắc nghiệm F
Giả thiết
+ H: 𝛽𝑖=0 “Phương trình hồi quy khơng thích hợp”
+ H0: 𝛽𝑖≠0 “Phương trình hồi quy thích hợp”
Giá trị thống kê
+ F
MS R
MS E
Phân bố Fischer
1 1, 2 n 2
Biện luận
+ Nếu F F 1, n 2 thì chấp nhận giả thiết H.
II. Áp dụng
Nhóm 4
Trang 9
Báo cáo bài tập lớn Xác suất - Thống kê
Giả thiết H: Phương trình hồi quy khơng thích hợp.
1. Nhập dữ liệu như Hình 1.5
Hình 1.5 – Bảng dữ liệu
Phương trình hồi quy: YˆX f X1
1
+ R2 0,21
+ S 1,81
YˆX
1
2,73 0,04 X
1
2. Áp dụng Regression
Điền các thông số cho hộp thoại Regression như Hình 1.6
(Trang kế)
Nhóm 4
Trang 10
Báo cáo bài tập lớn Xác suất - Thống kê
Hình 1.6 - Regression
Bấm OK ta được kết quả như Hình 1.7
(Trang kế)
Nhóm 4
Trang 11
Báo cáo bài tập lớn Xác suất - Thống kê
Hình 1.7 – Kết quả Regression
3. Kết quả và biện luận
2
t0 2,19 t0,05 2,365 (hay Pvalue
0,071 0,05) Chấp nhận giả thiết H.
t0 1,38 t0,05 2,365 (hay Pvalue 0,209 0, 05) Chấp nhận giả thiết H.
F 1,905 F0,05 5,590 hay FS4 0, 209 0,05 Chấp nhận giả thiết H.
Vậy phương trình hồi quy này khơng thích hợp, yếu tố thời gian khơng liên
quan tuyến tính với hiệu suất phản ứng.
Nhóm 4
Trang 12
Báo cáo bài tập lớn Xác suất - Thống kê
Phương trình hồi quy: YˆX f X 2
2
+ R2 0,76
+ S 0,99
YˆX
2
2,73 0,04 X 2
2. Áp dụng Regression
Điền các thông số cho hộp thoại Regression như Hình 1.8
Hình 1.8 - Regression
Bấm OK ta được kết quả như Hình 1.9
(Trang kế)
Nhóm 4
Trang 13
Báo cáo bài tập lớn Xác suất - Thống kê
Hình 1.9 – Kết quả Regression
3. Kết quả và biện luận
2
t0 3, 418 > t0,05 2,365 (hay Pvalue
0,011 0,05) Bác bỏ giả thiết H.
t2 4,757 t0,05 2,365 (hay Pvalue 0,002 0, 05) Bác bỏ giả thiết H.
F 22,631 > F0,05 5,590 hay FS4 0,002 0,05 Bác bỏ giả thiết H.
Vậy phương trình hồi quy này thích hợp, yếu tố nhiệt độ có liên quan tuyến tính
với hiệu suất phản ứng.
Nhóm 4
Trang 14
Báo cáo bài tập lớn Xác suất - Thống kê
Phương trình hồi quy: YˆX
1, X 2
f X1, X 2
+ R2 0,97
+ S 0,33
YˆX , X
1 2
12,70 0,04 X1 0,13 X 2
2. Áp dụng Regression
Điền các thông số cho hộp thoại Regression như Hình 1.10
Hình 1.10 - Regression
Bấm OK ta được kết quả như Hình 1.9
(Trang kế)
Nhóm 4
Trang 15
Báo cáo bài tập lớn Xác suất - Thống kê
Hình 1.9 – Kết quả Regression
3. Kết quả và biện luận
t0 11,528 > t0,05 2,365 (hay Pvalue 2,26.105 0, 05) Bác bỏ giả
thiết H.
t1 7,583 > t0,05 2,365 (hay Pvalue 0,00027 0,05) Bác bỏ giả thiết
H.
t2 14,328 > t0,05 2,365 (hay Pvalue 7,233.106 0,05) Bác bỏ giả
thiết H.
Nhóm 4
Trang 16
Báo cáo bài tập lớn Xác suất - Thống kê
F 131,392 > F0,05 5,140 hay FS 1,112.105 0,05 Bác bỏ giả
thiết H.
Vậy phương trình hồi quy này thích hợp. Hiệu suất của phản ứng có liên quan
tuyến tính với cả hai yếu tố thời gian và nhiệt độ.
Với điều kiện nhiệt độ 1150C trong vịng 50 phút, để dự đốn hiệu suất phản ứng, ta
tính:
+ B20: =B16+B17*50+B18*115
Hình 1.11 – Dự đốn
Hình 1.12 – Kết quả dự đốn
Vậy với điều kiện nhiệt độ 1150C trong vịng 50 phút thì hiệu suất phản ứng sẽ là
4,311.
Nhóm 4
Trang 17
Báo cáo bài tập lớn Xác suất - Thống kê
2. Để so sánh chi phí quảng cáo trên bốn tờ báo khác nhau (với các điều kiện quảng cáo
như nhau), người ta đã lấy mẫu 7 lần quảng cáo trên mỗi tờ báo và thu được các kết
quả sau (đơn vị: ngàn đồng):
Báo A
57
65
50
45
70
62
48
Báo B
72
81
64
55
90
38
75
Báo C
35
42
58
59
46
60
61
Báo D
73
85
92
68
82
94
66
Hãy tìm P-value để kiểm định xem có sự khác biệt về chi phí quảng cáo giữa các tờ báo
nói trên hay khơng.
I. Cơ sở lý thuyết
Phân tích phương sai một yếu tố
Sự phân tích này nhằm đánh giá sự ảnh hưởng của một yếu tố trên các giá trị quan
sát Yi (i = 1,2,...,k)
Mơ hình
Yếu tố thí nghiệm
1
…
2
…
Tổng cộng
Trung bình
Nhóm 4
…
…
…
…
…
k
…
…
̅
̅̅̅
…
T
̅
̅
Trang 18
Báo cáo bài tập lớn Xác suất - Thống kê
Bảng ANOVA
Nguồn sai
số
Bậc tự
do
Yếu tố
k 1
Sai số
nk
Tổng cộng
nk 1
Tổng số bình phương
Ti 2 T 2
n
i 1
k
SSTr
SSE SST SSTr
Bình phương
trung bình
SS
MSTr Tr
k 1
MS E
Giá trị
thống kê
F
MSTr
MS E
SS E
nk
SST Yij T
k
n
i 1 j 1
Giả thiết
- H: Các giá trị trung bình bằng nhau.
- H0: Có ít nhất có hai giá trị trung bình khác nhau.
Giá trị thống kê
+ F
MSTr
MS E
Biện luận
Nếu
F FCritical k 1, n k ,
thì ta bác bỏ giả thiết H.
II. Áp dụng
Giả thiết
+ Giả thiết H: Chi phí quảng cáo giữ các tờ báo là như nhau.
+ Giả thiết H0: Chi phí quảng cáo giữ các tờ báo là khác nhau.
1. Nhập bảng số liệu như Hình 2.1
(Trang kế)
Nhóm 4
Trang 19
Báo cáo bài tập lớn Xác suất - Thống kê
Hình 2.1 - Bảng số liệu
2. Sử dụng “Anova: Single Factor”
Vào Data, chọn Data Analysis, chọn Anova: Single Factor, rồi bấm OK.
Hình 2.3 – Data Analysis
Trong hộp thoại Anova: Single Factor, nhập các thơng số như Hình 2.3
- Input Range: $A$1:$H$4
- Alpha: 0,05
- Group by: Rows
- Output options: tích vào New Worksheet Ply
Hình 2.3 (Trang kế)
Nhóm 4
Trang 20
Báo cáo bài tập lớn Xác suất - Thống kê
Hình 2.3 – Anova: Single Factor
Ta được kết quả như như Hình 2.4
Hình 2.4 – Bảng kết quả
Nhóm 4
Trang 21
Báo cáo bài tập lớn Xác suất - Thống kê
3. Kết quả và biện luận
+ P-value = 0,001353 < 0, 05
+ F = 7,152086 > FCritacal = 3,008787
Bác bỏ giả thiết H.
Vậy chi phí quảng cáo giữa các tờ báo là khác nhau.
Nhóm 4
Trang 22
Báo cáo bài tập lớn Xác suất - Thống kê
3. Trong một thí nghiệm khoa học, người ta nghiên cứu độ dày của lớp mạ kền khi
dùng ba loại bể mạ khác nhau. Sau một thời gian mạ, người ta đo độ dày của lớp mạ
nhận được ở các bể như sau:
Độ dày lớp mạ kền
Số lần đo ở bể mạ
tính bằng micro mét
A
B
C
4-8
32
51
68
8 - 12
123
108
80
12 - 16
10
26
26
16 - 20
41
24
28
20 -24
19
20
28
Với mức ý nghĩa 0, 05 , hãy kiểm định giả thiết: độ dày lớp mạ sau khoảng thời gian
nói trên khơng phụ thuộc loại bể mạ được dùng.
I. Cơ sở lý thuyết
Đây là bài toán kiểm định tính độc lập của hai thuộc tính X và Y trên một mẫu.
Y2
n12
n22
...
X1
X2
Y1
n11
n21
...
...
...
...
...
Xh
nh1
...
nij
nhk
mj
m1
m2
...
mk
X\Y
...
Yk
n1k
...
ni
n1
n2
...
nh
n m j ni
Từ bảng trên, ta tính được bảng tần số lý thuyết:
X\Y
Y2
...
Yk
X2
11
21
12
22
...
...
...
ij
...
Xh
h1
...
...
hk
X1
Nhóm 4
Y1
...
1k
...
Trang 23
Báo cáo bài tập lớn Xác suất - Thống kê
Với
ij
ni .m j
n
Ta tính giá trị quan sát: Qqs 02
h
k
i 1 j 1
nij ij
ij
2
có phân phối
Trong đó: + nij là tần số thực nghiệm
+ ij là tần số lý thuyết
Trong Excel, ta sử dụng hàm CHITEST để tính xác suất P
2
0
(2(h1)() k 1)
2( )
( h 1)( k 1) .
Biện luận
- Nếu
02 (2(h1)() k 1)
hoặc P
2
0
2( )
( h 1)( k 1) thì X và Y độc lập với nhau.
II. Áp dụng
Giả thiết H: Độ dày lớp mạ phụ thuộc vào loại bể mạ đang dùng.
Giả thiết H0: Độ dày lớp mạ không phụ thuộc vào loại bể mạ đang dùng.
1. Nhập bảng số liệu như Hình 3.1
Hình 3.1 – Bảng số liệu
2. Ta tính các tổng như Hình 3.2
(Trang kế)
Nhóm 4
Trang 24
Báo cáo bài tập lớn Xác suất - Thống kê
Hình 3.2 – Các tổng
3. Tính các tần số lý thuyết
- Tần số lý thuyết
ij
ni .m j
n
- Tính B10: =B$8*$E3/$E$8 rồi kéo nút tự điền từ B10 đến D14, ta được như
Hình 3.3
Hình 3.3 – Bảng tần số lý thuyết
4. Áp dụng hàm CHITEST
- Tính B16: =CHITEST(B3:D7;B10:D14), đây chính là xác suất P
Nhóm 4
2
0
2( )
( h 1)( k 1) .
Trang 25