Tải bản đầy đủ (.doc) (54 trang)

Bài tập lớn xác suất thống kê nhóm 3

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.51 MB, 54 trang )

Page | 1
Bài tập lớn Xác suất thống kê- Nhóm 3
BÀI 1:
Phần A:(ví du 3.4 trang 161sgk)
Hiệu xuất phần trăm (%) của một phản ứng hóa học được nghiên cứu
theo 3 yếu tố:pH(A),nhiệt độ (B) và chất xúc tác (C)được trình bày trong
bảng sau:
Yếu tố
A
Yếu tố B
B1 B2 B3 B4
A1 C1 9 C2 14 C3 16 C4 12
A2 C2 12 C3 15 C4 12 C1 10
A3 C3 13 C4 14 C1 11 C2 14
A4 C4 10 C1 11 C2 13 C3 13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu xuất phản ứng?
Bài làm:
I.Dạng toán: phân tích phương sai ba yếu tố
II.CƠ SỞ LÝ THUYẾT
Mục đích của sự phân tích phương sai ba yếu tố là đánh giá sự ảnh hưởng
của ba yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát
Page | 2
Bài tập lớn Xác suất thống kê- Nhóm 3
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 3 yếu tố trên
các giá trị quan sát G(i=1,2…r:yếu tố A;j=1,2…r:yếu tố B;k=1,2…r:yếu tố
C)
• Mô hình vuông la tinh ba yếu tố được trình bày như sau:
Yếu
tố A
Yếu tố B
B1 B2 B3 B4 T


i
A1 C1 Y
111
C2 Y
122
C3 Y
133
C4 Y
144
T
1
A2 C2 Y
212
C3 Y
223
C4 Y
234
C1 Y
241
T
2
A3 C3 Y
313
C4 Y
324
C1 Y
334
C2 Y
342
T

3
A4 C4 Y
414
C1 Y
421
C2 Y
412
C3 Y
443
T
4
T
j
T
1
T
2
T
3
T
4
T
i
:Tổng theo hàng
T
j
:Tổng theo cột
T
k
:Giá trị này được tính như sau:

B C A D
C D A B
D A B C
Page | 3
Bài tập lớn Xác suất thống kê- Nhóm 3
A B C D
T
k
được tính theo bảng trên,ví dụ:
T
1
= Y
111
+ Y
421
+ Y
334
+ Y
241
Bảng ANOVA:
Nguồn
sai số
Bậc
tự do
Tổng số bình
phương
Bình phương trung
bình
Giá trị thống


Yếu tố A (r-1)
SSR=
MSR=
F
R
=MSR/MSE
Yếu tố B
(r-1)
SSC=
MSC=SSC/(R-1) F
C
=MSC/MSE
Yếu tố C (r-1)
SSF=
MSF=
F=MSF/MSE
Sai số
(r-1)
(r-2)
SSE=SST-
(SSF+SSR+SSC)
MSE=SSE/(r-1)(r-
2)
Tổng
cộng
(r
2
-1)
SST=
Ta có giả thuyết sau :

H
0
:Các giá trị trung bình bằng nhau
H
1
:Có ít nhất hai giá trị trung bình bằng nhau
Nếu giá trị thống kê bé hơn F
α
Page | 4
Bài tập lớn Xác suất thống kê- Nhóm 3
III.Áp dụng MS-EXCEL:
H
0
: µ
1
= µ
2
= µ
3
=…= µ
n
ó Các giá trị trung bình bằng nhau
H1: µ
j
≠ µ
k
ó Có ít nhất hai giá trị trung bình khác nhau

Thiết lập các biểu thức và tính các giá trị thống kê
1. Tính các giá trị Ti…. T.j… T k và T

• Các giá trị Ti…
Chọn ô B7 và chọn biểu thức=SUM(B2:E2)
Chọn ô C7 và nhập biểu thức=SUM(B3:E3)
Chọn ô D7 và nhập biểu thức=SUM(B4:E4)
Page | 5
Bài tập lớn Xác suất thống kê- Nhóm 3
Chọn ô E7 và nhập biểu thức=SUM(B4:E4)
• Các giá trị T.j.
Chọn ô B8 và nhập biểu thức=SUM(B2:B5)
Dùng con trỏ kéo ký tự điền từ ô B8 đến ô E8
• Các giá trị T k
Chọn ô B9 và nhập biểu thức=SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức=SUM(B3,C2,D5,E4)
Chọn ô D9 và nhập biểu thức=SUM(B4,C3,D2,E5)
Chọn ô E9 và nhập biểu thức=SUM(B5,C4,D3,E2)
• Giá trị T…
Chọn ô B10 và nhập biểu thức=SUM(B2:B5)
2. tính các giá trị G
• Các giá trị G
Chọn ô G7 và nhập biểu thức=SUMSQ(B7:E7)
Dung con trỏ kéo ký hiệu tự điền từ G7 đến ô G9
Chọn ô G10 và nhập biểu thức=POWER(B10,2)
Chọn ô G11 và nhập biểu thức=SUMSQ(B2:E5)
3. tính các giá trị SSR.SSC.SSF.SST và SSE
• Các giá trị SSR.SSC.SSF
Page | 6
Bài tập lớn Xác suất thống kê- Nhóm 3
Chọn ô I7 và nhập biểu thức=G7/4-39601/POWER(4,2)
Dung con trỏ kéo ký tự điền từ ô I7 đến ô I9
• Giá trị SST

Chọn ô I11 và nhập biểu thức=G11-G10/POWER(4,2)
• Giá trị SSE
Chọn ô I10 và nhập biểu thức=I11-SUM(I7:I9)
4. tính các giá trị MSR.MSC.MSF và MSE
• Giá trị SST
Chọn ô K7 và nhập biểu thức=I7/(4-1)
Dung con trỏ kéo ký tự điền từ ô K7 đến ô K9
• Giá trị MSE
Chọn ô K10 và nhập biểu thức=I/((4-1)*(4-2))
5. tính các giá trị G và F:
Chọn ô M7 và nhập biểu thức=K7/0.3958
Dùng con trỏ kéo ký tự điền từ ô M7 đến M9.
Page | 7
Bài tập lớn Xác suất thống kê- Nhóm 3
IV.KẾT QUẢ VÀ BIỆN LUẬN:
F
R
=3.10<F
0.05
(3.6)=4.76=>chấp nhận H
0
(Ph)
F
C
=11.95> F
0.05
(3.6)=4.76=> bác bỏ H
0
(nhiệt độ)
F=30.05> F

0.05
(3.6)=4.76=>bác bỏ H
0
(chất xúc tác)
Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng đến hiệu suất
Phần B:(ví du 4.2 trang 171)
Người ta dùng 3 mức nhiệt độ gồm 105,120 và 135
0
C kết hợp với 3
khoảng thời gian là 15,30 và 60 phút để thực hiện một phản ứng tổng
hợp.các hiệu xuất của phản ứng(%) được trình bày trong bảng sau:
Thời gian (phút)
X1
Nhiệt độ (
0
C)
X2
Hiệu xuất (%)
Y
Page | 8
Bài tập lớn Xác suất thống kê- Nhóm 3
15 105 1.87
30 105 2.02
60 105 3.28
15 120 3.05
30 120 4.07
60 120 5.54
15 135 5.03
30 135 6.45
60 135 7.26

Hãy cho biết yếu tố nhiệt độ và thời gian/hoặc yếu tố thời gian có liên
quan tuyến tính với hiệu xuất của phản ứng tổng hợp?nếu có thì điều kiện
nhiệt độ 115
0
C trong vòng 50 phút thì hiệu xuất phản ứng sẻ là bao nhiêu?
Giải:
I.Dạng toán: hồi quy tuyến tính đa tham số
II.Cơ sở lý thuyết:
HỒI QUY TUYẾN TÍNH ĐA THAM SỐ
Trong phương trình hồi quy tuyến tính đa tham số ,biến số Y có liên quan
đến k biến số độc lập.
Phương trình tổng quát:
Y(x
0
,x
1
,…x
k
) =B
0
+B
1
X
1
+…+B
k
X
k
Bảng ANOVA
Nguồn sai

số
Bậc tự do Tổng số bình
phương
Bình phương
trung bình
Giá trị thống

Hồi quy k SSR MSR=SSR/k F=MSR/MSE
Sai số N-k-1 SSE MSE=SSE/(N-
Page | 9
Bài tập lớn Xác suất thống kê- Nhóm 3
k-1)
Tổng cộng N-1 SST=SSR+SSE
• Giá trị thống kê:
• Giá trị R-bình phương
• Giá trị R
2
-được hiệu chỉnh
• R
2
= =Kf/((N-k-1)+Kf) (R
2
>=0,81 là khá tốt)
• Giá trị R
2
được hiệu chỉnh
• R
ii
2
= = R

2
-
• Độ lệch chuẩn
• S= (S=<0,30 là khá tốt)
Trắc nghiệm thống kê
Đối với một phương trình hồi quy ý nghĩa thống kê của các hệ số B
i
được đánh giá bằng trắc nghiệm t (phân phối student) trong khi tính
chất thích hợp của phương trình được đánh giá bằng trắc nghiệm F
(phân phối Fisher)
-Trong trắc nghiệm t
H
0
:Các hệ số hồi quy không có ý nghĩa
H
1
:Có ít nhất vài hệ số hồi quy có ý nghĩa
Bậc tự do của giá trị t: =N-k-1
t=
Page | 10
Bài tập lớn Xác suất thống kê- Nhóm 3
-trong trắc nghiệm F:
H
2
:phương trình hồi quy không thích hợp
H
3
:phương trình hồi quy thích hợp với ít nhất vài β
i
Bậc tự do của giá trị F:v

1
=1;v
v
=N-k-1
III.Áp dụng MS-EXCEL:
-Trong trắc nghiệm t:
H
0
: Β
i
= 0 ó Các hệ số hồi quy không có ý nghĩa
H
1
: Β
i
≠ 0 ó Các hệ số hồi quy có ý nghĩa
-Trong trắc nghiệm F:
H
0
: Β
i
= 0 ó Phương trình hồi quy không thích hợp
H
1
: Β
i
≠ 0 ó Phương trình hồi quy thích hợp với ít nhất vài B
i
Bước 1:nhập dử liệu vào bản tính
Dử liệu nhất thiết phải được nhập theo cột.

Bước 2:áp dụng Regression
Page | 11
Bài tập lớn Xác suất thống kê- Nhóm 3
Nhấn lần lượt đơn lệnh tools và lệnh data Analysis
Chọn chương trình Regression trong hộp thoại data Analysis rồi nhấp OK
Trong hộp thoại Regression ,làn lượt ấn các chi tiết:
Phạm vi của biến số Y (input Y range)
Phạm vi của biến số X (input X range)
Nhãn dử liệu(Labels)
Page | 12
Bài tập lớn Xác suất thống kê- Nhóm 3
Mức tin cậy(Confidence level)
Tọa độ đầu ra(Output range)
Đường hồi quy(line Fit Plots),…
Page | 13
Bài tập lớn Xác suất thống kê- Nhóm 3
Các giá trị đầu ra cho bảng sau:
Page | 14
Bài tập lớn Xác suất thống kê- Nhóm 3
Phương trình hồi quy:
X1
=f(X
1
)
X1
=2.73+0.04X
1
(R
2
=0.21,S=1.81)

t
0
=2.19<t
0.05
=2.365(hay P
v
2
=0.071>α=0.05)
=>Chấp nhận giả thiết H
0
t
1
=1.38<t
0.05
=2.365(hay P
v
=0.209>α=0.05)
=>Chấp nhận giả thiết H
0
F=1.95<F
0.05
=5.590(hay F
s
=0.209>α=0.05)
Page | 15
Bài tập lớn Xác suất thống kê- Nhóm 3
=>Chấp nhận giả thiết H
0
Vậy cả hai hệ số 2.73(B
0

) và 0.04(B
1
) của phương trình hồi quy
X1
=2.73+0.04X
1
đều không có ý nghĩa thống kê.nói cách khác
phương trình hồi quy này không thich hợp.
Phương trình hồi quy:
X2
=f(X
2
)
Y
X2
=2.73+0.04X
2
(R
2
=0.76,S=0.99)
t
0
=3.418> t
0.05
=2.365(hay P
v
2
=0.011>α=0.05)
Page | 16
Bài tập lớn Xác suất thống kê- Nhóm 3

=>Bác bỏ giả thiết H
0
t
1
= 4.757>t
0.05
=2.365(hay P
v
=0.00206<α=0.05)
=>Bác bỏ giả thiết H
0
F=22.631>F=5.590(hay F
s
=0.00206<α=0.05)
=>Bác bỏ giả thiết H
0
Vậy cả hai hệ số -11.14(B
0
) và 0.13(B1) của phương trình hồi quy
X2
=2.73+0.04X2 đều có ý nghĩa thống kê.Nói cách khác phương trình hồi
quy này thích hợp.
IV.Kết luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu xuất của phản
ứng tổng hợp.
Phương trình hồi quy:
X1,X2
=f(X1,X2)
X1,X2
=-12.70+0.04X
1

+0.13X
2
(R
2
=0.97; S=0.33)
Page | 17
Bài tập lớn Xác suất thống kê- Nhóm 3
X1.X2
=-12.7+0.04X
1
+0.13X
2
t
0
=11.528> t
0.05
=2.365(hay P
v
2
=2.260*10
-5
<α=0.05)
=>Bác bỏ giả thiết H
0
t
1
=7.583> t
0.05
=2.365(hay P
v

=0.00027<α=0.05)
=>Bác bỏ giả thiết H
0
F=131.392>5.14(hay F
s
=1.112*10
-5
<α=0.05)
=>Bác bỏ giả thiết H
0
Page | 18
Bài tập lớn Xác suất thống kê- Nhóm 3
Vậy cả hai hệ số -12.70(B
0
),0.04(B1)và 0.13(B1)của phương trình hồi
quy =-12.80+0.04X
1
+0.13X
2
đều có ý nghĩa thống kê. Nói cách
khác,phương trinh hồi quy này thích hợp
Kết luận: hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với
cả hai yếu tố là thời gian và nhiệt độ.
Sự tuyến tính của phương trình
X1,X2
=-12.70+0.04X
1
+0.13X
2
. có thể

được trình bày trong biểu đồ phân tán(scatterplots):
BIỂU ĐỒ:
Kết luận: hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với
cả hai yếu tố là thời gian và nhiệt độ.
Nếu muốn dự đoán hiệu xuất bằng phương trình hồi quy Y=-
12.70+0.04X
1
+0.13X
2
,chỉ cần chọn một ô,ví dụ như
Page | 19
Bài tập lớn Xác suất thống kê- Nhóm 3
E20,sau đó nhập hàm=E17+E18*50+E19*115 và được kết quả như sau:
Ghi chú: E17 tọa độ của B0 ,E18 tọa độ của B1,E19 tọa độ của B2,50 là giá
trị của X
1
(thời gian) và 115 là giá trị của X
2
(nhiệt độ)
BÀI 2:
Có 4 báo cáo viên A,B,C,D nói về cùng một chủ đề.sau đây là thời
gian(tính bằng phút)mà mỗi báo báo cáo viên đó sử dụng trong 5 buổi báo ở
các địa điểm khác nhau:
A: 25 29 30 42 35
B: 35 20 20 17 30
C: 30 27 18 19 26
D: 28 32 33 35 24
Hãy thiết lập bảng ANOVA cho các số liệu trên.Gỉa thiết H
0
là gì?giả

thiết H
0
có bị bác bỏ mứ ý nghĩa 5% hay không.
Giải:
Page | 20
Bài tập lớn Xác suất thống kê- Nhóm 3
I.Dạng tốn: phân tích phương sai một yếu tố :
II.Cơ sở lí thuyết:
Giả sử
1
11 21 n 1
{x , x , x }
là một mẫu có kích thước n
1
rút ra từ tập
hợp chính các giá trò của X
1;
2
12 22 n 2
{x , x , x }
là một mẫu kích thước rút
ra từ tập hợp chính các giá trò của X
2
, ,
k
1k 2k n k
{x , x , x }
là một mẫu
kích thước n
k

rút ra từ tập hợp chính các giá trò của X
k
. Các số liệu thu
được trình bày thành bảng ở dạng sau đây:
Ta đưa
ra một
số kí
hiệu sau
 Trung bình của mẫu thứ i (tức là mẫu ở cột thứ i trong bảng
trên):
Các mức nhân tố
1 2 K
=
=

1
1
k
i
n n
x
11
x
12
x
1k
x
21
x
22

x
2k

1
1n
x
2
2n
x

k
n k
x
Tổng
số
T
1
T
2
T
k
=
=

1
k
k
i
T T
Trung

bình
1
x
2
x

=
T
x
n
Page | 21
Bài tập lớn Xác suất thống kê- Nhóm 3
=
= =

i
n
ji
j 1
i
i
i i
x
T
x
n n
 Trung bình chung
= =
= = =
∑∑

∑∑
j
n
k
ij
ij i 1 j 1
x
x
T
x
n n n
ở đó n = n
1
+ n
2
+ + n
k;
T = T
1
+ T
2
+ + T
k
.
 Tổng bình phương chung ký hiệu là SST (viết tắt là chữ
Total Sum of Squares) được tính theo công thức sau:
( ) ( ) ( )
( )
= = =
= =

= − + − + + −
= −
∑ ∑ ∑
∑∑
L
1 2 k
j
k
n n n
2 2 2
i1 i2 ik
i 1 i 1 i 1
n
n
2
ij
j 1 i 1
SST x x x x x x
x x
có thể chứng minh rằng

,
= = =
= + + + −
= −
∑ ∑ ∑

L
1 2 k
n n n

2
2 2 2
i1 i2 ik
i 1 i 1 i 1
2
2
ij
i j
T
SST x x x
n
T
x
n
 Tổng bình phương do nhân tố ký hiệu là SSF (viết tắt của
chữ Sum of Squares for Factor) được tính theo công thức
sau:
Page | 22
Bài tập lớn Xác suất thống kê- Nhóm 3
( )
=
= −
= + + + −

L
k
2
i i
i 1
2 2 2

2
1 2 k
1 2 k
SSF n x x
T T T
T
n n n n
 Tổng bình phương do sai số ký hiệu là SSE (viết tắt của
chữ Sum of Squares for the Error) được tính theo công thức:
( ) ( ) ( )
1 2 k
1 2 k
n n n
2 2 2
i1 i 2 2 ik k
i 1 i 1 i 1
n n n
2 2 2
2 2 2
1 2 k
i1 i 2 ik
1 2 k
i 1 i 1 i 1
2 2
2
1 k
ij
1 k
SSE x x x x x x
T T T

x x x
n n n
T T
x
n n
= = =
= = =
= − + − + + −
= − + − + + −
 
= − + +
 ÷
 ÷
 
∑ ∑ ∑
∑ ∑ ∑
∑∑
L
L
L
Từ công thức trên ta thấy:
SST = SSF + SSE
 Trung bình bình phương của nhân tố, ký hiệu là MSF (viết
tắt của chữ Mean Square for Factor) được tính bởi công
thức:
SSF
MSF
k 1
=


k – 1 được gọi là bậc tự do của nhân tố.
 Trung bình bình phương của sai số, ký hiệu là MSE (viết
tắt của chữ Mean Square for Error) được tính bởi công
thức:
Page | 23
Bài tập lớn Xác suất thống kê- Nhóm 3
SSE
MSE
n k
=

n – k được gọi là bậc tự do của sai số.
Tỷ số F được tính bởi công thức

MSF
F
MSE
=
Các kết quả nói trên được trình bày trong bảng sau đây gọi là
ANOVA (viết tắt của chũ Analysis of Variance: phân tích phương sai)
Bảng ANOVA
Nguồn Tổng
bình
phương
Bậc tự
do
Trung
bình bình
phương
Tỷ số F

Nhân tố SSF k – 1 MSF MSF/MS
E
Sai số SSE n – k MSE
Tổng số SST n – 1
- Người ta chứng minh được rằng nếu giả thiết H
o
đúng thì tỷ số F
Page | 24
Bài tập lớn Xác suất thống kê- Nhóm 3
MSF
F
MSE
=
sẽ có phân bố Fisher với bậc tự do là (k – 1, n – k)
Thành thử giả thiết H
o
sẽ bò bác bỏ ở mức ý nghóa α của phân bố
Fisher với bậc tự do là (k – 1, n – k), k – 1 được gọi là bậc tự do ở mẫu
số.
Giả thiết H
0
: H
0

1
= µ
2
= µ
3
= µ

4
ó”thời gian nói trung bình của 4 người là
bằng nhau”
H1 :a
I
≠ a
J
TÍNH CỤ THỂ:
Thời gian báo cáo của các báo cáo viên
Tổng số
A B C D
25 35 30 28
29 20 27 32
30 20 18 33
42 17 19 35
35 30 26 24
n
i
5 5 5 5 20
Page | 25
Bài tập lớn Xác suất thống kê- Nhóm 3
T
i
161 122 120 152 555
Bước 1: Tính SSF:
SSF = (161
2
+122
2
+120

2
+152
2
)/5 – 555
2
/20=260,55
Bước 2: Tính SST:
SST = (25
2
+29
2
+30
2
+42
2
+35
2
+… 24
2
)- 555
2
/20=855,75
Bước 3: Tính SSE:
SSE= 855,75-260,55=595,20
Bước 4: Tính MSF:
MSF = 260.55/3=86.85
Bước 5: Tính SSE:
MSE = 595.20/16=37.2
Bước 6: Tính F:
F = 86.85/37.20 = 2.33

Tra bảng ta có F(3,16)=3.24
F<F(3,16)
Suy ra: chấp nhận Ho, thời gian trung bình mà các báo cáo viên cần cho các
bài báo cáo của mình là bằng nhau
III.Thuật toán:
a. mở chương trình Ms-EXCEL
b. nhập dử liệu vào bảng tính
sử dụng hàm ANOVA:single-factor từ data Analysis.

×