Tải bản đầy đủ (.docx) (39 trang)

Báo cáo mẫu btl XÁC SUẤT THỐNG KÊ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.09 MB, 39 trang )

Trường đại học Bách Khoa TPHCM
KHOA KHOA HỌC ỨNG DỤNG
-----oOo-----

BÀI TẬP LỚN XÁC XUẤT THỐNG KÊ
------ Nhóm 10 ------

GVHD: PGS-TS NGUYỄN ĐÌNH HUY
Người thực hiện: Lê Cơng Hậu
MSSV: 51101058
NHĨM :

10


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012

Câu 1: Trình bày lại ví dụ 3.4 trang 161 và ví dụ 4.2 trang 171 Giáo Trình XSTK
2009
Ví dụ 3.4 Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo
ba yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:

Yếu tố B

Yếu tố
A

B1


B2

B3

B4

A1

C1

9

C2

14

C3

16

C4

12

A2

C2

12


C3

15

C4

12

C1

10

A3

C3

13

C4

14

C1

11

C2

14


A4

C4

10

C1

11

C2

13

C3

13

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng
Bài làm:
1. Dạng toán: PHÂN TÍCH PHƯƠNG SAI BA YẾU TỐ
2. Cơ sở lý thuyết:
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các
giá trị quan sát G (i = 1, 2... r: yếu tố A; j = 1, 2...r: yếu tố B: k = 1, 2...r: yếu tố C).
Mơ hình:
Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mơ
hình vng la tinh n×n. Ví dụ như mơ hình vng la tinh 4×4:

LÊ CƠNG HẬU 51101058


B

C

D

A

C

D

A

B

D

A

B

C

A

B

C


D

2


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012

Mơ hình vng la tinh ba yếu tố được trình bày như sau:
Yếu tố C (T..k. Ví dụ: T..1 = Y111 + Y421 + Y331 + Y241)
Yếu tố B

Yếu tố A

B1

 

B2

B3

B4

 

A1

C1


Y111

C2

Y122

C3

Y133

C4

Y144

T1..

A2

C2

Y212

C3

Y223

C4

Y234


C1

Y241

T2..

A3

C3

Y313

C4

Y324

C1

Y331

C2

Y342

T3..

A4

C4


Y414

C1

Y421

C2

Y432

C3

Y443

T4..

T.i.

 

T.1.

 

T.2.

 

T.3.


 

T.4.

 

Bảng ANOVA:
Nguồn sai
số
Yếu tố A
(Hàng)
Yếu tố B
(Cột)

Bậc tự do

Tổng số bình phương

(r-1)

Bình phương
trung bình

MSR=

SSR =
T 2. j . T . . .2
∑ r − r2
j=1

r

(r-1)

SSC =

T 2. . k T .. .2
∑ − r2
k =1 r

MSC=

r

Yếu tố C

(r-1)

Sai số

(r-1)(r-2)

Tổng cộng

(r2-1)

SSF =

MSF=


SSE = SST –
(SSF + SSR + SSC)

MSE=

SSR
(r−1)
SSC
(r−1)

SSF
(r−1)

Giá trị thống kê

FR=

F C=

F=

MSR
MSE
MSC
MSE

MSF
MSE

SSE

(r −1)(r−2)

SST =

LÊ CÔNG HẬU 51101058

3


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012

Trắc nghiệm


Giả thiết:
H0: μ1 = μ2 = ...= μk  “Các giá trị trung bình bằng nhau”
H1 : μ i

¿

μj  “Có ít nhất hai giá trị trung bình khác nhau”



Giá trị thống kê: G và G




Biện luận:

Nếu G (chấp nhận H0 (đối với yếu tố A))
Nếu G (chấp nhận H0 (đối với yếu tố B))
Nếu G (chấp nhận H0 (đối với yếu tố C)).
3. Phần mềm: Microsoft Excel 2010.
4. Chương trình:
5. Phương pháp giải bài toán trên Excel 2010:
Giả thiết H0: pH ảnh hưởng đến hiệu suất phản ứng.
Giả thiết H0: Nhiệt độ ảnh hưởng đến hiệu suất phản ứng.
Giả thiết H0: Chất xúc tác ảnh hưởng đến hiệu suất phản ứng.
 Bước 1: Nhập dữ liệu vào bảng tính:

 Bước 2: Thiết lập các biểu thức và tính giá trị thống kê:
 Tính các giá trị Ti…,Tj.. và T..k ,T…
-

Các giá trị Ti..

-

Chọn ô B7 và nhập biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
Các giá trị T.j.
Chọn ô B8 và nhập =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền từ ơ B8 tới ơ E8.

LÊ CÔNG HẬU 51101058


4


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

-

Các giá trị T..k

-

Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)
Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)
Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
Giá trị T..

2012

Chọn ô B10 và nhập biểu thức =SUM(B2:E5)
 Tính các giá trị G và G
-Các giá trị G và G
Chọn ô B10 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 tới G9
-giá trị G
Chọn ô G10 và nhập biểu thức =POWER(B10,2)
-giá trị G
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
 Tính các giá trị SSR. SSC. SSF. SST và SSE

-Các giá trị SSR. SSC và SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ơ I7 tới I9
-Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
-Giá trị SSE
Chọn ơ I10 và nhập biểu thức =I11-SUM(J7:I9)
 Tính các giá trị MSR. MSC. MSF và MSE
-Các giá trị MSR. MSC và MSF
Chọn ô K7 và nhập biểu thức =K7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ơ K7 tới ô K9
-Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
 Tính giá trị G và F
Chọn ơ M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ơ M7 tới ơ M9

LÊ CƠNG HẬU 51101058

5


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012

 Bước 3: Kết quả và biện luận
FR = 3.10 < F0.05(3,6) = 4.76  chấp nhận Ho (pH)
FC = 11.95 > F0.05(3,6) = 4.76  bác bỏ Ho (nhiệt độ)
F = 30.05 > F0.05 (3,6)=4.76  bác bỏ Ho (chất xúc tác)

Vậy chỉ có nhiệt và chất xúc tác gây ảnh hưởng đến hiệu suất.
Ví dụ 4.2 Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 135 0C kết hợp với ba
khoảng thời gian là 15, 30, 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất
của phản ứng (%) được trình bày trong bảng sau đây:

LÊ CÔNG HẬU 51101058

6


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Thời gian (phút)
X1

Nhiệt độ (0C)
X2

Hiệu suất (%)
Y

15

105

1.87

30

105


2.02

60

105

3.28

15

120

3.05

30

120

4.07

60

120

5.54

15

135


5.03

30

135

6.45

60

135

7.26

2012

Hãy cho biết yếu tố nhiệt độ và thời gian/ hoặc yếu tố thời gian có liên quan tuyến
tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115 0C trong
vịng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
Bài làm:
1. Dạng tốn: HỒI QUY TUYẾN TÍNH ĐA THAM SỐ
2. Cơ sở lý thuyết:
Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên
quan đến k biến số độc lập Xi (I = 1,2,...,k) thay vì chỉ có một như trong hồi quy tuyến
tính đơn giản.
Phương trình tổng quát:
Ŷx0,x1,...,xk = B0 + B1X1 +B2X2 + ... + BkXk

LÊ CÔNG HẬU 51101058


7


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012

Bảng ANOVA:

Nguồn sai số

Bậc tự do

Tổng số bình
phương

Hồi quy

K

SSR

Bình phương
trung bình
MSR=

SSR
k


Giá trị
thống kê
F=

MSR
MSE

MSE =

MSR
MSE

Sai số

N-k-1

SSE

Tổng cộng

N-1

SST = SSR + SSE

Giá trị thống kê:
Giá trị R-bình phương:
Giá trị R2 được hiệu chỉnh (Adjusted R Square)

R2 =


SSR
kF
=
SST ( N−k−1)+ kF

(

là khá tốt)

Giá trị R2 được hiệu chỉnh (Adjusted R Square)

(

sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ)

Độ lệch chuẩn:

S=



SSE
( N −k −1)

(

là khá tốt)

Trắc nghiệm thống kê:
-


Trong trắc nghiệm t:
H0: βi = 0 “Các hệ số hồi quy khơng có ý nghĩa”.
H1 : β i

¿

0 “Có ít nhất vài hệ số hồi quy có ý nghĩa”.

Bậc tự do của giá trị t:  = N – k – 1

LÊ CÔNG HẬU 51101058

8


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ
-

2012

Trong trắc nghiệm F:
H0: βi = 0 “Phương trình hồi quy khơng thích hợp”.
H1: βi

¿

0 “Phương trình hồi quy thích hợp với ít nhất vài hệ số Bi”.

Bậc tự do của giá trị F: v1 = 1, v2 = N – k – 1.

3. Phần mềm: Micsrosoft Excel 2010.
4. Chương trình: Regression.
5. Phương pháp giải bài toán trên Excel 2010.
 Bước 1:Nhập dữ liệu vào bảng tính:
Dữ kiệu nhất thiết phải được nhập theo cột:

 Bước 2 : Nếu trong menu Tools chưa có mục Data Analysis , tiến hành cài
Analysis
ToolPak như sau :
Chọn File/Option/Add-Ins/Data Analysis Tool Pak /Go…/ Analysis Tool Pak
/OK… như
trong hình :

LÊ CÔNG HẬU 51101058

9


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012


a)
b)
c)
-

Bước 3: Sử dụng “Regression”
Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis

Chọn chương trình Regression trong hộp thoại Data Analysis rồi nhấn nút OK
Trong hộp Regression, lần lượt ấn định các chi tiết:
Phạm vi của biến số Y (Input Y Range)

-

Phạm vi của biến số X (Input X Range)

-

Nhãn dữ liệu (Labels)

-

Mức tin cậy (Confidence Level)

-

Tọa độ đầu ra (Output Range)

-

Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số
(residuals plots...)

LÊ CÔNG HẬU 51101058

10



BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012

Phương trình hồi quy
= 2,73 + 0,04X1

LÊ CÔNG HẬU 51101058

(R2 = 0,21; S = 1.81)

11


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

t0 = 2,19 < t0,05 = 2,365 ( hay

2012

= 0,071 > α = 0,05)

 Chấp nhận giả thiết H0.
t1 = 1,38 < t0,05 = 2,365 ( hay PV = 0,209 > α = 0,05)
Chấp nhận giả thiết H0.
F = 1,905 <

= 5,590 (hay

= 0,209 > α = 0,05)


Chấp nhận giả thiết H0.
Vậy cả 2 hệ số 2,37 (B0) và 0,04(B1) của phương trình hồi quy
= 2,73 + 0.04X1
đều khơng có ý nghĩa thống kê. Nói một cách khác, phương trình hồi quy này khơng
thích hợp.

LÊ CÔNG HẬU 51101058

12


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012

Kết Luận:
Yếu tố thời gian khơng liên quan tuyến tính tới hiệu suất của phản ứng tổng hợp.
Phương trình hồi quy:
= 2,73 + 0.04X2

LÊ CÔNG HẬU 51101058

(R2 = 0,76; S = 0,99)

13


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ


t0 = 3,418 > t0,05 = 2,365 ( hay

2012

= 0,011 < α = 0,05)

 bác bỏ giả thiết H0.
t2 = 4,757 > t0,05 = 2,365 ( hay PV = 0,00206 < α = 0,05)
 bác bỏ giả thiết H0.
F=22,631 >

= 5,590 (hay

=0,00206 < α = 0,05)

 bác bỏ giả thiết H0.
Vậy cả 2 hệ số -11,14 (B0) và 0,13(B2) của phương trình hồi quy
= -11,14 + 0,13X2
đều có ý nghĩa thống kê. Nói một cách khác, phương trình hồi quy này thích hợp.
LÊ CƠNG HẬU 51101058

14


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012

Kết Luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
Phương trình hồi quy

-12,70 + 0,04X1 + 0.13X2(R2 = 0,97; S = 0,33)

LÊ CÔNG HẬU 51101058

15


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

t0 = 11,528 > t0,05 = 2,365 (hay PV = 2,260
 bác bỏ giả thiết H0.

2012

< α = 0,05)

t1 = 7,583 > t0,05 = 2,365 (hay PV = 0,00207 < α = 0,05)
 bác bỏ giả thiết H0.
t2 = 14,328 > t0,05 = 2,365 (hay PV =7,233
 bác bỏ giả thiết H0.
F = 131,329 < F0,05 = 5,140 (hay FS = 1,112

< α = 0,05)
< α = 0,05)

 bác bỏ giả thiết H0.

LÊ CÔNG HẬU 51101058

16



BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012

Vậy cả 2 hệ số -12.70 (B0); 0,04 (B1) và 0,13(B2) của phương trình hồi quy
-12,70 + 0,04X1 + 0,13X2 đều có ý nghĩa thống kê. Nói một cách khác,

phương trình hồi quy này thích hợp.
Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai
yếu tố là thời gian và nhiệt độ.
Sự tuyến tính của phương trình
-12,70 + 0,04X1 + 0,13X2 có thể được
trình bày trên biểu đồ phân tán (scatterplots):
Hàm lượng dự đoán (Y')

8
7
6
5
4
3
2
1
0

0

1


2

3

4

5

6

7

8

9

10

Hàm lượng thực nghiệm (Y)

Muốn dự đoán hiệu suất của phản ứng bằng phương trình hồi quy :
12,70 + 0,04X1 + 0,13X2, bạn chỉ cần chọn một ơ, ví dụ B21, sau đó nhập hàm và được
kết quả như sau:

Ghi chú: B17 tọa độ của B0, B18 tọa độ của B1, B19 tọa độ của B2, 50 là giá
trị của X1 (thời gian) và 115 là giá trị của X2 (nhiệt độ)

LÊ CÔNG HẬU 51101058


17


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012

Câu 2 : Bảng sau đây cho ta một mẫu gồm 11 quan sát (x i, yi) từ tập hợp chính các
giá trị của cặp ĐLNN (X, Y):
X
Y

0,9
-0,3

1,22
0,1

X
Y

1,32
0,37

1,32
0,7

0,77
-0,28


0,95
-0,70

1,45
0,55

1,3
-0,25

1,2
0,02
1,3
0,35

1,2
0,32

a) Tìm đường hồi quy của Y đối với X.
b) Tính sai số tiêu chuẩn của đường hồi quy.
c) Tính tỷ số F để kiểm định sự đúng đắn của giả thiết: Có hồi quy tuyến tính của Y
theo X.
Bài làm:
1. Dạng tốn: PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH
2. Cơ sở lý thuyết:
PHƯƠNG TRÌNH TỔNG QT:

Bảng ANOVA:
Nguồn
sai sơ


Bậc tự do

Hồi quy

Tổng số bình phương

SSR =

Sai số

N–2

Tổng
cộng

N–1

LÊ CƠNG HẬU 51101058

SSE= =

Bình phương trung
bình
MSR = SSR

Giá trị thống

F=

MSE = SSE/(N - 2)


18


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012

GIÁ TRỊ THỐNG KÊ:
Gía trị R-bình phương (R-square):
(100R2: % của biến đổi trên Y đượcgiải thích bởi X)
Độ lệch chuẩn (Standard Error)

(Sự phân tán của dữ liện càng ít thì giá trị của S càng gần zero).
Trắc nghiệm thống kê:
Đối với một phương trình hồi quy
, ý nghĩa thống kê của các hệ số Bi
(B0 hay B) được đánh giá bằng trắc nghiệm t (phân phối Student) trong khi tính chất
thích hợp của phương trình
Fischer)

được đánh giá bằng trắc nghiệm F (phân bố

Trắc nghiệm t:
-

Giả thiết:
H0: βi = 0 “Hệ số hồi quy không có ý nghĩa”
H0: βi ≠ 0 “Hệ số hồi quy có ý nghĩa”


-

Giá trị thống kê:

Phân bố Student  = N – 2
-

Biện luận:

Nếu t < tα (N - 2)  chấp nhận giả thiết H0.
Trắc nghiệm F:
-

Giả thiết:
H0: βi = 0 “Hệ số hồi quy khơng thích hợp”
H0: βi ≠ 0 “Hệ số hồi quy thích hợp”

-

Giá trị thống kê:

LÊ CÔNG HẬU 51101058

19


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2012


Phân bố Fischer v1 = 1, v2 = N – 2
-

Biện luận:

Nếu F < Fα (N - 2)  chấp nhận giả thiết H0.
3. Phần mềm: Micsrosoft Excel 2010.
4. Chương trình: Regression.
5. Phương pháp giải bài toán trên Excel 2010.
Gỉa thiết H0 : Hệ số góc α của đường thẳng hồi quy của Y đối với X bằng 0
 Bước 1: Nhập dữ liệu vào bảng:

 Bước 2 : Nếu trong menu Tools chưa có mục Data Analysis , tiến hành cài
Analysis
ToolPak như sau :
Chọn File/Option/Add-Ins/Data Analysis Tool Pak /Go…/ Analysis Tool Pak
/OK… như
trong hình :

LÊ CƠNG HẬU 51101058

20



×