Tải bản đầy đủ (.pdf) (33 trang)

Báo cáo BTL XSTK Nhóm 4

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.28 MB, 33 trang )

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA ĐIỆN – ĐIỆN TỬ

BÁO CÁO BÀI TẬP LỚN

XÁC SUẤT – THỐNG KÊ
Giảng viên hướng dẫn:
Sinh viên thực hiện:
MSSV:
Lớp:

PGS.TS Nguyễn Đình Huy
Lê Sỹ Hậu
41201040
DD12LT03

Nhóm 4

TP Hồ Chí Minh, ngày 9/5/2012


Báo cáo bài tập lớn Xác suất - Thống kê

MỤC LỤC

Câu 1 .................................................................................................................................. Trang 3
Ví dụ 3.4................................................................................................................. Trang 3
Ví dụ 4.2................................................................................................................. Trang 7
Câu 2 ................................................................................................................................ Trang 18
Câu 3 ................................................................................................................................ Trang 23


Câu 4 ................................................................................................................................ Trang 27
Câu 5 ................................................................................................................................ Trang 31

Nhóm 4

Trang 2


Báo cáo bài tập lớn Xác suất - Thống kê
1.
Ví dụ 3.4 (Trang 207 – SBT). Hiệu suất phần trăm (%) của một phản ứng hóa học
được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày
trong bảng sau:
Yếu tố

Yếu tố B

A

B1

B2

B3

B4

A1

C1


9

C2

14

C3

16

C4

12

A2

C2

12

C3

15

C4

12

C1


10

A3

C3

13

C4

14

C1

11

C2

14

A4

C4

10

C1

11


C2

13

C3

13

Hãy đánh giá sự ảnh hưởng của các yếu tố đến hiệu suất phản ứng.
I. Cơ sở lý thuyết
Đây là dạng tốn phân tích phương sai ba yếu tố.
Mơ hình
Yếu tố

Yếu tố B

A

B1

B2

B3

B4

Ti..

A1


C1

Y111

C2

Y122

C3

Y133

C4

Y144

T1..

A2

C2

Y212

C3

Y223

C4


Y234

C1

Y241

T2..

A3

C3

Y313

C4

Y324

C1

Y331

C2

Y342

T3..

A4


C4

Y414

C1

Y421

C2

Y432

C3

Y443

T4..

Tj

T.1.

T.2.

T.3.

T.4.

Bảng ANOVA


(Trang kế)

Nhóm 4

Trang 3


Báo cáo bài tập lớn Xác suất - Thống kê
Nguồ
n
sai số
Yếu tố
A
(hàng
)
Yếu tố
B
(cột)
Yếu tố
C
Sai số
Tổng
cộng

Bậc tự
do

Tổng số bình phương


r 1

r
T2 T2 
SS R    i...  ...2 
r 
i 1  r

MS R 

SS R
r 1

FR 

MS R
SS E

r 1

 T j2... T...2 
SSC   
 2

r 
j 1  r

MSC 

SSC

r 1

FC 

MSC
SS E

r 1

r
T2 T2 
SS F    k ...  ...2 
r 
k 1  r

MS F 

SS F
r 1

FF 

MS F
SS E

r

 r  1 r  2 

r 1

2

SS E  SST   SS F  SS R  SSC 

Bình phương
trung bình

MS E 

Giá trị
thống kê

SS E
 r  1 r  2 

r
r
r

T2 
SST    Yijk2  ...2 
r 
i 1 j 1 k 1 

Giả thiết
+ Giả thiết H: Các giá trị trung bình bằng nhau.
+ Giả thiết H0: Các giá trị trung bình khác nhau.
Các giá trị thống kê
MS R
SS E

MSC
+ FC 
SS E
MS F
+ FF 
SS E

+ FR 

Biện luận
+ Nếu F  FCritical thì bác bỏ giả thiết H.
Nhóm 4

Trang 4


Báo cáo bài tập lớn Xác suất - Thống kê

II. Áp dụng
Giả thiết
+ Giả thiết H(pH): Độ pH không ảnh hưởng đến hiệu suất phản ứng.
+ Giả thiết H(nhiệt độ): Nhiệt độ không ảnh hưởng đến hiệu suất phản ứng.
+ Giả thiết H(xúc tác): Chất xúc tác không ảnh hưởng đến hiệu suất phản ứng.
1. Nhập bảng dữ liệu như Hình 1.1

Hình 1.1 – Bảng dữ liệu
2. Tính các giá trị Ti.., T.j., T..k
Tính Ti..
+ B7: =SUM(B2:E2)
+ C7: =SUM(B3:E3)

+ D7: =SUM(B4:E4)
+ E7: =SUM(B5:E5)
Tính T.j.
+ B8: = SUM(B2:B5)
+ Kéo nút tự điền từ B8 đến E8.
Tính T..k
+ B9: =SUM(B2;C5;D4;E3)
+ C9: =SUM(B3;C2;D5;E4)
+ D9: =SUM(B4;C3;D2;E5)
+ E9: =SUM(B5;C4;D3;E2)
Nhóm 4

Trang 5


Báo cáo bài tập lớn Xác suất - Thống kê

Tính T
+ B10: =SUM(B2:E5)
Tính các giá trị ̇ và ̇
+ G7:
+ Dùng con trỏ kéo kí hiệu tự điền từ ơ G7 đến ơ G9.
Tính giá trị ̇
+ G10: =POWER(B10,2)
Tính giá trị ̇
+ G11: =SUMSQ(B2:E5)
Tính các giá trị SSR, SSC và SSF
+ I7: =G7/4-39601/POWER(4;2)
+ Dùng con trỏ kéo kí hiệu tự điền từ ơ I7 đến ơ I9.
Tính giá trị SST

+ I11: =G11-G10/POWER(4;2)
Tính giá trị SSE
+ I10: =I11-SUM(I7:I9)
Tính các giá trị MSR, MSC và MSF
+ K7: =I7/(4-1)
+ Dùng con trỏ kéo kí hiệu tự điền từ ơ K7 đến ơ K9.
Tính giá trị MSE
+ K10: =I10/((4-1)*(4-2))
Tính giá trị G và F
+ M7: =K7/0.3958
+ Dùng con trỏ kéo kí hiệu tự điền từ ơ M7 đến ơ M9

Nhóm 4

Trang 6


Báo cáo bài tập lớn Xác suất - Thống kê

Hình 1.4 – Các giá trị
3. Kết quả và biện luận
+ FR = 3,1 < F0,05(3,6) = 4,76 => Chấp nhận giả thiết H (pH).
+ Fc = 11,95 > F0,05(3,6) = 4,76 => Bác bỏ giả thiết H (nhiệt độ).
+ FF = 30,05 > F0,05(3,6) = 4,76 => Bác bỏ giả thiết H (chất xúc tác).
Vậy chỉ có nhiệt độ và chất xúc tác ảnh hưởng đến hiệu suất của phản ứng.

Ví dụ 4.2(Trang 216 - SBT). Người ta đã dùng ba mức nhiệt độ gồm 1050C, 1200C và
1350C kết hợp với ba khoảng thời gian là 15 phút, 30 phút và 60 phút để thực hiện
một phản ứng tổng hợp. Các hiệu suất phản ứng (%) được trình bày trong bảng sau
đây:

Thời gian
(phút)
X1

X2

Hiệu suất
(%)
Y

15

105

1,87

30

105

2,02

60

105

3,28

15


120

3,05

30

120

4,07

60

120

5,54

15

135

5,03

30

135

6,45

60


135

7,26

Nhiệt độ (0C)

Hãy cho bết yếu tố nhiệt độ và/hoặc thời gian có liên quan tuyến tính với hiệu suất
phản ứng tổng hợp hay khơng? Nếu có thì với điều kiện nhiệt độ 1150C trong vịng
50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
Nhóm 4

Trang 7


Báo cáo bài tập lớn Xác suất - Thống kê

I. Cơ sở lý thuyết
Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan
k biến số độc lập 𝑋𝑖 (𝑖=1,2,,…𝑘) thay vì chỉ có một như trong hồi quy tuyến tính đơn
giản.
Phương trình tổng quát: YˆX1 , X 2 ,..., X k  B0  B1 X1  B2 X 2  ...  Bk X k
Bảng ANOVA

Nguồn
sai số

Bậc tự
do

Tổng số bình phương


Hồi
quy

k

SS R   Yi '  Y ' 

Sai số

n  k 1

SS E   Yi  Y ' 

Tổng
cộng

n 1

SST   Yi  Yi '   SS R  SS E

Bình
phương
trung bình

2

2

MS R  SS R

MS E 

Giá trị
thống

F

MS R
MS E

SS E
n2

2

Giá trị thống kê
+ Giá trị R – bình phương: R 

2

+ Giá trị R được hiệu chỉnh:

+ Độ lệch chuẩn: S 

SS R
kF

SST n  k 1  kF

k 1  R 2 

n 1 R 2  k

2
R 
R 
n  k 1
n  k 1
2
ii



1
Yi  Yi'

n2



2

Trắc nghiệm thống kê
1. Trắc nghiệm t
Giả thiết

Nhóm 4

Trang 8



Báo cáo bài tập lớn Xác suất - Thống kê
+ H: 𝛽𝑖=0 “Hệ số hồi quy khơng có ý nghĩa”
+ H0: 𝛽𝑖≠0 “Hệ số hồi quy có ý nghĩa”
Giá trị thống kê
+ t

+

Sn2

Bi  i
Sn2



S2

 Xi  X 

Phân bố Student

2

  n2

Biện luận
+ Nếu t  t  n  2  thì chấp nhận giả thiết H.
2. Trắc nghiệm F
Giả thiết
+ H: 𝛽𝑖=0 “Phương trình hồi quy khơng thích hợp”

+ H0: 𝛽𝑖≠0 “Phương trình hồi quy thích hợp”
Giá trị thống kê
+ F

MS R
MS E

Phân bố Fischer

1  1, 2  n  2

Biện luận
+ Nếu F  F 1, n  2  thì chấp nhận giả thiết H.

II. Áp dụng
Nhóm 4

Trang 9


Báo cáo bài tập lớn Xác suất - Thống kê
Giả thiết H: Phương trình hồi quy khơng thích hợp.
1. Nhập dữ liệu như Hình 1.5

Hình 1.5 – Bảng dữ liệu

 

Phương trình hồi quy: YˆX  f X1
1


+ R2  0,21
+ S  1,81
 YˆX

1

 2,73  0,04 X

1

2. Áp dụng Regression
Điền các thông số cho hộp thoại Regression như Hình 1.6

(Trang kế)

Nhóm 4

Trang 10


Báo cáo bài tập lớn Xác suất - Thống kê

Hình 1.6 - Regression
Bấm OK ta được kết quả như Hình 1.7

(Trang kế)

Nhóm 4


Trang 11


Báo cáo bài tập lớn Xác suất - Thống kê

Hình 1.7 – Kết quả Regression
3. Kết quả và biện luận
2
 t0  2,19  t0,05  2,365 (hay Pvalue
 0,071    0,05)  Chấp nhận giả thiết H.

 t0  1,38  t0,05  2,365 (hay Pvalue  0,209    0, 05)  Chấp nhận giả thiết H.
 F  1,905  F0,05  5,590  hay FS4  0, 209    0,05   Chấp nhận giả thiết H.
Vậy phương trình hồi quy này khơng thích hợp, yếu tố thời gian khơng liên
quan tuyến tính với hiệu suất phản ứng.
Nhóm 4

Trang 12


Báo cáo bài tập lớn Xác suất - Thống kê

 

Phương trình hồi quy: YˆX  f X 2
2

+ R2  0,76
+ S  0,99
 YˆX


2

 2,73  0,04 X 2

2. Áp dụng Regression
Điền các thông số cho hộp thoại Regression như Hình 1.8

Hình 1.8 - Regression
Bấm OK ta được kết quả như Hình 1.9
(Trang kế)

Nhóm 4

Trang 13


Báo cáo bài tập lớn Xác suất - Thống kê

Hình 1.9 – Kết quả Regression
3. Kết quả và biện luận
2
 t0  3, 418 > t0,05  2,365 (hay Pvalue
 0,011    0,05)  Bác bỏ giả thiết H.

 t2  4,757  t0,05  2,365 (hay Pvalue  0,002    0, 05)  Bác bỏ giả thiết H.
 F  22,631 > F0,05  5,590  hay FS4  0,002    0,05   Bác bỏ giả thiết H.
Vậy phương trình hồi quy này thích hợp, yếu tố nhiệt độ có liên quan tuyến tính
với hiệu suất phản ứng.


Nhóm 4

Trang 14


Báo cáo bài tập lớn Xác suất - Thống kê
Phương trình hồi quy: YˆX

1, X 2

 f  X1, X 2 

+ R2  0,97
+ S  0,33
 YˆX , X
1 2

 12,70  0,04 X1  0,13 X 2

2. Áp dụng Regression
Điền các thông số cho hộp thoại Regression như Hình 1.10

Hình 1.10 - Regression
Bấm OK ta được kết quả như Hình 1.9
(Trang kế)

Nhóm 4

Trang 15



Báo cáo bài tập lớn Xác suất - Thống kê

Hình 1.9 – Kết quả Regression
3. Kết quả và biện luận

 t0  11,528 > t0,05  2,365 (hay Pvalue  2,26.105    0, 05)  Bác bỏ giả
thiết H.

 t1  7,583 > t0,05  2,365 (hay Pvalue  0,00027    0,05)  Bác bỏ giả thiết
H.

 t2  14,328 > t0,05  2,365 (hay Pvalue  7,233.106    0,05)  Bác bỏ giả
thiết H.
Nhóm 4

Trang 16


Báo cáo bài tập lớn Xác suất - Thống kê

 F  131,392 > F0,05  5,140  hay FS  1,112.105    0,05   Bác bỏ giả
thiết H.
Vậy phương trình hồi quy này thích hợp. Hiệu suất của phản ứng có liên quan
tuyến tính với cả hai yếu tố thời gian và nhiệt độ.
Với điều kiện nhiệt độ 1150C trong vịng 50 phút, để dự đốn hiệu suất phản ứng, ta
tính:
+ B20: =B16+B17*50+B18*115

Hình 1.11 – Dự đốn


Hình 1.12 – Kết quả dự đốn
Vậy với điều kiện nhiệt độ 1150C trong vịng 50 phút thì hiệu suất phản ứng sẽ là
4,311.

Nhóm 4

Trang 17


Báo cáo bài tập lớn Xác suất - Thống kê
2. Để so sánh chi phí quảng cáo trên bốn tờ báo khác nhau (với các điều kiện quảng cáo
như nhau), người ta đã lấy mẫu 7 lần quảng cáo trên mỗi tờ báo và thu được các kết
quả sau (đơn vị: ngàn đồng):
Báo A

57

65

50

45

70

62

48


Báo B

72

81

64

55

90

38

75

Báo C

35

42

58

59

46

60


61

Báo D

73

85

92

68

82

94

66

Hãy tìm P-value để kiểm định xem có sự khác biệt về chi phí quảng cáo giữa các tờ báo
nói trên hay khơng.
I. Cơ sở lý thuyết
Phân tích phương sai một yếu tố
Sự phân tích này nhằm đánh giá sự ảnh hưởng của một yếu tố trên các giá trị quan
sát Yi (i = 1,2,...,k)
Mơ hình

Yếu tố thí nghiệm
1




2



Tổng cộng
Trung bình

Nhóm 4







k




̅

̅̅̅



T
̅


̅

Trang 18


Báo cáo bài tập lớn Xác suất - Thống kê
Bảng ANOVA
Nguồn sai
số

Bậc tự
do

Yếu tố

k 1

Sai số

nk

Tổng cộng

nk  1

Tổng số bình phương
Ti 2  T 2
n
i 1
k


SSTr  

SSE  SST  SSTr

Bình phương
trung bình
SS
MSTr  Tr
k 1
MS E 

Giá trị
thống kê
F

MSTr
MS E

SS E
nk

SST   Yij  T 
k

n

i 1 j 1

Giả thiết

- H: Các giá trị trung bình bằng nhau.
- H0: Có ít nhất có hai giá trị trung bình khác nhau.
Giá trị thống kê
+ F

MSTr
MS E

Biện luận
Nếu

F  FCritical  k  1, n  k ,  

thì ta bác bỏ giả thiết H.

II. Áp dụng
Giả thiết
+ Giả thiết H: Chi phí quảng cáo giữ các tờ báo là như nhau.
+ Giả thiết H0: Chi phí quảng cáo giữ các tờ báo là khác nhau.
1. Nhập bảng số liệu như Hình 2.1

(Trang kế)

Nhóm 4

Trang 19


Báo cáo bài tập lớn Xác suất - Thống kê


Hình 2.1 - Bảng số liệu
2. Sử dụng “Anova: Single Factor”
Vào Data, chọn Data Analysis, chọn Anova: Single Factor, rồi bấm OK.

Hình 2.3 – Data Analysis
Trong hộp thoại Anova: Single Factor, nhập các thơng số như Hình 2.3
- Input Range: $A$1:$H$4
- Alpha: 0,05
- Group by: Rows
- Output options: tích vào New Worksheet Ply

Hình 2.3 (Trang kế)

Nhóm 4

Trang 20


Báo cáo bài tập lớn Xác suất - Thống kê

Hình 2.3 – Anova: Single Factor
Ta được kết quả như như Hình 2.4

Hình 2.4 – Bảng kết quả

Nhóm 4

Trang 21



Báo cáo bài tập lớn Xác suất - Thống kê
3. Kết quả và biện luận
+ P-value = 0,001353 <   0, 05
+ F = 7,152086 > FCritacal = 3,008787

 Bác bỏ giả thiết H.
Vậy chi phí quảng cáo giữa các tờ báo là khác nhau.

Nhóm 4

Trang 22


Báo cáo bài tập lớn Xác suất - Thống kê
3. Trong một thí nghiệm khoa học, người ta nghiên cứu độ dày của lớp mạ kền khi
dùng ba loại bể mạ khác nhau. Sau một thời gian mạ, người ta đo độ dày của lớp mạ
nhận được ở các bể như sau:
Độ dày lớp mạ kền

Số lần đo ở bể mạ

tính bằng micro mét

A

B

C

4-8


32

51

68

8 - 12

123

108

80

12 - 16

10

26

26

16 - 20

41

24

28


20 -24

19

20

28

Với mức ý nghĩa   0, 05 , hãy kiểm định giả thiết: độ dày lớp mạ sau khoảng thời gian
nói trên khơng phụ thuộc loại bể mạ được dùng.

I. Cơ sở lý thuyết
Đây là bài toán kiểm định tính độc lập của hai thuộc tính X và Y trên một mẫu.
Y2
n12
n22

...

X1
X2

Y1
n11
n21

...

...


...

...

...

Xh

nh1

...

nij

nhk

mj

m1

m2

...

mk

X\Y

...


Yk
n1k

...

ni
n1
n2
...
nh
n   m j  ni

Từ bảng trên, ta tính được bảng tần số lý thuyết:
X\Y

Y2

...

Yk

X2

 11
 21

 12
 22


...

...

...

 ij

...

Xh

 h1

...

...

 hk

X1

Nhóm 4

Y1

...

 1k


...

Trang 23


Báo cáo bài tập lớn Xác suất - Thống kê
Với

 ij 

ni .m j
n

Ta tính giá trị quan sát: Qqs   02 

h

k


i 1 j 1



nij   ij

 ij




2

có phân phối

Trong đó: + nij là tần số thực nghiệm
+  ij là tần số lý thuyết
Trong Excel, ta sử dụng hàm CHITEST để tính xác suất P



2
0

(2(h1)() k 1)

2( )



  ( h 1)( k 1) .

Biện luận
- Nếu

02  (2(h1)() k 1)

hoặc P




2
0

2( )



  ( h 1)( k 1)   thì X và Y độc lập với nhau.

II. Áp dụng
Giả thiết H: Độ dày lớp mạ phụ thuộc vào loại bể mạ đang dùng.
Giả thiết H0: Độ dày lớp mạ không phụ thuộc vào loại bể mạ đang dùng.
1. Nhập bảng số liệu như Hình 3.1

Hình 3.1 – Bảng số liệu
2. Ta tính các tổng như Hình 3.2

(Trang kế)

Nhóm 4

Trang 24


Báo cáo bài tập lớn Xác suất - Thống kê

Hình 3.2 – Các tổng
3. Tính các tần số lý thuyết
- Tần số lý thuyết


 ij 

ni .m j
n

- Tính B10: =B$8*$E3/$E$8 rồi kéo nút tự điền từ B10 đến D14, ta được như
Hình 3.3

Hình 3.3 – Bảng tần số lý thuyết
4. Áp dụng hàm CHITEST
- Tính B16: =CHITEST(B3:D7;B10:D14), đây chính là xác suất P

Nhóm 4



2
0

2( )



  ( h 1)( k 1) .

Trang 25


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×