Tải bản đầy đủ (.docx) (35 trang)

Báo cáo bài tập lớn xác suất thống kê đh bách khoa

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (742.36 KB, 35 trang )

Trường Đại học Bách Khoa Thành phố Hồ Chí Minh
Khoa Khoa học Ứng Dụng
GVHD PGS.TS Nguyễn Đình Huy

BÁO CÁO BÀI
TẬP LỚN XÁC
SUẤT THỐNG KÊ
NHÓM 11
Họ và tên : Ngô Thị Minh Phương
MSSV : 41303103-41303716


NHÓM 11 - XSTK
Câu 1
Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên
cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày
trong bảng sau:
Yếu tố
A
A1
A2
A3
A4

B1
C1
C2
C3
C4

Yếu tố


B
B3
C3
C4
C1
C2

B2
9
12
13
10

C2
C3
C4
C1

14
15
14
11

B4
16
12
11
13

C4

C1
C2
C3

12
10
14
13

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
-

Nhận định
Bài toán phân tích phương sai 3 yếu tố

1) Cơ sở lý thuyết:

Khi phân tích phương sai ba yếu tố ta thường dung mô hình vuông La
tinh có dạng như sau:
Yếu
tố
A
A1
A2
A3
A4
T.i.

Page 30


Yếu
tố B
B1
C1
C2
C3
C4

B2
Y111
Y212
Y313
Y414
T.1.

C2
C3
C4
C1

B3
Y122
Y223
Y324
Y421
T.2.

C3
C4
C1

C2

B4
Y133
Y234
Y331
Y432
T.3.

C4
C1
C2
C3

Y144
Y241
Y342
Y443
T.4.

Ti..
T1..
T2..
T3..
T4..

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK

Bảng ANOVA:
Nguồn
sai số

Bậc tự
do

Tổng số bình phương

Bình phương
trung bình

Giá trị thống


Yếu tố
A
(hàng)

r-1

SSR =

MSR = SSR / (r
- 1)

FR = MSR /
SSE

Yếu tố

B (cột)

r-1

SSC =

MSC = SSC / (r
- 1)

FC = MSC
/SSE

Yếu tố
C

r-1

SSF =

MSF = SSF / (r
- 1)

F = MSF /
SSE

Sai số

(r-1)(r-2)

SSE = SST – (SSF + SSR +

SSC)

MSE =

Tổng
cộng

r2 - 1

SST =

Giả thiết:
H0: Các giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C)
bằng nhau.
H1: Có ít nhất hai giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất
xúc tác (C) khác nhau.
Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA để
kết luận ảnh hưởng của các yếu tố đến hiệu suất của phản ứng

.

2) Bài làm

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK
Nhập dữ liệu vào bảng như sau:








Page 30

Tính các giá trị Ti… T.j. T..k và T
- Các giá trị Ti..
Chọn ô B7 và nhập biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
- Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến E8
- Các giá trị T..k
Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)
Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)
Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
- Giá trị T…
Chọn ô B10 và nhập biểu thức =SUM(B5,C4,D3,E2)
Tính các giá trị và
- Các giá trị và
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9
- Giá trị

Chọn ô G10 và nhập biểu thức =POWER(B10,2)
- Giá trị
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tính các giá trị SSR, SSC, SSF, SST và SSE

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK
Các giá trị SSR, SSC và SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9
- Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
- Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF, và MSE
- Các giá trị MSR, MSC và MSF
Chọn ô K7 và nhập biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9
- Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính giá trị G và F
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
-






Kết luận:
FR = 3,1 < F0.05(3.6) =4,76 => Chấp nhận H0 (pH)
Fc = 11,95 < F0.05(3.6) =4,76 => Bác bỏ H0 (Nhiệt độ)
F = 30,05 < F0.05(3.6) =4,76 => Bác bỏ H0 (Chất xúc tác)
Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng tới hiệu suất.
Ví dụ 4.2: Người ta dung ba mức nhiệt độ gồm 105, 120 và 135oC kết hợp
với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng
hợp. Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:
Thời gian
(phút)
X1
15
30
60

Page 30

Nhiệt độ (oC)
X2

Hiệu suất (%)
Y

105
105
105

1.87
2.02

3.28

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK
15
30
60
15
30
60

120
120
120
135
135
135

3.05
4.07
5.54
5.03
6.45
7.26

Hãy cho biết yếu tố nhiệt độ hoặc yếu tố thời gian có liên quan tính tuyến với
hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115oC trong
vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?

-

Nhận định
Hồi quy tuyến tính đa tham số

1) Cơ sở lý thuyết:

Phương trình tổng quát cho biến phụ thuộc Y có liên quan đến k biến số
độc lập Xi (i=1,2,...,k):
B0 + B1X1 + B2X2 + … + BkXk

Bảng ANOVA:
Nguồn
sai số

Bậc tự
do

Tổng số bình phương

Bình phương
trung bình

Giá trị thống


Hồi quy

k


SSR

MSR = SSR / k

F = MSR /
MSE

Sai số

N-k-1

SSE

MSE = SSE / (N - k
- 1)

Tổng
cộng

N-1

SST = SSR + SSE

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK


Giá trị thống kê:


Giá trị R-bình phương:
Giá trị R2:
(R3 ≤ 0.81 là khá tốt)
Giá trị R2 được hiệu chỉnh (Adjusted R Square)

sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ


Độ lệch chuẩn:
(S ≤ 0.30 là khá tốt)

Trắc nghiệm thống kê:




Trắc nghiệm t:
Bậc tự do của t: = N - k - 1
;
Trắc nghiệm F:
Bậc tự do của giá trị F: v1 = 1, v2 = N -k – 1

2) Bài làm
Nhập dữ liệu theo cột:

Page 30


GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK

Sử dụng Regression: Data -> Data Analysis

Trong cửa sổ Data Analysis chọn Regression:

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK



Hồi quy theo Thời gian (X1):
Các thông số:
-

Page 30

Input Y Range: Phạm vi biến số Y
Input X Range: Phạm vi biến số X
Labels: Dữ liệu bao gồm nhãn
Confidence Level: Mức tin cậy (chọn 95%)
Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời
gian)


GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK

Kết quả:

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK

Phương trình hồi quy:
YX1 = f(X1) = 2.7667 + 0.0445X1 với R2 = 0.2139 và S = 1.8112
t0 = 2.1290 < t0.05 = 2.365 (tra bảng VII với n = 7, α = 0.025) hay =
0.0708 > α = 0.05


Nên chấp nhận giả thiết H0.

t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05


Nên chấp nhận giả thiết H0.

F = 1.9049 < = 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay = 0.2100
> α = 0.05



Nên chấp nhận giả thiết H0.

Vậy phương trình hồi quy trên không có ý nghĩa thống kê.
Kết luận: Yếu tố thời gian không có liên quan tính tuyến với hiệu suất của
phản ứng tổng hợp.
Hồi quy theo Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X
Range là $B$1:$B$10

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK
Kết quả:

Phương trình hồi quy:
YX2 = f(X2) =11.1411 + 0.1286X2 với R2 = 0.7638 và S = 0.9929
t0 = 3.4179 > t0.05 = 2.365 hay = 0.0112 < α = 0.05


Nên bác bỏ giả thiết H0.

t1 = 4.7572 > t0.05 = 2.365 hay PV = 0.0021 < α = 0.05


Nên bác bỏ giả thiết H0.


F = 22.6309 > = 5.590 hay = 0.0021 < α = 0.05


Nên bác bỏ giả thiết H0.

Vậy phương trình hồi quy trên có ý nghĩa thống kê.
Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất của phản
ứng tổng hợp.

Hồi quy theo Thời gian (X1) và Nhiệt độ (X2):

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X
Range là $A$1:$B$10
Kết quả:

Phương trình hồi quy:
YX1, X2 = f(X1,X2) = -12.7000 + 0.0445X1 + 0.1286X2 với R2 = 0.9777
và S = 0.3297
t0 = 11.5283 > t0.05 = 2.365 hay = 2.5607E-05 < α = 0.05


Nên bác bỏ giả thiết H0.


t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05


Nên bác bỏ giả thiết H0.

t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05


Nên bác bỏ giả thiết H0.

F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS =
0.0021 < α = 0.05

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK


Nên bác bỏ giả thiết H0.

Vậy phương trình hồi quy trên có ý nghĩa thống kê.
Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là
thời gian và nhiệt độ.
Dữ liệu với hàm hồi quy Y = -12.7000 + 0.0445X1 + 0.1286X2:
Vẽ
biểu
đồ:

chọn ô
C2,

vào Insert -> Scatter -> Scatter with only Maker

Sự tính tuyến của phương trình hồi quy YX1, X2 = -12.7000 + 0.0445X1 +
0.1286X2 có thể được trình bày trên biểu đồ phân tán:

Page 30

Hàm
lượn
g dự
đoá
n
(Y’)

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK

Hàm lượng thực nghiệm (Y)

Dự đoán hiệu suất của phản ứng bằng phương trình hồi quy tại nhiệt thời gian
(X1) 50 phút, nhiệt độ (X2) 115oC:

Công thức ô E3:
=B1+B2*E1+B3*E2
Kết quả: 4.3109


Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK
Câu 2
Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỷ lệ những
người đi làm bằng xe máy, xe đạp và buýt. Việc điều tra được tiến hành trên hai nhóm.
Kết quả như sau:

Nữ
Nam

Xe máy
25
75

Buyt
100
120

Xe đạp
125
205

Với mức ý nghĩa α = 5%, hãy nhận định xem có sự khác nhau về cơ cấu sử dụng các
phương tiện giao thông đi làm trong hai nhóm công nhân nam và công nhân nữ hay
không.

-Nhận

định

Kiểm tra cơ cấu sử dụng phương tiện giao thông đi làm trong nhóm công nhân
nam và nữ bằng phương pháp so sánh tỉ số
1)

Cơ sở lý thuyết :

- Đối với một số bài toán có hai hay nhiều kết quả, ta thường phải so sánh hai
hay nhiều tỉ số với nhau (thực nghiệm với lý thuyết, thực nghiệm với thực
nghiệm…). Phép trắc nghiệm khi bình phương không chỉ cho phép ta so sánh hai
mà là nhiều tỉ số ( hay tỉ lệ hoặc xác suất một cách tiện lợi )
- là phân phối về xác suất không có tính đối xứng và có gián trị ≥0 , bà toán với
N lần thử nghiệm mỗi lần thử nghiệm có k kết quả và mỗi kết quả mang một xác
suất thực nghiệm ( i= 1,2,3…,k ) .Nếu gọi là các giá trị lý thuyết tương ứng với
thì các tần số lý thuyết = N. Điều kiện trắc nghiệm một cách thành công là các
tần số ký thuyết ≥ 5

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK
Giả thiết :
: , , …  “Các giá trị trung bình bằng nhau”
: “ Có ít nhất 2 giá tri trung bình bằng nhau “
Giá trị thống kê :

=
: Các tần số thực nghiệm
: Các tần số lý thuyết
Biện luận :
Nếu => Bác bỏ giả thiết ( DF= k-1 )
Trong chương trình MS-EXCEL có hàm số CHITEST để tính

2) Bài làm:
-

-

Page 30

Giả thiết : “ Cơ cấu sử dụng phương tiện giao thông của công nhân nam
và công nhân nữ giống nhau .”
Nhập bảng dữ liệu như hình vẽ :

Tổng hàng:
Chọn E2 và nhập biểu thức =SUM(B2:D2)
Dùng con trỏ kéo nút tự điền từ E2 tới E3

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK
-

-


Tổng cột:
Chọn B4 và nhập biểu thức =SUM(B2:B3)
Dùng con trỏ kéo nút tự điền từ B4 tới D4
Tổng cộng:
Chọn E5 và nhập biểu thức =SUM(B2:D3)
Tính các tần số lí thuyết:
Tần số lí thuyết = (tổng hàng x tổng cột) / tổng cộng.

Chọn B8 nhập công thức =B$4*$E2/$E$4, dùng con trỏ kéo nút tự điền từ ô
B8 đến ô D9 hoặc nhấn tổ hợp phím ctrl + enter
Ta được bảng sau :

Áp dụng hàm CHITEST:
Chọn A11 và nhập biểu thức =CHITEST(B2:D3,B8:D9)
Ta sẽ có được kết quả của

Kết luận:
= 0.0022 < α = 0.05 => Bác bỏ giả thuyết Ho
Cơ cấu sử dụng các phương tiện giao thông đi làm trong 2 nhóm công nhân
nam và nữ khác nhau.

Câu 3

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK
Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E yêu cầu

những người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phối mà
họ đang sống. Kết quả được cho như sau:
Thành phố

A
B
C
D
E

Mức độ thỏa mãn
Rất thỏa Tương đối
Không
mãn
220
121
63
130
207
75
84
54
24
156
95
43
122
164
73


Với mức ý nghĩa α = 3%, kiểm định xem mức độ thỏa mãn cuộc sống có phân
bố giống nhau trong 5 thành phố trên hay không?
-Nhận định
Bài toán kiểm định mức độ thỏa mãn cuộc sống tại năm thành phố bằng phương
pháp so sánh tỉ số

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK

1) Cơ sở lý thuyết :
Đối với một thí nghiệm có hai kết quả (binomial experiment) – thí dụ,
đối với một thuốc được kê đơn: có hay không - bạn thường so sánh hai tỉ số
với nhau (thực nghiệm với lí thuyết hay thực nghiệm với thực nghiệm). Song
đối với một thí nghiệm có nhiều kết quả (multinomial experiment)-thí dụ, bác sĩ
đánh giá tình trạng của các bệnh nhân được điều trị bởi thuốc trong một khoảng
thời gian - bạn cần so sánh nhiều tỉ số. Trắc nghiệm “khi” bình phương () cho
phép bạn so sánh không những hai mà còn nhiều tỉ số (hay tỉ lệ hoặc xác suất)
một cách tiện lợi. là phân phối về xác suất, không có tính đối xứng và chỉ có
giá trị ≥ 0. Giả sử bạn có một công trình nghiên cứu với N thử nghiệm độc lập,
mỗi thử nghiệm có k kết quả và mỗi kết quả mang một các xác suất thực nghiệm
là Pi(i = 1, 2, …k). Nếu gọi Pi,0 là các giá trị lí thuyết tương ứng với Pi thì các
tần số lí thuyết sẽ là
Ei = . Điều kiện để áp dụng trắc nghiệm một cách thành công là các tần số lí
thuyết Ei phải ≥ 5.
Giả thuyết
“Các cặp giống nhau”.

H1 : “ Ít nhất có một cặp khác nhau”.
Giá trị thống kê


Giá trị thống kê:

Oi - các tần số thực nghiệm (observed frequency)
Ei - các tần số lý thuyết (expected frequency)
Biện luận:
Nếu => bác bỏ giả thiết H0

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK
Giá trị tính theo biểu thức:
Oi - các tần số thực nghiệm của ô thuộc hàng i cột j
Ei - các tần số lý thuyết của ô thuộc hàng i cột j, r là số hàng và c là số cột
Xác xuất với bậc tự do DF = (r - 1)(c - 1); trong đó r là số hàng và c là số cột
trong bảng VI
Nếu => Chấp nhận giả thiết H0 và ngược lại.

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK


2) Bài làm
Ta cần đi kiểm định giả thiết:
Ho: mức độ thỏa mãn cuộc sống phân bố giống nhau trong 5 thành phố trên .
Nhập dữ liệu vào bảng và tính tổng:

Tổng hàng : Chọn ô E3 nhập = SUM(B3:D3)
Dùng con trỏ kéo nút tự điền từ ô D3 đến D4
Tổng cột :Chọn ô B8 nhập =SUM(B3:B7)
Dùng con trỏ kéo nút tự điền từ ô B8 đến D8.
Tổng cộng :chọn ô E8 và nhập biểu thức =SUM(E3:E7).

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK
Tính các tần số lý thuyết:
Tần số lý thuyết = ( tổng hàng * tổng cột ) / tổng cộng.
Chọn ô B10 nhậpcôngthức=(B$8*$E3/$E$8), sau đó kéo nút tự điền từ
B10 đến D14 hoặc nhấn tổ hợp phim ctrl + enter, ta sẽ được kết quả.

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK
Áp dụng hàm CHITEST:

Chọn ô E15 và nhập biểu thức=CHITEST(B3:D7;B10:D14)
Ta sẽ có được kết quả của

Page 30

GVHD PGS.TS Nguyễn Đình Huy


NHÓM 11 - XSTK

Kết luận :
< 0.03 bác bỏ giả thiết Ho .
Vậy mức độ thỏa mãn cuộc sống có phân bố khác nhau trong 5 thành phố trên.

Page 30

GVHD PGS.TS Nguyễn Đình Huy


×