Tải bản đầy đủ (.pdf) (8 trang)

Tóm tắt XÁC SUẤT THỐNG KÊ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (278.32 KB, 8 trang )

DẠNG BÁO CÁO XÁC SUẤT

NHÓM 10

B1. a) Dạng: Kiểm định giá trị trung bình;
 Phương pháp: Phân tích - phương sai - 3 yêu tố.
b) Dạng: Phân tích tương quan và hồi quy tuyến tính;
 Phương pháp: Hồi quy tuyến tính đa tham số.
B2.

Dạng: Phân tích tương quan và hồi quy tuyến tính;
 Phương pháp: Hồi quy tuyến tính.

B3.

Dạng: Kiểm định so sánh - 2 tỷ lệ;
 Phương pháp: So sánh tỷ số.

B4.

Dạng: Kiểm định tính độc lập;
 Phương pháp: Kiểm định tính độc lập.

B5.

Dạng: Kiểm định giá trị Trung bình;
 Phương pháp: Phân tích - phương sai - 2 yếu tố - có lặp.


Bài 1a
1 Đề bài:


Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo ba yếu tố: pH (A), nhiệt độ
(B) và chất xúc tác (C) được trình bày trong bảng sau
Yếu tố B

Yếu tố A
B1

B2

B3

B4

A1

C1

9

C2

14

C3

16

C4

12


A2

C2

12

C3

15

C4

12

C1

10

A3

C3

13

C4

14

C1


11

C2

14

A4

C4

10

C1

11

C2

13

C3

13

2 Yêu cầu Hãy đánh giá về ảnh hưởng của các yếu tố trên đến hiệu suất phản ứng?
3 Dạng bài: Kiểm định giá trị trung bình
4 Phương pháp giải: Phân tích phương sai 3 yếu tố (A, B, C)



Giả thiết:
H0: μ1 = μ2 = ...= μk ↔ Các giá trị trung bình bằng nhau



Giá trị thống kê: FR, FC, F



Biện luận:

Nếu FR< Fα [r-1, (r-1)(r-2)] → Chấp nhận H0 đối với yếu tố A
Nếu FC < Fα [r-1, (r-1)(r-2)] → Chấp nhận H0 đối với yếu tố B
Nếu F < Fα [r-1, (r-1)(r-2)] → Chấp nhận H0 đối với yếu tố C
5 Excel
Tính các giá trị Ti.., T.j.., T..k, T…
Tính SUMSQTi.. , SUMSQT.j. , SUMSQT..k , SQT.. và SUMSOYijk (Tổng từng số bình phương)
Tính các giá trị SSR, SSC, SSF, SST và SSE (Tổng số bình phương)
Tính các giá trị MSR, MSC, MSF và MSE (Bình phương trung bình)
Tính các giá trị FR, FC và F (Giá trị thống kê)
6 Kết quả:
So sánh các giá trị và kết luận :
FR=3.10 < F0.05(3,6) = 4.76 => chấp nhận H0 (pH)
FC=11.95 > F0.05(3,6) = 4.76 => bác bỏ H0

(nhiệt độ)

F=30.05 > F0.05(3,6) = 4.76 => bác bỏ H0

(chất xúc tác)


Kết luận chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng đến hiệu suất phản ứng


Bài 1b
1 Đề bài:
Người ta dùng ba mức nhiệt độ gồm 105, 120 và 135°C kết hợp với ba khoảng thời gian là 15, 30 và 60
phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình bày trong bảng sau:
Nhiệt độ (°C)

Thời gian (phút)

Hiệu suất (%)

X1

X2

Y

15

105

1.87

30

105


2.02

60

105

3.28

15

120

3.05

30

120

4.07

60

120

5.54

15

135


5.03

30

135

6.45

2 Yêu cầu:
Hãy cho biết yếu tố nhiệt độ và thời gian/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản
ứng tổng hợp?
Nếu có thì điều kiện nhiệt độ 115°C trong vịng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
3 Dạng bài: Phân tích tương quan và hồi quy tuyến tính;
4 Phương pháp giải :Hồi quy tuyến tính đa tham số.


Giá trị thống kê: F



Trắc nghiệm t:
H0: βi = 0 ↔ Các hệ số hồi quy khơng có ý nghĩa.

t

Trắc nghiệm F
H0: βi = 0 ↔ Phương trình hồi quy khơng thích hợp.

F


5 Excel
Áp dụng Regression
Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis
Chọn chương trình Regression trong hộp thoại Data Analysis rồi nhấp OK






Phạm vi của biến số Y (input Y range)
Phạm vi của biến số X (input X range)
Nhãn dữ liệu (Labels)
Mức tin cậy (Confidence level)
Tọa độ đầu ra(Output range)




Đường hồi quy (Line Fit Plots),…

6 Kết quả
(1) Phương trình hồi quy: Ŷx1=f(X1)
Ŷx1=2.73+0.04X1 (R2=0.21, S=1.81)
t0= 2.129 < t0.05 = 2.365 (hay Pv2=0.071> α=0.05) =>Chấp nhận giả thiết H0
t1= 1.38 < t0.05 = 2.365 (hay Pv =0.209> α=0.05) =>Chấp nhận giả thiết H0
F= 1.95 < F0.05 = 5.590 (hay Fs=0.209 > α=0.05) =>Chấp nhận giả thiết H0
 Vậy cả hai hệ số 2.73(B0) và 0.04(B1) của phương trình hồi quy Ŷx1=2.73+0.04X1
đều khơng có ý nghĩa thống kê.

Nói cách khác phương trình hồi quy này khơng thích hợp.
Kết luận 1: Yếu tố Thời gian khơng có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.

(2) Phương trình hồi quy: Ŷx2=f(X2)
Ŷx2= -11.141 +0.129X2 (R2=0.76, S=0.99)
t0=3.418> t0.05=2.365(hay Pv2=0.011>α=0.05)

=>Bác bỏ giả thiết H0

t1= 4.757>t0.05=2.365(hay Pv =0.00206<α=0.05) =>Bác bỏ giả thiết H0
F=22.631>F=5.590(hay Fs=0.00206<α=0.05)

=>Bác bỏ giả thiết H0

Vậy cả hai hệ số -11.141 (B0) và 0.129 (B1) của phương trình hồi quy Ŷx2=-11.141 +0.129X2 đều có ý nghĩa
thống kê.
Nói cách khác phương trình hồi quy này thích hợp.
Kết luận 2: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.

(3) Phương trình hồi quy: Ŷx1, x2=f(X1, X2)
Ŷx1, x2 =-12.70+0.04X1+0.13X2 (R2=0.97; S=0.33)
t0=11.528 > t0.05=2.365 (hay Pv2=2.260*10-5>α=0.05) => Bác bỏ giả thiết H0
t1= 7.583 > t0.05=2.365 (hay Pv =0.00027<α=0.05)

=> Bác bỏ giả thiết H0

-6

t2= 14.328 > t0.05=2.365 (hay Pv =7.233*10 <α=0.05) => Bác bỏ giả thiết H0
F=131.392 > F=5.140 (hay Fs=1.112*10-5<α=0.05)


=> Bác bỏ giả thiết H0

Vậy cả hai hệ số -12.70 (B0), 0.04(B1) và 0.13(B1) của phương trình hồi quy
Ŷx1,x2 =-12.7 +0.04X1+0.13X2 đều có ý nghĩa thống kê.
Nói cách khác, phương trình hồi quy này thích hợp.
 Kết luận 3: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian và nhiệt độ.

Dự đốn hiệu suất bằng phương trình hồi quy Y=-12.70+0.04X1+0.13X2
Với: 50 là giá trị của X1 thời gian) và 115 là giá trị của X2 (nhiệt độ)
 Kết luận 4 hiệu suất phản ứng theo dự đoán ở 115°C trong vòng 50 phút là 4.3109%.


Bài 2:
1 Đề bài.
Bảng sau đây cho ta một mẫu gồm 11 quan sát (xi, yi) từ tập hợp chính các giá trị của cặp ĐLNN (X,Y):
X

0,9

1,22

1,32

0,77

1,3

1,2


Y

-0,3

0,1

0,7

-0,28

-0,25

0,02

X

1,32

0,95

1,45

1,3

1,2

Y

0,37


-0,70

0,55

0,35

0,32

2 Yêu cầu:
a) Tìm đường hồi quy của Y đối với X.
b) Tính sai số tiêu chuẩn của đường hồi quy
c) Tính tỷ số F để kiểm định sự đúng đắn của giả thiết: Có hồi quy tuyến tính của Y theo X.
3 Dạng bài: Phân tích tương quan và hồi quy tuyến tính;
4 Phương pháp :Phân tích hồi quy tuyến tính
Kiểm định hệ số a, b:
Giả thuyết Ho: Hệ số quy hồi không có ý nghĩa (= 0)
Trắc nghiệm t  t  N  2  : chấp nhận Ho
Kiểm định phương trình hồi quy:
Giả thuyết Ho: “Phương trình hồi quy tuyến tính khơng phù hợp”
Trắc nghiệm F  F 1, N  2  : chấp nhận Ho.

5 Excel Chọn Data/Data Analysis/ Regression
Bước 1: Nhâp bảng số liệu
Bước 2: Chọn Data/Data Analysis/ Regression
6 Kết quả + biện luận
a) Đường quy hồi tuyến tính của Y đối với X là: Y= 1.547892 X- 1.73948
b) Sai số tiêu chuẩn của đường hồi quy. SY.X= 0.28965
c) Tỷ số F = 12.6267 Với mức ý nghĩa a=0.05,
Ta thấy F=12.6367 > 5.12 (bảng Fisher [1, 9])
Pv=0.006169 < 0.05 Bác bỏ giả thiết Ho

Vậy cả hai hệ số -1.73948(Bo) và 1.547892(B1) của pt hồi quy Y= 1.547892 X- 1.73948 có ý nghĩa.
Nói một cách khác, phương trình hồi quy này thích hợp.
 Kết luận: Y có liên quan tuyến tính với X.


Bài 3:
1 Đề bài.
Bảng sau đây cho ta phân bố thu nhập của 2 nhóm tuổi: Nhóm từ 40 – 50 tuổi và nhóm từ 50 – 60 tuổi trong số
các cơng nhân lành nghề ở Thụy Điển năm 1930.
Nhóm tuổi
40 – 50
50 – 60

0–1
71
54

1–2
430
324

2–3
1072
894

Thu nhập
3–4
1609
1202


4–6
1178
903

>=6
158
112

2 Yêu cầu: Có sự khác nhau về phân bố thu nhập giữa hai nhóm tuổi này trong số các công nhân lành nghề hay
không? Mức ý nghĩa  = 2%.
3 Dạng toán: Kiểm định so sánh - 2 tỷ lệ;
4 Phương pháp: So sánh tỷ số.
5 Bài làm excel
Bước 1: Lập giả thiết H0:
Phân bố thu nhập giữa hai nhóm tuổi này trong số các cơng nhân lành nghề là như nhau.
Bước 2: Tính tổng hàng và tổng cột.
Bước 3: Tính tần số lý thuyết.
Bước 4: Dùng hàm CHITEST để tính.
6 Kết quả
P = 0.511582
Vì giá trị P > α = 2% => Chấp nhận giả thuyết H0
Kết luận: Phân bố thu nhập giữa hai nhóm tuổi này trong số các cơng nhân lành nghề là như nhau.


BÀI 4
1 Đề bài.
Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu nhập hằng năm và tuổi thọ của họ. Kết quả
thu được như hình sau:
Thu nhập
Tuổi


Dưới 100 000 $

Từ 100 000 $ đến
399 599 $

Trên 400 000 $

Dưới 40

6

9

5

Từ 40 đến 54

18

19

8

Trên 54

11

12


17

2 Yêu cầu: Với mức ý nghĩa 1%, kiểm định giả thiết cho rằng tuổi và mức thu nhập có quan hệ với nhau hay
khơng?
3 Dạng: Kiểm định tính độc lập;
4 Phương pháp: Kiểm định tính độc lập.
5 Bài làm excel
Bước 1: Lập giả thiết H0: Tuổi và thu nhập không phụ thuộc nhau.
Bước 2: Tính tổng hàng và tổng cột.
Bước 3: Tính tần số lý thuyết. Tần số = (tổng hàng * tổng cột) / tổng cộng.
Bước 4: Dùng hàm CHITEST để tính.
Nhấn vào Tab Fomulas chọn Insert Function chọn CHITEST rồi nhấn OK
6 Kết quả
Ta được P = 0.14376
Vì giá trị P > α = 1% => Chấp nhận giả thuyết H0, tuổi và thu nhập không phụ thuộc nhau.

 Kết luận: Tuổi và thu nhập không phụ thuộc nhau.


Bài 5:
1 Đề bài + yêu cầu
Với mức ý nghĩa 1%, Hãy phân tích tình hình kinh doanh của một số ngành nghề ở 4 quận nội thành trên sơ sở
số liệu về doanh thu của một số cửa hàng như sau:

3
4
5

Ngành nghề kinh Khu vực kinh doanh
doanh

Q1
Q2

Q3

Q4

Điện lạnh
Vật liệu xây dựng
Dịch vụ tin học

2.0:2.4
9.5:9.3:9.1
1.2:1.3:1.2

5.0:5.4
19.5:17.5
5.0:4.8:5.2

2.5:2.7:2.0:3.0
0.6:10.4
1.2:1.0:9.8:1.8

3.1:3.5:2.7
15.0
2.0:2.2:1.8

Dạng: Kiểm định giá trị Trung bình;
Phương pháp: Phân tích - phương sai - 2 yếu tố - có lặp.
Excel

Bước 1: Giả thuyết Ho:

-HA (yếu tố ngành nghề): doanh thu không phụ thuộc vào ngành nghề.
-HB (yếu tố quận): doanh thu không phụ thuộc vào quận.
-HAB(sự tương tác giữa 2 yếu tố): doanh thu giữa các ngành nghề và các quận khơng có liên quan tới nhau.
Bước 2: Áp dụng: “Anova: Two-Factor With Replication”
Vào Data -> Data Analysis. Chọn mục Anova: Two-Factor With Replication. Chọn OK





Phạm vi đầu vào (Input Range): $A$3:$E$15
Số hàng mỗi mẫu (Rows per sample): 4
Ngưỡng tin cậy (Alpha): 0.01 (mức ý nghĩa = 1%)
Phạm vi đầu ra (Output Range): $A$17

. Biện luận: ( n: hàng, m: cột, r: số giá trị trong mỗi ơ)
a.

Nếu FA
b.

Nếu FB < Fα [m-1 ; nm(r-1)] thì chấp nhận yếu tố B (cột)
Nếu FAB
6 Kết quả và biện luận:
Yếu tố hàng (mẫu): FR = 2.8929 < F0.01 = 5.2479 => Chấp nhận giả thiết H0 .
→ Tình hình kinh doanh giữa các ngành nghề là như nhau.

Yếu tốc cột: FC = 0.8189 < F0.01 = 4,3771 => Chấp nhận giả thiết H0 .
→Tình hình kinh doanh giữa các quận là như nhau.
Ảnh hưởng: F = 0.6498 < F0.01 = 3.3507 => Chấp nhận giả thiết H0.
→ Khơng có sự tương tác giữa khu vực kinh doanh (quận) và ngành nghề kinh doanh.

 Kết luận: Vậy tình hình kinh doanh là như nhau khơng những giữa các ngành nghề mà cịn giữa các quận. Ngồi
ra, khơng có sự tương tác giữa hai yếu tố ngành nghề kinh doanh và địa điểm kinh doanh (quận).



×