Tải bản đầy đủ (.docx) (31 trang)

Bài tập lớn môn Xác suất TK excel

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (866.53 KB, 31 trang )

BÀI 1:
Câu A.Ví dụ 3.4/207/Sách BT XSTK 2012 ( NGUYỄN ĐÌNH HUY )
Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố :
pH(A), nhiệt độ (B), va chất xúc tác (C) được trình bày trong bảng sau:
Yếu tố
Yếu tố B
A
B1
B2
B3
B4
A1

C1

9

C2

14

C3

16

C4

12

A2


C2

12

C3

15

C4

12

C1

10

A3

C3

13

C4

14

C1

11


C2

14

A4

C4

10

C1

11

C2

13

C3

13

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng.

Bài làm
1. Dạng toán: Phân Tích Phương Sai 3 Yếu Tố
2. Cơ sở lý thuyết:
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị quan
sát G (i = 1, 2... r: yếu tố A; j = 1, 2...r: yếu tố B: k = 1, 2...r: yếu tố C).
Mô hình:

Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông
la tinh n×n. Ví dụ như mô hình vuông la tinh 4×4:

ThienPhuoc.Tk

B

C

D

A

C

D

A

B

D

A

B

C

A


B

C

D

Page 1


Mô hình vuông la tinh ba yếu tố được trình bày như sau:
Yếu tố C (T..k. Ví dụ: T..1 = Y111 + Y421 + Y331 + Y241)
Yếu tố B

Yếu tố A

B1

B2

B3

B4

A1

C1

Y111


C2

Y122

C3

Y133

C4

Y144

T1..

A2

C2

Y212

C3

Y223

C4

Y234

C1


Y241

T2..

A3

C3

Y313

C4

Y324

C1

Y331

C2

Y342

T3..

A4

C4

Y414


C1

Y421

C2

Y432

C3

Y443

T4..

T.i.

T.1.

T.2.

T.3.

T.4.

Bảng ANOVA:
Nguồn sai
số

Bậc tự do


Yếu tố A

Tổng số bình phương

Bình phương trung
bình

Giá trị thống kê

(r-1)

(Hàng)
Yếu tố B

SSR =

MSR=

FR=

SSC =

MSC=

FC=

SSF =

MSF=


F=

(r-1)

(Cột)

Yếu tố C

(r-1)

Sai số

(r-1)(r-2)

SSE = SST –
(SSF + SSR + SSC)

MSE=

(r2-1)

Tổng cộng

SST =

Trắc nghiệm


Giả thiết:
H0: μ1 = μ2 = ...= μk ⇔ “Các giá trị trung bình bằng nhau”

H1: μi

ThienPhuoc.Tk

μj ⇔ “Có ít nhất hai giá trị trung bình khác nhau”
Page 2


Giá trị thống kê: FR ,FC , F
Biện luận:
Nếu FR < Fα(r-1)(r-2) → Chấp nhận H0 đối với yếu tố A
Nếu FC < Fα(r-1)(r-2) → Chấp nhận H0 đối với yếu tố B
Nếu F < Fα(r-1)(r-2) → Chấp nhận H0 đối với yếu tố C



3.Phương pháp giải toán trên Excel :
Giả thiết H0: pH không ảnh hưởng đến hiệu suất phản ứng.
Giả thiết H0: Nhiệt độ không ảnh hưởng đến hiệu suất phản ứng.
Giả thiết H0: Chất xúc tác không ảnh hưởng đến hiệu suất phản ứng.

- Bước 1: Nhập dữ liệu

- Bước 2: Thiết lập các giá trị biểu thức và tính giá trị thống kê

-

-

-




Tính các giá trị Ti…,Tj.. và T..k ,T…
Các giá trị Ti.. :
Chọn ô B7 và nhập biểu thức “=SUM(B2:E2)”
Chọn ô C7 và nhập biểu thức “=SUM(B3:E3)”
Chọn ô D7 và nhập biểu thức “=SUM(B4:E4)”
Chọn ô E7 và nhập biểu thức “=SUM(B5:E5)”
Các giá trị T.j. :
Chọn ô B8 và nhập “=SUM(B2:B5)”
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 tới ô E8.
Các giá trị T..k :
Chọn ô B9 và nhập biểu thức “=SUM(B2,C5,D4,E3)”
Chọn ô C9 và nhập biểu thức “=SUM(B3,C2,D5,E4)”
Chọn ô D9 và nhập biểu thức “=SUM(B4,C3,D2,E5)”
Chọn ô E9 và nhập biểu thức “=SUM(B5,C4,D3,E2)”
Giá trị T..:
Chọn ô B10 và nhập biểu thức “=SUM(B2:E5)”
Tính các giá trị SUMSQ:Ti,Tj,Tk,T,Yij
-Các giá trị SUMSQ Ti Tj Tk:
Chọn ô G7 và nhập biểu thức “=SUMSQ(B7:E7)”

ThienPhuoc.Tk

Page 3









Dùng con trỏ kéo kí hiệu tự điền từ ô G7 tới G9
-Giá trị SQT
Chọn ô G10 và nhập biểu thức “=POWER(B10,2)”
-Giá trị SUMSQ YIJ:
Chọn ô G11 và nhập biểu thức “=SUMSQ(B2:E5)”
Tính các giá trị SSR, SSC, SSF, SST và SSE
-Các giá trị SSR , SSC và SSF
Chọn ô I7 và nhập biểu thức “=G7/4-39601/POWER(4,2)”
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 tới I9
-Giá trị SSE
Chọn ô I10 và nhập biểu thức “=I11-SUM(I7:I9)”
-Giá trị SST
Chọn ô I11 và nhập biểu thức “=G11-G10/POWER(4,2)”
Tính các giá trị MSR. MSC. MSF và MSE
-Các giá trị MSR, MSC và MSF:
Chọn ô K7 và nhập biểu thức “=I7/(4-1)”
Dùng con trỏ kéo kí hiệu tự điền từ ô K7 tới ô K9
-Giá trị MSE:
Chọn ô K10 và nhập biểu thức “=I10/((4-1)*(4-2))”
Tính giá trị FR ,FC và F
Chọn ô M7 và nhập biểu thức “=K7/0.3958”
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 tới ô M9

- Bước 3: Kết quả và biện luận
+ Tính F0.05(3,6) trong Excel như sau: ta nhập hàm “=FINV(0.05,3,6)” sau đó ta được kết quả
F0.05(3,6)=4.7570

ThienPhuoc.Tk

Page 4


+ Ta có:
FR = 3.10 < F0.05(3,6) = 4.76 ⇒ chấp nhận Ho (pH)
FC = 11.95 > F0.05(3,6) = 4.76 ⇒ bác bỏ Ho (nhiệt độ)
F = 30.05 > F0.05 (3,6)=4.76 ⇒ bác bỏ Ho (chất xúc tác)

Vậy chỉ có nhiệt và chất xúc tác gây ảnh hưởng đến hiệu suất.
CÂU B. Ví dụ 4.2/216/Sách BT XSTK 2012 ( NGUYỄN ĐÌNH HUY )
Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 135 0C kết hợp với ba khoảng thời
gian là 15, 30, 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%)
được trình bày trong bảng sau đây:
Thời gian (phút)
X1

Nhiệt độ (0C)
X2

Hiệu suất (%)
Y

15

105

1.87


30

105

2.02

60

105

3.28

15

120

3.05

30

120

4.07

60

120

5.54


15

135

5.03

30

135

6.45

60

135

7.26

Hãy cho biết yếu tố nhiệt độ và thời gian/ hoặc yếu tố thời gian có liên quan tuyến tính với
hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115 0C trong vòng 50 phút thì
hiệu suất phản ứng sẽ là bao nhiêu?

Bài làm
1. Dạng toán: Hồi Quy Tuyến Tính Đa Tham Số
2. Cơ sở lý thuyết:
Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan đến k
biến số độc lập Xi (I = 1,2,...,k) thay vì chỉ có một như trong hồi quy tuyến tính đơn giản.
Phương trình tổng quát:
ThienPhuoc.Tk


Page 5


Ŷx0,x1,...,xk = B0 + B1X1 +B2X2 + ... + BkXk
Bảng ANOVA:
Nguồn sai số

Bậc tự do

Tổng số bình
phương

Hồi quy

K

SSR

Bình phương
trung bình

MSR=
Sai số

N-k-1

SSE
MSE =

Tổng cộng


N-1

SST = SSR + SSE

Giá trị thống kê:
Giá trị R-bình phương:
Giá trị R2 được hiệu chỉnh (Adjusted R Square)

(

là khá tốt)

Giá trị R2 được hiệu chỉnh (Adjusted R Square)

(

sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ)

Độ lệch chuẩn:

(

là khá tốt)

Trắc nghiệm thống kê:
- Trong trắc nghiệm t:
H0: βi = 0 “Các hệ số hồi quy không có ý nghĩa”.
H1: βi 0 “Có ít nhất vài hệ số hồi quy có ý nghĩa”.
Bậc tự do của giá trị t: γ = N – k – 1


ThienPhuoc.Tk

Page 6

Giá trị thống


F=


-

Trong trắc nghiệm F:
H0: βi = 0 “Phương trình hồi quy không thích hợp”.
H1: βi 0 “Phương trình hồi quy thích hợp với ít nhất vài hệ số Bi”.
Bậc tự do của giá trị F: v1 = 1, v2 = N – k – 1.

3.Phương pháp giải trên Excel :
- Bước 1: Nhập dữ liệu vào bảng tính:
Dữ kiệu nhất thiết phải được nhập theo cột:

- Bước 2: Sử dụng “Regression”
a)
b)
c)
-

Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis
Chọn chương trình Regression trong hộp thoại Data Analysis rồi nhấn nút OK

Trong hộp Regression, lần lượt ấn định các chi tiết:
Phạm vi của biến số Y (Input Y Range)
Phạm vi của biến số X (Input X Range)
Nhãn dữ liệu (Labels)
Mức tin cậy (Confidence Level)
Tọa độ đầu ra (Output Range)
Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số (residuals
plots...)

ThienPhuoc.Tk

Page 7


-

Phương trình hồi quy

*

ThienPhuoc.Tk

Page 8


-

= 2,73 + 0,04X1

(R2 = 0,21; S = 1.81)


t0 = 2,1290 < t0,05 = 2,365 ( hay
= 0,071 > α = 0,05) ⇒ Chấp nhận giả thiết H0.
(Cách tính t0,05 bằng Excel ta nhập biểu thức sau “=TINV(0.05,7)” kết quả ta thu được t0,05 =
2,365)
t1 = 1,3801 < t0,05 = 2,365 ( hay PV = 0,209 > α = 0,05) ⇒ Chấp nhận giả thiết H0.
F = 1,905 <
(Cách tính
= 5,591)

= 5,591 (hay

= 0,209 > α = 0,05) ⇒Chấp nhận giả thiết H0.

bằng Excel ta nhập biểu thức sau “=FINV(0.05,1,7)” kết quả ta thu được

ThienPhuoc.Tk

Page 9


Vậy cả 2 hệ số 2,37 (B0) và 0,04(B1) của phương trình hồi quy
= 2,73 + 0.04X1 đều không có
ý nghĩa thống kê. Nói một cách khác, phương trình hồi quy này không thích hợp.

Kết Luận: Yếu tố thời gian không liên quan tuyến tính tới hiệu suất của phản ứng tổng
hợp.

Phương trình hồi quy:
= -11,141 + 0,13X2


ThienPhuoc.Tk

Page 10

(R2 = 0,76; S = 0,99)


t0 = 3,418 > t0,05 = 2,365 ( hay
= 0,011 < α = 0,05) ⇒ bác bỏ giả thiết H0.
t2 = 4,757 > t0,05 = 2,365 ( hay PV = 0,00206 < α = 0,05) ⇒ bác bỏ giả thiết H0.
ThienPhuoc.Tk

Page 11


F=22,631 >

= 5,590 (hay

(Cách tính t0,05 và

=0,00206 < α = 0,05) ⇒ bác bỏ giả thiết H0.

tương tự ở trên)

Vậy cả 2 hệ số -11,14 (B0) và 0,13(B2) của phương trình hồi quy
= -11,14 +
0,13X2 đều có ý nghĩa thống kê. Nói một cách khác, phương trình hồi quy này thích hợp.


Kết Luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
Phương trình hồi quy
-12,70 + 0,04X1 + 0.13X2(R2 = 0,97; S = 0,33)

ThienPhuoc.Tk

Page 12


t0 =
11,
528
>
t0,05
=
2,3
65
(ha
y
PV
=
2,2
60

< α = 0,05) => bác bỏ giả thiết H0.
t1 = 7,583 > t0,05 = 2,365 (hay PV = 0,00207 < α = 0,05) => bác bỏ giả thiết H0.
t2 = 14,328 > t0,05 = 2,365 (hay PV =7,233

< α = 0,05)=> bác bỏ giả thiết H0.


F = 131,329 > F0,05 = 5,143 (hay FS = 1,112
< α = 0,05) => bác bỏ giả thiết H0.
(F0,05 = 5,143 được tính như sau ta nhập hàm “=FINV(0.05,2,6)” kết quả thu được F0,05 = 5,143)
Vậy cả 2 hệ số -12.70 (B0); 0,04 (B1) và 0,13(B2) của phương trình hồi quy
-12,70 + 0,04X1 + 0,13X2 đều có ý nghĩa thống kê. Nói một cách khác, phương trình hồi quy
này thích hợp.
ThienPhuoc.Tk

Page 13


Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là
thời gian và nhiệt độ.
Sự tuyến tính của phương trình
-12,70 + 0,04X1 + 0,13X2 có thể được trình bày
trên biểu đồ phân tán (Scatterplots).
Cách thực hiện như sau: Chọn tất cả dữ liệu ở cột “Predicted Y” trong bảng
“RESIDUAL OUTPUT” trên tab menu chọn Insert => Scatter

Muốn dự đoán hiệu suất của phản ứng bằng phương trình hồi quy :
-12,70 +
0,04X1 + 0,13X2, bạn chỉ cần chọn một ô, ví dụ B21, sau đó nhập hàm và được kết quả như sau:

Ghi chú: B17 tọa độ của B0, B18 tọa độ của B1, B19 tọa độ của B2, 50 là giá trị của X1
(thời gian) và 115 là giá trị của X2 (nhiệt độ)

BÀI 2:
Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E yêu cầu những
người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phố mà họ đang sống. kết quả
như sau:

ThienPhuoc.Tk

Page 14


Thành phố
A
B
C
D

Rất thoả mãn
220
130
84
156

Mức độ thoả mãn
Tương đối
121
207
54
95

Không
63
75
25
43


E

122

164

73

Với mức ý nghĩa α = 2%, hãy kiểm định xem mức độ thỏa mãn cuộc sống có phân bố giống nhau trong 5
thành phố trên hay không?

---------------------------------------------------------------------------------------------------------------------

1. Dạng toán: So Sánh Tỷ Số
2. Cơ sở lý thuyết:
Giả thiết:

Ho : P1=P1,0;P2= P2,0;….;Pk,0  các cặp Pi và Pi,0 giống nhau.
H1 : có ít nhất một cặp Pi và Pi,0 khác nhau.
Giá trị thống kê
2

=

Oi : các tần số thực nghiệm.
Ei : các tần số lý thuyết.
Biện Luận:
1

>


2

(a)  bác bỏ giả thiết Ho (DF=K-1)

Trong Excel có hàm Chitest có thể tính giá trị 2 theo biểu thức:
2
=
Oi j : các tần số thực nghiệm của ô thuộc hàng thứ I cột j.
Ei j : các tần số lý thuyết của ô thuộc hàng thứ I cột j; r là số hàng; c là số cột.


Xác suất P(X > 2) với bậc tự do DF= (r-1) (c-1)

Nếu P(X >) ⇒ chấp nhận giả thiết Ho và ngược lại.

3.Phương pháp giải trên Excel:
- Bước 1: Nhập dữ liệu vào bảng tính:

ThienPhuoc.Tk

Page 15


- Bước 2:Ta đi thiết lập một số biểu thức và tiến hành tính toán:
+ Tính các tổng số
Tính tổng hàng tổng cột ta là như sau:chọn dữ liệu từ ô B2->E7

Sau đó nhấn “AutoSum” trên tab Home,ta được kết quả như sau:


ThienPhuoc.Tk

Page 16


+ Tính các tần số lí thuyết:


Tần số lí thuyết = (tổng hàng tổng cột) / tổng cộng
Các tần số tại thành phố A,B,C,D:
- Chọn ô B10 nhập biểu thức sau : “ =$E2*B$7/$E$7 ”
- Sau đó kéo tự động điền từ ô B10 sang các ô còn lại , ta được các giá trị cần tính.

+ Tính xác suất P(X> 2) áp dụng hàm số “CHITEST” trong Excel :
* Tính xác suất P(X > 2) bằng cách chọn B15 và nhập biểu thức sau:
“ =CHITEST(B2:D6,B10:D14) ”
* Hoặc trên tab menu chọn tab Formulas -> Insert Funcion trong hộp thoại mới hiện ra
chọn ngay khung Selection a Funcion->CHITEST.Hộp thoại mới xuất hiện mục Actual_rage
(Tần số thực nghiệm) điền B2:D6 ,mục Expected_rage (Tần số lý thuyết) điền B10:D14

ThienPhuoc.Tk

Page 17


Kết quả : P(X > 2) = 3.5299.10-13 < α =0.02 => bác bỏ giả thiết H0

Kết Luận: Như vậy mức độ thỏa mãn cuộc sống tại 5 thành phố trên là không giống nhau

BÀI 3 :

Bảng sau đây cho ta số liệu về màu tóc của 422 người:
Màu tóc

Nam

Nữ

Đen

56

32

Hung

37

66

Nâu

84

90

Vàng

19

38


Với mức ý nghĩa 1%, nhận định xem số liệu có mối quan hệ giữa màu tóc và giới tính hay không.

Bài làm
1. Dạng toán: Kiểm Định Tính Độc Lập
2. Cơ sở lý thuyết:
-

Mục đích: Xét một tổng thể gồm 2 dấu hiện X, Y. Các dấu hiệu này có thể là dấu hiệu định
tính hoặc định lượng. Trong trường hợp bài toán nêu trên là cả 2 dấu hiệu đều là dấu hiệu
định tính.

-

Lấy mẫu kích thước n ta có bảng số liệu như sau:

ThienPhuoc.Tk

Page 18


Trong đó:
- ni (i =1,k) – số lần X nhận xi
- mj (j =1,h) – số lần Y nhận yj
nij (i = 1,...,k ; j = 1,...,h) – số lần đồng thời X nhận xi và Y nhận yj

Kiểm định giả thiết: H0: X và Y độc lập, với mức ý nghĩa α.


từ bảng phân vị χ2 “khi bình phương”


Tìm

Cách 1: Tính thống kê dựa vào các công thức sau:

Cách 2: Sử dụng hàm CHITEST trong Excel: CHITEST(nij,γij), với lưu ý số lượng các giá trị của nij và γij
phải bằng nhau.
 Kết luận

Nếu

→ Chấp nhận giả thiết H0.

Hoặc kết quả hàm CHITEST > α = 0.01 → Chấp nhận giả thiết H0.

3. Phương pháp giải trên Excel :
– Giả thuyết H0: Màu tóc độc lập với giới tính
– Nhập bảng số liệu như hình sau:

ThienPhuoc.Tk

Page 19


Tính các tổng số
+ Tổng hàng (ni) và tổng cột (mj) :Tương tự bài 2,ta chọn từ ô B2 đến ô D6,nhấn “AutoSum”
trên tab Home ta được kết quả cần tính
+ Tổng cộng: Vị trí ô D6

Tính tần số lý thuyết dựa vào công thức sau:


-

Chọn từ ô G2->H5 ta nhấn dấu “=” và nhập tiếp biểu thức sau: “$D2*B$6/$D$6” sau đó
nhấn CTRL+ENTER
Sau cùng ta được kết quả:

ThienPhuoc.Tk

Page 20


Áp dụng hàm số “CHITEST”
Tính xác suất P(X>

Kết quả: P(X>

) bằng cách chọn ô G7và nhập biểu thức “=CHITEST(B2:C5,G2:H5)”.

) = 0,000247 < α =0,01 ... Bác bỏ giả thuyết Ho.
Kết Luận: Vậy màu tóc và giới tính có mối liên hệ với nhau.

BÀI 4 :
Với mức ý nghĩa 1%, Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các
hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập trung bình của một hộ tương
ứng với các ngành nghề nói trên như sau:
Nghề chính

Nghề phụ
(1)


(2)

(3)

(4)

Trồng lúa (1)

3.5

7.4

8.0

3.5

Trồng cây ăn quả (2)

5.6

4.1

6.1

9.6

Chăn nuôi (3)

4.1


2.5

1.8

2.1

ThienPhuoc.Tk

Page 21


Dịch vụ (4)

7.2

3.2

2.2

1.5

1. Dạng toán: Toán Phân Tích Phương Sai Hai Yếu Tố (Không Lặp):
2. Cơ sở lý thuyết:
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát
Yij(i=1,2….r:yếu tố A;j=1,2…c:yếu tố B)
Mô hình
Yếu tố A
1
Y11

Y12

Yr1
T1
Ŷ.1

Tổng cộng
Trung bình

2
Y12
Y22

Yr2
T2
Ŷ.2

Yếu tố B








Tổng cộng

Trung bình


c
Y1c
Y2c

Y1
Y2

Ŷ1
Ŷ2







Yr
Tc
Ŷ.c

Yr
T..
Ŷ...

Ŷr

Bảng ANOVA:
Nguồn sai
số
Yếu tố A

(Hàng)
Yếu tố B
(Cột)

Sai số

Tổng cộng

Bậc tự do

Tổng số bình phương

Bình phương trung
bình

Giá trị thống kê

(r-1)
SSB =

MSB=

FR=

SSB =

MSF=

FC=


(c-1)

(r-1)(c-2)

SSE = SST –
(SSF + SSR)

MSB=

(rc-1)
SST =

Trắc nghiệm
ThienPhuoc.Tk

Page 22




Giả thiết:
H0: μ1 = μ2 = ...= μk ⇔ “Các giá trị trung bình bằng nhau”
H1: μi

μj ⇔ “Ít nhất hai giá trị trung bình khác nhau”



Giá trị thống kê: FR và FC




Biện luận:

Nếu FR < Fα[(b-1),(k-1)(b-1)] → Chấp nhận H0 đối với yếu tố A
Nếu FC < Fα[(k-1),(k-1)(b-1)] → Chấp nhận H0 đối với yếu tố B

3. Phương pháp giải trên Excel :
Giả thiết H0: Các giá trị trung bình là bằng nhau
Đối giả thiết H1: Các giá trị trung bình là không bằng nhau.

- Bước 1: Nhập dữ liệu

- Bước 2: Áp dụng “Anova: Two – Factor without Replication”
+ Nhấp lần lượt đơn lệnh Data và lệnh Data Analysis
+ Chọn chương trình Anova: Two-Factor Without Replication trong hộp thoại
Data Analysis rồi nhấp nút OK .
+ Trong hộp thoại Anova: Two-Factor Without Replication lần lượt ấn định các chi tiết:






Phạm vi đầu vào (Input Rangle). Chọn từ A1 kéo đến E5
Nhãn dữ liệu (Labels in First Row / Column). Bấm check
Ngưỡng tin cậy (Alpha).Nhập Alpha=0.01
Chọn đầu ra (Output Option) điền thông tin mong muốn hoặc check newWorksheet Ply.
Nhấp OK.


ThienPhuoc.Tk

Page 23


+ Bảng Anova sau khi hoàn thành

- Bước 3:Kết quả và biện luận



FR(rows-Thực nghiệm) = 1,99662<F (crit-Lý thuyết)=6,99192 => chấp nhận giả thiết H0
(các nghề chính tạo ra thu nhập trung bình như nhau.)
FC(columns-Thực nghiệm) = 0,11057 < F (crit-Lý thuyết)=6,99192 => chấp nhận giả
thiết H0( các nghề phụ tạo ra thu nhập trung bình như nhau)

Vậy, thu nhập của gia đình giống nhau xét cho nghề chính hay nghề phụ.

ThienPhuoc.Tk

Page 24


BÀI 5 :
Bảng sau đây ghi lại kỷ lục thế giới về chạy 1 dặm trong thế kỷ 20:
Năm(X)
1911
1913
1915
1923

Thời gian
4:15.4
4:14.6
4:12.6
4:10.4
(Y)

Năm(X)
Thời gian
(Y)

1931
4:09.2

1933
4:07.6

1934
4:06.8

1937
4:06.4

X
Y

1942
4:06.2

1942

4:06.2

1942
4:04.6

1943
4:02.6

1944
4:01.6

X
Y

1945
4:01.4

1954
3:59.4

1954
3:58

1957
3:57.2

1958
3:54.5

X

Y

1962
3:54.4

1964
3:54.1

1965
3:53.6

1966
3:51.3

1967
3:51.1

X
Y

1975
3:51

1975
3:49.4

1979
3:49

1980

3:48.9

1981
3:48.8

X
Y

1981
3:48.7

1981
3:47.6

1985
3:46.5

a) Tính hệ số tương quan giữa X và Y (đơn vị của Y là giây)
b) Tìm đường thẳng hồi quy giữa Y và X.
c) Tìm sai số tiêu chuẩn của đường thẳng hồi quy. Kiểm định giả thiết có hồi quy.
d) Dựa trên phương trình này ước lượng kỷ lục thế giới năm 2050.
e) Ước lượng năm mà kỷ lục thế giới là 3 phút 30 giây.
f) Dựa trên phương trình hồi quy ước lượng kỷ lục thế giới năm 2500.Kết quả này có hợp lý hay
không?
(Chú thích: 3:48.7 = 3 phút 48.7 giây).

1. Dạng toán: Phân Tích Tương Quan Và Phân Tích Hồi Quy
2. Cơ sở lý thuyết:
Hai biến số ngẫu nhiên Y và X có thể liên quan tuyến tính (ρ=1,ρ=-1), có
khuynh hướng tuyến tính (0<ρ<1) hoặc không có liên quan.

ThienPhuoc.Tk

Page 25


×