Tải bản đầy đủ (.pdf) (20 trang)

bài tập xác xuất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.06 MB, 20 trang )

Mục lục
Trang
Bài 1………………………………………………………………. 3
Bài 2………………………………………………………………..4
Bài 3………………………………………………………………..9
Bài 4……………………………………………………………….16

2


Bài 1:
Một cuộc điều tra xã hội được tiến hành ở 5 thành phố A, B, C ,D E yêu cầu những người
được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phố mà họ đang sống. Kết như
sau:
Thành phố
A
B
C
D
E

Mức độ thỏa mãn
Rất thỏa mãn
Tương đối
220
121
130
207
84
54
156


95
122
164

Không
63
75
24
43
73

Với mức ý nghĩa α = 5%, mức độ thỏa mãn cuộc sống có giống nhau trong 5 thành phố
trên hay không?
Bài làm
Dạng bài: Kiểm định giả thiết về tỉ lệ.
Phương pháp giải: Áp dụng kiểm định khi bình phương ꭓ2
Cơ sở lý thuyết:
-

-

Giả thiết:
H0: P1 = P1,0, P2 = P2,0=… = Pk,0  “ Các cặp Pi và Pi,0 giống nhau”
H1: Ít nhất có một cặp Pi và Pi,0 khác nhau”
Trong trắc nghiệm khi bình phương cho phép so sánh không những hai mà nhiều tỷ số
(tỷ lệ hay xác suất) một cách tiện lợi. Dạng thống kê hay sử dụng nhất là:
(𝑂𝑖 −𝐸𝑖 )2

ꭓ2 = ∑ℎ𝑖=1 [


-

𝐸𝑖

]

Với 𝑂𝑖 – các tần số thực nghiệm (observed frequency)
𝐸𝑖 – các tần số lý thuyết ( expected frequency)
Biện luận:
+ Nếu ꭓ2 > ꭓ2 𝑎 ⇒ Bác bỏ giả thiết H0( DF= k-1)
Trong chương trình MS-EXCEL có hàm số Chitest có thể tính:
Giá trị ꭓ2 theo biểu thức:
𝑟

𝑐

2

(𝑂𝑖𝑗 − 𝐸𝑖𝑗 )
]
ꭓ = ∑∑[
𝐸𝑖𝑗
2

𝑖=1 𝑗=1

-

-


Với 𝑂𝑖𝑗 – các tần số thực nghiệm của ô thuộc hàng j cột j
𝐸𝑖𝑗 – các tần số lý thuyết của ô thuộc hàng j cột j
𝑟 là số hàng, 𝑐 là số cột
Xác suất P(X> ꭓ2 ) với bậc tự do DF = (𝑟 -1)( 𝑐 -1) trong đó 𝑟 là số hàng, 𝑐 là số cột
trong bảng ngẫu nhiên ( Contingency table)
Nếu P(X> ꭓ2 ) > α⇒ Chấp nhận giả thiết H0 và ngược lại.

Công cụ giải: hàm CHITEST trên Excel
3


Thực hiện thuật toán bằng Excel
• Nhập dữ liệu vào bảng tính:
Mức độ thỏa mãn
Rất thỏa mãn
Tương đối
220
121
130
207
84
54
156
95
122
164

Thành phố
A
B

C
D
E

Không
63
75
24
43
73

• Tính tổng các hàng và các cột
Mức độ thỏa mãn
Thành phố
A
B
C
D
E
Tổng cột

Rất thỏa mãn
220
130
84
156
122
712

Tương đối

121
207
54
95
164
641

Không
63
75
24
43
73
278

Tổng
hàng
404
412
162
294
359
1631

• Tính các tần số lý thuyết: tần số lý thuyết = (tổng hàng x tổng cột)/(tổng cộng)
Rất thảo mãn
176.3629675
179.8553035
70.7198038
128.3433476

156.7185776

A
B
C
D
E

Tương đối
158.7762109
161.9202943
63.66768853
115.5450644
141.0907419

Không
68.86082158
70.22440221
27.61250766
50.11158798
61.19068056

• Sử dụng hàm CHITEST để tính xác suất
CHITEST

3.52990E-13

• Kết quả và biện luận
Giả thiết


H0: Mức độ thỏa mãn cuộc sống của 5 thành phố là như nhau
H1: Mức độ thỏa mãn cuộc sống của 5 thành phố là khác nhau

Ta có: P(X>ꭓ2) = 3.5299E-13 < α = 0.05
⇒Ta bác bỏ giả thiết H0 , chấp nhận giả thiết H1
Vậy: Mức độ thỏa mãn cuộc sống của 5 thành phố là khác nhau

4


Bài 2:
Để đánh giá hiệu quả của một chiến dịch quảng cáo, người ta so sánh doanh số của công
ty tại 6 khu vực thị trường trước và sau chiến dịch quảng cáo và thu được các số liệu sau
( đơn vị: triệu đồng/ tháng):
Trước khi quảng cáo

Sau khi quảng cáo

620
600
640
630
570
600

660
620
670
620
580

630

Với độ tin cậy là 95% hãy ước lượng doanh số trung bình trước và sau chiến dịch quảng
cáo. Với mức ý nghĩa 5% hãy cho ý kiến là chiến dịch quảng cáo là có thành công hay
không? Biết rằng doanh số của công ty là biến ngẫu nhiên phân phối chuẩn.
Bài làm
Dạng bài: Kiểm định giá trị trung bình với phương sai bằng nhau và ước lượng hai trung
bình tổng thể.
Cơ sở lý thuyết:
-

Ước lượng giá trị trung bình:
Ta tính khoảng ước lượng trung bình theo công thức sau:

Với 𝑥̅ là giá trị trung bình còn
là độ chính xác.
So sánh giá trị trung bình với phương sai bằng nhau
 Giả thiết:
Trường hợp hai mẫu có dữ liệu tương ứng từng cặp:
Ho: giả thuyết chiến dịch quảng cáo thành công.
H1: giả thuyết chiến dịch quảng cáo không thành công.
 Giá trị thống kê:
t=

̅̅̅̅−𝑋2
̅̅̅̅)−(𝜇1− 𝜇2)
(𝑋1
1
1
√𝑆𝑝2 ( + )

𝑁1 𝑁2

=

̅̅̅̅− 𝑋2
̅̅̅̅)
(𝑋1
1
1
+ )
𝑁1 𝑁2

√𝑆𝑝2 (

Có phân phối Student với 𝛾 = N1 + N2 – 2 bậc tự do
(𝑁1 − 1). 𝑆12 + (𝑁2 − 1). 𝑆21
2
𝑆𝑝 =
𝑁1 + 𝑁2 − 2
5


 Biện luận:
Nếu | t | < t𝛼 hay 𝑡𝛼 (𝛾 = N1 + N2 – 2) => Chấp nhận giả thiết Ho
2

Thực hiện thuật toán bằng Excel
• Nhập dữ liệu vào bảng tính:
Trước khi quảng cáo
Sau khi quảng cáo


620
660

600
620

640
670

630
620

570
580

600
630

Phần 1: Ước lượng doanh số trung bình trước và sau chiến dịch quảng cáo.
Mở hộp thoại Data Analysis chọn Descriptive Statistics.

Nhập vào hộp thoại Desciptive Statistics.
ₒ Input Range: phạm vi dữ liệu nhập vào
ₒ Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)
ₒ Labels in first row: nhãn ở cột đầu tiên (chọn)
ₒ Output Range: phạm vi dữ liệu xuất ra
ₒ Tích dấu chọn vào Summary statistics.
ₒ Confidence Level for Mean: Nhập 95 (%)


6


Ta được bảng kết quả.
Trước khi
quảng cáo
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
Confidence Level(95.0%)

610
10.32795559
610
600
25.29822128
640
0.166015625
-0.55586912
70

570
640
3660
6
26.54885504

Kết luận:
Doanh số trước khi quảng cáo là:
610 ± 26.5488550386206

Mở hộp thoại Data Analysis chọn Descriptive Statistics

Nhập vào hộp thoại Desciptive Statistics.
7


ₒ Input Range: phạm vi dữ liệu nhập vào
ₒ Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)
ₒ Labels in first row: nhãn ở cột đầu tiên (chọn)
ₒ Output Range: phạm vi dữ liệu xuất ra
ₒ Tích dấu chọn vào Summary statistics.
ₒ Confidence Level for Mean: Nhập 95 (%)

Ta được bảng kết quả.
Sau khi
quảng cáo
Mean
Standard Error
Median
Mode

Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
Confidence Level(95.0%)

630
13.16561177
625
620
32.24903099
1040
0.011094675
0.322013253
90
580
670
3780
6
33.84328248

8


Kết luận:

Doanh số sau khi quảng cáo là:
630 ± 33.8432824763682
Tổng kết:
+ Chiến dịch quảng cáo có tác dụng với doanh số
+ Doanh số trước khi quảng cáo là: 610 ± 26.5488550386206
+ Doanh số sau khi quảng cáo là: 630 ± 33.8432824763682

Phần 2: Tìm kết luận về tác dụng của chiến dịch quảng cáo
Mở hộp thoại Data Analysis chọn t-Test Two-Sample Assuming Equal Variances.

Nhập vào hộp thoại t-Test Two-Sample Assuming Equal Variances.
ₒ Input Range: phạm vi dữ liệu nhập vào
ₒ Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)
ₒ Labels in first row: nhãn ở cột đầu tiên (chọn)
ₒ Output Range: phạm vi dữ liệu xuất ra
ₒ Tích dấu chọn vào Summary statistics.
ₒ Confidence Level for Mean: Nhập 95 (%)

9


Ta được bảng kết quả.
t-Test: Two-Sample Assuming Equal Variances
Kết quả
Trước khi quảng cáo
Mean
Variance
Observations
Pooled Variance
Hypothesized Mean

Difference
df
t Stat
P(T<=t) one-tail
t Critical one-tail
P(T<=t) two-tail
t Critical two-tail

Sau khi quảng cáo
610
640
6
840

630
1040
6

0
10
-1.195228609
0.129786466
1.812461123
0.259572932
2.228138852

Giả thiết:
+ H0 : Chiến dịch quảng cáo thành công
+ H1 : Chiến dịch quảng cáo không thành công
Vì t Start < tα/2 nên chấp nhận giả thiết H0

Vậy chiến dịch quảng cáo thành công

Bài 3:
Một nghiên cứu được tiến hành ở Mỹ để xác định mối quan hệ giữa chiều cao của một
người cỡ giày của họ. Nhà nghiên cứu đã thu được số liệu như sau:
10


X
Y

66
9

63
7

67
8

71
10

62
6

64
11

66

6

63
8

67
5

71
12

62
5

64
9

trong đó X là chiều cao (đơn vị inches) còn Y là cỡ giày. Tính tỷ số tương quan, tương
quan giữa X và Y hệ số tương quan và hệ số xác định Y đối với X. Với mức ý nghĩa α =
5%, có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến hay không? Có tuyến
tính hay không?) Tìm đường hồi quy của Y đối với X

Bài làm
Dạng bài: Bài toán kiểm định tương quan và hồi quy.
Cơ sở lý thuyết:
-

-

-


a. Phân tích tương quan:
Hệ số tương quan có thể được ước tính bởi biểu thức:
∑𝑛𝑖=1(𝑋𝑖 − 𝑋)(𝑌𝑖 − 𝑌)
𝑆𝑋𝑌
𝜌̂ = 𝑅 =
=
√𝑆𝑋𝑋 𝑆𝑌𝑌
√∑𝑛𝑖=1(𝑋𝑖 − 𝑋)2 ∑𝑛𝑖=1(𝑌𝑖 − 𝑌)2
Hệ số xác định R2 ( Coeffocient of determination) là một trong các chỉ tiêu dung đánh giá
mức độ phù hợp của mô hình thể hiện mối liên hệ tương quan tuyến tính, hệ số xác định
là bình phương của hệ số tương quan.
Kiểm định giả thiết về hệ số tương quan:
Giả thiết H0: X và Y không có tương quan tuyến tính
𝑇=

𝑟 √𝑛 − 2
√1 − 𝑟 2
𝛼

Dựa vào phân phối Student với bậc tự do n-2 ta có được giá trị 𝑡𝑛−2 ( ), nếu giả thiết Ho là
2

𝛼

đúng. Vì vậy, giả thiết Ho sẽ bị bác bỏ ở mức ý nghĩa 𝛼 nếu |T| > 𝑡𝑛−2 ( ).
2

b. Hồi quy tuyến tính :
𝑌̂𝑋 = 𝐵0 + 𝐵𝑋

𝐵0 = 𝑌̅ − 𝐵𝑋̅
𝐵=

∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑋𝑖 𝑌𝑖 /𝑁
∑ 𝑋𝑖2 − 𝑁(𝑋̅ )2

𝑌 − là biến số phụ thuộc (dependent / reponse variable)
𝑋 − là biến số độc lập ( independent / predictor variable)
𝐵0 𝑣à 𝐵 – các hệ số hồi quy ( regresstion coeficients)
Bảng Anova:

11


+ Giá trị thống kê:
Giá trị R-bình phương ( R-square):
𝑅=

𝑆𝑆𝐴
𝑆𝑆𝐸

(100𝑅 2 : % của biến đổi trên Y được giải thích bởi X)

Độ lệch chuẩn ( Standard Error):
𝑆= √

1
∑(𝑋𝑖 − 𝑌𝑖 )2
𝑁−2


(Sự phân tán của dữ liệu càng ít thì giá trị S càng gần 0)
+ Trắc nghiệm thống kê:
Đối với phương trình hồi quy, 𝑌̂𝑋 = 𝐵0 + 𝐵𝑋 , ý nghĩa thống kê của các hệ số 𝐵𝑗 (
𝐵0 ℎ𝑎𝑦 𝐵0)được đánh giá bằng trắc nghiệm t ( phân phối Student) trong khi tính chất
thích hợp của phương trình 𝑌̂𝑋 = 𝑓(𝑥) được đánh giá trắc nghiệm F ( phân bố Fisher).
+ Trắc nghiệm t
-

-

Giả thiết :
H0: 𝛽𝑖 = 0 “ Hệ số hồi quy không có ý nghĩa”
H1: 𝛽𝑖 ≠ 0 “ Hệ số hồi quy có ý nghĩa”
Giá trị thống kê:
|𝐵𝑖 − 𝛽𝑖 | 2
𝑆2
𝐵
𝑡=
; 𝑆𝑛 =
=
∑(𝑋𝑖 − 𝑋̅ )2
√𝑆𝑛2
√𝑆𝑛2
Phân bố Student 𝛾 = 𝑁 − 2
Biện luận:
Nếu t < tα(N-2) ⇒ Chấp nhận giả thiết H0
+ Trắc nghiệm F
-

Giả thiết

H0: 𝛽𝑖 = 0 “ Phương trình hồi quy không có ý nghĩa”
H1: 𝛽𝑖 ≠ 0 “ Phương trình hồi quy có ý nghĩa”
12


i. Giá trị thống kê:
𝑀𝑆𝑅
F=
𝑀𝑆𝐸
Phân bố fisher 𝑣1 = 1, 𝑣2 = 𝑁 − 2
Kết luận
Nếu F< Fα(1, N-2) ⇒ Chấp nhận giả thiết H0
Công cụ giải: Correlation
Thực hiện thuật toán bằng Excel:
• Nhập dữ liệu:
X
Y

66
9

63
7

67
8

71
10


62
6

64
11

66
6

63
8

67
5

71
12

62
5

64
9

Mở hộp thoại Data Analysis chọn Correlation

Nhập vào hộp thoại Correlation.
ₒ Input Range: phạm vi dữ liệu nhập vào
ₒ Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)
ₒ Labels in first row: nhãn ở cột đầu tiên (chọn)

ₒ Output Range: phạm vi dữ liệu xuất ra
X
X
Y

1
0.53314

Y
1

Biện luận:
n = 12
Từ bảng, ta có hệ số tương quan r = 0.533142623546057
Hệ số xác định: r2= 0.284241057
T= 1.992783017
Giá trị của T = 1.992783017 xác định theo công thức

13


Giả thiết: H0: X và Y không tương quan tuyến tính
Dựa vào phân phối Student với n-2 = 10 bậc tự do, mức ý nghĩa α= 0.05, ta tra bảng tìm
tn-2(α/2) hoặc dùng hàm TINV
tn-2(α/2) = 2.228138852
So sánh ta thấy |T| < tn-2(α/2). Do đó chưa đủ cơ sở để bác bỏ giả thiết H
Vậy: X và Y không tương quan tuyến tính.
Phân tích tương quan phi tuyến tính:
Nhập dữ liệu theo thứ tự tăng dần
X

Y

62
6
5

63
7
8

64
11
9

66
9
6

67
8
5

71
10
12

Giả thiết H1: X và Y không có tương quan phi tuyến.
Mở hộp thoại Data Analysis chọn Anova Single Factor
Nhập vào hộp thoại Anova Single Factor.
ₒ Input Range: phạm vi dữ liệu nhập vào

ₒ Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)
ₒ Labels in first row: nhãn ở cột đầu tiên (chọn)
ₒ Output Range: phạm vi dữ liệu xuất ra

14


Anova: Single Factor
SUMMARY
Groups
62
63
64
66
67
71

ANOVA
Source of
Variation
Between Groups
Within Groups
Total

Count Sum Average Variance
2
11
5.5
0.5
2

15
7.5
0.5
2
20
10
2
2
15
7.5
4.5
2
13
6.5
4.5
2
22
11
2

SS

df

MS

44
14

5

6

58

11

F

8.8
2.333

Pvalue
F crit
3.7714 0.0685 4.387

n=12, k=6
Tổng bình phương giữa các nhóm SSF = 44
Tổng bình phương nhân tố SST = 58
η2Y/X = SSF/SST = 0.75862069
Tỷ số tương quan : ηY/X = 0.870988341
Giá trị F = 2.947930574
Phân bố Fisher mức α = 0,05 với bậc tự do (k-2, n-k) = (4,6)

15


Dùng hàm FINV ta tính được: C=4.53367695

FINV là hàm tính toán trong excel để cho ra kết quả là nghịch đảo của phân bố xác suất F
Vì F < c nên chấp nhận giả thuyết H1

Vậy X và Y không tương quan phi tuyến tính
Phân tích hồi quy (sử dụng Regression).
Giả thiết H: Hệ số không thích hợp.
Nhập bảng dữ liệu:
X
62
62
63
63
64
64
66
66
67
67
71
71

Y
6
5
7
8
11
9
9
6
8
5
10

12

16


Mở Data Analysis chọn Regression

Nhập vào hộp thoại Regression.
ₒ Input Range: phạm vi dữ liệu nhập vào
ₒ Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)
ₒ Labels in first row: nhãn ở cột đầu tiên (chọn)

SUMMARY OUTPUT
Regression Statistics
Multiple R
0.53314
R Square
0.28424
Adjusted R Square
0.21267
Standard Error
2.0375
Observations
12

17


ANOVA
df

Regression
Residual
Total

Intercept
X

SS
1

16.486

10
11

41.514
58

Coefficien
ts

Standar
d Error

-17.71

12.915

0.39252


0.197

Predicted
Y
8.19626
7.01869
8.58879
10.1589
6.62617
7.41121
8.19626
7.01869
8.58879
10.1589
6.62617
7.41121

Residual
s
0.8037
-0.019
-0.589
-0.159
-0.626
3.5888
-2.196
0.9813
-3.589
1.8411
-1.626

1.5888

MS
16.4
9
4.15
1

F
3.971
2

t
Stat
1.37
1
1.99
3

Pvalue
0.200
3
0.074
3

Significanc
eF
0.0743

Lower

95%

Uppe
r 95%

Lower
95.0%

Upper
95.0%

-46.49

11.07

-46.49

11.07

-0.046

0.831

-0.046

0.831

RESIDUAL OUTPUT

Observation

1
2
3
4
5
6
7
8
9
10
11
12

Hệ số góc = 0.392523364485981
Hệ số tự do = -17.7102803738318
Giá trị P của hệ số tự do (P-value) = 0.200270866648733 > α = 0,05 => Bác bỏ giả thiết H
Suy ra, hệ số tự do có ý nghĩa thống kê
Giá trị P của hệ số góc (P-value) =0.0742756317313767 > α = 0,05 => bác bỏ giả thiết H
Suy ra, hệ số góc có ý nghĩa thống kê
Giá trị F (Significance F) = 0.0742756317313767 > α = 0,05 => Bác bỏ giả thiết H
->Phương trình đường hồi quy thích hợp
Kết luận:
18


Tỷ số tương quan ηY/X =0.870988341
Hệ số tương quan r = 0.533142623546057
Hệ số xác định r² = 0.284241057
X và Y không tương quan tuyến tính với mức ý nghĩa 5%.
X và Y không tương quan phi tuyến với mức ý nghĩa 5%.

Phương trình đường hồi quy của Y đối với X: Y =0.392523364485981X + -17.7102803738318

Bài 4:
Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các hộ gia đình ở một
vùng nông thôn trên cơ sở bảng số liệu về thu nhập của một hộ tươngứng với các ngành nghề
nói trên như sau ( mức ý nghĩa 5%):
Nghề chính
Trông lúa (1)
Trồng cây ăn quả (2)
Chăn nuôi (3)
Dịch vụ (4)

(1)
3.5
5.6
4.1
7.2

Nghề phụ
(2)
(3)
7.4
8
4.1
6.1
2.5
1.8
3.2
2.2


(4)
3.5
9.6
2.1
1.5

Bài làm:
Dạng bài: bài toán phân tích phương sai hai yếu tố không lặp.
Cơ sở lý thuyết:

Giả thiết
19


H0: 𝜇1 = 𝜇2 = . . .= 𝜇k  “Các giá trị trung bình bằng nhau”
H1: 𝜇i ≠ 𝜇j  “Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
𝐹𝑅 =

𝑀𝑆𝐵
𝑀𝑆𝐸

và 𝐹𝐶 =

𝑀𝑆𝐹
𝑀𝑆𝐸

Biện luận:
Nếu FR < Fα[r-1,(r-1)(c-1)] ⇒ chấp nhận H0 (yếu tố A)


Nếu FC < Fα[r-1,(r-1)(c-1)] ⇒ chấp nhận H0 (yếu tố A)
Công cụ giải: Two-Factor Without Replication
Thực hiện thuật toán bằng Excel
Giả thiết H: Các giá trị trung bình bằng nhau
• Nhập dữ liệu vào bảng tính:
Nghề chính
Trông lúa (1)
Trồng cây ăn quả (2)
Chăn nuôi (3)
Dịch vụ (4)

(1)
3.5
5.6
4.1
7.2

Nghề phụ
(2)
(3)
7.4
8
4.1
6.1
2.5
1.8
3.2
2.2

(4)

3.5
9.6
2.1
1.5

Mở hộp thoại Data Analysis chọn Anova: Two-Factor Without Replication

ₒ Input Range: phạm vi dữ liệu nhập vào
ₒ Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)
ₒ Labels in first row: nhãn ở cột đầu tiên (chọn)
ₒ Output Range: phạm vi dữ liệu xuất ra

20


Anova: Two-Factor Without Replication
SUMMARY
Trông lúa (1)
Trồng cây ăn quả (2)
Chăn nuôi (3)
Dịch vụ (4)
(1)
(2)
(3)
(4)

Count
4
4
4

4

Sum
22.4
25.4
10.5
14.1

Average
5.6
6.35
2.625
3.525

Variance
5.94
5.4167
1.0492
6.4892

4
4
4
4

20.4
17.2
18.1
16.7


5.1
4.3
4.525
4.175

2.74
4.7
9.1292
13.783

df

MS
12.13
0.672
6.074

F
P-value
1.9966 0.1851
0.1106 0.9517

ANOVA
Source of Variation
Rows
Columns
Error
Total

SS

36.385
2.015
54.67
93.07

3
3
9

F crit
3.862548358
3.862548358

15

Biện luận :
Frows (Nghề chính)=1.99661605999634 < F0.05 = 3.86254835762476 nên chấp nhận giả
thuyết H(nghề chính)
Fcol (Nghề phụ)= 0.110572526065483 < F0.05 = 3.86254835762476 nên chấp nhận giả thuyết
H(Nghề phụ)
Kết luận :
Vậy cả nghề chính và nghề phụ đều ảnh hưởng đến thu nhập

21



×