Mục lục
Mục lục 0
Câu 1. 1
Câu 2. 3
Câu 3. 6
Câu 4. 14
Trang 1
Bài tập lớn xác suất thống kê – Nhóm 1
Câu 1. Một hãng sản xuất ôtô tiến hành một nghiêm cứu nhằm xác định xem có sự khác nhau giữa tỷ lệ
đàn ông và đàn bà trong việc chọn mua các loại ôtô của hãng hay không. Kết quả thu được như sau:
Với mức ý nghĩa 5% ,ta cần phải đưa ra kết luận gì?
Bài giải:
Dạng bài: so sánh tỉ số .
Cơ sở lý thuyết:
- Đối với một thí nghiệm có nhiều kết quả (ở bài này là thí nghiệm nghiên cứu nhằm xác định xem
sự khác nhau giữa tỉ lệ đàn ông và đàn bà trong việc chọn mua các loại ô tô) cần so sánh nhiều tỉ số.
- Trắc nghiệm χ
2
cho phép ta so sánh không những hai mà còn nhiều tỉ số (hay tỉ lệ, xác suất) một
cách tiện lợi.
Giả thiết H
0
: phân bố chọn mua các loại ôtô A, B, C giữa phụ nữ và nam giới là như nhau.
Thực hiện bài toán bằng Excel:
1. Nhập dữ liệu vào bảng tính:
2. Tính các tổng số:
Tổng hàng: chọn ô E2 và nhập biểu thức = SUM(B2:D2)
+ Dùng con trỏ kéo nút tự điền từ ô E2-> E3
Tổng cột: chọn ô B4 và nhập biểu thức =SUM(B2:B3)
+ Dùng con trỏ kéo nút tự điền từ ô B4->D4
Tổng cộng: chọn ô E5 và nhập biểu thức =SUM(E2:E3)
Loại ôtô
A
B
C
Phụ nữ
70
80
150
Nam giới
40
60
100
Trang 2
Bài tập lớn xác suất thống kê – Nhóm 1
3. Tính các tần số lý thuyết:
Tần số lý thuyết = (tổng cột x tổng hàng) / tổng cộng
Phụ nữ mua ôtô loại A: chọn ô B8 và nhập biểu thức = B4*$E$2/$E$5.
+ Dùng con trỏ kéo nút tự điền từ ô B8 -> D8, ta được tỷ lệ phụ nữ mua ôtô loại B, loại C.
Nam giới mua ôtô lại A: chọn ô B8 và nhập biểu thức = B4*$E$3/$E$5.
+ Dùng con trỏ kéo nút tự điền từ ô B9 -> D9, ta được tỷ lệ nam giới mua ôtô loại B, loại C.
4. Áp dụng hàm số CHITEST:
Chọn ô B10 và nhập vào =CHITEST(B2:D3,B8:D9)
Ta sẽ có được kết quả của
2
()PX
: 0.582092714
Biện luận: giá trị P = 0.582092714 > α = 0.05=> chấp nhận giả thiết H
0
.
Kết luận: phân bố chọn mua các loại ôtô A, B, C giữa phụ nữ và nam giới là như nhau.
Trang 3
Bài tập lớn xác suất thống kê – Nhóm 1
Câu 2. Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân trên các cây cà chua và theo
dõi số quả cà chua mọc trên mỗi cây. Kết quả thu được như sau:
Với mức ý nghĩa α=5%, hãy so sánh số quả cà chua mọc trung bình khi bón ba loại phân A,B,C nói trên.
Bài giải:
Dạng bài: phân tích phương sai 1 nhân tố.
Cơ sớ lý thuyết:
-Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị
trung bình của hai hay nhiều mẫu từ các phân bố.
-Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một
yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Y
i
, (I = 1,2, …, k).
Giả thiết H
0
: số quả cà chua mọc trung bình khi bón ba loại phân A, B, C là như nhau.
Thực hiện bài toán bằng Excel:
1. Nhập dữ liệu vào bảng tính:
Loại phân
A
B
C
24
18
27
28
21
26
32
25
16
22
19
17
Trang 4
Bài tập lớn xác suất thống kê – Nhóm 1
2. Mở Data Analysis chọn Anova Single Factor
3. Nhập vào hộp thoại Anova Single Factor
Input Range: phạm vi đầu vào (ô A2 ô C6)
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first column: nhãn ở cột đầu tiên (chọn)
Alpha: giá trị α (0,05)
Output Range: phạm vi dữ liệu xuất ra (ô Ạ9)
Trang 5
Bài tập lớn xác suất thống kê – Nhóm 1
4. Ta nhận được bảng kết quả:
Biện luận: F = 3.8556562174 < F
0.05
= 4.256494729 => chấp nhận giả thiết H
0
.
Kết luận: số quả cà chua mọc trung bình khi bón ba loại phân A, B, C nói trên nói trên là như nhau.
Trang 6
Bài tập lớn xác suất thống kê – Nhóm 1
Câu 3.Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số liệu sau đây.
Với mức ý nghĩa α= 5%, có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến không ? Có tuyến
tính không ?). Tìm đường hồi quy của Y đối với X.
Bài giải:
Dạng bài: phân tích tương quan và hồi quy.
Thực hiện bài toán bằng Excel:
Phân tích tương quan tuyến tính
Giả thiết H
0
: X, Y không có tương quan tuyến tính
1. Nhập dữ liệu vào bảng tính:
X
210
90
240
50
240
270
130
270
90
240
130
170
50
170
210
Y
255
115
255
35
275
315
135
355
135
295
175
235
75
195
235
Trang 7
Bài tập lớn xác suất thống kê – Nhóm 1
2. Mở Data Analysis chọn Correlation
3. Nhập vào hộp thoại Correlation
Input Range: phạm vi đầu vào (ô A1 B16)
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first column: nhãn ở cột đầu tiên (chọn)
Output Range: phạm vi dữ liệu xuất ra (ô D1)
Trang 8
Bài tập lớn xác suất thống kê – Nhóm 1
4. Ta nhận được bảng kết quả:
Biện luận:
Từ bảng kết quả, ta tìm được hệ số tương quan r (X/Y) = 0.974355761;
hệ số xác định r² = 0.949369149
Giá trị
2
2
1
rn
T
r
= 15.6128296
c= 2.16037 (c là phân vị mức α /2= 0.025 của phân bố Student với n-2=13 bậc tự
do)
|T| < c nên bác bỏ giả thiết H
0
Kết luận: vậy X và Y có tương quan tuyến tính.
Phân tích tương quan phi tuyến
Giả thiết H
0
: X, Y không có tương quan phi tuyến
Trang 9
Bài tập lớn xác suất thống kê – Nhóm 1
1. Nhập dữ liệu vào bảng tính sau khi đã sắp xếp lại
2. Mở Data Analysis chọn Anova Single Factor
3. Nhập vào hộp thoại Anova Single Factor
Input Range: phạm vi đầu vào (ô B1 ô H4)
rouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first row: nhãn ở cột đầu tiên (chọn)
Alpha: giá trị α (0,05)
Output Range: phạm vi dữ liệu xuất ra (ô A6)
Trang 10
Bài tập lớn xác suất thống kê – Nhóm 1
4. Ta nhận được bảng kết quả:
Biện luận:
SSF = 114693,3333; SST = 119093,3333
Tỷ số tương quan :
2
/YX
=SSF/SST = 0,9630541872
Giá trị
22
/
2
/
( )( )
(1 )( 2)
YX
YX
r n k
F
k
= 0.5926533878
c = 3.6875 (c là phân vị mức α =0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(5,8))
F < c nên chấp nhận giả thiết H
0
Kết luận: vậy X và Y không có tương quan phi tuyến.
Trang 11
Bài tập lớn xác suất thống kê – Nhóm 1
Phân tích hồi quy
1. Nhập dữ liệu vào bảng tính theo cột dọc:
2. Mở Data Analysis chọn Regression
Trang 12
Bài tập lớn xác suất thống kê – Nhóm 1
3. Nhập vào hộp thoại Regression
Input Y Range: phạm vi đầu vào (ô B1 ô B16)
Input X Range: phạm vi đầu vào (ô A1 ô A16)
Labels: nhãn (chọn)
Line Fit Plots: vẽ đồ thị (chọn)
Output Range: phạm vi dữ liệu xuất ra (ô D1)
4. Ta nhận được bảng kết quả:
Kết luận: phương trình đường hồi quy của Y đối với X: Y= 1.169300226X+ 6.106094808
Trang 13
Bài tập lớn xác suất thống kê – Nhóm 1
Trang 14
Bài tập lớn xác suất thống kê – Nhóm 1
Câu 4. Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các hộ gia đình ở một
vùng nông thôn trên cơ sở bảng số liệu về thu nhập của một số hộ tương ứng với các ngành nghề nói trên
như sau (mức ý nghĩa 5%)
Nghề chính
Nghề phụ
(1)
(2)
(3)
(4)
Trồng lúa (1)
3.5:3.4:4.0
7.4:7.6:7.1
8.3:8.1:8.0
3.5:3.4:3.7
Trồng cây ăn quả (2)
5.6:5.2:5.8
4.1:4.4:3.9
6.1:6.4:5.8
9.6:9.7:9.2
Chăn nuôi (3)
4.1:4.4:3.8
2.5:2.5:2.7
1.8:1.6:1.4
2.1:2.3:2.0
Dịch vụ (4)
7.2:7.0:7.7
3.2:3.5:3.1
2.2:2.6:2.3
1.5:1.7:1.4
Bài giải:
Dạng bài: phân tích phương sai hai yếu tố có lặp
Giả thiết : H
A
: thu nhập không phụ thuộc vào nghề chính
H
B
: thu nhập không phụ thuộc vào nghề phụ
H
AB
: nghề chính và nghề phụ không có liên quan đến nhau.
Thực hiện bài toán bằng Excel:
1. Nhập dữ liệu vào bảng tính:
Trang 15
Bài tập lớn xác suất thống kê – Nhóm 1
2. Mở Data Analysis và chọn Two Factor With Replication
3. Nhập vào hộp thoại Anova: Two-Facror With Replication
Input Range : (ô A2 ô E14)
Rows per sample : 3
Alpha: 0.05
Output Range : (A16)
Trang 16
Bài tập lớn xác suất thống kê – Nhóm 1
4. Ta nhận được bản kết quả
Trang 17
Bài tập lớn xác suất thống kê – Nhóm 1
Biện luận:
F
A
= 602.7073171; F
0.05
= 2,90112
F
A
> F
0.05
bác bỏ yếu tố H
A
thu nhập phụ thuộc vào nghề chính
F
B
= 35.55284553; F
0.05
= 2.90112
F
B
> F
0 05
bác bỏ yếu tố H
B
thu nhập phụ thuộc vào nghề phụ.
F
AB
= 301,7487418; F
0.05
= 2.188766
F
AB
> F
0.05
bác bỏ yếu tố H
AB
có sự tương tác năng suất giữa nghề chính và nghề
phụ.
Kết luận:
Thu nhập phụ thuộc vào nghề chính
Thu nhập phụ thuộc vào nghề phụ
Có sự tương tác giữa nghề chính và nghề phụ.