Tải bản đầy đủ (.pdf) (18 trang)

Báo cáo bài tập lớn Xác suất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.03 MB, 18 trang )




Mục lục
Mục lục 0
Câu 1. 1
Câu 2. 3
Câu 3. 6
Câu 4. 14



















Trang 1

Bài tập lớn xác suất thống kê – Nhóm 1



Câu 1. Một hãng sản xuất ôtô tiến hành một nghiêm cứu nhằm xác định xem có sự khác nhau giữa tỷ lệ
đàn ông và đàn bà trong việc chọn mua các loại ôtô của hãng hay không. Kết quả thu được như sau:




Với mức ý nghĩa 5% ,ta cần phải đưa ra kết luận gì?
Bài giải:
Dạng bài: so sánh tỉ số .
Cơ sở lý thuyết:
- Đối với một thí nghiệm có nhiều kết quả (ở bài này là thí nghiệm nghiên cứu nhằm xác định xem
sự khác nhau giữa tỉ lệ đàn ông và đàn bà trong việc chọn mua các loại ô tô) cần so sánh nhiều tỉ số.
- Trắc nghiệm χ
2
cho phép ta so sánh không những hai mà còn nhiều tỉ số (hay tỉ lệ, xác suất) một
cách tiện lợi.
Giả thiết H
0
: phân bố chọn mua các loại ôtô A, B, C giữa phụ nữ và nam giới là như nhau.
Thực hiện bài toán bằng Excel:
1. Nhập dữ liệu vào bảng tính:


2. Tính các tổng số:

 Tổng hàng: chọn ô E2 và nhập biểu thức = SUM(B2:D2)
+ Dùng con trỏ kéo nút tự điền từ ô E2-> E3
 Tổng cột: chọn ô B4 và nhập biểu thức =SUM(B2:B3)
+ Dùng con trỏ kéo nút tự điền từ ô B4->D4

 Tổng cộng: chọn ô E5 và nhập biểu thức =SUM(E2:E3)
Loại ôtô
A
B
C
Phụ nữ
70
80
150
Nam giới
40
60
100

Trang 2

Bài tập lớn xác suất thống kê – Nhóm 1

3. Tính các tần số lý thuyết:
Tần số lý thuyết = (tổng cột x tổng hàng) / tổng cộng


 Phụ nữ mua ôtô loại A: chọn ô B8 và nhập biểu thức = B4*$E$2/$E$5.
+ Dùng con trỏ kéo nút tự điền từ ô B8 -> D8, ta được tỷ lệ phụ nữ mua ôtô loại B, loại C.
 Nam giới mua ôtô lại A: chọn ô B8 và nhập biểu thức = B4*$E$3/$E$5.
+ Dùng con trỏ kéo nút tự điền từ ô B9 -> D9, ta được tỷ lệ nam giới mua ôtô loại B, loại C.

4. Áp dụng hàm số CHITEST:
Chọn ô B10 và nhập vào =CHITEST(B2:D3,B8:D9)
Ta sẽ có được kết quả của

2
()PX


: 0.582092714

Biện luận: giá trị P = 0.582092714 > α = 0.05=> chấp nhận giả thiết H
0
.
Kết luận: phân bố chọn mua các loại ôtô A, B, C giữa phụ nữ và nam giới là như nhau.



Trang 3

Bài tập lớn xác suất thống kê – Nhóm 1

Câu 2. Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân trên các cây cà chua và theo
dõi số quả cà chua mọc trên mỗi cây. Kết quả thu được như sau:





Với mức ý nghĩa α=5%, hãy so sánh số quả cà chua mọc trung bình khi bón ba loại phân A,B,C nói trên.

Bài giải:
Dạng bài: phân tích phương sai 1 nhân tố.
Cơ sớ lý thuyết:
-Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị

trung bình của hai hay nhiều mẫu từ các phân bố.
-Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một
yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Y
i
, (I = 1,2, …, k).
Giả thiết H
0
: số quả cà chua mọc trung bình khi bón ba loại phân A, B, C là như nhau.
Thực hiện bài toán bằng Excel:
1. Nhập dữ liệu vào bảng tính:








Loại phân
A
B
C
24
18
27
28
21
26
32
25

16
22
19
17

Trang 4

Bài tập lớn xác suất thống kê – Nhóm 1

2. Mở Data Analysis chọn Anova Single Factor



3. Nhập vào hộp thoại Anova Single Factor



 Input Range: phạm vi đầu vào (ô A2  ô C6)
 Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
 Labels in first column: nhãn ở cột đầu tiên (chọn)
 Alpha: giá trị α (0,05)
 Output Range: phạm vi dữ liệu xuất ra (ô Ạ9)







Trang 5


Bài tập lớn xác suất thống kê – Nhóm 1

4. Ta nhận được bảng kết quả:

Biện luận: F = 3.8556562174 < F
0.05
= 4.256494729 => chấp nhận giả thiết H
0
.
Kết luận: số quả cà chua mọc trung bình khi bón ba loại phân A, B, C nói trên nói trên là như nhau.








Trang 6

Bài tập lớn xác suất thống kê – Nhóm 1

Câu 3.Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số liệu sau đây.
Với mức ý nghĩa α= 5%, có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến không ? Có tuyến
tính không ?). Tìm đường hồi quy của Y đối với X.


Bài giải:
Dạng bài: phân tích tương quan và hồi quy.

Thực hiện bài toán bằng Excel:
 Phân tích tương quan tuyến tính
 Giả thiết H
0
: X, Y không có tương quan tuyến tính
1. Nhập dữ liệu vào bảng tính:









X
210
90
240
50
240
270
130
270
90
240
130
170
50
170

210
Y
255
115
255
35
275
315
135
355
135
295
175
235
75
195
235

Trang 7

Bài tập lớn xác suất thống kê – Nhóm 1

2. Mở Data Analysis chọn Correlation



3. Nhập vào hộp thoại Correlation





 Input Range: phạm vi đầu vào (ô A1  B16)
 Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
 Labels in first column: nhãn ở cột đầu tiên (chọn)
 Output Range: phạm vi dữ liệu xuất ra (ô D1)









Trang 8

Bài tập lớn xác suất thống kê – Nhóm 1

4. Ta nhận được bảng kết quả:

Biện luận:
 Từ bảng kết quả, ta tìm được hệ số tương quan r (X/Y) = 0.974355761;
hệ số xác định r² = 0.949369149
 Giá trị
2
2
1
rn
T
r




= 15.6128296
c= 2.16037 (c là phân vị mức α /2= 0.025 của phân bố Student với n-2=13 bậc tự
do)
 |T| < c nên bác bỏ giả thiết H
0

Kết luận: vậy X và Y có tương quan tuyến tính.




 Phân tích tương quan phi tuyến
 Giả thiết H
0
: X, Y không có tương quan phi tuyến

Trang 9

Bài tập lớn xác suất thống kê – Nhóm 1

1. Nhập dữ liệu vào bảng tính sau khi đã sắp xếp lại



2. Mở Data Analysis chọn Anova Single Factor



3. Nhập vào hộp thoại Anova Single Factor


 Input Range: phạm vi đầu vào (ô B1 ô H4)
 rouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
 Labels in first row: nhãn ở cột đầu tiên (chọn)
 Alpha: giá trị α (0,05)
 Output Range: phạm vi dữ liệu xuất ra (ô A6)

Trang 10

Bài tập lớn xác suất thống kê – Nhóm 1

4. Ta nhận được bảng kết quả:


Biện luận:
 SSF = 114693,3333; SST = 119093,3333
 Tỷ số tương quan :
2
/YX

=SSF/SST = 0,9630541872
 Giá trị
22
/
2
/
( )( )
(1 )( 2)

YX
YX
r n k
F
k





= 0.5926533878

c = 3.6875 (c là phân vị mức α =0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(5,8))
 F < c nên chấp nhận giả thiết H
0

Kết luận: vậy X và Y không có tương quan phi tuyến.


Trang 11

Bài tập lớn xác suất thống kê – Nhóm 1

 Phân tích hồi quy
1. Nhập dữ liệu vào bảng tính theo cột dọc:


2. Mở Data Analysis chọn Regression












Trang 12

Bài tập lớn xác suất thống kê – Nhóm 1

3. Nhập vào hộp thoại Regression



 Input Y Range: phạm vi đầu vào (ô B1  ô B16)
 Input X Range: phạm vi đầu vào (ô A1  ô A16)
 Labels: nhãn (chọn)
 Line Fit Plots: vẽ đồ thị (chọn)
 Output Range: phạm vi dữ liệu xuất ra (ô D1)

4. Ta nhận được bảng kết quả:

Kết luận: phương trình đường hồi quy của Y đối với X: Y= 1.169300226X+ 6.106094808



Trang 13


Bài tập lớn xác suất thống kê – Nhóm 1
















Trang 14

Bài tập lớn xác suất thống kê – Nhóm 1

Câu 4. Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các hộ gia đình ở một
vùng nông thôn trên cơ sở bảng số liệu về thu nhập của một số hộ tương ứng với các ngành nghề nói trên
như sau (mức ý nghĩa 5%)
Nghề chính
Nghề phụ
(1)
(2)
(3)

(4)
Trồng lúa (1)
3.5:3.4:4.0
7.4:7.6:7.1
8.3:8.1:8.0
3.5:3.4:3.7
Trồng cây ăn quả (2)
5.6:5.2:5.8
4.1:4.4:3.9
6.1:6.4:5.8
9.6:9.7:9.2
Chăn nuôi (3)
4.1:4.4:3.8
2.5:2.5:2.7
1.8:1.6:1.4
2.1:2.3:2.0
Dịch vụ (4)
7.2:7.0:7.7
3.2:3.5:3.1
2.2:2.6:2.3
1.5:1.7:1.4

Bài giải:
Dạng bài: phân tích phương sai hai yếu tố có lặp
Giả thiết : H
A
: thu nhập không phụ thuộc vào nghề chính
H
B
: thu nhập không phụ thuộc vào nghề phụ

H
AB
: nghề chính và nghề phụ không có liên quan đến nhau.

Thực hiện bài toán bằng Excel:
1. Nhập dữ liệu vào bảng tính:






Trang 15

Bài tập lớn xác suất thống kê – Nhóm 1

2. Mở Data Analysis và chọn Two Factor With Replication



3. Nhập vào hộp thoại Anova: Two-Facror With Replication



 Input Range : (ô A2  ô E14)
 Rows per sample : 3
 Alpha: 0.05
 Output Range : (A16)











Trang 16

Bài tập lớn xác suất thống kê – Nhóm 1

4. Ta nhận được bản kết quả



Trang 17

Bài tập lớn xác suất thống kê – Nhóm 1


Biện luận:
 F
A
= 602.7073171; F
0.05
= 2,90112
F
A
> F

0.05
 bác bỏ yếu tố H
A
 thu nhập phụ thuộc vào nghề chính
 F
B
= 35.55284553; F
0.05
= 2.90112
F
B
> F
0 05
 bác bỏ yếu tố H
B
 thu nhập phụ thuộc vào nghề phụ.
 F
AB
= 301,7487418; F
0.05
= 2.188766
F
AB
> F
0.05
bác bỏ yếu tố H
AB
 có sự tương tác năng suất giữa nghề chính và nghề
phụ.
Kết luận:

 Thu nhập phụ thuộc vào nghề chính
 Thu nhập phụ thuộc vào nghề phụ
 Có sự tương tác giữa nghề chính và nghề phụ.


×