Tải bản đầy đủ (.docx) (21 trang)

Bài tập lớn môn xác suất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (379.26 KB, 21 trang )

BÀI 1
Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C. Lượng sữa của các
con bò được thống kê trong bảng sau đây.

Loại bò

Lượng sữa
Ít

Trung Bình

Nhiều

A

92

37

46

B

53

15

19

C


75

19

12

Với mức ý nghĩa , hãy nhận định xem có phải ba giống bò này có phân
bố tỉ lệ như nhau về phương diện sữa hay không?

BÀI LÀM
A) DẠNG BÀI
_ Đây là bài toán kiểm định giả thuyết vể tỷ lệ.
B) PHƯƠNG PHÁP GIẢI
_ Ta tính các giá trị tổng hang, tổng cột và tổng cộng.
_ Từ đó ta tính ra được xác suất .
_ So sánh với ta sẽ kết luận được về phân bố tỉ lệ về phương diện sữa
của cả ba giống bò.
C) CÔNG CỤ GIẢI
_ Ta sử dụng công cụ Autosum của Excel để tính tổng hang tổng cột và
tổng cộng.
_ Ta sử dụng hàm CHITEST để tính giá trị xác suất


D) CÁC BƯỚC THỰC HIỆN
 Đặt giả thiết:
_ H0 : Các giống bò có tỉ lệ giống nhau về phương diện sữa.
_ H1 : Các giống bò có tỉ lệ khác nhau về phương diện sữa.
 Nhập giá trị vào bảng tính:

 Tính tổng hàng, tổng cột và tổng cộng.

_ Ta quét từ ô B5 đến ô E8.
_ Nhấn vào công cụ Autosum trên thanh công cụ.
_ Ta được bảng sau :

 Tính các tần số lý thuyết: (tổng hàng*tổng cột)/tổng cộng
_ Chọn B13: nhập =E5*$B$8/$E$8, rồi nhấn Enter, dùng con trỏ quét từ ô
B13 đến B15.


_ Chọn C13: nhập =E5*$C$8/$E$8, rồi Enter, dùng con trỏ quét từ C13
đến C15.
_ Chọn D13: nhập =E5*$D$8/$E$8, rồi Enter, dùng con trỏ quét từ D13
đến D15.

_ Áp dụng hàm CHITEST tính giá trị
_ Chọn B16, nhập =CHITEST(B5:D7;B13:D15) rồi Enter. Ta được giá trị

E) KẾT LUẬN.
_ Biện luận:
_ Kết luận:

nên bác bỏ giả thuyết H0.
Ba giống bò này có tỉ lệ khác nhau về phương diện sữa.


BÀI 2
Điều tra ý kiến của 6 nhân viên chính phủ về mức độ làm phát trong năm tới
thu được các giá trị 4,2% 5,1% 3,9% 4,7% 4,9% 5,8%. Trong khí đó hỏi ý kiến
của 6 nhà kinh tế đang làm việc tại các công ty cùng một vấn đề trên thì ta
nhận được các kết quả là: 5,7% 6,1% 5,2% 4,9% 4,6% và 5,5%. Với độ tin

cậy 95% hãy ước lượng mức lạm phát do các nhà kinh tế trong hai khu vực
kinh tế trên dự báo. VỚi mực ý nghĩa 5% hãy cho ý kiến về sự khác biệt của
các dự đoán trên. Giả thiết mức lạm phát là biến ngẫu nhiên phân phối chuẩn.

BÀI LÀM
A) DẠNG BÀI
_ Đây là dạng bài tìm khoảng ước lượng của giá trị trung bình và phân tích
phương sai một yếu tố của hai mẫu khác phương sai.
B) PHƯƠNG PHÁP GIẢI
_ Ta tìm độ lệch chuẩn và trung bình của hai mẫu.
_ Tra bảng phân phối Student để được giá trị Tα.
_ Từ đó ta có thể tính được
C) CÔNG CỤ GIẢI
_Ta sử dụng công cụ bảng Despritive Statistic để tính các độ lệch chuẩn và
trung bình của hai mẫu đã cho ở đề bài.
_ Ta dùng hàm TINV để tra phân phối Student tìm Tα.
_ Ta sử dụng công cụ bảng t-test : two samples assuming unequal variances.

D) CÁC BƯỚC THỰC HIỆN


1) Tìm khoảng ước lượng của mức lạm phát.
 Ta nhập giá trị hai mẫu vào bảng tính.

 Ước lượng mức lạm phát.
_ Ta vào Data chọn Despritive Statistic.

_ Trong bảng hiện ra ta điền các giá trị như sau:
 Input range: Quét từ ô A3 đến ô B9.
 Group by: collums.

 Tích vào Label in first row.
 Output range: ta chọn ô A15
 Tích vào summary statistic và confident level.


_ Ta được các giá trị trong bảng sau:

_ Để tính Tα tại ô I16 và I17 ta điền vào: =TINV(G16;H16-1)
_ Ta tính giá trị ԑ: tại ô K16 ta điền vào =I16*J16/SQRT(6). Ta quét
xuống tương tự cho ô I17.


2) Kiểm định sự khác biệt của các dự đoán.
 Ta vào Data/ t-test : two samples assuming unequal variances.

 Ta điền vào bảng t-test như sau :


 Từ đó ta được bảng t-test kết quả :

 Giá trị thống kê nằm ở :
 tSTAT = -1,599
 tCRIT = 2,228
Kết luận :
_ Do tSTAT < tCRIT nên chấp nhận giả thiết H0
_ Vậy dự đoán về mức lạm phát có sự giống nhau

BÀI 3
Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định
của tập số liệu sau đây. Với mức ý nghĩa , có kết luận gì về mối tương quan

giữa X và Y (Có phi tuyến không? Có tuyến tính không ? ). Tìm đường hồi quy
của Y đối với X
X

Y

X

Y

X

Y

X

Y

50

75

90

135

50

35


170

355

130

235

90

175

240

235

210

275


210

235

270

115

170


295

270

95

240

195

130

255

270

135

170

335

90

115

50

15


210

315

170

315

210

295

270

75

50

55

90

155

BÀI LÀM
A) DẠNG BÀI
_ Nhận xét: Đây là bài toán phân tích tương quan tuyến tình và phi tuyến, tìm
đường hồi quy tuyến tính của X và Y
B) CÔNG CỤ GIẢI

_ Ta sử dụng công cụ Data Analysis / Correlation để phân tích tương quan
tuyến tính.
_ Ta sử dụng công cụ Data Analysis/ Anova: single factor để phân tích tương
quan phi tuyến.
_ Ta sử dụng công cụ Data Analysis / Regression để tìm phương trình đượng
hồi quy của X và Y.

C) CÁC BƯỚC THỰC HIỆN.
1. Phân tích tương quan tuyến tính
 Giả thuyết H0: X và Y không có quan hệ tương quan tuyến tính.
 Giả thuyết H1: X và Y không có quan hệ tương quan tuyến tính.
 Nhập bảng giá trị:


 Vào Data/Data analysis, chọn Correlation:

 Trên màn hình xuất hiện hộp thoại Correlation, ta nhập vào như hình
sau:
 Input Range: ta kéo từ ô A3 đến ô B27.
 Grouped By: chọn Comlumns.
 Tích vào Label in First Row.


 Output Range: ta chọn ô D6.

Ta được kết quả như sau:

 Ta tìm được:
 Hệ số tương quan:
 Hệ số xác định


:

Ta có:
Mà :
(c là phân vị mức của phân bố Student với n-2=22 bậc tự do)
Vì nên chưa có cơ sở bác bỏ giả thuyết H0.
Vậy: Chưa kết luận được X và Y có tương quan tuyến tính.


2) Phân tích tương quan phi tuyến.
 Ta sửa lại bảng số liệu theo dạng sau:

 Ta đặt giả thiết:
_Giả thiết H0: X và Y không tương quan phi tuyến.
_ Giả thiết H1: X và Y tương quan phi tuyến.

 Vào Data/Data analysic, chọn Anova: Single Factor, Nhấn OK.

.
 Trong hội thoại Anova: Single Factor, ta điền các giá trị như hình sau:
 Input Range: ta kéo từ ô A4 đến ô H8.
 Grouped By: chọn Columns
 Tích vào Labels in first row
 Nhập 0.05 vào Alpha.


 Output Range: ta chọn ô A12.

 Ta được kết quả như sau:


 Rút ra được từ bảng Anova:
SSF = 237383,3
SST = 248383,3
Tính được:


=> Tỷ sô tương quan:
Suy ra:
Ta có:

(c là phân vị mức của phân bố Fisher bậc tự do (k-2,n-k)=(5,21))
Vì: F>c nên không chấp nhận giả thuyết H0.
Vậy X và Y có tương quan phi tuyến.
3) Tìm đường hồi quy của X và Y
 Giả thuyết H0: X và Y hồi quy tuyến tính
 Ta nhập bản giá trị.

 Vào Data/Data Analysic, chọn Regression.


 Trong hội thoại Regression ta nhập vào các giá trị như hình sau:
 Input Y Range: ta chọn từ ô B3 đến ô B27.
 Input X Range: ta chọn từ ô A3 đến ô A27.
 Tích vào Labels.
 Tích vào mục Line Fit Plots
 Output Range: chọn ô D6. Nhấ OK

Ta được kết quả như sau.



 Kết luận: Đường hồi quy của Y đối với X là:

Y

X Line Fit Plot
400
300
200
100
0

Y
Predicted Y
0

50

100

150

200

250

300

X


BÀI 4
Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về
số lượng học sinh trung bình đến lớp muộn của các trường đó như sau:
Ngày trong

Trường PTTH

tuần

A

B

C

D

Thứ hai

5

4

5

7


Thứ tư


4

5

3

2

Thứ sáu

4

3

4

5

Thứ bảy

4

4

3

2

Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường. Chọn .


BÀI LÀM
A) DẠNG BÀI
_ Đây là bài toán phân tích phương sai hai yếu tố không lặp
B) PHƯƠNG PHÁP GIẢI
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố
trên các giá trị quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
 Giả thuyết:
 “Các giá trị trung bình bằng nhau”
 “Ít nhất có hai giá trị trung bình khác nhau”
 Giá trị thống kê:

 Biện luận:
Nếu => Chấp nhận H0 (yếu tố A)
Nếu => Chấp nhận H0 (yếu tố B).

C) CÔNG CỤ GIẢI
_ Ta sử dụng công cụ bảng Anova: two factor without replication.
D) CÁC BƯỚC THỰC HIỆN
 Ta đặt giả thuyết:
_ H01: yếu tố ngày không ảnh hưởng đến số lượng học sinh trung bình
đến lớp muộn của các trường đó.


_ H02: yếu tố trường khác không ảnh hưởng đến số lượng học sinh trung
bình đến lớp muộn của các trường đó.



Nhập bảng số liệu vào excel




Vào Data/Data analysis, chọn Anova: Two-Factor Without Replication,
bấm OK.

 Trên màn hình sẽ hiện lên hộp thoại của Anova: Two-Factor Without
Replication như hình dưới:

 Ta nhập các thông số như hình bên dưới:
 Input Range: ta quét từ ô B5 tới ô E8.
 Ta tích vào Labels.


 Vào mục Alpha và đổi thành 0,01
 Output Range: ta chọn A11

 Ta được kết quả như sau:

E) KẾT LUẬN
 Biện luận


Ta thấy: => Chấp nhận H01.
=> Chấp nhận H02.
 Vậy cả 2 yếu tố ngày trong tuần và trường khác đều không ảnh hưởng
đến số lượng học sinh trung đi đến lớp muộn.





×