Tải bản đầy đủ (.docx) (24 trang)

Bài tập lớn môn xác suất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (469.99 KB, 24 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ
Giáo viên hướng dẫn: Nguyễn Bá Thi.
MỤC LỤC
Đề tài nhóm 10
Bài 1: Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C. Lượng sữa của các con bò
được thống kê trong bảng sau đây
Loại bò
Lượng sữa
Ít Trung Bình Nhiều
A
B
C
92
53
74
37
15
19
46
19
12
Với mức ý nghĩa , hãy nhận định xem có phải ba giống bò này có phân bố tỉ lệ như
nhau về phương diện sữa hay không?
Bài 2: So sánh mức lợi nhuận trung bình trong kinh doanh của một Công ty tại 5 thị
trường khác nhau trên cơ sở bảng số liệu thống kê sau đây với :
Số thứ tự
quan sát
Thị trường
I II III IV V


1
2
3
4
7,3
7,6
8,3
8,3
5,4
7,1
7,4
6,4
8,1
7,9
9,5
9,6
7,1
Bài 3: Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về số
lượng học sinh trung bình đến lớp muộn của các trường đó như sau:
Ngày trong
tuần
Trường PTTH
A B C D
Thứ hai
Thứ tư
Thứ sáu
Thứ bảy
5
4
4

4
4
5
3
4
5
3
4
3
7
2
5
2
Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường. Chọn .
Bài 4: Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập
số liệu sau đây. Với mức ý nghĩa , có kết luận gì về mối tương quan giữa X và Y (Có phi
tuyến không? Có tuyến tính không ? ). Tìm đường hồi quy của Y đối với X
X Y X Y X Y X Y
50
130
210
240
90
210
75
235
235
195
115
295

90
90
270
130
50
270
135
175
115
255
15
75
50
240
170
270
210
50
35
235
295
135
315
55
170
210
270
170
170
90

355
275
95
335
315
155
BÀI 1:
Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C. Lượng sữa của các con bò được
thống kê trong bảng sau đây
Loại bò
Lượng sữa
Ít Trung Bình Nhiều
A
B
C
92
53
74
37
15
19
46
19
12
Với mức ý nghĩa , hãy nhận định xem có phải ba giống bò này có phân bố tỉ lệ như
nhau về phương diện sữa hay không?
BÀI LÀM
 Nhận xét: Đây là bài toán kiểm định giả thuyết vể tỷ lệ.
 Giải thuyết H
0

: Tỷ lệ sữa của ba giống bò này có phân phân bố tỉ lệ như nhau.
THỰC HIỆN BÀI TOÁN BẰNG EXCEL
• Nhập giá trị vào bảng tính:
• Tính tổng các số:
• Tổng hàng: Chọn E3, nhập =SUM(B3:D3), rồi Enter, dùng con trỏ kéo nút
tự điều khiển từ điền từ E4 đến E5.
• Tổng cột: Chọn B6, nhập =SUM(B3:B5), rồi Enter, dùng con trỏ kéo nút tự
điều khiển từ B6 đến D6.
• Tổng cộng: chọn E8 và nhập =SUM(E3:E5).
• Tính các tần số lý thuyết: (tổng hàng*tổng cột)/tổng cộng
• A: Chọn B11: nhập =E3*$B$6/$E$6, rùi Enter, dùng con trỏ kéo nút tự điều
khiển từ B11 đến B13.
• B: Chọn C11: nhập =E3*$C$6/$E$6, rồi Enter, dùng con trỏ kéo nút tự điều
khiển từ C11 đến C13.
• C: Chọn D11: nhập =E3*$D$6/$E$6, rồi Enter, dùng con trỏ kéo nút tự điều
khiển từ D11 đến D13.
• Áp dụng hàm số CHITEST tính giá trị
Chọn B15, nhập =CHITEST(B3:D5,B11:D13), rồi Enter.
 Biện luận:
 Bác bỏ giả thuyết H
0
.
 Kết luận: Ba giống bò này có tỉ lệ khác nhau về phương diện sữa.
BÀI 2
So sánh mức lợi nhuận trung bình trong kinh doanh của một Công ty tại 5 thị
trường khác nhau trên cơ sở bảng số liệu thống kê sau đây với :
Số thứ tự
quan sát
Thị trường
I II III IV V

1
2
3
4
7,3
7,6
8,3
8,3
5,4
7,1
7,4
6,4
8,1
7,9
9,5
9,6
7,1
BÀI LÀM
• Nhận xét: Đây là bài toán phân tích phương sai một yếu tố.
Sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu
tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Y
i
(i=1,2,…,k)
 Giả thuyết:
 “Các giá trị trung bình bằng nhau”
 “Ít nhất có hai giá trị trung bình khác nhau”.
 Giá trị thống kê:
 Biện luận:
Nếu  Chấp nhận giả thiết H
0

.
• Ta giả thuyết H
0
: mức lợi lợi nhuận trung bình trong kinh doanh của một Công
ty tại 5 thị trường là như nhau.
THỰC HIỆN BÀI TOÁN BẰNG EXCEL
Nhập bản số liệu:
Vào Data/Data analysis, chọn Anova: Singer Factor.
Trên màn hình sẽ hiện ra hội thoại của Anova: Single Factor.
Ta nhập thông sô như hình bên dưới:
+ Phạm vi biến số Y (Input Range): ta kéo từ A1 đến E5
+ Group By: chọn Columns
+ Nhấp vào Labels in First Row
+ Nhận giá trị 0.1 vào Alpha.
+ Tọa độ đầu ra Output Range: nhấp vào A8. Nhấn OK.
Ta được kết quả như sau:
Biện luận:
Ta thấy
=> Bác bỏ giả thuyết H
0
với mức ý nghĩ
Vậy mức lợi nhuận trung bình trong kinh doanh của một Công ty tại 5 thị
trường khác nhau thì khác nhau.
BÀI 3
Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về số lượng
học sinh trung bình đến lớp muộn của các trường đó như sau:
Ngày trong
tuần
Trường PTTH
A B C D

Thứ hai
Thứ tư
Thứ sáu
Thứ bảy
5
4
4
4
4
5
3
4
5
3
4
3
7
2
5
2
Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường. Chọn .
BÀI LÀM
• Nhận xét: Đây là bài toán phân tích phương sai hai tố không lặp
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị
quan sát Y
ij
(i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
 Giả thuyết:
 “Các giá trị trung bình bằng nhau”
 “Ít nhất có hai giá trị trung bình khác nhau”

 Giá trị thống kê:

 Biện luận:
Nếu => Chấp nhận H
0
(yếu tố A)
Nếu => Chấp nhận H
0
(yếu tố B).
• Ta giả thuyết:
H
01
: yếu tố ngày không ảnh hưởng đến số lượng học sinh trung bình đến lớp
muộn của các trường đó.
H
02
: yếu tố trường khác không ảnh hưởng đến số lượng học sinh trung bình
đến lớp muộn của các trường đó.
THỰC HIỆN BÀI TOÁN BẰNG EXCEL
• Nhập bảng số liệu như hình dưới:
• Vào Data/Data analysis, chọn Anova: Two-Factor Without Replication, bấm
OK.
• Trên màn hình sẽ hiện lên hộp thoại của Anova: Two-Factor Without
Replication như hình dưới:
• Ta nhập các thông số như hình bên dưới:
+ Phạm vi của biến sô Y (Input Range): ta kéo từ ô A2 tới ô E6
+ Nhấp vào Labels, điền giá trị Alpha 0.1
+ Tọa độ đầu ra Output Range: nhấp vào A8.
+ Nhấn OK.
• Ta được kết quả như sau:

• Biện luận
Ta thấy: => Chấp nhận H
01
.
=> Chấp nhận H
02.
Vậy cả 2 yếu tố ngày trong tuần và trường khác đều không ảnh hưởng đến số
lượng học sinh trung đi đến lớp muộn.
BÀI 4
Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số
liệu sau đây. Với mức ý nghĩa , có kết luận gì về mối tương quan giữa X và Y (Có phi
tuyến không? Có tuyến tính không ? ). Tìm đường hồi quy của Y đối với X
X Y X Y X Y X Y
50
130
210
240
90
210
75
235
235
195
115
295
90
90
270
130
50

270
135
175
115
255
15
75
50
240
170
270
210
50
35
235
295
135
315
55
170
210
270
170
170
90
355
275
95
335
315

155
BÀI LÀM
• Nhận xét: Đây là bài toán phân tích tương quan, phân tích hồi quy tuyến tính
THỰC HIỆN BÀI TOÁN BẰNG EXCEL
(i) Phân tích tương quan tuyến tính
• Nhập bảng giá trị:
• Vào Data/Data analysis, chọn Correlation:
• Trên màn hình xuất hiện hộp thoại Correlation, ta nhập vào như hình sau:
+ Phạm vi đầu vào (Input Range), ta kéo từ ô A1 đến ô B25.
+ Ở Grouped By: chọn Comlumns.
+ Đánh dấu vào Label in First Row.
+ Tọa độ đầu ra (Output Range): ta chọn ô D4. Nhấn OK.
Ta được kết quả như sau:
• Ta tìm được:
+ Hệ số tương quan:
+ Hệ số xác định :
• Giả thuyết H
0
: X và Y không có quan hệ tương quan tuyến tính.
Ta có:
Mà :
(c là phân vị mức của phân bố Student với n-2=22 bậc tự do)
Vì nên chưa có cơ sở bác bỏ giả thuyết H
0
.
Vậy: Chưa kết luận được X và Y có tương quan tuyến tính.
(ii) Phân tích tương quan phi tuyến:
• Phân tích lại bảng số liệu:
• Vào Data/Data analysic, chọn Anova: Single Factor, Nhấn OK.
• Trên màn hình xuất hiện Anova: Single Factor.

• Trong hội thoại Anova: Single Factor, ta điền các giá trị như hình sau:
+ Phạm vi đầu vào (Input Range): ta kéo từ ô B1 đến ô H5.
+ Trong Grouped By: chọn Columns
+ Chọn Labels in first row
+ Nhập 0.05 vào Alpha.
+ Tọa độ đầu ra (Output Range): ta chọn ô A8.
• Ta được kết quả như sau:
• Rút ra được từ bảng Anova:
SSF = 237383,3
SST = 248383,3
Tính được:
=> Tỷ sô tương quan:
Suy ra:
+ Giả thiết H
0
: X và Y không tương quan phi tuyến
Ta có:

(c là phân vị mức của phân bố Fisher bậc tự do (k-2,n-k)=(5,21))
Vì: F>c nên không chấp nhận giả thuyết H
0
.
Vậy X và Y có tương quan phi tuyến.
(iii) Tìm đường hồi quy của X và Y
• Giả thuyết H
0
: X và Y hồi quy tuyến tính
• Ta nhập bản giá trị.
• Vào Data/Data Analysic, chọn Regression.
• Trong hội thoại Regression ta nhập vào các giá trị như hình sau:

+ Phạm vi đầu vào Y (Input Y Range): ta chọn từ ô B1 đến ô B25.
+ Phạm vi đầu vào X (Input X Range): ta chọn từ ô A1 đến ô A25.
+ Nhấp vào Labels.
+ Nhấp vào Line Fit Plots
+ Tọa đồ đầu ra (Output Range): chọn ô D1. Nhấ OK
Ta được kết quả như sau.
• Kết luận: Đường hồi quy của Y đối với X là:

×