TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM
BÁO CÁO BÀI TẬP LỚN
XÁC SUẤT THỐNG KÊ
GVHD: TS. Nguyễn Bá Thi
Họ và tên SV: Trương Quang Thịnh
MSSV: 1413803
Lớp:
L12-C
Nhóm: 10
TP.Hồ Chí Minh, tháng 11 năm 2015
MỤC LỤC
Đề tài
trang 4
Bài làm
Bài 1……………………………………………………………………..
trang 6
Bài 2……………………………………………………………………..
trang 10
Bài 3……………………………………………………………………..
trang 13
Bài 4……………………………………………………………………..
trang 17
2
Đề tài nhóm 10
Bài 1: Một nông trường nuôi bò nuôi 3 giống bò sữa A, B,C. Lượng sữa của các con bò
được thống kê trong bảng sau đây
Loại bò
Lượng sữa
Ít
Trung Bình
Nhiều
A
92
37
46
B
53
15
19
C
74
19
12
Với mức ý nghĩa , hãy nhận định xem có phải ba giống bò này có phân bố tỉ lệ như
nhau về phương diện sữa hay không?
Bài 2: Điều tra ý kiến của 6 nhà kinh tế đang làm việc trong các cơ quan của chính phủ
về mức lạm phát trong năm tới thu được các giá trị 4,2%, 5,1%, 3,9%, 4,7%, 4,9% và
5,8%. Trong khi đó hỏi ý kiến 6 nhà kinh tế đang làm việc tại các công ty cùng về vấn đề
trên thì thu được các kết quả là 5,7%, 6,1%, 5,2%, 4,9%, 4,6% và 5,5%.
a/ Với độ tin cậy 95% hãy ước lượng mức lạm phát do các nhà kinh tế làm việc
trong hai khu vực kinh tế nói trên dự báo.
b/ Với mức ý nghĩa 5% hãy cho ý kiến về sự khác biệt của các dự đoán trên .Giả
thiết mức lạm phát là biến ngẫu nhiên phân phối chuẩn.
Bài 3: Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về số
lượng học sinh trung bình đến lớp muộn của các trường đó như sau
3
Trường PTTH
Ngày trong
tuần
A
B
C
D
Thứ hai
5
4
5
7
Thứ tư
4
5
3
2
Thứ sáu
4
3
4
5
Thứ bảy
4
4
3
2
Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường. Chọn .
Bài 4: Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập
số liệu sau đây. Với mức ý nghĩa , có kết luận gì về mối tương quan giữa X và Y (Có phi
tuyến không? Có tuyến tính không ? ). Tìm đường hồi quy của Y đối với X
X
Y
X
Y
X
Y
X
Y
50
75
90
135
50
35
170
355
130
235
90
175
240
235
210
275
210
235
270
115
170
295
270
95
240
195
130
255
270
135
170
335
90
115
50
15
210
315
170
315
210
295
270
75
50
55
90
155
BÀI 1:
Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C. Lượng sữa của các con bò được
thống kê trong bảng sau đây
Loại bò
Lượng sữa
4
Ít
Trung Bình
Nhiều
A
92
37
46
B
53
15
19
C
74
19
12
Với mức ý nghĩa , hãy nhận định xem có phải ba giống bò này có phân bố tỉ lệ như
nhau về phương diện sữa hay không?
Bài làm:
I/ Dạng bài:
Đây là bài toán kiểm định giả thiết vể tỉ lệ.
II/ Phương pháp giải:
Đặt giả thuyết H0: Tỉ lệ sữa của ba giống bò này có phân phân bố tỉ lệ như nhau.
Ta có
0.05
Tính các tần số lý thuyết
Tính
P(X> ) rồi so sánh với
Nếu P >
P<
chấp nhận giả thiết H0
bác bỏ giả thuyết H0
III/ Giải trên excel
Nhập giá trị vào bảng tính:
5
Tính tổng các số:
• Tổng hàng.
• Tổng cột.
• Tổng cộng.
Tính các tần số lý thuyết:
(=tổng hàng*tổng cột)/tổng cộng)
Loại A: Nhập vào ô B11: =E3*$B$6/$E$6, rồi Enter, dùng con trỏ để ở góc phải ô
B11 kéo từ B11 đến B13.
Loại B: Nhập vào ô C11: =E3*$C$6/$E$6, rồi Enter, dùng con trỏ để ở góc phải
ô C11 kéo từ C11 đến C13.
Loại C: Nhập vào ô D11: =E3*$D$6/$E$6, rồi Enter, dùng con trỏ để ở góc phải
ô D11 kéo từ D11 đến D13.
6
•
Áp dụng hàm số CHITEST tính giá trị
Chọn ô B15, nhập =CHITEST(B3:D5;B11:D13), rồi Enter.
Biện luận:
Bác bỏ giả thuyết H0.
Kết luận:
Ba giống bò này có tỉ lệ khác nhau về phương diện sữa.
7
8
BÀI 2
Điều tra ý kiến về mức lạm phát trong năm tới của 6 nhà kinh tế làm việc ở cơ quan nhà
nước và 6 nhà kinh tế làm việc ở cơ quan tư nhân thu được kết quả:
Thuộc
Thứ tự nhà kinh tế được hỏi
1
2
3
4
5
6
Nhà nước
4,2%
5,1%
3,9%
4,7%
4,9%
5,8%
Tư nhân
5,7%
6,1%
5,2%
4,9%
4,6%
5,5%
Với độ tin cậy là γ=95%, hãy ước lượng mức lạm phát do các nhà kinh tế đó dự báo. Với
mức ý nghĩa α=5%, hãy cho ý kiến về sự khác biệt của các dự đoán trên. Giả thiết mức
lạm phát là biến ngẫu nhiên phân phối chuẩn.
Bài làm:
I/ Dạng bài: Ước lượng khoảng trung bình và kiểm định giả thuyết về giá trị trung bình
II/ Phương pháp giải:
Tra bảng tìm phân phối student của
Tính độ lệch mẫu S cho các mẫu
Tính trung bình của từng mẫu
Từ đó =>
Từ đó ta có ước lượng cho các mẫu
9
Chưa biết
và n<30
Tính
So sánh
Biện luận:
III/ Giải trên excel:
Công cụ: Descriptive Statistics trong Excel
Vào Data Analysis và chọn công cụ Descriptive Statistics
Hộp thoại Descriptive Statistics
10
Input Range: Mảng dữ liệu đầu vào ( từ B8 đến C15).
Grouped By:
o Columns: Nếu bảng dữ liệu trình bày theo cột.
o Rows: Nếu bảng dữ liệu trình bày theo hàng.
Labels in first row (column): Nếu có tên của đối tượng ở hàng (cột) đầu tiên.
Output Range: Nơi xuất dữ liệu (ô A23)
Chọn Summary statistics
Chọn Confidence Level for Mean: Độ tin cậy (95%)
Chọn OK
Ta được bảng kết quả:
11
Kết luận: Từ những giá trị trong bảng kết quả, ta tính được ước lượng lạm phát do các nhà kinh
tế trong 2 khu vực:
Lạm phát nhà kinh tế làm việc ở các công ty:
Lạm phát nhà kinh tế làm việc ở chính phủ:
Giả thiết H: Độ lạm phát của hai các nhà kinh tế ở các công ty là như nhau.
Xét:
H đúng
H sai
Nếu H sai:
•
•
12
Công cụ: “t-Test: Two-Sample Assuming Unequal Variances” trong Excel.
Vào Data Analysis và chọn công cụ “t-Test: Two-Sample Assuming Unequal Variances”
Hộp thoại công cụ:
•
•
•
•
•
•
Variable 1 Range: Mảng dữ liệu mẫu 1 (Từ ô B15 đến ô B21)
Variable 2 Range: Mảng dữ liệu mẫu 2 (Từ ô C15 đến ô C21)
Chọn Labels: Vì có tên mẫu.
Alpha: Mức ý nghĩa (5%)
Output Range: Nơi xuất kết quả. (Ô C24)
Chọn OK
Ta được bảng kết quả:
13
Kết luận
Vì
H đúng: Độ lạm phát của hai các nhà kinh tế ở các công
ty là như nhau.
BÀI 3
14
Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được số liệu về số
lượng học sinh trung bình đến lớp muộn của các trường đó như sau:
Trường PTTH
Ngày trong
tuần
A
B
C
D
Thứ hai
5
4
5
7
Thứ tư
4
5
3
2
Thứ sáu
4
3
4
5
Thứ bảy
4
4
3
2
Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của các trường. Chọn .
Bài làm:
I/ Dạng bài: Đây là bài kiểm định giá trị trung bình.
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị
quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
Giả thuyết:
“Các giá trị trung bình bằng nhau”
“Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
Biện luận:
Nếu => Chấp nhận H0 (yếu tố A)
Nếu => Chấp nhận H0 (yếu tố B).
•
Ta giả thuyết:
H01: yếu tố ngày ảnh hưởng đến số lượng học sinh trung bình đến lớp muộn
của các trường đó.
H02: yếu tố trường khác ảnh hưởng đến số lượng học sinh trung bình đến lớp
muộn của các trường đó.
II/ Giải trong Excel:
Nhập bảng số liệu như hình dưới:
15
Vào Data/Data analysis, chọn Anova: Two-Factor Without Replication, bấm
OK.
Trên màn hình sẽ hiện lên hộp thoại của Anova: Two-Factor Without
Replication như hình dưới:
Ta nhập các thông số như hình bên dưới:
+ Phạm vi của biến sô Y (Input Range): ta kéo từ ô A2 tới ô E6
+ Nhấp vào Labels, điền giá trị Alpha 0.1
+ Tọa độ đầu ra Output Range: nhấp vào A8.
16
+ Nhấn OK.
Ta được kết quả như sau:
Biện luận
Ta thấy: => Bác bỏ H01.
=> Bác bỏ H02.
Vậy cả 2 yếu tố ngày trong tuần và trường khác đều không ảnh hưởng đến số
lượng học sinh trung đi đến lớp muộn.
17
Bài 4
Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số
liệu sau đây. Với mức ý nghĩa , có kết luận gì về mối tương quan giữa X và Y (Có phi
tuyến không? Có tuyến tính không ? ). Tìm đường hồi quy của Y đối với X
X
Y
X
Y
X
Y
X
Y
50
75
90
135
50
35
170
355
130
235
90
175
240
235
210
275
210
235
270
115
170
295
270
95
240
195
130
255
270
135
170
335
90
115
50
15
210
315
170
315
210
295
270
75
50
55
90
155
Bài làm
I/ Dạng bài: Đây là bài toán phân tích tương quan, phân tích hồi quy tuyến tính
II/ Giải trên excel:
Phân tích tương quan tuyến tính
Nhập bảng giá trị:
18
Vào Data/Data analysis, chọn Correlation:
Trên màn hình xuất hiện hộp thoại Correlation, ta nhập vào như hình sau:
19
+ Phạm vi đầu vào (Input Range), ta kéo từ ô A1 đến ô B25.
+ Ở Grouped By: chọn Comlumns.
+ Đánh dấu vào Label in First Row.
+ Tọa độ đầu ra (Output Range): ta chọn ô D4. Nhấn OK.
Ta được kết quả như sau:
20
Ta tìm được:
+ Hệ số tương quan:
+ Hệ số xác định :
Giả thuyết H0: X và Y có quan hệ tương quan tuyến tính.
Ta có:
Mà :
(c là phân vị mức của phân bố Student với n-2=22 bậc tự do)
Vì nên bác bỏ giả thuyết H0.
Vậy: X và Y không có tương quan tuyến tính.
Phân tích tương quan phi tuyến:
21
Phân tích lại bảng số liệu:
Vào Data/Data analysic, chọn Anova: Single Factor, Nhấn OK.
Trên màn hình xuất hiện Anova: Single Factor.
Trong hội thoại Anova: Single Factor, ta điền các giá trị như hình sau:
+ Phạm vi đầu vào (Input Range): ta kéo từ ô B1 đến ô H5.
+ Trong Grouped By: chọn Columns
22
+ Chọn Labels in first row
+ Nhập 0.05 vào Alpha.
+ Tọa độ đầu ra (Output Range): ta chọn ô A8.
Ta được kết quả như sau:
23
Rút ra được từ bảng Anova:
SSF = 237383,3
SST = 248383,3
Tính được:
=> Tỷ sô tương quan:
Suy ra:
+ Giả thiết H0: X và Y có tương quan phi tuyến
Ta có:
Mà
(c là phân vị mức của phân bố Fisher bậc tự do (k-2,n-k)=(5,21))
Vì: F>c nên chấp nhận giả thuyết H0.
Vậy X và Y có tương quan phi tuyến.
Tìm đường hồi quy của X và Y
24
Giả thuyết H0: X và Y hồi quy tuyến tính
Ta nhập bản giá trị.
Vào Data/Data Analysic, chọn Regression.
Trong hội thoại Regression ta nhập vào các giá trị như hình sau:
+ Phạm vi đầu vào Y (Input Y Range): ta chọn từ ô B1 đến ô B25.
25