Tải bản đầy đủ (.doc) (17 trang)

Báo cáo bài tập lớn xác suất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (388.44 KB, 17 trang )

ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
…………oOo…………
BÁO
CÁO
BÀI
TẬP
LỚN
XÁC SUẤT THỐNG KÊ
GVHD: Nguyễn Bá Thi
Sinh viên: Nguyễn Hoàng Minh
MSSV: 51001955
Lớp: A09
Nhóm: 3
2
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
Thành phố Hồ Chí Minh, 05/2014
Sinh viên: Nguyễn Hoàng Minh
3
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
Mục lục
Mục lục 3
Câu 1 4
Câu 2 8
Câu 3 9
Câu 4 15
Sinh viên: Nguyễn Hoàng Minh
4
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
Câu 1.
Một xí nghiệp may sản xuất áo khoác với 4 màu: đỏ, xanh, vàng và tím than. Số khách hàng nam và nữ


mua áo khoác với các màu được ghi trong bảng sau:
Với mức ý nghĩa 1% hãy so sánh tỉ lệ khách hàng nam và nữ ưa chuộng các màu sắc nói trên.
Bài giải:
Dạng bài: bài toán kiểm định giả thiết tỷ lệ.
Giả thiết H
0
: Tỷ lệ khách hàng ưa chuộng các màu sắc nói trên là như nhau trong 2 nhóm.
Thực hiện bài toán bằng Excel:
1. Nhập dữ liệu vào bảng tính:
2. Tính các tổng số:
 Tổng hàng: chọn ô F2 và nhập biểu thức = SUM(B2:E2)
 Dùng con trỏ kéo nút tự điền từ ô F2->F3
 Tổng cột: chọn ô B4 và nhập biểu thức =SUM(B2:B3)
 Dùng con trỏ kéo nút tự điền từ ô B4->E4
 Tổng cộng: chọn ô F4 và nhập biểu thức = SUM(B4:E4)
Sinh viên: Nguyễn Hoàng Minh
Đỏ Xanh Vàng Tím than
Nữ 62 34 71 42
Nam 125 223 52 54
5
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
3. Tính các tần số lý thuyết:
 Nữ thích màu đỏ: chọn ô B7 và nhập biểu thức = B4*F2/F4.
 Nữ thích màu xanh: chọn ô C7 và nhập biểu thức = C4*F2/F4.
 Nữ thích màu vàng: chọn ô D7 và nhập biểu thức = D4*F2/F4.
 Nữ thích màu tím than: chọn ô E7 và nhập biểu thức = E4*F2/F4.
 Nam thích màu đỏ: chọn ô B8 và nhập biểu thức =B4*F3/F4.
 Nam thích màu xanh: chọn ô C8 và nhập biểu thức =C4*F3/F4.
 Nam thích màu vàng: chọn ô D8 và nhập biểu thức =D4*F3/F4.
 Nam thích màu tím than: chọn ô E8 và nhập biểu thức =E4*F3/F4.

Sinh viên: Nguyễn Hoàng Minh
6
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
4. Áp dụng hàm số CHITEST:
Chọn ô B10 và nhập vào =CHITEST(B2:E3,B7:E8)
Ta sẽ có được kết quả của P(X>X²):
Sinh viên: Nguyễn Hoàng Minh
7
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
Biện luận: Giá trị P = 0.0000000000000000017151444 < α = 0.01 => bác bỏ giả thiết H
0
.
Kết luận: Tỷ lệ khách hàng ưa chuộng các màu sắc nói trên là khác nhau trong 2 nhóm nam và nữ.
Sinh viên: Nguyễn Hoàng Minh
8
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
Câu 2.
Lượng sữa vắt được bởi 16 con bò cái khi cho nghe các loại nhạc khác nhau (nhạc nhẹ, nhạc rốc, nhạc cổ
điển, không có nhạc) được thống kê trong bảng sau đây:
Với mức ý nghĩa 5%, nhận định xem lượng sữa trung bình của mỗi nhóm trên như nhau hay khác nhau.
Liệu âm nhạc có ảnh hưởng đến lượng sữa của các con bò hay không?
Bài giải:
Dạng bài: bài toán kiểm định giả thiết giá trị trung bình.
Giả thiết H
0
: Lượng sữa trung bình khi cho các con bò nghe các loại nhạc nói trên là như nhau.
Thực hiện bài toán bằng Excel:
1. Nhập dữ liệu vào bảng tính:
2. Mở Data
Analysis chọn

Anova Single
Factor
3. Hộp thoại
Anova
Single
Factor xuất
hiện
Sinh viên: Nguyễn Hoàng Minh
Nhạc nhẹ 15 18 22 17
Nhạc rốc 13 20 16 15
Nhạc cổ điển 15 19 24 28
Không có nhạc 14 23 17 14
9
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
 Input Range: phạm vi đầu vào (ô D20  ô H23)
 Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)
 Labels in first column: nhãn ở cột đầu tiên (chọn)
 Alpha: giá trị α (0,05)
 Output Range: phạm vi dữ liệu xuất ra (ô C26)
4. Ta nhận
được bảng
kết quả:
Biện luận: F quan sát = 1,35468 < F
ngưỡng = 3,490295 => chấp nhận giả
thiết H
0
.
Kết luận: Lượng sữa trung bình khi cho
các con bò nghe các loại nhạc nói trên là
như nhau.

Câu 3.
Từ 12 cặp quan sát (xi, yi) sau đây của cặp hai biến (X, Y), tính tỷ số tương quan, hệ số tương quan và hệ
số xác định của Y đối với X. Với mức ý nghĩa α = 5%, có kết luận gì về mối tương quan giữa X và Y (Có phi
tuyến không? Có tuyến tính không?). Tìm đường hồi quy của Y đối với X.
X 123 356 111 118 123 356 111 118 123 356 111 118
Y 4,2 4,1 3,7 3,9 4,5 4,1 3 3,8 2 3,1 3,4 3
Bài giải:
Sinh viên: Nguyễn Hoàng Minh
10
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
Dạng bài: bài toán kiểm định tương quan và hồi quy.
Thực hiện bài toán bằng Excel:
 Phân tích tương quan tuyến tính
Giả thiết H
0
: X và Y không có tương quan tuyến tính.
1. Nhập dữ liệu vào bảng tính:
2. Mở Data Analysis chọn Correlation
3. Hộp thoại Correlation xuất hiện
 Input Range: phạm vi đầu vào (ô C15  ô O16)
 Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)
 Labels in first column: nhãn ở cột đầu tiên (chọn)
 Output Range: phạm vi dữ liệu xuất ra (ô C19)
4. Ta
nhận
được
bảng
kết
quả:
Biện luận:

 n = 12
Sinh viên: Nguyễn Hoàng Minh
11
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
 Từ bảng kết quả, ta tìm được hệ số tương quan r = 0,177098
 Hệ số xác định r² = 0,031364
 Giá trị T = 0,569028
 Phân phối Student mức α = 0,05 với bậc tự do n-2 = 10:
c = T.INV.2T(0,05;10) = 2,228139
 |T| < c nên chưa bác bỏ giả thiết H
0
(chấp nhận giả thiết H
0
)
Kết luận:
Vậy X và Y không có tương quan tuyến tính.
 Phân tích tương quan phi tuyến
Giả thiết H
1
: X và Y không có tương quan phi tuyến.
1. Nhập dữ liệu vào bảng tính sau khi đã sắp xếp lại:
2. Mở Data
Analysis
chọn
Anova
Single Factor
3. Hộp thoại Anova Single Factor xuất hiện
 Input Range: phạm vi đầu vào (ô D27  ô G30)
 Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
 Labels in first row: nhãn ở cột đầu tiên (chọn)

 Alpha: giá trị α (0,05)
 Output Range: phạm vi dữ liệu xuất ra (ô C33)
Sinh viên: Nguyễn Hoàng Minh
12
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
4. Ta
nhận
được
bảng
kết
quả:
Biện luận:
 n = 12 , k = 4
 Tổng bình phương giữa
các nhóm SSF = 0,24
 Tổng bình phương nhân
tố SST = 5,366667
 η
2
Y/X
= SSF/SST = 0,04472
 Tỷ số tương quan :
η
Y/X
= 0,211472
 Giá trị F = 0,055929
 Phân bố Fisher mức α =
0,05 với bậc tự do (k-2,
n-k) = (2, 8)
c = F.INV.RT(0,05; 2; 8) = 4,45897

 F < c chấp nhận giả thiết H
1
Kết luận:
X và Y không có tương quan phi tuyến.
 Phân tích đường hồi quy
Giả thiết H: Hệ số không thích hợp.
Sinh viên: Nguyễn Hoàng Minh
13
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
1. Nhập dữ liệu vào bảng tính theo cột dọc:
2. Mở Data Analysis chọn
Regression
3. Hộp thoại Regression xuất
hiện
 Input Y Range: phạm vi
đầu vào (ô D61  ô
D73)
 Input X Range: phạm vi
đầu vào (ô C61  ô
C73)
 Labels: nhãn (chọn)
 Line Fit Plots: vẽ đồ thị (chọn)
 Output Range: phạm vi dữ liệu xuất ra (ô F61)
4. Ta
nhận
được
bảng
kết
quả:
Sinh viên: Nguyễn Hoàng Minh

14
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
Biện luận:
Sinh viên: Nguyễn Hoàng Minh
15
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
 Hệ số góc = 0,001145
 Hệ số tự do = 3,363998
 Giá trị P của hệ số tự do (P-value) = 9,95x10
-6
< α = 0,05 => Bác bỏ giả thiết H
 Hệ số tự do có ý nghĩa thống kê
 Giá trị P của hệ số góc (P-value) = 0,581892 > α = 0,05 => Chấp nhận giả thiết H
 Hệ số góc không có ý nghĩa thống kê
 Giá trị F (Significance F) = 0,581892 > α = 0,05 => Chấp nhận giả thiết H
 Phương trình đường hồi quy không thích hợp
Kết luận phân tích đường hồi quy:
Phương trình đường hồi quy không thích hợp.
Kết luận:
Tỷ số tương quan η
Y/X
= 0,211472
Hệ số tương quan r = 0,177098
Hệ số xác định r² = 0,031364
X và Y không có tương quan tuyến tính với mức ý nghĩa 5%.
X và Y không có tương quan phi tuyến với mức ý nghĩa 5%.
Phương trình đường hồi quy của Y đối với X: Y = 0,001145X + 3,363998 là không thích hợp.
Câu 4.
Với mức ý nghĩa 0,05 , hãy phân tích sự biến động của thu nhập ($/tháng/người) trên cơ sở số liệu điều
tra về thu nhập trung bình của 4 loại ngành nghề ở 4 khu vực khác nhau sau đây:

Loại ngành
nghề
Nơi làm việc
V1 V2 V3 V4
1 212 200 230 220
2 222 205 222 225
3 241 250 245 235
4 240 228 230 240
Sinh viên: Nguyễn Hoàng Minh
16
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
Bài giải:
Dạng bài: bài toán phân tích phương sai hai yếu tố không lặp.
Giả thiết H: Các giá trị trung bình bằng nhau.
Thực hiện bài toán bằng Excel:
1. Nhập bảng dữ liệu
2. Áp dụng
chương trình
Anova : Two
Factor
Without
Replication trong thẻ Data => Data Analysis
3. Nhấn OK
ta được
bản kết
quả
Biện luận:

Sinh viên: Nguyễn Hoàng Minh
0.05

8.78 3.86
R
F F= > =
17
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – NHÓM 3
=> Bác bỏ giả thiết H ( Ngành nghề )
=> Chấp nhận giả thiết H ( Nơi
làm việc )
Kết luận:
Chỉ có Ngành nghề ảnh hưởng đến thu nhập trung bình.
Sinh viên: Nguyễn Hoàng Minh
0.05
1.23 3.86
C
F F= < =

×