Tải bản đầy đủ (.doc) (17 trang)

Báo cáo xác suất thống kê - Nguyễn Phước Lộc pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (479.45 KB, 17 trang )

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
GVHD:
Thầy
Nguyễn
Bá Thi
Sinh viên: Nguyễn Phước Lộc
MSSV : 40901457
Nhóm 3
Lớp:
BÁO CÁO BÀI TẬP XÁC
SUẤT THỐNG KÊ
MỤC LỤC
M C L CỤ Ụ 2
Bài 1
Một xí nghiệp may sản xuất áo khoác với 4 màu: đỏ, xanh, vàng và tím than. Số khách
hàng nam và nữ mua áo khoác với các màu được ghi trong bảng sau:
Đỏ Xanh Vàng Tím than
Nữ 62 34 71 42
Nam 125 233 52 54
Với mức ý nghĩa α = 1% hãy so sánh tỷ lệ khách hàng nam và nữ ưa chuộng một
trong các màu sắc nói trên.
BÀI LÀM
Nhận xét : Đây là bài toán kiểm định giả thiết về tỷ lệ.
Trang 2
Giả thiết H
o
: Tỷ lệ khách hàng nam và nữ ưa chuộng một trong các màu sắc là như
nhau.
Thực hiện bài toán bằng Excel
• Nhập giá trị vào bảng tính :


• Tính các tổng số:
• Tổng hàng: Chọn ô E8 và nhập = SUM(C8:D8)
Dùng con trỏ kéo nút tự điền từ E8 đến E11
• Tổng cột: Chọn C12 và nhập = SUM(C8:C11)
Dùng con trỏ kéo nút tự điền từ C12 đến D12
• Tổng cộng: Chọn E12 và nhập =SUM(E8:E11)
• Tính các tần số lý thuyết:
• Chọn C16 và nhập =$C$12*E8/$E$12
Trang 3
Dùng con trỏ kéo nút tự điền từ C16 đến C19
• Chọn D16 và nhập =$D$12*E8/$E$12
Dùng con trỏ kéo nút tự điền từ D16 đến D19
• Áp dụng hàm số CHITEST :
• Chọn C21 và nhập = CHITEST(C8:D11,C16:D19)
• Ta sẽ có được kết quả của P(X>X²).
Trang 4
• Biện luận : P(X>X²) = 1,71514e-18 < α = 0,01.
=> Bác bỏ giả thiết H
o
.
• Kết luận : Tỉ lệ khách hàng nam và nữ ưa chuộng một trong các màu sắc là
khác nhau.
Trang 5
Bài 2
Lượng sữa vắt được bởi 16 con bò cái khi nghe các loại nhạc khác nhau (nhạc nhẹ,
nhạc rốc, nhạc cổ điển, không có nhạc) được thống kê trong bảng sau đây:
Với mức ý nghĩa 5%, nhận định xem lượng sữa trung bình của mỗi nhóm như trên
như nhau hay khác nhau. Liệu âm nhạc có ảnh hưởng đến lượng sữa của các con bò hay
không?
BÀI LÀM

Nhận xét: Đây là bài toán phân tích phương sai một nhân tố.
Giả thiết H
o
: Lượng sữa trung bình của mỗi nhóm là như nhau.
Thực hiện bài toán bằng Excel
• Nhập dữ liệu vào bảng tính :
• Vào Data /Data analysis, chọn Anova: Single Factor.
Trang 6
Nhạc nhẹ 15 18 22 17
Nhạc rốc 13 20 16 15
Nhạc cổ điển 15 19 24 28
Không có nhạc 14 23 17 14
Trang 7
• Trong hộp thoại Anova: Single Factor lần lượt ấn định :
• Phạm vi đầu vào: Input Range, quét chọn vùng (C4:F8).
• Cách nhóm theo hàng hay cột: Group By, chọn Columns
(nhóm theo cột).
• Chọn Labels in first row (nhãn dữ liệu nằm ở dòng đầu).
• Mức ý nghĩa α: Alpha (ấn định α=0,05).
• Phạm vi đầu ra: Output Range, chọn ô C10.
• Nhấn OK, ta sẽ có bảng kết quả sau:
Trang 8
• Biện luận : F = 1.354679803 < F
0.05
= 3.490295.
 Chấp nhận giả thiết H
o
• Kết luận : Lượng sữa trung bình của các nhóm là như nhau.
Hay âm nhạc không ảnh hưởng đến lượng sữa của các con bò.
Trang 9

Bài 3
Từ 12 cặp quan sát (x,y) sau đây từ cặp 2 biến (X,Y) ,tính tỷ số tương quan, hệ số
tương quan và hệ số xác định của Y đối với X. Với mức ý nghĩa α = 5%, có kết luận gì về
mối tương quan giữa X và Y (tuyến tính hay phi tuyến )? Tìm đường hồi quy của Y đối
với X.
BÀI LÀM
Nhận xét : đây là bài toán phân tích tương quan.
Thực hiện bài toán bằng Excel
1. Phân tích tương quan tuyến tính.
Nhập giá trị vào bảng tính:
Trang 10
X 123 356,9 111,1 118 123 356,9 111,1 11
8
123 356,9 111,1 118
Y 4,15 4,1 3,74 3,89 4,5 4,1 3 3,8 2 3,1 3,4 3
• Thiết lập bảng Correlation.
• Vào Data /Data analysis , chọn Correlation.
• Phạm vi đầu vào: Input Range, quét vùng (C5:D17).
• Cách nhóm theo hang hay cột: Group By, chọn Columns (nhóm theo
cột).
• Chọn Labels in first row (nhãn dữ liệu ở hàng đầu).
• Phạm vi đầu ra: Output Range, chọn ô F6.
• Nhấn OK, ta sẽ có bảng kết quả sau:
Trang 11
• Ta tìm được hệ số tương quan r = 0.17875.
Và hệ số xác định r
2
= 0.03195.
* Giả thiết H
o

: X và Y không có tương quan tuyến tính.
Ta có: T = 0.574506 với
Mà: c = 2,228.
(c là phân vị mức α/2=0.025 của phân bố Student với n-2=10 bậc tự do).
Vì T < c nên chưa có cơ sở bác bỏ giả thiết H
o
.
Vậy: Chưa kết luận được X và Y có tương quan tuyến tính.
2. Phân tích tương quan phi tuyến.
Sắp xếp lại các giá trị của X và Y theo bảng sau:
Trang 12
2
2
1
r n
T
r

=

• Thiết lập bảng Anova: Single Factor.
• Vào Data /Data analysis , chọn Anova: Single Factor.
• Trong hộp thoại Anova: Single Factor lần lượt ấn định :
o Phạm vi đầu vào: Input Range, quét vùng (D29:G32).
o Cách nhóm theo hàng hay cột: Group By, chọn Columns (nhóm theo
cột).
o Chọn Labels in first row (nhãn dữ liệu nằm ở hàng đầu).
o Mức ý nghĩa α: Alpha (ấn định α=0,05).
o Phạm vi đầu ra: Output Range, chọn ô C34.
Trang 13

• Nhấn OK, ta sẽ có bảng kết quả sau:
• Rút ra được từ bảng Anova:
SSF = 0,22537.
SST = 5,3115.
Tính: η
2
Y/X
= SSF/SST = 0,04243.
=> Tỷ số tương quan : η
Y/X
= 0,206.
Suy ra : η
2
Y/X
- r² = 0.174034 ≠ 0.
* Giả thiết H
o
: X và Y không có tương quan phi tuyến.
Ta có: F = 0,87673 với
Trang 14
( )
( )
( )
( )
2 2
/
2
/
2
Y X

Y X
r n k
F
k
η − −
=
1− η −
Mà: c = 4,46.
(c là phân vị mức α=0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(2,8)).
Vì: F < c nên chấp nhận giả thiết H
o
.
Vậy: X và Y không có tương quan phi tuyến.
Trang 15
• Kết luận :
 Hệ số tương quan: r = 0.178749.
 Hệ số xác định: r² = 0.03195.
 Tỷ số tương quan: η
Y/X
= 0.206.
• T = 0,574506 < c = 2,228.
(c là phân vị mức 0.025 của phân bố Student bậc tự do 10).
=> Chưa kết luận được X và Y có tương quan tuyến tính.
• F = 0,043772 < c = 4,46
(c là phân vị mức 0,05 của phân bố Fisher bậc tự do (2,8)).
=> X và Y không có tương quan phi tuyến với mức ý nghĩa 5%.
3. Tìm đường hồi quy của Y đối với X.
Trang 16
Bài 4
Hãy phân tích sự biến động của thu nhập ($/tháng/người) trên cơ sở số liệu điều tra vềt

thu nhập trung bình của 4 loại ngành nghề ở 4 khu vực khác nhau sau đây:
Loại ngành
nghề
Nơi làm việc
V1 V2 V3 V4
1 212 200 230 220
2 222 205 222 225
3 241 250 245 235
4 240 228 230 240

BÀI LÀM
 Nhận xét: Đây là dạng bài tập phân tích phương sai hai yếu tố.
 Giả thiết Ho: “lượng thu nhập trung bình là như nhau theo ngành và nơi làm
việc”
 Ta áp dụng phương pháp phân tích phương sai 2 yếu tố.
Thực hiện bài toán bằng Excel
1. Nhập dữ liệu vào bảng tính:
Trang 17

×