Tải bản đầy đủ (.docx) (17 trang)

Báo Cáo Bài Tập Lớn Xác Suất Thống Kê Bách Khoa HCM ( Khi tải file về sẽ được 1 file Word Báo Cáo hoàn chỉnh, không lỗi và đánh sẵn số trang )

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (422.73 KB, 17 trang )

Hướng dẫn chi tiết Bài Tập Lớn môn Xác Suất Thống Kê
(Tài liệu dùng tham khảo)


Lời nói đầu
Các bạn sinh viên thân mến!

Nhằm tạo điều kiện thuận lợi cho các bạn làm bài tập
lớn môn Xác Suất Thống Kê, cuốn sách này ra đời với
mục đích giúp các bạn thuận tiện hơn trong việc làm bài
và đạt được điểm số cao. Mỗi bài gồm có các phần:
dạng bài, công cụ, cách giải với đầy đủ các hình ảnh
minh họa dễ hiểu. Ở đây mình dùng Bài Thực Hành
Nhóm 1 để làm ví dụ điển hình cho các bạn. Lưu ý rằng
cuốn sách này dùng với mục đích tham khảo và bổ sung
thêm kiến thức, muốn có kỹ năng thì các bạn cịn phải
tự tìm tịi để phát triển bản thân. Chúc các bạn học tốt
và đạt được kết quả cao trong môn học này. Thân ái!

Tác Giả


MỤC LỤC
Bài 1 ---------------------------------------------------------------------------------------------- Trang 01
Bài 2 ---------------------------------------------------------------------------------------------- Trang 02
Bài 3 ---------------------------------------------------------------------------------------------- Trang 07
Bài 4 ---------------------------------------------------------------------------------------------- Trang 13


1.
Một hãng sản xuất ôtô tiến hành một nghiên cứu nhằm xác định xem có


sự khác nhau giữa tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô của
hãng hay không. Kết quả thu được như sau:
Loại ôtô

A

B

C

Phụ nữ

70

80

150

Nam giới

40

60

100

Với mức ý nghĩa α = 5%, ta cần phải đưa ra kết luận gì?
Bài làm:
• Dạng bài: Bài toán kiểm định giả thuyết tỷ lệ.
Giả thuyết H : Tỷ lệ nam giới và phụ nữ trong việc chọn mua các loại ơtơ là


0
như nhau.
• Quy trình thực hiện bằng EXCEL:
1) Nhập dữ liệu vào bảng tính.
2) Tính các tổng số trên bảng.
Theo hàng: Nhập vào E biểu thức “=SUM(B2:D2)”, sau đó kéo nút
2

tự điền đến E .
3

Theo cột: Nhập vào B biểu thức “=SUM(B2:B3)”, sau đó kéo nút tự
4

điền đến E .
4

3) Tính các tần số lý thuyết.
Nhập vào B biểu thức “=B$4*$E2/$E$4”, sau đó kéo nút tự điền đến
9

D .
10

4) Áp dụng Chitest để tìm kết quả.
Cú pháp hàm Chitest: “CHITEST (actual_range; expected_range)”.
Điền vào ô B biểu thức “=CHITEST(B2:D3; B9:D10)”.
12





χ

→ Ta được kết quả của P(X < 2).
Biện luận: Vì P(X < χ2) = 0,582093 > α = 0,05 nên chấp nhận giả thuyết H .
0

Kết luận: Tỷ lệ nam giới và phụ nữ trong việc chọn mua các loại ôtô là như
nhau.


2. Để xác định hiệu quả của một loại thức ăn phụ đối với sự tăng trọng của bò,
người ta lấy ngẫu nhiên 8 con bò cùng trọng lượng chia thành hai nhóm, mỗi
nhóm 4 con, một nhóm ăn bình thường, một nhóm cho ăn thêm thức ăn phụ. Sau
6 tháng thu được kết quả sau:
Nhóm ăn thêm thức ăn phụ (A)
Nhóm thức ăn bình thường (B)
330
290
360
320
400
340
350
370
Với mức ý nghĩa 5% hãy cho kết luận về tác dụng của loại thức ăn phụ đó, biết
rằng trọng lượng của bị là biến ngẫu nhiên phân phối chuẩn. Với độ tin cậy 95%
hãy ước lượng trọng lượng trung bình của các con bị với mỗi loại thức ăn trên.

Bài làm:
• Dạng bài: So sánh giá trị trung bình với phương sai bằng nhau & Ước lượng
hai trung bình tổng thể.
• Quy trình thực hiện bằng EXCEL:
Phần 1: Tìm kết luận về tác dụng của loại thức ăn phụ.
1) Giả thuyết H : Trọng lượng trung bình của bị ở nhóm ăn thêm thức ăn
0

phụ (A) và nhóm thức ăn bình thường (B) là như nhau.
2)

3)

Nhập dữ liệu vào bảng tính.

Mở hộp thoại

chọn t-Test Two-Sample Assuming

Equal Variances.

4)

Nhập vào hộp thoại t-Test Two-Sample Assuming Equal Variances.
 Variable 1 Range: Nhập “$A$1:$E$1” (ô A → E ).
1

1

 Variable 2 Range: Nhập “$A$2:$E$2” (ô A → E ).

2



Labels: Chọn.



Alpha: Nhập 0,05.
 Output Range: phạm vi dữ liệu xuất ra (ô G ).
1

2


5)
6)

Ta được bảng kết quả.
Kết luận:
Vì t Stat = 1,341640786 < t

α/2

= 2,446911851 nên chấp nhận

giả thuyết H .
0

Vậy thức ăn phụ khơng có tác dụng đối với số cân nặng của bị.

Phần 2: Ước lượng trọng lượng trung bình của các con bò với mỗi loại
thức ăn.
1) Nhập dữ liệu vào bảng tính.

Mở hộp thoại
chọn Descriptive Statistics.
2)


3) Nhập vào hộp thoại Desciptive Statistics.
 Input Range: phạm vi dữ liệu nhập vào (ô A → A ).
1



Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột).



Labels in first row: nhãn ở cột đầu tiên (chọn).
 Output Range: phạm vi dữ liệu xuất ra (ơ D ).
1




5

Tích dấu chọn vào Summary statistics.


Confidence Level for Mean: Nhập 95 (%).
4) Ta được bảng kết quả.


 Kết luận:
Trọng lượng trung bình của các con bị ở nhóm ăn thêm
thức ăn phụ (A) là: 360 ± 46,84434123.
5) Mở hộp thoại
chọn Descriptive Statistics.
6) Nhập vào hộp thoại Desciptive Statistics.
 Input Range: phạm vi dữ liệu nhập vào (ơ B → B ).
1



Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột).



Labels in first row: nhãn ở cột đầu tiên (chọn).
 Output Range: phạm vi dữ liệu xuất ra (ơ G ).
1




5

Tích dấu chọn vào Summary statistics.
Confidence Level for Mean: Nhập 95 (%).



7) Ta được bảng kết quả.
 Kết luận:
Trọng lượng trung bình của các con bị ở nhóm thức ăn
bình thường (B) là: 330 ± 53,56855363.
• Tổng
kết:
 Thức ăn phụ khơng có tác dụng đối với số cân nặng của bị.
 Trọng lượng trung bình của các con bị ở nhóm ăn thêm thức ăn phụ
(A) là: 360 ± 46,84434123.
 Trọng lượng trung bình của các con bị ở nhóm thức ăn bình thường (B) là: 330 ±
53,56855363.


3.
Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của
tập số liệu sau đây. Với mức ý nghĩa α = 5%, có kết luận gì về mối tương quan giữa X
và Y (Có phi tuyến khơng? Có tuyến tính khơng? ). Tìm đường hồi quy của Y đối với
X.
X 210 90 240 50 240 270 130 270 90 240 130 170 50 170 210
Y 255 115 255 35 275 315 135 355 135 295 175 235 75 195 235
Bài làm:



Dạng bài: Bài toán kiểm định tương quan và hồi quy.
Quy trình thực hiện bằng EXCEL:
1) Phân tích tương quan tuyến tính.
o Giả thuyết H : X và Y khơng có tương quan tuyến tính.

0

o

Nhập dữ liệu vào bảng tính.

Mở hộp thoại
o

chọn Correlation.


o Nhập vào hộp thoại Correlation.

 Input Range: phạm vi đầu vào (ơ A → B ).
1



16

Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột).



Labels in first row: nhãn ở cột đầu tiên (chọn).
 Output Range: phạm vi dữ liệu xuất ra (ô D ).
1

o Ta nhận được bảng kết quả.


Biện luận:
 Từ bảng kết quả ta được hệ số tương quan r (X/Y) = 0,974356.
2
→ Hệ số xác định
=2 0,9493696147.
r nr−

 Giá trị T =√
2 = 15,61290524.
1−�
α
Sử dụng hàm TINV để tìm đơn vị phân mức
2
phân bố Student với n – 2 = 13 bậc tự do.


c


= 2,16036865646279.

= 0,025 của


Vì │T│> c nên bác bỏ giả thuyết H .
0

Kết luận:
Vậy X và Y có tương quan tuyến tính.

2) Phân tích tương quan phi tuyến.
o Giả thuyết H : X và Y khơng có tương quan phi tuyến.
0

o
o
o

Nhập dữ liệu vào bảng tính sau khi đã sắp xếp lại.
Mở hộp thoại

chọn Anova Single Factor.

Nhập vào hộp thoại Anova Single Factor.

 Input Range: phạm vi đầu vào (ô B → H ).
1




4

Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột).
Labels in first row: nhãn ở cột đầu tiên (chọn).


 Alpha: mức ý nghĩa (0,05).
Output Range: phạm vi dữ liệu xuất ra (ô A ).


6

o Ta nhận được bảng kết quả.
Biện luận:
 Ta có:
Tổng bình phương giữa các nhóm: SSF = 114693,3.
Tổng bình phương nhân tố: SST = 119093,3.
SSF
2 Y/
= 0,9630541769.
 Tính tỷ số tương quan η X =
SST
→ η = 0,9813532376.

F=

2
−r )(n−k)
Y/X
2
(1−η
)(k−2)
Y/X



2

→ F = 0,5926326086.
Sử dụng hàm FINV để tìm đơn vị phân mức


α = 0,025 của
2

phân bố Fisher bậc tự do (k ˗ 2; n ˗ k) = (5; 8).
→ c = 3,68749866634003.
Vì F < c nên chấp nhận giả thuyết H .
0


Kết luận:
Vậy X và Y khơng có tương quan phi tuyến.
3) Phân tích hồi quy (sử dụng Regression).
o
Nhập dữ liệu vào bảng tính.

Mở hộp thoại
o
o


quy.

chọn Regression.
Nhập vào hộp thoại Regression.
 Phạm vi đầu vào:
Input Y Range: quét vùng (ô B2 → B16).
Input X Range: quét vùng (ô A2 → A16).
 Chọn Labels.
Output Range: phạm vi đầu ra (ô D ).


11
 Confidence Level: Nhập 95 (%).
Chọn Line Pit Plots trong Residuals để vẽ đường hồi


o

Ta nhận được bảng kết quả.

Kết Luận:
Đường hồi quy của Y đối với X là:
Y = 6,159101 + 1,167563X


4.
Hãy phân tích vai trị ngành nghề (chính, phụ) trong hoạt động kinh tế của các
hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập của một số hộ
tương ứng với các ngành nghề nói trên như sau (mức ý nghĩa 5%):
Nghề phụ (3)
Nghề chính

(2)

(1)

Bài làm:




Dạng bài: phân tích phương sai hai yếu tố có lặp.
Giả thuyết:
 H là năng suất khơng phụ thuộc vào nghề chính.
A

 H là năng suất khơng phụ thuộc vào nghề phụ.
B

 H

AB

là năng suất giữa nghề chính và nghề phụ khơng có liên quan đến nhau.

• Quy trình thực hiên bằng EXCEL:
2) Mở hộp thoại
chọn Anova Two-Factor With Replication.
1) Nhập dữ liệu vào bảng tính.

3) Nhập vào hộp thoại Anova Two-Factor With Replication.


 Input Range: phạm vi đầu vào (ô A → E ).
2



14

Rows per sample: nhập 3.




Alpha: điền 0,05.
 Output Range: phạm vi dữ liệu xuất ra (ô G ).
1

4) Ta nhận được bảng kết quả.




Kết luận:
 602,7073 = F > F
A

n – 1; nm(r – 1); 1 – α

= 2,90112 → Bác bỏ yếu tố H

A.

→ Năng suất phụ thuộc vào nghề chính.
= 2,90112 → Bác bỏ yếu tố H
 35,55285 = F > F
B

m – 1; nm(r – 1); 1 – α

→ Năng suất phụ thuộc vào nghề phụ.

 301,7487 = F > F
AB

(n – 1)(m – 1); nm(r – 1); 1 – α

B.

= 2,188766 → Bác bỏ yếu tố

H .
AB

→ Có sự tương tác năng suất giữa nghề chính và nghề phụ.



×