Tải bản đầy đủ (.docx) (27 trang)

báo cáo bài tập lớn xác suất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (607.09 KB, 27 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM


BÁO CÁO BÀI TẬP LỚN
XÁC SUẤT THỐNG KÊ

GVHD: TS. Nguyễn Bá Thi






Họ và tên SV: Trương Quang Thịnh
MSSV: 1413803
Lớp:
L12-C
Nhóm: 10

TP.Hồ Chí Minh, tháng 11 năm 2015


MỤC LỤC

Đề tài

trang 4

Bài làm
Bài 1……………………………………………………………………..


trang 6

Bài 2……………………………………………………………………..

trang 10

Bài 3……………………………………………………………………..

trang 13

Bài 4……………………………………………………………………..

trang 17

2


Đề tài nhóm 10
Bài 1: Một nông trường nuôi bò nuôi 3 giống bò sữa A, B,C. Lượng sữa của các con bò
được thống kê trong bảng sau đây

Loại bò

Lượng sữa
Ít

Trung Bình

Nhiều


A

92

37

46

B

53

15

19

C

74

19

12

Với mức ý nghĩa , hãy nhận định xem có phải ba giống bò này có phân bố tỉ lệ như
nhau về phương diện sữa hay không?
Bài 2: Điều tra ý kiến của 6 nhà kinh tế đang làm việc trong các cơ quan của chính phủ
về mức lạm phát trong năm tới thu được các giá trị 4,2%, 5,1%, 3,9%, 4,7%, 4,9% và
5,8%. Trong khi đó hỏi ý kiến 6 nhà kinh tế đang làm việc tại các công ty cùng về vấn đề
trên thì thu được các kết quả là 5,7%, 6,1%, 5,2%, 4,9%, 4,6% và 5,5%.

a/ Với độ tin cậy 95% hãy ước lượng mức lạm phát do các nhà kinh tế làm việc
trong hai khu vực kinh tế nói trên dự báo.
b/ Với mức ý nghĩa 5% hãy cho ý kiến về sự khác biệt của các dự đoán trên .Giả
thiết mức lạm phát là biến ngẫu nhiên phân phối chuẩn.

Bài 3: Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về số
lượng học sinh trung bình đến lớp muộn của các trường đó như sau

3


Trường PTTH

Ngày trong
tuần

A

B

C

D

Thứ hai

5

4


5

7

Thứ tư

4

5

3

2

Thứ sáu

4

3

4

5

Thứ bảy

4

4


3

2

Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường. Chọn .

Bài 4: Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập
số liệu sau đây. Với mức ý nghĩa , có kết luận gì về mối tương quan giữa X và Y (Có phi
tuyến không? Có tuyến tính không ? ). Tìm đường hồi quy của Y đối với X
X

Y

X

Y

X

Y

X

Y

50

75

90


135

50

35

170

355

130

235

90

175

240

235

210

275

210

235


270

115

170

295

270

95

240

195

130

255

270

135

170

335

90


115

50

15

210

315

170

315

210

295

270

75

50

55

90

155


BÀI 1:
Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C. Lượng sữa của các con bò được
thống kê trong bảng sau đây
Loại bò

Lượng sữa
4


Ít

Trung Bình

Nhiều

A

92

37

46

B

53

15


19

C

74

19

12

Với mức ý nghĩa , hãy nhận định xem có phải ba giống bò này có phân bố tỉ lệ như
nhau về phương diện sữa hay không?
Bài làm:
I/ Dạng bài:

Đây là bài toán kiểm định giả thiết vể tỉ lệ.

II/ Phương pháp giải:
 Đặt giả thuyết H0: Tỉ lệ sữa của ba giống bò này có phân phân bố tỉ lệ như nhau.

Ta có

0.05

Tính các tần số lý thuyết

Tính

P(X> ) rồi so sánh với


Nếu P >
P<

chấp nhận giả thiết H0
bác bỏ giả thuyết H0

III/ Giải trên excel
 Nhập giá trị vào bảng tính:

5


 Tính tổng các số:
• Tổng hàng.
• Tổng cột.
• Tổng cộng.

 Tính các tần số lý thuyết:

(=tổng hàng*tổng cột)/tổng cộng)
 Loại A: Nhập vào ô B11: =E3*$B$6/$E$6, rồi Enter, dùng con trỏ để ở góc phải ô
B11 kéo từ B11 đến B13.
 Loại B: Nhập vào ô C11: =E3*$C$6/$E$6, rồi Enter, dùng con trỏ để ở góc phải

ô C11 kéo từ C11 đến C13.
 Loại C: Nhập vào ô D11: =E3*$D$6/$E$6, rồi Enter, dùng con trỏ để ở góc phải
ô D11 kéo từ D11 đến D13.

6





Áp dụng hàm số CHITEST tính giá trị
Chọn ô B15, nhập =CHITEST(B3:D5;B11:D13), rồi Enter.

 Biện luận:
 Bác bỏ giả thuyết H0.
 Kết luận:

Ba giống bò này có tỉ lệ khác nhau về phương diện sữa.
7


8


BÀI 2
Điều tra ý kiến về mức lạm phát trong năm tới của 6 nhà kinh tế làm việc ở cơ quan nhà
nước và 6 nhà kinh tế làm việc ở cơ quan tư nhân thu được kết quả:
Thuộc

Thứ tự nhà kinh tế được hỏi
1

2

3

4


5

6

Nhà nước

4,2%

5,1%

3,9%

4,7%

4,9%

5,8%

Tư nhân

5,7%

6,1%

5,2%

4,9%

4,6%


5,5%

Với độ tin cậy là γ=95%, hãy ước lượng mức lạm phát do các nhà kinh tế đó dự báo. Với
mức ý nghĩa α=5%, hãy cho ý kiến về sự khác biệt của các dự đoán trên. Giả thiết mức
lạm phát là biến ngẫu nhiên phân phối chuẩn.
Bài làm:

I/ Dạng bài: Ước lượng khoảng trung bình và kiểm định giả thuyết về giá trị trung bình
II/ Phương pháp giải:

 Tra bảng tìm phân phối student của
 Tính độ lệch mẫu S cho các mẫu
 Tính trung bình của từng mẫu

Từ đó =>

Từ đó ta có ước lượng cho các mẫu

9


Chưa biết

và n<30

 Tính

So sánh
 Biện luận:


III/ Giải trên excel:
Công cụ: Descriptive Statistics trong Excel
 Vào Data Analysis và chọn công cụ Descriptive Statistics

Hộp thoại Descriptive Statistics

10




Input Range: Mảng dữ liệu đầu vào ( từ B8 đến C15).



Grouped By:
o Columns: Nếu bảng dữ liệu trình bày theo cột.
o Rows: Nếu bảng dữ liệu trình bày theo hàng.



Labels in first row (column): Nếu có tên của đối tượng ở hàng (cột) đầu tiên.



Output Range: Nơi xuất dữ liệu (ô A23)




Chọn Summary statistics



Chọn Confidence Level for Mean: Độ tin cậy (95%)



Chọn OK

 Ta được bảng kết quả:

11


 Kết luận: Từ những giá trị trong bảng kết quả, ta tính được ước lượng lạm phát do các nhà kinh

tế trong 2 khu vực:
Lạm phát nhà kinh tế làm việc ở các công ty:
Lạm phát nhà kinh tế làm việc ở chính phủ:
 Giả thiết H: Độ lạm phát của hai các nhà kinh tế ở các công ty là như nhau.

Xét:

H đúng
H sai

Nếu H sai:



12


Công cụ: “t-Test: Two-Sample Assuming Unequal Variances” trong Excel.
 Vào Data Analysis và chọn công cụ “t-Test: Two-Sample Assuming Unequal Variances”

Hộp thoại công cụ:








Variable 1 Range: Mảng dữ liệu mẫu 1 (Từ ô B15 đến ô B21)
Variable 2 Range: Mảng dữ liệu mẫu 2 (Từ ô C15 đến ô C21)
Chọn Labels: Vì có tên mẫu.
Alpha: Mức ý nghĩa (5%)
Output Range: Nơi xuất kết quả. (Ô C24)
Chọn OK

 Ta được bảng kết quả:

13


Kết luận



H đúng: Độ lạm phát của hai các nhà kinh tế ở các công

ty là như nhau.

BÀI 3
14


Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được số liệu về số
lượng học sinh trung bình đến lớp muộn của các trường đó như sau:
Trường PTTH

Ngày trong
tuần

A

B

C

D

Thứ hai

5

4

5


7

Thứ tư

4

5

3

2

Thứ sáu

4

3

4

5

Thứ bảy

4

4

3


2

Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của các trường. Chọn .
Bài làm:
I/ Dạng bài: Đây là bài kiểm định giá trị trung bình.
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị
quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
 Giả thuyết:
 “Các giá trị trung bình bằng nhau”
 “Ít nhất có hai giá trị trung bình khác nhau”
 Giá trị thống kê:
 Biện luận:

Nếu => Chấp nhận H0 (yếu tố A)
Nếu => Chấp nhận H0 (yếu tố B).


Ta giả thuyết:
H01: yếu tố ngày ảnh hưởng đến số lượng học sinh trung bình đến lớp muộn
của các trường đó.
H02: yếu tố trường khác ảnh hưởng đến số lượng học sinh trung bình đến lớp
muộn của các trường đó.

II/ Giải trong Excel:
 Nhập bảng số liệu như hình dưới:

15



 Vào Data/Data analysis, chọn Anova: Two-Factor Without Replication, bấm

OK.



Trên màn hình sẽ hiện lên hộp thoại của Anova: Two-Factor Without
Replication như hình dưới:

 Ta nhập các thông số như hình bên dưới:

+ Phạm vi của biến sô Y (Input Range): ta kéo từ ô A2 tới ô E6
+ Nhấp vào Labels, điền giá trị Alpha 0.1
+ Tọa độ đầu ra Output Range: nhấp vào A8.
16


+ Nhấn OK.

 Ta được kết quả như sau:

 Biện luận

Ta thấy: => Bác bỏ H01.
=> Bác bỏ H02.
Vậy cả 2 yếu tố ngày trong tuần và trường khác đều không ảnh hưởng đến số
lượng học sinh trung đi đến lớp muộn.

17



Bài 4
Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số
liệu sau đây. Với mức ý nghĩa , có kết luận gì về mối tương quan giữa X và Y (Có phi
tuyến không? Có tuyến tính không ? ). Tìm đường hồi quy của Y đối với X
X

Y

X

Y

X

Y

X

Y

50

75

90

135

50


35

170

355

130

235

90

175

240

235

210

275

210

235

270

115


170

295

270

95

240

195

130

255

270

135

170

335

90

115

50


15

210

315

170

315

210

295

270

75

50

55

90

155

Bài làm
I/ Dạng bài: Đây là bài toán phân tích tương quan, phân tích hồi quy tuyến tính


II/ Giải trên excel:
Phân tích tương quan tuyến tính
 Nhập bảng giá trị:

18


 Vào Data/Data analysis, chọn Correlation:

 Trên màn hình xuất hiện hộp thoại Correlation, ta nhập vào như hình sau:
19


+ Phạm vi đầu vào (Input Range), ta kéo từ ô A1 đến ô B25.
+ Ở Grouped By: chọn Comlumns.
+ Đánh dấu vào Label in First Row.
+ Tọa độ đầu ra (Output Range): ta chọn ô D4. Nhấn OK.

Ta được kết quả như sau:

20


 Ta tìm được:

+ Hệ số tương quan:
+ Hệ số xác định :
 Giả thuyết H0: X và Y có quan hệ tương quan tuyến tính.

Ta có:

Mà :
(c là phân vị mức của phân bố Student với n-2=22 bậc tự do)
Vì nên bác bỏ giả thuyết H0.
Vậy: X và Y không có tương quan tuyến tính.
Phân tích tương quan phi tuyến:
21


 Phân tích lại bảng số liệu:

 Vào Data/Data analysic, chọn Anova: Single Factor, Nhấn OK.

 Trên màn hình xuất hiện Anova: Single Factor.

 Trong hội thoại Anova: Single Factor, ta điền các giá trị như hình sau:

+ Phạm vi đầu vào (Input Range): ta kéo từ ô B1 đến ô H5.
+ Trong Grouped By: chọn Columns
22


+ Chọn Labels in first row
+ Nhập 0.05 vào Alpha.
+ Tọa độ đầu ra (Output Range): ta chọn ô A8.

 Ta được kết quả như sau:

23



 Rút ra được từ bảng Anova:

SSF = 237383,3
SST = 248383,3
Tính được:
=> Tỷ sô tương quan:
Suy ra:
+ Giả thiết H0: X và Y có tương quan phi tuyến
Ta có:

(c là phân vị mức của phân bố Fisher bậc tự do (k-2,n-k)=(5,21))
Vì: F>c nên chấp nhận giả thuyết H0.
Vậy X và Y có tương quan phi tuyến.
Tìm đường hồi quy của X và Y
24


 Giả thuyết H0: X và Y hồi quy tuyến tính
 Ta nhập bản giá trị.

 Vào Data/Data Analysic, chọn Regression.

 Trong hội thoại Regression ta nhập vào các giá trị như hình sau:

+ Phạm vi đầu vào Y (Input Y Range): ta chọn từ ô B1 đến ô B25.
25


×