Tải bản đầy đủ (.docx) (23 trang)

Báo cáo XÁC SUẤT THỐNG KÊ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (423.38 KB, 23 trang )

ĐẠI HỌC QUỐC GIA TP. HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA

…………..o..O..o…………..

BÁO CÁO BÀI TẬP LỚN
XÁC SUẤT THỐNG KÊ

Giáo viên hướng dẫn : Nguyễn Bá Thi
Sinh viên : Nguyễn Quốc Khang
MSSV : 1710124
Nhóm 2 - Lớp L08-A


1. Một nghiên cứu được tiến hành ở thành phố công nghiệp X
để xác định tỷ lệ những người đi làm bằng xe máy, xe đạp và xe buýt.
Việc điều tra được tiến hành trên hai nhóm. Kết quả như sau:

Với mức ý nghĩa α=5%, hãy nhận định xem có sự khác nhau về tỉ lệ sử dụng
các phương tiện giao thơng đi
làm trong hai nhóm cơng nhân nam và công nhân nữ hay không.
Giải
-Dạng bài: Kiểm định giả thuyết về tỉ lệ
-Giả thuyết H0: tỷ lệ sử dụng các phương tiện giao thơng đi làm trong
hai nhóm cơng nhân nam và công nhân nữ giống nhao
-Cách làm: để so sánh 2 tỉ số của 2 kết quả đó, ta dùng kiểm định χ2(chisquared)
Tính giá trị: P(X>χ2) =CHITEST
Hàm CHITEST( actual_range, expected_range)
Nếu P(X>χ2) > α thì chấp nhận H0 và ngược lại.
-Quy trình thực hiện Excel
+ Nhập dữ liệu vào bảng tính:




+ Tính tổng các số trên bảng:
Theo hàng: nhập vào H13 biểu thức “ =SUM(E13:G13) “, sau đó kéo
nút tự điền đến H14

Theo cột: nhập vào D15 biểu thức “=SUM(E13:E14) “, sau đó kéo nút
tự điền đến H15
Ta được bảng sau:

+ Tính các tần số lí thuyết:
Nhập vào E21 biểu thức: ” =E15*H13/H15” . Thao tác tương tự cho 2
tổng tương ứng cho đến ơ G22.
Ta có bảng sau:


+ Áp dụng hàm CHITEST để tìm kết quả:
Cú pháp hàm chitest : CHITEST (actual_range, expected_range)
Điền vào ô F25 biểu thức “=CHITEST(E13:G14,E21:G22)”
Kết quả ta được kết quả của P(X<χ2)

Biện luận: vì P=0.002189 <α=0.05 nên khơng chấp nhận giả thuyết H0
Kết luận : Tỷ lệ những người đi làm bằng xe máy, xe đạp và xe bt
giữa 2 nhóm cơng nhân nam và công nhân nữ là khác nhau

2. Để nghiên cứu chiều cao của nam thanh niên ở nước A
và B, người ta lấy ngẫu nhiên ở mỗi
nước 28 nam thanh niên và tiến hành đo chiều cao (tính
bằng cm)thì được kết quả sau:



a) Với độ tin cậy 95%, hay ước lượng chiều cao trung bình của
nam thanh niên ở mỗi nước.
b) Có ý kiếm cho rằng chiều cao của nam thanh niên ở hai quốc gia là khác
nhau. Với mức ý nghĩa
0,05 hãy nhận xét ý kiến này.
Giả sử chiều cao nam thanh niên ở mỗi nước tuân theo quy luật
phân phối chuẩn
Giải
a)
Dạng bài: Ước lượng khoảng trung bình tổng thể’
Cơng cụ: Descriptive Statistic trong mục Data Analysis
Cách làm: Ta thu số liệu về trung bình mẫu và độ chính xác về chiều
cao của 2 nước A và B bằng công cụ Descriptive Statistic, từ đó ta ước
lượng được khoảng chiều cao trung bình của mỗi nước.

Nhập lại bảng số liệu:

Nhập lại bảng số liệu theo cột dọc, ta được:


Vào thẻ Data, chọ Data Analysis, chọn Descriptive Statistic, nhập dữ liệu như hình
sau:


Ta thu được bảng số liệu nước A

Thao tác tương tự cho nước B:



Ta thu được bảng số liệu nước B

Ta thu được Độ chính xác

ɛ:


Khoảng ước lượng chiều cao trung bình nước A:
- Nhập ‘=I34-I47’ vào G51 và ‘=I34+I47’ vào I51
Ta được:
174.2857-2.1567< a < 174.2857+ 2.1567
 172.129 < a < 176.4424
Khoảng ước lượng chiều cao trung bình nước B:
- Nhập ‘=M34-M47’ vào L51 và ‘=M34+M47’ vào N51
Ta được:
175-2.089481923< b < 175+ 2.089481923
 172.91< b <177.089
b)

Dạng bài: Kiểm định giá trị trung bình, bài tốn 2 mẫu
Phương pháp: So sánh 2 trung bình với dữ liệu từng cặp
Công cụ: t-Test: Paired Two Sample for Means trong thẻ Data
Analysis
Giả thiết:
H0: Chiều cao của nam thanh niên ở 2 nước là giống nhau
H1: Chiều cao của nam thanh niên ở 2 nước là khác nhau
Cách làm:
Ta dung công cụ t-Test: Paired Two Sample for Means để quét
dữ liệu 2 nước. Nếu:
-|t|> tα/2 thì bác bỏ H0, chấp nhận H1

-|t|≤tα/2 thì chấp nhận H0, bác bỏ H1
Quy trình Excel:
Vào Data->Data Analysis


Nhập dữ liệu như hình sau:

Ta được bảng sau:


Ta thấy: t Stat=-2.422718559 , t Critical two-tail=2.051830516
Suy ra: |t|>tα/2
Nên ta bác bỏ H0
Kết luận: Chiều cao của nam thanh niên ở 2 quốc gia trên là
khác nhau.

Câu 3: Tính tỷ số tương quan của Y đối với X, hệ số tương
quan và hệ số xác định của tập số liệu sau đây. Với mức ý
nghĩa α=5%, có kết luận gì về mối tương quan giữa X và Y
( Có phi tuyến khơng? Có tuyến tính khơng?). Tìm đường hồi
quy của Y đối với X
(X,Y)= (15,13),(25,22),(10,6),(15,17),(20,21),(10,10),(20,25),
(25,18),(30,14),(30,10)


Dạng bài: Kiểm định tương quan và hồi quy

a)Phân tích tương quan tuyến tính

+ Cơng cụ Correlation trong thẻ Data Analysis

+Giả thuyết H0 : X và Y khơng có tương quan tuyến tính.
+ Nhập dữ liệu vào máy tính

Mở hộp thoại Data Analysis trong thẻ Data, chọn Correlation

Ta thu được kết quả:


Biện luận:
n = 10
Từ bảng, ta có hệ số tương quan r = ‘F17’= 0.319844
Hệ số xác định r2 = ‘F17*F17’= 0.1023
Giá trị của T xác định theo công thức

Nhập biểu thức ‘=(F20*SQRT(F19-2))/SQRT(1-F20*F20)’ vào ô F21
Ta được T = 0.954812
Phân phối Student mức α = 0,05 với bậc tự do n-2 = 8, dung hàm TINV
trong excel để tính
- Nhập ‘=TINV(0.05,F19-2)’ vào ơ F23
ta được c = 2.306004
Vì |T|Kết luận : X và Y không tương quan tuyến tính.

b) Phân tích tương quang phi tuyến :

Cơng cụ: Anova Single Factor
o Giả thiết H1: X và Y khơng có tương quan phi tuyến.
Copy dịng 9,10 đến dịng 27,28
Chọn vùng dữ liệu số cần sắp xếp lại rồi sắp xếp theo dòng X



Ta được bảng số liệu

Thống kê lại ta được số liệu

Mở hộp thoại Data Analysis trong thẻ Data, chọn Anova Single Factor
Hộp thoại Anova Single Factor xuất hiện:


Ta nhận được kết quả:

Biện luận:
 n = 10 , k = 5
 Tổng bình phương giữa các nhóm SSF = 290.4
 Tổng bình phương nhân tố SST = 330.4
 Tỷ số tương quan η2Y/X = SSF/SST = 0.8789346
 Giá trị F được tính theo cơng thức


Suy ra: F= 10.69167
 Phân bố Fisher mức α = 0,05 với bậc tự do (k-2, n-k) = (3, 7)
Dùng hàm FINV tính được
c = F.INV.RT(0.05,3,7) = 5.409451
 F > c nên bác bỏ giả thiết H1
Vậy X và Y có tương quan phi tuyến

+ Phân tích đường hồi quy

Cơng cụ: Regression
Giả thiết H1: Hệ số hồi quy khơng có ý nghĩa.

Giả thiết H2: Phương trình đường hồi quy khơng thích hợp
Nhập dữ liệu theo cột dọc bằng cách copy vùng A9->K10 đến ô B62 rồi
sắp xếp theo độ lớn X tăng dần.

Sau đó Copy tồn bộ B62:L63 rồi chọn H65, Paste Special, chọn
Transpose, chọn OK


Ta được bảng sau:

Mở Data Analysis chọn Regression


Ta được bảng số liệu:







Biện luận:
Hệ số góc = 0.26
Hệ số tự do = 10.4
Giá trị P của hệ số tự do (P-value) = 0.109484> α = 0,05 => chấp
nhận giả thiết H
->Hệ số tự do khơng có ý nghĩa thống kê
Giá trị P của hệ số góc (P-value) = 0.36763> α = 0,05 => chấp nhận
giả thiết H
->Hệ số góc khơng có ý nghĩa thống kê

Giá trị F (Significance F) = 0.36763> α = 0,05 => Chấp nhận giả
thiết H
->Phương trình đường hồi quy khơng thích hợp
Kết luận:
Hệ số tương quan r = 0.319844
Hệ số xác định r² = 0.1023
X và Y không tương quan tuyến tính với mức ý nghĩa 5%.
X và Y có tương quan phi tuyến với mức ý nghĩa 5%.
Phương trình đường hồi quy của Y đối với X: y= 0.26x+ 10 khơng thích
hợp



×