Tải bản đầy đủ (.docx) (4 trang)

Câu 3 XÁC SUẤT THỐNG KÊ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (87.49 KB, 4 trang )

Câu 3: Bảng sau đây cho ta phân bố thu nhập của hai nhóm tuổi: Nhóm từ 40 – 50
tuổi và nhóm từ 50 – 60 tuổi trong số các cơng nhân lành nghề ở Thụy Điển
năm 1930.
Nhóm
tuổi

Thu nhập
0–1

1–2

2–3

3–4

4–6

6

40 – 50

71

430

1072

1609

1178


158

50 – 60

54

324

894

1202

903

112

Có sự khác nhau về phân bố thu nhập giữa hai nhóm tuổi này trong số các
cơng nhân lành nghề hay không? Mức ý nghĩa  = 2%.
Bài làm
I. Cơ sở lý thuyết:
a. Dạng bài toán: Kiểm định giả thuyết về tỷ lệ
b. Khái niệm thống kê:
Đối với một thí nghiệm có hai kết quả (binomial experiment) - thí dụ, đối với một
thuốc được kê đơn: có hay không – bạn thường so sánh hai tỉ số với nhau
(thực nghiệm với lí thuyết hay thực nghiệm với thực nghiệm). Song đối với một thí
nghiệm có nhiều kết quả (multinomial experiment) – thí dụ, bác sĩ đánh giá tình
trạng của các bệnh nhân được điều trị bởi thuốc trong một khoảng thời gian – bạn cần
so sánh nhiều tỉ số. Trắc nghiệm “khi” bình phương (2) cho phép bạn so sánh khơng
những hai mà cịn nhiều tỉ số (hay tỉ lệ hoặc xác suất) một cách tiện lợi. 2 là phân
phối về xác suất, khơng có tính đối xứng và chỉ có giá trị ≥ 0. Giả sử bạn có một cơng

trình nghiên cứu với N thử nghiệm độc lập, mỗi thử nghiệm có k kết quả và mỗi kết quả
mang một trong các xác suất thực nghiệm là Pi (i = 1, 2, … k). Nếu gọi P i,0 là các giá trị
lý thuyết tương ứng với Pi thì các tần số lí thuyết sẽ là Ei = NPi,0. Điều kiện để áp
dụng trắc nghiệm 2 một cách thành cơng là các tần số lí thuyết Ei phải ≥ 5.
c. Giả thuyết:
H0: P1 = P1,0; P2 = P2,0; … ; Pk = Pk,0 “Các cặp Pi và Pi,0 giống nhau”.
H1:

“Ít nhất có một cặp Pi và Pi,0 khác nhau”.

trị thống kê:
Giá


Oi: các tần số thực nghiệm (observed frequency);

Ei: các tần số lý thuyết (expected frequency).

Biện luận:


Nếu

 Bác bỏ giả thuyết H0 (DF = k-1)

Trong chương trình MS-EXCEL có hàm CHITEST có thể tính:

-

Giá trị 2 theo biểu thức:

Oij: tần số thực nghiệm của ô thuộc hàng i và cột j;
Eij: tần số lý thuyết của ô thuộc hàng i với cột j;
r: số hàng;
c: số cột.



Xác suất P(X >2) với bậc tự do DF = (r-1)(c-1); trong đó, r là số hàng và c là
số cột trong bảng ngẫu nhiên (contingency table).

Nếu P(X >2) > α  Chấp nhận giả thuyết H0 và ngược lại.
d. Giải thuật:
- Tính các tổng số
- Tổng hàng (row totals)
- Tổng cột (column totals)
-Tổng cộng (grand total)
- Tính các tần số lý thuyết
- Tần số lý thuyết = tổng hàng x tổng cột / tổng cộng

II. Áp dụng Excel:
H0 : Phân bố thu nhập giữa 2 nhóm tuổi trong số các cơng nhân lành nghề là như nhau


Bước 1: Nhập bảng số liệu:

Bước 2: Sử dụng lệnh Sum

Tính các tổng hàng : Chọn ơ H3 và nhập biểu thức =SUM(B3:G3)
Dùng con trỏ kéo kí hiệu tự điền ô H3 đến ô H4.
Tính các tổng cột : Chọn ô B5 và nhập biểu thức =SUM(B3:B4)

Dùng con trỏ kéo kí hiệu tự điền ơ B5 đến ơ H5.

Chọn ơ B7 nhập biểu thức = B$5*$H3/$H$5
Dùng con trỏ kéo kí hiệu tự điền từ ơ B9 đến G9.Sau đó kéo từ ơ G9 đến ơ G10.
Bước 3: Tính giá trị, sử dụng hàm CHITEST và hàm CHIINV

Chọn ô B12: Nhập hàm =CHITEST(B3:G4,B9:G10)


Chọn ô B13: Nhập hàm =CHIINV(0.02,5)
Chọn ô B14: Nhập hàm =CHIINV(B12,5)

P(X >2) =0.511582 > α=0.05  Chấp nhận giả thuyết H0.
Hoặc 20 = 4.2675< 2a = 13.3882  Chấp nhận giả thuyết H0.
Kết luận: Nên phân bố thu nhập giữa 2 nhóm tuổi trong số các cơng nhân lành nghề là
như nhau



×