Câu 5: Chọn dữ liệu 2 biến để lập bài tốn kiểm định so sánh 2 trung bình tổng thể. Trình bày
các bước thực hiện và nhận xét kết quả.
Khảo sát chỉ số Cholesterol.
Với mức ý nghĩa α = 5%, so sánh chỉ số Cholesterol trung bình giữa nam và nữ.
Bài giải:
Dạng bài: Kiểm định giả thuyết trung bình (bài tốn hai mẫu).
Phương pháp giải: So sánh trung bình 2 tổng thể với phương sai biết trước (n>30).
Cơ sở lý thuyết:
Giả sử tổng thể I có trung bình a1; tổng thể II có trung bình a2. Từ tổng thể I có mẫu kích
thước
, trung bình mẫu
;
phương sai mẫu hiệu chỉnh
.
Từ tổng thể II có mẫu kích thước
, trung bình mẫu
. Kiểm định giải thuyết H0 : a1 = a2 với
, phương sai mẫu hiệu chỉnh
mức ý nghĩa α .
Với n1,n2 ≥ 30, ta có quy tắc kiểm định như sau:
Giá trị thống kê:
Nếu zqs ≤
thì chấp nhận giả thuyết H0.
Ngược lại , zqs ¿
thì bác bỏ giả thuyết H0.
Cơng cụ giải: Descriptive Statistics và z-Test: Two Sample for Means.
Giả thuyết H0: Chỉ số Cholesterol trung bình của nam và nữ là như nhau.
H1: Chỉ số Cholesterol trung bình của nam và nữ là khác nhau.
Quy trình thực hiện excel:
-
Đầu tiên, ta sử dụng công cụ Descriptive Statistics trong Data/Data Analysis lần lượt tìm
các đặc trưng cho 2 mẫu.
-
Chọn các mục như trong ảnh:
Input: Phạm vi đầu vào.
Group By: Cách sắp xếp theo hang hay cột.
-
Output Range: Phạm vi đầu ra.
Labels in first row: Nhãn dữ liệu.
Summary statistics: Kết quả tóm tắt.
Confidence Level for Mean: Mức tin cậy 95%.
Ta được kết quả:
•
-
-
Xác định phương sai mẫu của nam và nữ:
2
σ 1 =1432.10
2
σ 2 =4347.16
Tiếp theo, ta sử dụng công cụ “z-Test: Two Sample for Means” trong Data/ Data
Analysis để so sánh trung bình hai tổng thể.
Chọn các mục như trong ảnh:
-
-
• Input: Phạm vi đầu vào.
• Output Range: Phạm vi đầu ra.
• Variable 1 Variance (known): 1432.1
• Variable 2 Variance (known): 4347.16
• Labels: Nhãn dữ liệu.
• Alpha: Mức ý nghĩa 5%.
Ta được kết quả:
Tiêu chuẩn kiểm định:
.
Kết luận: Chấp nhận H0. Bác bỏ H1. Vậy chỉ số Cholesterol trung bình của nam và nữ là
như nhau.