BÀI TOÁN KIỂM ĐỊNH
GIẢ THUYẾT THỐNG KÊ
GV. ThS Trần Thị Thu Hà
Trường ĐHYDTB
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Mục tiêu
• Trình bày được các khái niệm về kiểm
định giả thuyết thống kê.
• Biết cách tiến hành kiểm định giả
thuyết thống kê
• Trình bày được các nguyên tắc chọn
test thống kê
• Áp dụng được các test thống kê phổ
biến trong nghiên cứu khoa học
© 1984-1994 T/Maker Co.
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Giả thuyết thống kê là gì?
Một giả thuyết là một điều giả sử về:
1. Tham số.
2. Quy luật phân phối
3. Tính độc lập
© 1984-1994 T/Maker Co.
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Giả thuyết “không”, H0
•
•
•
Giả thuyết Ho là giả thuyết về không khác biệt
Ví dụ: Chiều cao trung bình bằng 165 cm
(H0: µ = 165)
Giả thuyết Ho là phủ định của giả thuyết nghiên
cứu. Bắt đầu bài toán kiểm định với giả sử rằng giả
thuyết H0 là đúng.
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
•
•
•
Đối thuyết, H1
Là giả thuyết khác với H0
Ví dụ: Chiều cao trung bình khác 165 cm
(H0: µ = 165 ; H1: m ≠ 165)
Đối thuyết H1 có thể được chấp nhận hoặc
bác bỏ
Trong một vài tình huống, đối thuyết sẽ dễ
được xác định trước tiên.
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Xây dựng giả thuyết
Câu hỏi nghiên cứu
Giả thuyết H1
(QĐ của nhà NC)
Giả thuyết Ho
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Giả thuyết khoa học
• Câu hỏi nghiên cứu được đổi thành giả thuyết
– Giả thuyết không (H0)
– Đối thuyết/ Giả thuyết đối (H1)
• Ví dụ
H0: µ1 = µ2
H1: µ1 ≠ µ2
Kiểm định 2 phía
H0: µ1 = µ2
H1: µ1 < µ2 (>)
Kiểm định 1 phía
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Bài toán kiểm định giả thuyết??
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Các loại sai lầm
Bản chất tổng thể (thực tế)
Kết luận của Test
Chấp nhận H0
Bác bỏ H0
H0 đúng
H0 Sai
Quyết định đúng
Sai lầm loại II: ()
Sai lầm loại I: ()
Quyết định đúng
Lực của test (1- )
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Mức ý nghĩa,
• Kí hiệu:
Một vài giá trị cụ thể thường gặp: 0.01,
0.05, 0.10,…
• Được chọn bởi người nghiên cứu ngay
lúc bắt đầu tiến hành kiểm định.
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
p < 0,05 là gì????
Ví dụ:
• Trọng lượng trung bình của trẻ trai 3211 gram lớn hơn
trọng lượng trung bình của trẻ gái là 3044 gram
(p=0,0012)
• Trọng lượng trung bình của trẻ trai 3211 gram lớn hơn
trọng lượng trung bình của trẻ gái là 3044 gram
(p<0,01)
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
•
•
•
Giá trị p-value
Là giá trị xác suất nhỏ nhất mà H0 có thể
bị bác bỏ :
p-value = P(H1/ H0)
Không trực tiếp cho ta kết luận về giả thuyết mà
chỉ gián tiếp cho ta kết luận về việc chấp nhận
và bác bỏ đối thuyết
Được sử dụng khi đưa ra quyết định:
Nếu p-value
α: Chấp nhận H0
Nếu p-value < α: Bác bỏ H0
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Các loại kiểm định?
1. Kiểm định tham số là công cụ xử lý các
dữ liệu dạng định lượng có phân phối
chuẩn.
2. Kiểm định phi tham số là công cụ xử lý
các dữ liệu định lượng không có phân
phối chuẩn, dạng định danh và thứ bậc.
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Các loại kiểm định
Kiểm định tham số đòi hỏi một số giả định:
1.
Các nhóm quan sát phải độc lập với nhau.
3.
Các nhóm quan sát phải có phương sai tương
đương.
2.
4.
Các nhóm quan sát phải được rút ra từ các
đám đông có phân phối xác định (chuẩn, nhị
thức,....)
Các mẫu ngẫu nhiên
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Các loại kiểm định
Kiểm định phi tham số ít đòi hỏi các giả định:
– Không đòi hỏi các quan sát phải được rút ra từ các
đám đông có phân phối chuẩn.
– Không đòi hỏi các nhóm phải có phương sai tương
đương.
– Là cách duy nhất để xử lý dữ liệu định danh.
– Là cách đúng đắn để xử lý dữ liệu với thang đo thứ
tự (ordinal), mặc dù kiểm định tham số có thể áp
dụng được .
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Các loại kiểm định
So sánh, tìm sự khác biệt
• So sánh hàm lượng đường
máu trước và sau điều trị
• So sánh tỷ lệ tai biến mạch
não giữa 2 nhóm bệnh nhân
Phân tích liên quan
• Huyết áp phụ thuộc vào tuổi
và giới như thế nào
• Tỷ lệ mắc bệnh tim mạch có
liên quan đến hút thuốc lá,
chế độ ăn như thế nào
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Tiến trình kiểm định giả thuyết thống kê????
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Các bước kiểm định giả thiết
Bước 1: Hình thành giả thuyết
Bước 2: Chọn test thích hợp
Bước 3: Quyết định
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Làm thế nào chọn được test thống kê thích hợp?
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Lựa chọn kiểm định giả thuyết
Mục tiêu và kiểu của các câu hỏi nghiên cứu
Mục tiêu chung
Mục tiêu cụ thể
Kiểu câu hỏi/ giả thiết
Kiểu thống kê
Quan hệ giữa các biến
So sánh
nhóm
Khác biệt
Thống kê khác biệt
( t-test, ANOVA….)
Mức độ liên
quan, các biến
liên quan
Liên quan
Thống kê liên
quan
(tương quan,
hồi quy)
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
So sánh, tìm sự khác biệt biến định lượng
Phân bố chuẩn
1
nhóm
CI,
T test
2
nhóm
CI,
ttest đlập
ttest g.cặp
Phân bố không chuẩn
>=2
nhóm
CI,
ANOVA
(ph.sai đ
nhất)
1
nhóm
2
nhóm
>2
nhóm
Sign test,
Wilcoxon
signedrank test
Đ.lập:
MannWhitney
test
Gh. cặp:
Sign test,
Wilcoxon
signedrank test
KruskalWallis test
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
So sánh, tìm sự khác biệt biến định tính
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
So sánh số trung bình quan sát với số TB lý thuyết
Bước 1: Thiết lập giả thuyết
Bước 2: Giả sử mẫu ngẫu nhiên được chọn từ tổng thể cá phân
phối chuẩn với kỳ vọng µ chưa biết và các quan sát là
độc lập với nhau
TH1: σ đã biết
t
X m0
. n
TH2: σ chưa biết
X m0
t
. n ; df n 1
S
Bước 3: Quyết định:
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
So sánh số trung bình quan sát với số TB lý thuyết
Ví dụ: Kết quả điều tra y tế quốc gia cho thấy
cân nặng trung bình của trẻ em lúc mới sinh là
3250g. Các nhà quản lý y tế của tỉnh A quyết định
tiến hành nghiên cứu trên 30 trẻ mới sinh tại các cơ
sở y tế của tỉnh. Kết quả nghiên cứu cho thấy cân
nặng trung bình là 2950g và độ lệch chuẩn là 350g
(giả sử cân nặng trẻ sơ sinh có phân phối chuẩn).
Hỏi cân nặng trung bình của trẻ sơ sinh của tỉnh A
có giống cân nặng trung bình của trẻ sơ sinh toàn
quốc không ở mức ý nghĩa 0,05?
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà
Kiểm định sự khác biệt về hai phương sai
Giả sử nghiên cứu 2 mẫu với kích thước tương ứng là nA và nB từ
2 tổng thể có phân phối chuẩn có phương sai chưa biết.
Bước 1: Thiết lập giả thuyết
H 0 : 12 22
Bước 2: Tính
H1 : 12 22
S A2
F 2 (víi S A2 S B2 )
SB
Bước 3: Quyết định:
Nếu F F : Chấp nhận giả thuyết H0
Nếu F F : Bác bỏ giả thuyết H0.
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà