KIỂM ĐỊNH
CHI BÌNH PHƯƠNG
TH.S. BÙI THỊ KIỀU ANH
TH.S. LÊ HUỲNH THỊ CẨM HỒNG
Nội dung
Sự
biến thiên mẫu của tỷ lệ
Đại
cương mẫu và phươn pháp lấy mẫu
Khoảng
tin cậy 95%
Nguyên
tắc kiểm định ý nghĩa
Các
bước trong quy trình kiểm định thống kê
Lựa
chọn kiểm định phù hợp
Kiểm
định chi bình phương
SỰ BIẾN THIÊN MẪU
CỦA TỈ LỆ
Biến số nhị giá
Là
biến số định tính có 2 giá trị
Trình
bày phân phối của biến nhị giá
chỉ cần mô tả bằng một con số tỷ lệ
(%)
Ví dụ:
Cuộc
điều tra dinh dưỡng tiến hành trên
1503 trẻ em dưới 5 tuổi tại TPHCM năm
1994. Trong số trẻ được điều tra có 494
trẻ bị suy dinh dưỡng nhẹ cân.
Tỷ
lệ trẻ bị suy dinh dưỡng nhẹ cân =
494/1503 = 0,329 = 32,9%
Đại cương
về mẫu và phương pháp lấy mẫu
Trong
nghiên cứu, chúng ta chỉ
có thể thu thập số liệu trên một
tập hợp nhất định các đối tượng
Nhưng
chúng ta lại muốn khái
quát hóa kết quả của các số liệu
và áp dụng chúng cho một dân
số rộng lớn hơn
Làm sao áp dụng kết quả nghiên cứu
(mẫu) lên dân số mục tiêu?
- Cỡ mẫu phải đủ lớn
- Phương pháp lấy
mẫu phải có tính đại
diện
Các khái niệm
8
Mẫu
(sample): Tập hợp các đối tượng
được thu thập số liệu
Dân
số nghiên cứu (study population): tập
hợp các đối tượng có các đặc tính hay
đại lượng được thu thập trong quá trình
nghiên cứu.
Dân
số mục tiêu (Target population): Tập
hợp các đối tượng mà chúng ta muốn các
thành quả nghiên cứu được áp dụng vào
DÂN
SỐ
MỤC
TIÊU
DÂN SỐ
NGHIÊN
CỨU
MẪU
Dân số
Toàn bộ dân số đích
N
Mẫu
Mẫu
n
n
Tỷ lệ
p
p
: Tỷ lệ trong dân số đích, là một tham số hằng định và
chúng ta muốn biết
p: Tỷ lệ trong mẫu, là một số luôn dao động, là số liệu
chúng ta rút ra các kết luận về tỷ lệ trong dân số đích
Ví dụ:
Cuộc
điều tra tỷ lệ suy dinh dưỡng trên trẻ em dưới 5 tuổi ở
TPHCM
Tỷ lệ suy dinh
dưỡng của
p1, 2, 3, 4, 5: là
dân số
những tỷ lệ suy
dinh dưỡng
p5
p1
tương ứng với
các mẫu khác
p2
p4
nhau
p3
Nếu
chúng ta rất may mắn, p =
Tuy nhiên, thường tỷ lệ mẫu sẽ dao động (phân tán) xung quanh giá trị
của dân số đích
Phương sai _ Sai số chuẩn
Phương
sai của tỷ lệ:
Sai
số chuẩn của tỷ lệ: căn bậc hai của phương
sai. Đo lường mức độ sai số trung bình của p.
Nó cho chúng ta biết chúng ta hy vọng tỷ lệ p
của chúng ta khác với tỷ lệ của dân số là bao
nhiêu
Công thức:
Ví dụ:
Cuộc
điều tra tỷ lệ suy dinh dưỡng trên trẻ em dưới 5
tuổi ở TPHCM. Cỡ mẫu n = 1000, tỷ lệ suy dinh
dưỡng trong dân số đích
Như vậy, sai số chuẩn của tỷ lệ quan sát là:
S.E = = 0.0145 = 1.45%
Trong
thực tế, ta ít khi biết tỷ lệ của dân số , do đó ta
sử dụng tỷ lệ của mẫu p đề ước lượng sai số chuẩn
Khoảng tin cậy
Khi
chúng ta quan sát một tỷ lệ trong một mẫu
ngẫu nhiên, ta mong muốn có được một
khoảng các giá trị mà giá trị tỷ lệ (thực) của
dân số nằm trong đó. Khoảng này được gọi là
khoảng tin cậy.
Khoảng
tin cậy được xác định bằng cách giới
hạn tin cậy mức trên và dưới
Khoảng tin cậy cho ước lượng tỉ lệ
Giả sử:
Có hai biến định tính
Tổng thể tuân theo phân phối nhị thức
Có thể sử dụng xấp xỉ chuẩn
Điều kiện áp dụng
(nxp) > 5
&
nx(1 - p) > 5
=> Ước lượng khoảng tin cậy 95%:
(p – 1,96 x S.E.) < p < (p - 1,96 x S.E. )
Khoảng
tin cậy 95%:
95% các trường hợp nghiên cứu giá trị
nằm trong khoảng
Khoảng tin cậy 95%:
Nên
nhớ rằng có xác suất 5% tỷ lệ của dân số
đích nằm ngoài khoảng tin cậy 95%, do đó có
thể có khoảng tin cậy sẽ không chứa tỷ lệ thực.
Khoảng
tin cậy sẽ hẹp nhất khi cỡ mẫu là lớn
nhất và khoảng tin cậy sẽ rộng nhất khi cỡ mẫu
nhỏ
Trình bày khoảng tin cậy
Nguyên tắc của kiểm định ý nghĩa
Nguyên tắc của kiểm định ý nghĩa
Phương
pháp phản chứng/phản nghiệm
A làm B không xảy ra
=>
B xảy ra suy ra A không xảy ra
Chúng ta thường sử dụng trong y khoa.
Ví dụ: Bn nhập viện vì bị đau bụng dữ dội. Chúng ta nghi ngờ
BN bị tắt ruột và khai thác bệnh sử. BN nói rằng BN trung tiện
bình thường, ta loại bỏ căn nguyên tắc ruột.
Nếu BN bị tắc ruột thì BN sẽ không trung tiện
Do BN trung tiện bình thường nên BN không bị tắt ruột.
Nguyên tắc của kiểm định ý nghĩa
Nếu giả thuyết Ho xảy ra => T hiếm xảy ra
T xảy ra
=>
giả thuyết Ho hiếm xảy ra
Ký hiệu theo công thức tính xác suất của biến cố T
là P(T)
Nếu {Ho => P(T) nhỏ}
thì
{T xảy ra => P(Ho) nhỏ}
Giả thuyết Ho (null hypothesis)
Giả thuyết Ho
Giả
22
thuyết Ho là một mệnh đề âm tính cho rằng không có sự
liên hệ thống kê nào
Giả
thuyết Ho khẳng định về
sự bằng nhau,
không
khác biệt,
không
có liên quan
Giả thuyết Ho
Chỉ
có thể bác bỏ chứ không chứng minh được giả
thuyết Ho
Giả
Là
thuyết Ho là phủ định của giả thuyết nghiên cứu
bước đầu tiên của bất cứ kiểm định thống kê nào
Nguy
cơ tương đối =1
23
Giả thuyết phụ (alternative hypothesis)
Ha:
Là một giả thuyết mà nhà nghiên cứu
nghĩ là sự thật
Điều
kiện.
cần được “chứng minh” bằng dữ
Một thử nghiệm lâm sàng điều trị ung thư vú đã di căn, BN được
phân nhóm ngẫu nhiên để điều trị với L-Pam hay CMF (phối hợp 3
thuốc).
Giả thuyết Ho:
Hai phương pháp điều trị có hiệu quả tương đương
Giả thuyết phụ Ha:
Hai phương pháp điều trị có hiệu quả khác nhau
PP điều trị CMF hiệu quả hơn PP điều trị L-Pam
PP điều trị L-Pam hiệu quả hơn PP điều trị CMF