Tải bản đầy đủ (.pdf) (46 trang)

Bài giảng Xác suất thống kê y học: Kiểm định chi bình phương - ThS. Bùi Thị Kiều Anh, ThS. Lê Huỳnh Thị Cẩm Hồng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (988.22 KB, 46 trang )

KIỂM ĐỊNH
CHI BÌNH PHƯƠNG
TH.S. BÙI THỊ KIỀU ANH
TH.S. LÊ HUỲNH THỊ CẨM HỒNG


Nội dung
 Sự

biến thiên mẫu của tỷ lệ

 Đại

cương mẫu và phươn pháp lấy mẫu

 Khoảng

tin cậy 95%

 Nguyên

tắc kiểm định ý nghĩa

 Các

bước trong quy trình kiểm định thống kê

 Lựa

chọn kiểm định phù hợp


 Kiểm

định chi bình phương


SỰ BIẾN THIÊN MẪU
CỦA TỈ LỆ


Biến số nhị giá
Là

biến số định tính có 2 giá trị

Trình

bày phân phối của biến nhị giá
chỉ cần mô tả bằng một con số tỷ lệ
(%)


Ví dụ:
Cuộc

điều tra dinh dưỡng tiến hành trên
1503 trẻ em dưới 5 tuổi tại TPHCM năm
1994. Trong số trẻ được điều tra có 494
trẻ bị suy dinh dưỡng nhẹ cân.

Tỷ


lệ trẻ bị suy dinh dưỡng nhẹ cân =
494/1503 = 0,329 = 32,9%


Đại cương
về mẫu và phương pháp lấy mẫu
 Trong

nghiên cứu, chúng ta chỉ
có thể thu thập số liệu trên một
tập hợp nhất định các đối tượng

 Nhưng

chúng ta lại muốn khái
quát hóa kết quả của các số liệu
và áp dụng chúng cho một dân
số rộng lớn hơn


Làm sao áp dụng kết quả nghiên cứu
(mẫu) lên dân số mục tiêu?
- Cỡ mẫu phải đủ lớn
- Phương pháp lấy
mẫu phải có tính đại
diện


Các khái niệm


8

 Mẫu

(sample): Tập hợp các đối tượng
được thu thập số liệu

 Dân

số nghiên cứu (study population): tập
hợp các đối tượng có các đặc tính hay
đại lượng được thu thập trong quá trình
nghiên cứu.

 Dân

số mục tiêu (Target population): Tập
hợp các đối tượng mà chúng ta muốn các
thành quả nghiên cứu được áp dụng vào

DÂN
SỐ
MỤC
TIÊU

DÂN SỐ
NGHIÊN
CỨU


MẪU


Dân số
Toàn bộ dân số đích

N

Mẫu
Mẫu

n
n

Tỷ lệ

p
p

 

: Tỷ lệ trong dân số đích, là một tham số hằng định và
chúng ta muốn biết
p: Tỷ lệ trong mẫu, là một số luôn dao động, là số liệu
chúng ta rút ra các kết luận về tỷ lệ trong dân số đích


Ví dụ:
 Cuộc


điều tra tỷ lệ suy dinh dưỡng trên trẻ em dưới 5 tuổi ở
TPHCM
 Tỷ lệ suy dinh
dưỡng của
p1, 2, 3, 4, 5: là
dân số
những tỷ lệ suy
dinh dưỡng
p5
p1
tương ứng với
các mẫu khác
p2
p4
nhau
p3

 Nếu

chúng ta rất may mắn, p =
Tuy nhiên, thường tỷ lệ mẫu sẽ dao động (phân tán) xung quanh giá trị
của dân số đích


Phương sai _ Sai số chuẩn
  Phương


sai của tỷ lệ:


 Sai

số chuẩn của tỷ lệ: căn bậc hai của phương
sai. Đo lường mức độ sai số trung bình của p.
Nó cho chúng ta biết chúng ta hy vọng tỷ lệ p
của chúng ta khác với tỷ lệ của dân số là bao
nhiêu
Công thức:


Ví dụ:



 Cuộc

điều tra tỷ lệ suy dinh dưỡng trên trẻ em dưới 5
tuổi ở TPHCM. Cỡ mẫu n = 1000, tỷ lệ suy dinh
dưỡng trong dân số đích

Như vậy, sai số chuẩn của tỷ lệ quan sát là:
S.E = = 0.0145 = 1.45%
 Trong

thực tế, ta ít khi biết tỷ lệ của dân số , do đó ta
sử dụng tỷ lệ của mẫu p đề ước lượng sai số chuẩn


Khoảng tin cậy
 Khi


chúng ta quan sát một tỷ lệ trong một mẫu
ngẫu nhiên, ta mong muốn có được một
khoảng các giá trị mà giá trị tỷ lệ (thực) của
dân số nằm trong đó. Khoảng này được gọi là
khoảng tin cậy.

 Khoảng

tin cậy được xác định bằng cách giới
hạn tin cậy mức trên và dưới


Khoảng tin cậy cho ước lượng tỉ lệ
Giả sử:


Có hai biến định tính



Tổng thể tuân theo phân phối nhị thức



Có thể sử dụng xấp xỉ chuẩn



Điều kiện áp dụng


(nxp) > 5

&

nx(1 - p) > 5

=> Ước lượng khoảng tin cậy 95%:
(p – 1,96 x S.E.) < p < (p - 1,96 x S.E. )


Khoảng
tin cậy 95%:
 
95% các trường hợp nghiên cứu giá trị
nằm trong khoảng


Khoảng tin cậy 95%:
 Nên

nhớ rằng có xác suất 5% tỷ lệ của dân số
đích nằm ngoài khoảng tin cậy 95%, do đó có
thể có khoảng tin cậy sẽ không chứa tỷ lệ thực.

 Khoảng

tin cậy sẽ hẹp nhất khi cỡ mẫu là lớn
nhất và khoảng tin cậy sẽ rộng nhất khi cỡ mẫu
nhỏ



Trình bày khoảng tin cậy


Nguyên tắc của kiểm định ý nghĩa


Nguyên tắc của kiểm định ý nghĩa
 Phương

pháp phản chứng/phản nghiệm

A làm B không xảy ra

=>

B xảy ra suy ra A không xảy ra

Chúng ta thường sử dụng trong y khoa.
Ví dụ: Bn nhập viện vì bị đau bụng dữ dội. Chúng ta nghi ngờ
BN bị tắt ruột và khai thác bệnh sử. BN nói rằng BN trung tiện
bình thường, ta loại bỏ căn nguyên tắc ruột.


Nếu BN bị tắc ruột thì BN sẽ không trung tiện



Do BN trung tiện bình thường nên BN không bị tắt ruột.



Nguyên tắc của kiểm định ý nghĩa


Nếu giả thuyết Ho xảy ra => T hiếm xảy ra
T xảy ra



=>

giả thuyết Ho hiếm xảy ra

Ký hiệu theo công thức tính xác suất của biến cố T
là P(T)
Nếu {Ho => P(T) nhỏ}
thì

{T xảy ra => P(Ho) nhỏ}


Giả thuyết Ho (null hypothesis)


Giả thuyết Ho
 Giả

22


thuyết Ho là một mệnh đề âm tính cho rằng không có sự
liên hệ thống kê nào

 Giả


thuyết Ho khẳng định về

sự bằng nhau,

 không

khác biệt,

 không

có liên quan


Giả thuyết Ho
 Chỉ

có thể bác bỏ chứ không chứng minh được giả

thuyết Ho
 Giả
 Là

thuyết Ho là phủ định của giả thuyết nghiên cứu


bước đầu tiên của bất cứ kiểm định thống kê nào

 Nguy

cơ tương đối =1

23


Giả thuyết phụ (alternative hypothesis)
Ha:

Là một giả thuyết mà nhà nghiên cứu
nghĩ là sự thật

Điều

kiện.

cần được “chứng minh” bằng dữ


Một thử nghiệm lâm sàng điều trị ung thư vú đã di căn, BN được
phân nhóm ngẫu nhiên để điều trị với L-Pam hay CMF (phối hợp 3
thuốc).


Giả thuyết Ho:

Hai phương pháp điều trị có hiệu quả tương đương



Giả thuyết phụ Ha:

Hai phương pháp điều trị có hiệu quả khác nhau
PP điều trị CMF hiệu quả hơn PP điều trị L-Pam
PP điều trị L-Pam hiệu quả hơn PP điều trị CMF


×