Tải bản đầy đủ (.pdf) (23 trang)

Bài giảng kiểm định giả thuyết hoàng thị hải vân

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.02 MB, 23 trang )

Hoàng Thị Hải Vân
Bộ môn Thống kê Tin học Y học
Viện Đào tạo YHDP&YTCC
Tel: 0912693335
Email:

Phân biệt được ước lượng và kiểm định giả
thuyết
Giả thuyết nghiên cứu
Giá trị của p và mức ý nghĩa thống kê
Phân biệt được sai lầm loại I và sai lầm loại II
Liệt kê được các bước tiến hành kiểm định giả
thuyết
Có khả năng lựa chọn được trắc nghiệm thống kê
thích hợp cho một bộ số liệu cụ thể

1


Thng kờ mụ t:
l mụ t kt qu thu c t mu nghiờn cu
biu th ln, s phõn b ca cỏc tham s ca mu nghiờn
cu nh giỏ tr trung bỡnh, lch chun, cỏc t l, bng,
biu, th s phõn b theo cỏc bin s khỏc nhau nh tui,
gii, a d...
Thng kờ suy lun:
l quỏ trỡnh ngoi suy kt qu nghiờn cu t mu ra qun
th nghiờn cu.
bao gm 2 phng phỏp: c lng v kim nh

Quần thể đích


Lựa chọn
Mẫu xác suất
- Ngẫu nhiên đơn
- Ngẫu nhiên hệ thống
- Mẫu phân tầng
- Mẫu chùm
- Mẫu nhiều bậc
Mẫu không xác suất
- Mẫu kinh nghiệm
- Mẫu thuận tiện
- Mẫu chỉ tiêu
- Mẫu có mục đích.

Kết luận ngoại suy

Quần thể
nghiên cứu

Chọn
mẫu

Mẫu

Tham số quần thể
(à, , P...)
Suy luận
thông kê
(Chỉ áp
dụng cho
mẫu xác

suất với
cỡ mẫu
đủ lớn)

Ước lợng
điểm
khoảng

Kiểm định
giả thuyết
Giá trị p

Biến số

Thống kê
mô tả

Thống kê suy luận

Tham số mẫu
( X , s, p...)

Các test
thống kê

Mô tả các tham số mẫu
(trình bày kết quả nghiên cú)

2



Ước lượng:
ngoại suy từ tham số mẫu ra tham số quần thể:
từ trung bình của mẫu ( X ) sang TB quần thể (µ)
từ tỷ lệ của mẫu (p) sang tỷ lệ của quần thể (P)
từ OR, RR, r của mẫu ra quần thể.
Kiểm định giả thuyết:
so sánh 2 hoặc nhiều quần thể NC từ sự khác biệt của
2 hoặc nhiều mẫu rút ra từ chính quần thể đó.
kiểm định mối tương quan của quần thể dựa theo mối
tương quan thu được từ mẫu

TrÎ s¬ sinh
t¹i huyÖn A
5000 trÎ

Tham sè QT:

µ ± σ = ?± ?

X ± s = 2954 ± 1280
MÉu
500 trÎ

Tham sè mÉu:

−íc l−îng hay kiÓm ®Þnh?

3



TrÎ s¬ sinh
t¹i huyÖn A
5000 trÎ

Tû lÖ trÎ (P) cã c©n nÆng
< 2500 gram = ?

MÉu
500 trÎ

Tû lÖ trÎ (p) cã c©n nÆng
< 2500 gram = 20%

−íc l−îng hay kiÓm ®Þnh?

TrÎ s¬ sinh
t¹i huyÖn A
5000 trÎ

?

MÉu
500 trÎ

2954 ± 1280

TrÎ s¬ sinh
t¹i huyÖn B
6000 trÎ


MÉu B
500 trÎ

>

2785 ± 886

−íc l−îng hay kiÓm ®Þnh?

4


1.

Từ câu hỏi nghiên cứu đặt ra giả thuyết nghiên cứu

2.

Đề xuất mức ý nghĩa thống kê thích hợp

3.

Chọn test thống kê thích hợp

4.

Xác định vùng suy xét hoặc vùng loại bỏ

5.


Tính toán test thống kê

6.

Đề xuất quyết định thống kê

7.

Rút ra kết luận

Giả thuyết nghiên cứu là một giả định được đặt ra bởi
người nghiên cứu và được xuất phát từ câu hỏi
nghiên cứu
Giả thuyết không (null hypothesis – Ho): không có sự
khác biệt/ tất cả đều như nhau
Giả thuyết khác biệt (alternative hypothesis – Ha/H1):
được chấp nhận khi Ho bị loại bỏ (có sự khác biệt)

5


Sai lầm loại I: xảy ra khi giả thuyết Ho bị loại bỏ khi nó đúng
◦ Xác suất xảy ra sai lầm loại I chính là mức ý nghĩa thống kê
(α) thường bằng hoặc nhỏ hơn 0,05. Khi mức ý nghĩa
thống kê bằng 0,05, p<0,05, Ho bị loại bỏ.
Sai lầm loại II: xảy ra khi chấp nhận giả thuyết H1 khi nó sai
◦ Xác suất xảy ra sai lầm loại II gọi là β. Khi đó (1-β) được
gọi là lực của test (power test): khả năng loại trừ Ho khi Ha
là đúng


Chấp nhận
Ho

Loại bỏ Ho

Ho đúng

ok

Sai lầm loại I

Ho sai

Sai lầm loại II

ok

Ho bị loại
bỏ trong
khi nó
ñúng

Ho ñược chấp
nhân trong
khi nó sai

6



Khi giá trị P – có ý nghĩa thống kê ở mức 0,05 –
(100-5) 95% khoảng tin cậy sẽ không đi qua giá trị
“không” (null)
Giá trị “không” (null) là gì?
◦ Khi so sánh sự khác biệt (giá trị TB và tỷ lệ) giá trị
“không” chính là 0 (zero)
◦ Khi so sánh các đo lường về tỷ suất (OR, RR) giá
trị “không” là 1

Ví dụ:

Giá trị trung bình của sự khác biệt giữa 2
nhóm là 12 kg, 95% CI (-2 kg đến 23kg)
OR của mối liên quan giữa cà phê và và
ung thư phổi là 1,6, 95%CI (0,5-2,3)

7


Ở mức ý nghĩa thống kê 5%, giá trị giới hạn
(cut-off) của p là 0,05
Ở mức ý nghĩa thống kê 1%, giá trị giới hạn
(cut-off) của p là 0,01
Giá trị của p ñược tính toán dựa trên ñộ mạnh
của bằng chứng chống lại giả thuyết Ho
P

Độ mạnh của bằng chứng

<0.001


Bằng chứng vô cùng mạnh mẽ

0,01 đến 0,001

Bằng chứng mạnh m

0,05 đến 0,01

Bằng chứng yếu

>0,05

Rất yếu hoặc không có bằng chứng

Giả thuyết Ho đã bị loại bỏ với nguy cơ sai lầm <5%
Xác suất để Ho đúng là <5%
Ho xảy ra chỉ là may rủi
Bác bỏ giả thuyết Ho
Xác suất để Ha (H1) đúng là >95%
Ha (H1) xảy ra là chắc chắn
Chấp nhận Ha
“p là xác suất xảy ra sự kiện nếu Ho là sự thật”

8


Chỉ giá trị của P chưa ñủ cơ sở ñể kết luận
Cần phải biết giá trị thực tế của ñộ lớn: OR,
RR, trung bình của sự khác biệt giữa 2 nhóm


1.
2.

3.

4.

5.

6.

Nếu p=0,05, giả thuyết Ho chỉ có 5% cơ hội xảy ra
Sự khác biệt không có ý nghĩa thống kê (p>=0,05) có
nghĩa là không có sự khác biệt giữa các nhóm
Kết quả có ý nghĩa thống kê có nghĩa là cũng rất quan
trọng về mặt lâm sàng
Các nghiên cứu có giá trị p ở về 2 phía của giá trị 0,05
là mâu thuẫn nhau
Các nghiên cứu có giá trị p như nhau cung cấp các
bằng chứng như nhau chống lại giả thuyết Ho
P=0,05 có nghĩa là khi chúng ta quan sát thì chỉ 5% sự
kiện xảy ra tuân theo giả thuyết Ho

9


7.
8.
9.

10.
11.

12.

P=0,05 và p<=0,05 là như nhau
Giá trị của p có thể được viết dưới dạng <= (p<=0,02
khi p=0,15)
P=0,05 có nghĩa là nếu bạn loại bỏ Ho, xác suất xảy ra
sai lầm loại I là 0,05
Với ngưỡng ý nghĩa 0,05, khả năng xảy ra sai lầm loại I
là 5%
Bạn nên sử dụng p một phía khi bạn không quan tâm
đến chiều hướng của kết quả hoặc sự khác biệt về một
hướng là không thể xác định
Các kết luận khoa học hay phương hướng điều trị căn
cứ vào việc giá trị p có ý nghĩa hay không

Test tham số và test phi tham số
Test cho biến ñịnh lượng và biến ñịnh tính
Test ghép cặp và test không ghép cặp
Test cho biến phụ thuộc và biến ñộc lập

10


Mục tiêu

Đo lường mối
liên quan


So sánh sự
khác biệt
Biến định
lượng (1)

Biến định
tính (2)

Biến định
lượng (3)

Biến định
tính (4)

Mục tiêu

So sánh sự
khác biệt
Biến định
lượng (1)

Biến định
tính (2)

Đo lường mối
liên quan
Biến định
lượng (3)


Biến định
tính (4)

11


X-Axis

X-Axis

X-Axis

12


Nội dung kiểm tra
Kiểm tra biểu đồ cột
liên tục (histogram)
So sánh giá trị trung
bình và giá trị trung vị
Tính toán skewness và
kurtosis
Kiểm tra bằng box plot
(biểu đồ hộp)
Test kiểm tra phân bố
chuẩn

1.

Các chỉ số thể hiện phân bố

chuẩn
Có hình chuông và đối xứng
Các giá trị này tương đối bằng
nhau
Nằm trong khoảng -1 đến +1 (có
thể chấp nhận -3 đến +3)
Không có các giá trị ngoại lai
Skewness-kurtosis test
(sktest, p>0,05)

So sánh huyết áp tối đa của mẫu nghiên cứu với hằng
số sinh học của người Việt Nam (120mmHg)

2.

So sánh huyết áp tối đa của nam và nữ trong mẫu
nghiên cứu

3.

So sánh huyết áp tối đa của mẫu nghiên cứu trước và
sau điều trị thuốc hạ huyết áp

4.

So sánh huyết áp tối đa của các nhóm có BMI khác
nhau (<18,5; 18,50-24,99: >=25)

13



Mục tiêu

Đo lường mối
liên quan

So sánh sự
khác biệt
Biến định
lượng (1)

Biến định
tính (2)

Biến định
lượng (3)

Biến định
tính (4)

2. Xác định sự khác biệt
biến định tính
1
nhóm
Z
test

2
nhóm


>2
nhóm

Độc
lập

Ghép
cặp

Độc
lập

Ghép
cặp

Khi bình
phương
test
Fisher
exact
test nếu
tần số
mong
đợi <5

Khi bình
phương
của Mc
Nemar


Khi bình
phương
test

Cochran
Q test

14


1.

2.

3.

4.

So sánh tỷ lệ suy dinh dưỡng của mẫu nghiên
cứu với tỷ lệ chung của cả nước
So sánh tỷ lệ suy dinh dưỡng của nông thôn và
thành thị
So sánh tỷ lệ suy dinh dưỡng của một xã trước
và sau can thiệp
So sánh tỷ lệ suy dinh dưỡng của trẻ dưới 5 tuổi
là con của các bà mẹ có trình độ văn hóa khác
nhau (lên)

Mục tiêu


So sánh sự
khác biệt
Biến định
lượng (1)

Biến định
tính (2)

Đo lường mối
liên quan
Biến định
lượng (3)

Biến định
tính (4)

15


3. Đo lường mối liên quan
biến định lượng
2 biến

Hệ số
tương
quan r
của
pearson
nếu

phân bố
chuẩn

>2 biến

Hệ số
tương
quan r của
spearman
nếu phân
bố không
chuẩn

Hồi
quy
tuyến
tính

Có giá trị từ -1 đến +1
Khi HSTQ = 0 ⇒ 2 biến không có tương quan tuyến tính
Khi HSTQ > 0 ⇒ tương quan đồng biến
Khi HSTQ < 0 ⇒ tương quan nghịch biến
Càng gần 1 ⇒ tương quan càng chặt
HSTQ = 1 ⇒ không có sai số ngẫu nhiên
Bình phương của HSTQ (r2) thể hiện tỷ lệ biến thiên của biến phụ thuộc
được quy là do sự thay đổi của biến độc lập (nếu giữa hai biến có quan hệ
nhân quả)
Quy ước:
◦ <0,3: tương quan yếu;
◦ 0,3 - 0,5: tương quan TB

◦ 0,5-0,7: tương quan chặt chẽ
◦ >0,7: tương quan rất chặt chẽ

16


y


















x

y

x


y






















x







r=0



r=0

x

Pham Ngan Giang

17


y
y








r = -1











r = +1





x

x

Phương trình mô tả sự biến thiên của một biến định
lượng theo sự biến đổi của các biến khác
Y = a + bx1+bx2+bx3….
Y: biến phụ thuộc
X: biến độc lập
a: hằng số
b,c,d: hệ số

18


Biến phụ thuộc là biến ñịnh lượng có phân bố
chuẩn
Biến ñộc lập (giải thích) có thể là ñịnh tính
hoặc ñịnh lượng


Xác định mối tương quan giữa cân nặng và
chiều cao
Xây dựng mô hình hồi quy tuyến tính thể hiện
mối liên quan giữa cân nặng với chiều cao và
nhóm tuổi

19


Mục tiêu

So sánh sự
khác biệt
Biến định
lượng (1)

Biến định
tính (2)

Đo lường mối
liên quan
Biến định
lượng (3)

Biến định
tính (4)

4. Đo lường mối liên quan
giữa các biến định tính

2 biến

OR

>2 biến

RR

Hồi quy
logistic

20


Nguy cơ tương đối (RR)
được tính bằng tỷ lệ mới
mắc của những người có
tiếp xúc với yếu tố nguy cơ
(phơi nhiễm)/tỷ lệ mới mắc
của những người không tiếp
xúc với yếu tố nguy cơ
(không phơi nhiễm)
RR=[a/(a+b)]/[c/(c+d)]

Bệnh

Tổng




Không

a

b

a+b

Không c
phơi
nhiễm

d

a+d

Tổng

b+d

n


phơi
nhiễm

a+c

Áp dụng cho nghiên cứu
thuần tập


Tỷ suất chênh (OR) được
tính bằng độ chênh giữa tỷ
suất giữa số phơi nhiễm
trong nhóm có bệnh(a/b) và
số phơi nhiễm trong nhóm
không có bệnh (c/d)
RR=[a/b]/[c/d]=ad/bc
Áp dụng cho nghiên cứu
ngang và nghiên cứu bệnh
chứng

Bệnh

Tổng



Không

a

b

a+b

Không c
phơi
nhiễm


d

a+d

Tổng

b+d

n


phơi
nhiễm

a+c

21


Xác ñịnh mối liên quan giữa tỷ lệ cao huyết
áp và giới tính của mẫu nghiên cứu
Xác ñịnh mối liên quan giữa tỷ lệ mắc cúm
và việc tiêm vaccine phòng cúm

RR, OR = 1
RR, OR > 1
RR, OR < 1

Không có mối liên quan
Yếu tố nguy cơ

Yếu tố bảo vệ

22


Để tìm mối liên quan giữa biến phụ thuộc là biến nhị
phân và các biến độc lập là định lượng hoặc định tính
Ví dụ: Nghiên cứu bệnh - chứng về tình trạng mắc bệnh
phong và có tiêm vaccine BCG, với các yếu tố nghi ngờ
nhiễu là tuổi, giới, nơi học,...
Biến phụ thuộc: Mắc bệnh phong
Biến độc lập: có sẹo BCG, tuổi, giới, nơi học,...

23



×