Tải bản đầy đủ (.pdf) (26 trang)

Bài giảng Xác suất thống kê y học: So sánh hai trung bình kiểm định T không bắt cặp - ThS. Bùi Thị Kiều Anh, ThS. Lê Huỳnh Thị Cẩm Hồng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (816.7 KB, 26 trang )

SO SÁNH HAI TRUNG BÌNH
KIỂM ĐỊNH T KHÔNG BẮT CẶP
(T-TEST KHÔNG BẮT CẶP)
1


SO SÁNH HAI TRUNG BÌNH
• So sánh trung bình của 2 dân số
• Mẫu không bắt cặp:
Hai mẫu chọn từ hai dân số khác nhau và không có liên
hệ gì giữa các quan sát
Quan sát thứ nhất của mẫu 1 không liên hệ gì với quan
sát thứ nhất của mẫu 2


VÍ DỤ
So sánh chiều cao trung bình của nam sinh viên và
nữ sinh viên trường ĐH Hồng Bàng
• Dân số 1/Mẫu số 1: Nam sinh viên
• Dân số 2/Mẫu số 2: Nữ sinh viên
 So sánh trung bình của 2 dân số
 Hai dân số nam và nữ khác nhau, không có liên hệ
với nhau
 Dân số/Mẫu không bắt cặp


CHỌN LỰA KIỂM ĐỊNH PHÙ HỢP
Biến phụ
thuộc
(hậu quả)


Biến độc lập (nguyên nhân)
Nhị giá

Danh định –
Thứ tự

Định lượng Đa biến (mô
hình hóa)

Định lượng (phân phối
bình thường)

T-test

ANOVA

Hồi quy tuyến
tính

Thứ tự (biến định
lượng pp không bình
thường)

Wilcoxon Rank
sum t.
Mann-Whitney

Kruskal-Wallis

TQ Spearman


Nhị giá

Chi bình phương

Chi bình
Hồi quy logistic
phương
Hồi quy
(mhodds, tab2) Poisson

Sống còn

Wilcoxon tổng
quát
Logrank

Wilcoxon tổng
quát
Logrank

Hồi quy Cox
4


KIỂM ĐỊNH T (T-TEST)
• Biến độc lập (Nguyên nhân): Biến nhị giá
Vd: Giới tính (nam/nữ), Kết quả xét nghiệm
(Âm tính/Dương tính)
• Biến phụ thuộc (Kết quả): Biến định lượng, có

phân phối bình thường
Vd: Chiều cao trung bình; Thu nhập trung bình


KÝ HIỆU

Trung bình
Độ lệch chuẩn

Dân số
1
μ1

Mẫu
1
x1

Dân số
2
μ2

Mẫu
2
x2

σ1

s1

σ2


s2


Chúng ta tiến hành lấy mẫu nhiều lần từ dân số P1 và P2
sẽ thu được các trung bình và độ lệch chuẩn khác nhau
μ1 , σ1
μ2 , σ2

x1 , s1
x2 , s 2
Mẫu 1

x1 , s1
x2 , s2

x1 , s1
x2 , s 2

Mẫu 2

Mẫu 3


Hiệu số trung bình

μ1 -μ2
Mẫu 1

Mẫu 2


Mẫu 3

x1 - x2

x1 - x 2

x1 - x2

Giá trị (x1 - x2) sẽ thay đổi từ mẫu này sang mẫu khác
Giá trị (x1 - x2) sẽ phân phối đối xứng chung quanh giá trị (μ 1 -μ2)


Dữ liệu từ mẫu
Ví dụ: Nồng độ Vitamin D ở 2 nhóm nam và nữa
Mẫu
Nam
222 (n1)

Nữ
336 (n2)

Trung bình

28.57 (x1)

23.79 (x2)

Độ lệch
chuẩn (SD)


8.94 (s1)

7.86 (s2)

N


Phân biệt giữa sample và population
Nồng độ Vitamin D ở 2 nhóm nam và nữa
Mẫu

Dân số

Nam
222 (n1)

Nữ
336 (n2)

Trung bình

28.57 (x1)

23.79 (x2)

μ1 = ?

μ2 = ?


Độ lệch
chuẩn (SD)

8.94 (s1)

7.86 (s2)

σ1 = ?

σ2 = ?

N

Nam
Nữ
Ko xác định Ko xác định

Ta dùng số liệu mẫu để suy luận số liệu của quần thể
Chúng ta sẽ không biết μ1, μ2, σ1, σ2


Nồng độ Vitamin D ở 2 nhóm nam và nữa
Mẫu

Dân số

Nam
222 (n1)

Nữ

336 (n2)

Trung bình

28.57 (x1)

23.79 (x2)

μ1 = ?

μ2 = ?

Độ lệch chuẩn (SD)

8.94 (s1)

7.86 (s2)

σ1 = ?

σ2 = ?

N

Sự khác nhau
Tình trạng thông tin

Tính d => suy luận ð

Nam

Nữ
Ko xác định Ko xác định

d = x1 – x2

ð = μ1 – μ2

Biết

Không biết


Nồng độ Vitamin D ở 2 nhóm nam và nữa
Mẫu

Dân số

Nam
222 (n1)

Nữ
336 (n2)

Trung bình

28.57 (x1)

23.79 (x2)

μ1 = ?


μ2 = ?

Độ lệch chuẩn (SD)

8.94 (s1)

7.86 (s2)

σ1 = ?

σ2 = ?

N

Sự khác nhau
Tình trạng thông tin

Nam
Nữ
Ko xác định Ko xác định

d = x1 – x2

ð = μ1 – μ2

Biết

Không biết


Khác biệt giữa Vitamin D giữa nam và nữ
là thực tế hay ngẫu nhiên?


CÁC BƯỚC KIỂM ĐỊNH T KHÔNG BẮT CẶP
• Xây dựng giả thuyết Ho
• Chọn kiểm định phù hợp
• Tính giá trị thống kê của số liệu thu thập được
• Tính giá trị p-value
• Kết luận. Nếu p đủ nhỏ chúng ta bác bỏ giả thuyết Ho


CÁC BƯỚC KIỂM ĐỊNH T KHÔNG BẮT CẶP
• Giả thuyết Ho:

Trung bình nồng độ Vitamin D ở 2 nhóm dân số nam và nữ bằng nhau
Hay

ð = μ1 – μ2 = 0
• Nghiên cứu so sánh 2 trung bình nồng độ Vitamin D (biến phụ thuộc, định
lượng, phân phối bình thường) của nhóm nam và nữ (biến độc lập, nhị giá)
=> kiểm định T không bắt cặp


Ước tính phương sai của d
 

• Tính d (sự khác biệt giữa trung bình nam và nữ)

d = x1 – x 2

• Gọi var = Phương sai của d (Variance)
var (d) = var (x1) + var (x2)
=


Ước tính độ lệch chuẩn của d
 

Độ lệch chuẩn của d = Căn bậc 2 của phương sai

s
Thực tế, chúng ta không biết được σ1 và σ2 nên chúng ta sử dụng
s1 và s2 thay thế

s=


Ước tính khoảng tin cậy 95%

• Khoảng tin cậy 95% của d là:
CI 95% = d ± 1,96 s


ƯỚC TÍNH T
••  Tính

t:

• Thực tế, chúng ta không biết
được σ1 và σ2 nên chúng ta sử

dụng s1 và s2 thay thế

 


Tính độ tự do, giá trị p
Khi cỡ mẫu đủ lớn, ta không cần tính độ tự do (bởi vì độ tự do khá
lớn)
=>

chỉ cần áp dụng giá trị tới hạn của z thay cho giá trị tới hạn của t


20


GIẢ ĐỊNH CỦA KIỂM ĐỊNH T KHÔNG BẮT CẶP
• Dữ liệu tuân theo luật phân phối chuẩn/phân phối bình
thường
• Hai nhóm độc lập, không liên quan
• Cỡ mẫu tương đối đủ lớn, n1 > 30 và n2 > 30
• Lấy mẫu ngẫu nhiên


Bài tập
Nồng độ Vitamin D ở 2 nhóm nam và nữa. Biết rằng biến nồng
độ VitD có phân phối bình thường và phương pháp lấy mẫu
ngẫu nhiên
Câu hỏi:
Mẫu

d
Nam
Nữ
Phương sai
N
222 (n1)
336 (n2)
Độ lệch chuẩn
Khoảng tin cậy 95%
Trung bình
28.57 (x1)
23.79 (x2)
Kiểm tra giả định
Tính t
Độ lệch
8.94 (s1)
7.86 (s2)
Giá trị p
chuẩn (SD)
Kết luận


BÀI TẬP:
Một nghiên cứu thực hiện ở 2 làng, nhằm đánh giá:
Tình trạng suy dinh dưỡng ở tuối thiếu nhi >< Khả năng hoạt động thể
lực ở tuổi trưởng thành
- Làng 1: Tất cả phụ nữ mang thai + bà mẹ cho con bú + trẻ em
dưới 7 tuổi được bổ sung thực phẩm giàu năng lượng và giàu protein
Atole: 163 Kcal + 6,4 g protein/180ml
- Làng 2: Tất cả phụ nữ mang thai + bà mẹ cho con bú + trẻ em dưới

7 tuổi chỉ được bổ sung thực phẩm nghèo năng lượng và không có
protein
Fresco: 59 Kcal + 0 g protein/180ml


Sau hơn 10 năm, các nhà KH quay lại đo tốc dộ tiêu thụ Oxy cực
đại (VO2max) trên thanh niên 14-18 tuổi (những người đã được bổ
sung dinh dưỡng lúc mang thai và 3 năm đầu đời).
Biết rằng biến VO2max có phân phối bình thường và phương pháp
lấy mẫu ngẫu nhiên
KếtNhóm
quả:

can
thiệp

Atole
Fresco

n

44
42

VO2max (l/phút)
Trung bình
mẫu

Độ lệch
chuẩn


2,62
2,24

0,54
0,54

Câu hỏi:
Đặt giả thuyết Ho
d
Phương sai
Độ lệch chuẩn
Khoảng tin cậy 95%
Kiểm tra giả định
Tính t
Giá trị p
Kết luận


BÀI TẬP
Xem xét kết quả sau từ một chương trình sốt rét trong đó các lam
máu của trẻ từ 1 đến 4 tuổi được xét nghiệm tìm kí sinh trùng
Plasmodium falciparum.
• Kí sinh trùng được tìm thấy trong 70 lam máu (từ 70 trẻ), có nồng
độ hemoglobin trung bình của những trẻ này là 10,6g% với độ
lệch chuẩn là 1,4g%.
• Ở 80 mẫu máu của trẻ khác (không nhiễm ký sinh trùng) có nồng
độ hemoglobin trung bình là 11,5g% với độ lệch chuẩn là 1,3g%.
Nồng độ hemoglobin bị giảm trong lúc bị nhiễm P. falciparum
không?

25


×