Tải bản đầy đủ (.pdf) (50 trang)

Bài toán kiểm định giả thuyết thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.98 MB, 50 trang )

BÀI TOÁN KIỂM ĐỊNH

GIẢ THUYẾT THỐNG KÊ
GV. ThS Trần Thị Thu Hà
Trường ĐHYDTB

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Mục tiêu
• Trình bày được các khái niệm về kiểm
định giả thuyết thống kê.
• Biết cách tiến hành kiểm định giả
thuyết thống kê

• Trình bày được các nguyên tắc chọn
test thống kê
• Áp dụng được các test thống kê phổ
biến trong nghiên cứu khoa học

© 1984-1994 T/Maker Co.

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Giả thuyết thống kê là gì?
Một giả thuyết là một điều giả sử về:
1. Tham số.

2. Quy luật phân phối
3. Tính độc lập



© 1984-1994 T/Maker Co.

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Giả thuyết “không”, H0




Giả thuyết Ho là giả thuyết về không khác biệt
Ví dụ: Chiều cao trung bình bằng 165 cm
(H0: µ = 165)

Giả thuyết Ho là phủ định của giả thuyết nghiên

cứu. Bắt đầu bài toán kiểm định với giả sử rằng giả
thuyết H0 là đúng.

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà







Đối thuyết, H1


Là giả thuyết khác với H0

Ví dụ: Chiều cao trung bình khác 165 cm
(H0: µ = 165 ; H1: m ≠ 165)

Đối thuyết H1 có thể được chấp nhận hoặc
bác bỏ

Trong một vài tình huống, đối thuyết sẽ dễ
được xác định trước tiên.
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Xây dựng giả thuyết
Câu hỏi nghiên cứu

Giả thuyết H1

(QĐ của nhà NC)

Giả thuyết Ho

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Giả thuyết khoa học
• Câu hỏi nghiên cứu được đổi thành giả thuyết

– Giả thuyết không (H0)


– Đối thuyết/ Giả thuyết đối (H1)

• Ví dụ

H0: µ1 = µ2
H1: µ1 ≠ µ2

Kiểm định 2 phía

H0: µ1 = µ2

H1: µ1 < µ2 (>)

Kiểm định 1 phía

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Bài toán kiểm định giả thuyết??

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Các loại sai lầm
Bản chất tổng thể (thực tế)
Kết luận của Test

Chấp nhận H0

Bác bỏ H0


H0 đúng

H0 Sai

Quyết định đúng

Sai lầm loại II: ()

Sai lầm loại I: ()

Quyết định đúng
Lực của test (1- )

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Mức ý nghĩa, 

• Kí hiệu: 

Một vài giá trị cụ thể thường gặp: 0.01,
0.05, 0.10,…

• Được chọn bởi người nghiên cứu ngay
lúc bắt đầu tiến hành kiểm định.

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà



p < 0,05 là gì????
Ví dụ:

• Trọng lượng trung bình của trẻ trai 3211 gram lớn hơn
trọng lượng trung bình của trẻ gái là 3044 gram
(p=0,0012)
• Trọng lượng trung bình của trẻ trai 3211 gram lớn hơn
trọng lượng trung bình của trẻ gái là 3044 gram
(p<0,01)

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà







Giá trị p-value

Là giá trị xác suất nhỏ nhất mà H0 có thể
bị bác bỏ :

p-value = P(H1/ H0)

Không trực tiếp cho ta kết luận về giả thuyết mà
chỉ gián tiếp cho ta kết luận về việc chấp nhận
và bác bỏ đối thuyết

Được sử dụng khi đưa ra quyết định:


Nếu p-value



α: Chấp nhận H0

Nếu p-value < α: Bác bỏ H0

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Các loại kiểm định?
1. Kiểm định tham số là công cụ xử lý các
dữ liệu dạng định lượng có phân phối
chuẩn.

2. Kiểm định phi tham số là công cụ xử lý
các dữ liệu định lượng không có phân
phối chuẩn, dạng định danh và thứ bậc.
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Các loại kiểm định
Kiểm định tham số đòi hỏi một số giả định:
1.

Các nhóm quan sát phải độc lập với nhau.

3.


Các nhóm quan sát phải có phương sai tương
đương.

2.

4.

Các nhóm quan sát phải được rút ra từ các
đám đông có phân phối xác định (chuẩn, nhị
thức,....)

Các mẫu ngẫu nhiên

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Các loại kiểm định

Kiểm định phi tham số ít đòi hỏi các giả định:
– Không đòi hỏi các quan sát phải được rút ra từ các
đám đông có phân phối chuẩn.

– Không đòi hỏi các nhóm phải có phương sai tương
đương.

– Là cách duy nhất để xử lý dữ liệu định danh.

– Là cách đúng đắn để xử lý dữ liệu với thang đo thứ
tự (ordinal), mặc dù kiểm định tham số có thể áp

dụng được .

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Các loại kiểm định
So sánh, tìm sự khác biệt
• So sánh hàm lượng đường
máu trước và sau điều trị

• So sánh tỷ lệ tai biến mạch
não giữa 2 nhóm bệnh nhân

Phân tích liên quan
• Huyết áp phụ thuộc vào tuổi
và giới như thế nào
• Tỷ lệ mắc bệnh tim mạch có
liên quan đến hút thuốc lá,
chế độ ăn như thế nào

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Tiến trình kiểm định giả thuyết thống kê????

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Các bước kiểm định giả thiết
Bước 1: Hình thành giả thuyết

Bước 2: Chọn test thích hợp
Bước 3: Quyết định

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Làm thế nào chọn được test thống kê thích hợp?

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Lựa chọn kiểm định giả thuyết
Mục tiêu và kiểu của các câu hỏi nghiên cứu
Mục tiêu chung
Mục tiêu cụ thể

Kiểu câu hỏi/ giả thiết
Kiểu thống kê

Quan hệ giữa các biến
So sánh
nhóm
Khác biệt
Thống kê khác biệt
( t-test, ANOVA….)

Mức độ liên
quan, các biến
liên quan
Liên quan

Thống kê liên
quan
(tương quan,
hồi quy)

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


So sánh, tìm sự khác biệt biến định lượng
Phân bố chuẩn

1
nhóm

CI,
T test

2
nhóm

CI,
ttest đlập
ttest g.cặp

Phân bố không chuẩn

>=2
nhóm

CI,

ANOVA
(ph.sai đ
nhất)

1
nhóm

2
nhóm

>2
nhóm

Sign test,
Wilcoxon
signedrank test

Đ.lập:
MannWhitney
test
Gh. cặp:
Sign test,
Wilcoxon
signedrank test

KruskalWallis test

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà



So sánh, tìm sự khác biệt biến định tính

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


So sánh số trung bình quan sát với số TB lý thuyết
Bước 1: Thiết lập giả thuyết
Bước 2: Giả sử mẫu ngẫu nhiên được chọn từ tổng thể cá phân
phối chuẩn với kỳ vọng µ chưa biết và các quan sát là
độc lập với nhau
TH1: σ đã biết

t

X  m0



. n

TH2: σ chưa biết

X  m0
t
. n ; df  n  1
S

Bước 3: Quyết định:
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà



So sánh số trung bình quan sát với số TB lý thuyết

Ví dụ: Kết quả điều tra y tế quốc gia cho thấy
cân nặng trung bình của trẻ em lúc mới sinh là
3250g. Các nhà quản lý y tế của tỉnh A quyết định
tiến hành nghiên cứu trên 30 trẻ mới sinh tại các cơ
sở y tế của tỉnh. Kết quả nghiên cứu cho thấy cân
nặng trung bình là 2950g và độ lệch chuẩn là 350g
(giả sử cân nặng trẻ sơ sinh có phân phối chuẩn).
Hỏi cân nặng trung bình của trẻ sơ sinh của tỉnh A
có giống cân nặng trung bình của trẻ sơ sinh toàn
quốc không ở mức ý nghĩa 0,05?
Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


Kiểm định sự khác biệt về hai phương sai
Giả sử nghiên cứu 2 mẫu với kích thước tương ứng là nA và nB từ
2 tổng thể có phân phối chuẩn có phương sai chưa biết.

Bước 1: Thiết lập giả thuyết
H 0 :  12   22

Bước 2: Tính

H1 :  12   22

S A2
F  2 (víi S A2  S B2 )
SB


Bước 3: Quyết định:

Nếu F  F : Chấp nhận giả thuyết H0
Nếu F  F : Bác bỏ giả thuyết H0.

Bài giảng PTSL – YTCCK1. GV. Ths. Trần Thị Thu Hà


×