1.
1.
TIẾN TRÌNH CHỌN MẪU
TIẾN TRÌNH CHỌN MẪU
2.
2.
CỠ MẪU
CỠ MẪU
3.
3.
PHƯƠNG PHÁP CHỌN MẪU
PHƯƠNG PHÁP CHỌN MẪU
1.
1.
TIẾN TRÌNH CHỌN MẪU
TIẾN TRÌNH CHỌN MẪU
2.
2.
CỠ MẪU
CỠ MẪU
3.
3.
PHƯƠNG PHÁP CHỌN MẪU
PHƯƠNG PHÁP CHỌN MẪU
CHƯƠNG 3. CHỌN MẪU VÀ CÁC
CHƯƠNG 3. CHỌN MẪU VÀ CÁC
VẤN ĐỀ CÓ LIÊN QUAN
VẤN ĐỀ CÓ LIÊN QUAN
1. Đảm bảo tính ngẫu nhiên, đại diện, chính xác
2. Vấn đề chi phí và thời gian trong nghiên cứu
3. Thiệt hại về mẫu thử
4. Tính chính xác của khoa học xử lý thông tin với
phương pháp suy luận xử lý thông tin
Vì sao phải chọn mẫu
Vì sao phải chọn mẫu
1
.
X
á
c
đ
ị
n
h
t
ổ
n
g
t
h
ể
2
.
C
ấ
u
t
r
ú
c
m
ẫ
u
3
.
Đ
ơ
n
v
ị
3
.
Đ
ơ
n
v
ị
l
ấ
y
m
ẫ
u
l
ấ
y
m
ẫ
u
6
.
S
ơ
đ
ồ
C
h
ọ
n
m
ẫ
u
7
.
T
i
ế
n
h
à
n
h
C
h
ọ
n
m
ẫ
u
5
.
P
P
c
h
ọ
n
m
ẫ
u
4
.
C
ỡ
m
ẫ
u
1. TIẾN TRÌNH CHỌN MẪU
1. TIẾN TRÌNH CHỌN MẪU
2. XÁC ĐỊNH CỠ MẪU
2. XÁC ĐỊNH CỠ MẪU
3 yếu tố chủ yếu ảnh hưởng đến cỡ mẫu
•
Độ biến động của dữ liệu: V = p (1 – p) tỷ lệ thuận
với cỡ mẫu (p là tỷ lệ xuất hiện của các phần tử
trong đơn vị lấy mẫu) đúng như mục tiêu chọn mẫu
(0
≤
p
≤
1)
•
Độ tin cậy liên hệ với giá trị Z (90%, 95%)
•
Tỷ lệ sai số ước lượng MOE (nếu điều tra toàn bộ
tổng thể thì MOE = 0)
[ ]
2
2/
2
)1(
α
Ζ
−
=
MOE
pp
n
2. XÁC ĐỊNH CỠ MẪU
2. XÁC ĐỊNH CỠ MẪU
Cỡ mẫu phụ thuộc vào tổng thể
•
N: tổng thể
•
e: sai số tối đa (e = 1- độ tin cậy)
•
n: cỡ mẫu
)1(
2
eN
N
n
×+
=
Các yếu tố ảnh hưởng
đến cỡ mẫu
•
Mục tiêu nghiên cứu
•
Yêu cầu của dữ liệu phân tích
•
Hạn chế về thời gian
•
Hạn chế về chi phí
•
Cỡ mẫu tương quan với độ lớn của tổng thể
•
Cỡ mẫu khi chọn mẫu phi xác suất
3. PHƯƠNG PHÁP CHỌN MẪU
3. PHƯƠNG PHÁP CHỌN MẪU
•
Chọn mẫu xác suất - ngẫu nhiên
•
Chọn mẫu phi xác suất
Save your
Save your
forests !!!
forests !!!
CHỌN MẪU XÁC SUẤT
(NGẪU NHIÊN)
•
Ngẫu nhiên đơn giản:
+ Rút thăm, thẻ ngẫu nhiên
+ Dùng bảng số ngẫu nhiên nếu tổng thể lớn
+ Dùng hàm @ Rand ( ) * N
•
Ngẫu nhiên hệ thống:
+ Chọn ngẫu nhiên mẫu đầu tiên
+ Sau đó dùng bước nhảy (lặp đi lặp lại) căn cứ vào N
và n
k= N/n
+ Áp dụng tốt nếu danh sách tổng thể được xếp ngẫu
nhiên (giảm sai lệch do tuần hoàn theo bước nhảy)
•
Ngẫu nhiên phân tầng:
+ Phổ biến nhất vì tính chính xác &ì đại diện cao
+ Chia tổng thể ra từng nhóm nhỏ theo 1 tiêu thức
nào đó gọi là tiêu thức phân tầng (thu nhập, giới tính,
tuổi tác, TĐ VH, nhân khẩu )
+ Chọn ngẫu nhiên hay hệ thống trong từng nhóm
phân tầng theo tỉ lệ với độ lớn của nhóm
+ Quan trọng là chọn tiêu thức phân tầng phù hợp
(trường hợp số liệu không có sẵn)
•
Ngẫu nhiên theo vùng địa giới:
Vùng 2 cấp
Ở TP có 200 Khu phố, mỗi khu phố có 20 hộ gia đình. Mục tiêu
chọn cỡ mẫu là 100 hộ gia đình thì tỷ lệ chọn sẽ là n/N=
1/40
Chọn mẫu ngẫu nhiên theo vùng 2 cấp:
•
Cấp Khu phố: với tỷ lệ chọn 1/b
•
Cấp hộ gia đình: với tỷ lệ chọn 1/h
Vậy theo yêu cầu thì tỷ lệ chọn toàn thể là: (1/b).(1/h) = 1/b.h =
1/40 và m.k = 100
Các phương án chọn mẫu
Ph.án
chọn
mẫu
Tỷ lệ
chọn
Cấp 1
(1/b)
Tỷ lệ
chọn
Cấp 2
(1/h)
Tỷ lệ
chọn
toàn
thể
(1/b.h)
Số
Kphố
chọn
cấp 1
(m)
Số hộ
GĐ
chọn
cấp 2
(k)
1
2
3
4
5
6
1/2
1/4
1/8
1/10
1/20
1/40
1/20
1/10
1/5
1/4
1/2
1
1/40
1/40
1/40
1/40
1/40
1/40
100
50
25
20
10
5
1
2
4
5
10
20
•
Chọn mẫu thuận tiện:
+ Dựa trên tính “dễ tiếp xúc” và “cơ hội thuận tiện” để chọn mẫu
+ Chỉ dùng cho nghiên cứu thăm dò, trắc nghiệm, không dùng cho
nghiên cứu mô tả hay nhân quả vì tính đại diện không cao
•
Chọn mẫu tích luỹ nhanh:
+ Các mẫu đầu tiên được chọn theo phương pháp xác suất
+ Các mẫu bổ sung tiếp theo được chọn ra từ việc cung cấp thông
tin qua hình thức nhờ giới thiệu
+ Áp dụng cho các nội dung nghiên cứu khá đặc biệt, không phổ
biến
CHỌN MẪU PHI XÁC SUẤT
•
Chọn mẫu theo hạn mức:
+ Tổng thể quá lớn, sự khác biệt (biến động) giữa
các phần tử không lớn
+ Tổng thể đã được phân tổ nhóm trước (đồng
nhất)
PVV chỉ chọn cho đủ số lượng không cần
ngẫu nhiên
+ Dựa vào đặc tính kiểm soát (tiêu thức phân tổ)
của từng nhóm để chọn
SO SÁNH CHỌN MẪU
XÁC SUẤT VÀ PHI XÁC SUẤT
Xác suất Phi xác suất
Ưu điểm Tính đại diện cao
Khái quát hóa cho
tổng thể
Tiết kiệm thời gian
và chi phí
Nhược
điểm
Tốn kém thời gian
và chi phí
Tính đại diện thấp
Phạm vi sử
dụng
Nghiên cứu mô tả,
khám phá và quan
hệ nhân quả
Nghiên cứu thử
nghiệm, thăm dò
VẼ SƠ ĐỒ CHỌN MẪU
•
Trường hợp địa bàn rộng
•
Cần quản lý chặt chẽ nhóm PVV
•
Vẽ phác họa sơ đồ khu vực chọn mẫu, đánh dấu
các số nhà trên địa bàn
•
Chia nhỏ các ô trên bản đồ Thành phố, đánh số
thứ tự các ô, chọn ngẫu nhiên 100 ô để xác định
các hộ gia đình, cửa hàng được chọn làm mẫu
GROUP
WORKING !!!