BÀI 7
PHƯƠNG PHÁP CHỌN MẪU
N I DUNGỘ
Xác định cỡ mẫu
Các cách chọn mẫu
◦
Chọn mẫu phi xác suất
◦
Chọn mẫu xác suất
Chọn mẫu ngẫu nhiên đơn giản
Chọn mẫu hệ thống
Chọn mẫu cụm
Chọn mẫu phân tầng (nhiều giai đoạn)
Xác định cỡ mẫu
Số lượng các đơn vị chọn mẫu được lấy ra để
nghiên cứu được gọi là dụng lượng mẫu hay còn
gọi là cỡ mẫu.
Để xác định cỡ mẫu phụ thuộc vào rất nhiều yếu
tố. Có rất nhiều công thức tính cỡ mẫu, các công
thức này khác nhau tuỳ theo các phương pháp
chọn mẫu.
Xác định cỡ mẫu
Cỡ mẫu phụ thuộc vào các yếu tố cơ bản
sau:
◦
Mục đích của cuộc điều tra
◦
Khả năng vật chất (tài chính)
◦
Nguồn lực (số lượng điều tra viên)
◦
Quy mô dân số.
◦
Lỗi mẫu cho phép (Yêu cầu về độ chính xác)
◦
Ngoài ra, các yếu tố về số lượng tiêu thức điều
tra, mức độ thuần nhất của tổng thể.
Xác định cỡ mẫu
Chúng ta sử dụng công thức dưới đây để xác định
kích thước mẫu:
Trong đó:
◦
n: kích cỡ mẫu được tính
◦
Z: giá trị liên quan đến độ tin cậy (thường chọn độ tinh cậy
95% => z= 1.96
Xác định cỡ mẫu
p = ước tính phần trăm trong tập hợp. Thông thường p sẽ
thấy ở một vài nghiên cứu trước đó hoặc một vài nguồn thông tin. Trong trường
hợp chúng ta không có thông tin trước liên quan đến p, chúng ta thường thiết lập
giá trị của p tới 0.5
q = (1-p)
e = sai số (Sai số càng nhỏ thì kích thước mẫu càng
lớn. Giá trị tham khảo: 0.05
Tham khảo />%C3%ADchthướcmẫu/tabid/132/language/vi-VN/Default.aspx
Các cách chọn mẫu
Chọn mẫu phi xác suất
◦ Nghiên cứu thăm dò
◦
Chọn mẫu thuận tiện
◦
Chọn mẫu không biết trước xác suất của mẫu
Chọn mẫu xác suất
◦ Tổng quát hóa cho toàn bộ tổng thể
◦
Chọn mẫu nhắm đến kết quả
◦
Chọn mẫu biết trước xác suất được lựa chọn nằm
trong mẫu
Chọn mẫu phi xác suất
Mẫu thuận tiện (dễ dàng lấy mẫu)
Chọn mẫu theo mạng quan hệ (VD: dựa
trên quan hệ bạn bè)
Chọn mẫu có mục tiêu(chọn mẫu có phán
đoán)
Sẽ chọn mẫu dựa theo mục đích nghiên cứu về đối
tượng nào
Chọn mẫu xác suất
Mẫu ngẫu nhiên giản đơn
Mẫu hệ thống
Chọn mẫu chùm
Chọn mẫu phân tầng (nhiều giai
đoạn)
Chọn mẫu ngẫu nhiên đơn giản
Định nghĩa: là cách chọn các đơn vị từ tổng thể vào mẫu hoàn
toàn ngẫu nhiên.
Xác suất được chọn của các phần tử là như nhau: n/N (trong đó:
n=cỡ mẫu, N= cỡ của tổng thể)
Nguyên tắc:
◦ Xác suất chọn của các phần tử là ngang nhau
Các bước tiến hành:
◦ Xác định khung lấy mẫu
Liệt kê tất cả các phần tử chọn mẫu
Đánh số tất cả các phần tử
◦
Lấy ngẫu nhiên các phần tử
Chọn mẫu ngẫu nhiên đơn giản
Ví dụ: ước lượng tỷ lệ hộ gia đình được tiếp cận với
nước sạch trong thôn A
Khung lấy mẫu: danh sách các hộ gia đình trong thôn A.
Cách chọn:
◦
Liệt kê tất cả hộ gia đình trong thôn A (vd: 1200 hộ)
◦
Đánh số các hộ này từ 1 đến 1200
◦
Chọn cỡ mẫu bằng 100
◦
Chọn ngẫu nhiên 100 số trong khoảng từ 1 đến 1200
Chọn mẫu ngẫu nhiên đơn giản
Cách 2: dùng Excel:
◦
Excel option/ add-in/ excel – analysis toolPak
◦
Data analysis/ Sampling
Chọn mẫu ngẫu nhiên đơn giản
Chọn mẫu ngẫu nhiên đơn giản
Ưu điểm:
◦
Đơn giản
◦
Dễ dàng trong việc đo lường sai lệch chọn mẫu
Nhược điểm:
◦ Phải liệt kê tất cả các phần tử
◦
Không phải lúc nào cũng lấy được mẫu đại diện tốt
nhất
◦
Các phần tử có thể phân tán và khó khăn thu thập
Chọn mẫu hệ thống
Định nghĩa: chọn các đơn vị từ tổng thể vào mẫu
theo một khoảng cách cố định sau khi đã chọn
ngẫu nhiên một nhóm nào đó trên cơ sở các đơn
vị điều tra được sắp xếp theo thứ tự
Nguyên tắc
◦
Chọn mẫu trong khoảng thông thường, tùy thuộc vào
khoảng lấy mẫu
Chọn mẫu hệ thống
Quy trình chọn mẫu:
◦
Khung lấy mẫu: Tấm bản đồ hoặc danh sách các hộ
gia đình. (1200 hộ chọn 60 hộ)
◦
Đơn vị lấy mẫu: Hộ gia đình
◦ Xác định khoảng cách mẫu: SI = 1200/60 = 20
◦
Phương pháp chọn mẫu:
B1: Đánh số liên tục các khu nhà từ 1 đến 20 trong khung
chọn mẫu.
B2: Chọn ngẫu nhiên 1 số từ 1 – SI: tức là 1- 20 => 8
B3: Chọn các hộ tiếp theo: 8+SI => 8, 28, 48….
Chọn mẫu hệ thống
Ưu điểm:
◦
Đơn giản
◦
Dễ dàng đánh giá được những lỗi trong chọn mẫu
Nhược điểm:
◦ Phải liệt kê tất cả các phần tử
◦
Phải có tính tuần hoàn
Chọn mẫu hệ thống
Chọn mẫu chùm
Nguyên tắc:Lấy mẫu theo chùm là phương pháp chọn mẫu các
nhóm riêng biệt (thường được gọi là chùm hoặc cụm) của các
đơn vị nhỏ hơn tổng thể và gọi là phần tử. Tức là tổng thể
được phân chia ra làm các chùm sao cho :
◦
Mỗi đơn vị nghiên cứu được phân và một chùm
◦
Mỗi chùm cố gắng chứa nhiều đơn vị khác nhau sao cho sự phân
bố các đơn vị của nó giống như tổng thể.
◦
Giữa các chùm có sự phân bố tương đối đồng đều với nhau.
20
Khu vực 4
Khu vực: 5
Khu vực: 3
Khu vực: 2
Khu vực 1
Ví dụ: Chọn mẫu theo chùm
21
Chọn mẫu theo chùm
Ưu điểm:
◦
Đơn giản vì không yêu cầu liệt kê tất cả các phần tử
chọn mẫu trong tổng thể
◦
Đỡ tốn kém (đi điều tra ở các đơn vị ở gần nhau)pppl
Nhược điểm:
◦
Có thể xảy ra trường hợp các phần tử trong cùng một
nhóm này giống nhau nhiều hơn các phần tử trong
cùng một nhóm khác. Donhững hộ gia đình gần nhau
thì có xu hướng mang những đặc trưng giống nhau, do
ảnh hưởng đến tính đại diện của mẫu và làm cho sai
số lấy mẫu tăng lên.
22
Chọn mẫu phân tầng (nhiều giai đoạn)
Nguyên tắc: Chọn mẫu liên tiếp
Phần tử chọn mẫu: hộ gia đình
◦
Giai đoạn 1: Lựa chọn tỉnh
◦
Giai đoạn 2: Lựa chọn khu vực (thôn)
◦
Giai đoạn 3: lựa chọn hộ gia đình
23
Chọn mẫu phân tầng (nhiều giai đoạn)
Ưu điểm
◦
Có thể thu thập được thông tin của toàn bộ tổng thể và cả
từng tầng nhỏ
◦
Tính chính xác cao nếu sự khác biệt trong mỗi nhóm nhỏ là
đồng nhất hơn sự khác biệt giữa các nhóm
Nhược điểm
◦
Khó khăn trong việc xác định các tầng
◦
Tính chính xác của mẫu không còn nếu có quá ít phần tử
trong từng tầng nhỏ
Có thể khắc phục bằng cách lấy tỷ lệ chọn mẫu theo tổng thể các mỗi
tầng
24
Lựa chọn phương pháp chọn mẫu
Tổng thể được nghiên cứu
◦
Quy mô và sự phân bố về mặt địa lý
◦
Tính không thuần nhất đối với các biến
Sự sẵn có của danh sách các phần tử chọn
mẫu
Mức độ chính xác cần thiết
Các nguồn lực sẵn có
Th c hànhự