1
Chän mÉu
NguyÔn H÷u Minh
ViÖn NC Gia ®×nh vµ Giíi
2
Lý tưởng là có thể khảo sát toàn bộ những người có
liên quan.
Trong thực tế không làm được điều đó (ngân sách,
thời gian, v.v.)
Cần lưu ý:
Bảo đảm mỗi phần tử trong tổng thể có cơ hội được chọn
bằng nhau.
Bảo đảm tính đúng đắn của mẫu bằng cách tăng kích
thước mẫu.
3
Tổng thể mục tiêu
Nhóm các đơn vị (ví dụ ng+ời, hộ gia đình, nông trại)
Mẫu
Một phần của tổng thể mục tiêu mà chúng ta muốn
nghiên cứu
Khung mẫu
Danh sách hoặc các thủ tục chúng ta sẽ sử dụng để chọn
mẫu
4
Độ tin cậy (mức ý nghĩa) & Khoảng tin cậy: kết quả
ước lượng của một chỉ báo nhất định từ mẫu là một
biến xác suất nên có khác biệt (sai số) nhất định so với
giá trị thực tế của tổng thể. Ví dụ, từ khảo sát mẫu, ta
kết luận “95% khả năng là tỷ lệ người thất nghiệp của
dân số mục tiêu nằm trong khoảng 12% ± 1.5%”.
Trong trường hợp này, ước lượng mẫu là 12% với
mức ý nghĩa 95% và khoảng tin cậy là [10.5% -
13.5%]
5
Sai số của một ước lượng từ khảo sát chọn mẫu là
tổng của sai số chọn mẫu (hay sai số ngẫu nhiên) và
sai số phi chọn mẫu.
Nếu là chọn mẫu xác suất thì có thể ước lượng được
sai số chọn mẫu.
Sai số phi chọn mẫu khá đa dạng, phức tạp và không
có công thức chung để ước lượng.
6
Các hình thức chọn mẫu
Có nhiều loại thông tin khác nhau cần thu thập: thông
tin cá nhân, ý kiến của các chuyên gia, v.v.
Có các hình thức chọn mẫu tương ứng: xác suất và phi
xác suất.
Mẫu xác suất: ngẫu nhiên đơn giản, ngẫu nhiên hệ
thống, phân tầng, cụm.
Mẫu phi xác suất: định mức (quota), hướng đích
(purposive), thuận tiện (convenien ce), bóng tuyết
(snowball).
7
Khái niệm: Là phương pháp chọn mẫu mà tất cả đơn vị nghiên
cứu cơ bản trong tổng thể có xác suất được chọn lớn hơn 0 và
xác suất đó phải tính được.
Một số nguyên tắc:
Tổng thể nghiên cứu phải hữu hạn và xác định, tức là ta có thể đếm
và quan sát được.
Mọi đơn vị mẫu của tổng thể phải được đưa vào khung lấy mẫu.
Bảo đảm tính ”ngẫu nghiên” và ”đại diện” của việc lấy mẫu từ tổng
thể.
Nếu xác suất chọn các đơn vị mẫu không bằng nhau, phải tiến hành
“cân bằng xác suất” (gia quyền) khi tính toán ra các số đo đặc trưng
cho tổng thể.
8
Ưu điểm chính:
Có cơ sở khoa học vững chắc
Có thể dễ dàng suy rộng cho tổng thể với sai số xác định
Có thể thực hiện các phân tích định lượng với độ tin cậy
nhất định
Hạn chế:
Phải tuân thủ nghiêm ngặt một số nguyên tắc
Cần có nhiều thông tin, thời gian, kinh phí hơn
9
Mẫu xác suất dựa trên việc chọn một số cho tr+ớc các
đơn vị phân tích từ danh sách gọi là khung mẫu.
Khung mẫu (sampling frame) thể hiện tổng thể mẫu
nghiên cứu. Cần có một khung mẫu (hay tổng thể
mẫu) tốt nếu muốn có mẫu tốt.
Trong mẫu xác suất mỗi cá nhân có cùng cơ hội nh+
các cá nhân khác đ+ợc chọn.
Chỳ ý n kớch thc mu (cụng thc v bng kớch
thc mu).
10
!"#$!
Đánh số và chọn ngẫu nhiên (máy tính hoặc bảng số ngẫu nhiên).
Tr+ờng hợp ng+ời đ+ợc phỏng vấn không ở nhà.
Chn cú lp li: Khi mt n v c chn vo mu xong, n v
ú khụng b loi khi danh sỏch chn mu nờn vn cú th c
chn trong cỏc ln chn n v tip theo.
Chn khụng lp: Khi mt n v c chn vo mu xong, n v
ú b loi khi danh sỏch chn mu nờn khụng th c chn
trong cỏc ln chn n v tip theo.
Chn mu ngu nhiờn trong kho sỏt nghiờn cu khoa hc xó hi
thng l chn khụng lp.
Tớnh kớch thc mu: Xem cụng thc kốm theo.
11
%
!"&!
Chọn mẫu ngẫu nhiên hệ thống là dễ hơn và tiết kiệm
hơn.
Cần có số đ+ợc chọn ban đầu và khoảng cách mẫu.
Tớnh k= n/N.
Chn s ngu nhiờn bt k a k
Chn cỏc phn t th a, a+k, a+2k, , a+(n-1)k trong
khung ly mu
Khi k khụng phi l s nguyờn => lm trũn k, ni danh
sỏch chn mu thnh 1 vũng trũn, thc hin tng t
nh trờn cho n khi chn n phn t.
12
'
!"(!
Mẫu ngẫu nhiên phân tầng bảo đảm rằng các nhóm dân
số chủ yếu đều có mặt trong mẫu.
Chia khung mẫu ra thành các tiểu khung mẫu dựa trên
một số biến độc lập chủ yếu. Sau đó chọn mẫu ngẫu
nhiên đơn giản/hệ thống từ mỗi một nhóm này.
13
)
*
Mẫu cụm là cách chọn mẫu khi không có danh sách mẫu
hoặc khung mẫu.
Mẫu cụm dựa trên cơ sở vùng địa lý hoặc các tổ chức.
Tng th c chia thnh cỏc cm tng i ging nhau
S dng phng phỏp ngu nhiờn n gin hoc h thng
chn mt s cm nht nh.
14
+
,* (!
/(!0
Chi phÝ cao h¬n (lËp danh s¸ch, ph©n tÇng, v.v.)
HiÖu qu¶ h¬n so víi mÉu côm.
*0
Chi phÝ thÊp h¬n: Không cần lập danh sách tất cả các đơn
vị cơ bản trong tổng thể (mà chỉ cần danh sách đơn vị cơ
bản trong các cụm được chọn)
HiÖu qu¶ thÊp h¬n.
15
Chọn mẫu xác suất đảm bảo được tính chính xác và đại diện,
nhưng phải có khung mẫu (danh sách đầy đủ các thành viên của
tổng thể để từ đó chọn ra một mẫu).
Tuy nhiên, trong nhiều truờng hợp chọn mẫu xác suất là điều
không thể được. Những trường hợp sau đây thậm chí không nên
nghĩ đến việc chọn mẫu:
Khi tổng thể nghiên cứu rất nhỏ, chọn mẫu là điều không cần thiết
Khi hiện tượng mới xuất hiện và còn chưa rõ, chọn mẫu là không
phù hợp
Khi dữ liệu dễ tiếp cận, cũng không cần phải chọn mẫu.
16
Chọn mẫu phi xác suất là phương pháp chọn mẫu mà không
phải tất cả các đơn vị trong tổng thể đều có khả năng được
chọn vào mẫu nghiên cứu hoặc không thể tính xác xuất được
chọn cho tất cả các đơn vị trong tổng thể.
Ưu điểm: Đơn giản, dễ tiến hành; Cần ít thông tin, thời gian,
kinh phí.
Nhược điểm:
Phụ thuộc vào kinh nghiệm và sự hiểu biết về tổng thể của người
nghiên cứu => kết quả mang tính chủ quan của người nghiên cứu.
Không thể tính được sai số do chọn mẫu => không thể áp dụng
phương pháp ước lượng thống kê để suy rộng kết quả trên mẫu cho
tổng thể chung.
17
#123,445!
Dựa vào số l+ợng các nhóm nhỏ cần quan tâm nghiên
cứu và tỉ lệ các nhóm đó trong mẫu phải chọn.
Mẫu định mức gần giống nh+ mẫu phân tầng. Điểm
khác biệt cơ bản là ng+ời đ+ợc phỏng vấn không đ+ợc
chọn ngẫu nhiên.
67!#89,-:45!
Xác định tr+ớc mục đích muốn ng+ời đ+ợc PV trả lời,
sau đó tìm ng+ời đ+ợc phỏng vấn.
Gần giống mẫu định mức nh+ng không có thiết kế mẫu
chung cho phép biết đ+ợc bao nhiêu ng+ời của mỗi
nhóm cần cho nghiên cứu.
18
;,-:::45!
Sử dụng cho bất kỳ ng+ời nào gặp. Thuận tiện để thử bảng hỏi.
Ch nờn s dng khi NC cú mc ớch khỏm phỏ hoc khi cỏc bin
th c th trong tng th khụng cú/cú ớt tỏc ng n hin tng
ang c nghiờn cu.
Nguy hiểm trong nhiều tình huống khác. Ví dụ, hỏi sinh viên trong
th+ viện về những vấn đề xảy ra trong ký túc xá, mà không hỏi
những sinh viên đang đánh bài trong quán cà phê.
3<=!,><45545!
Chọn một hay vài nhân vật chủ yếu và yêu cầu họ giới thiệu tiếp.
Đặc biệt hiệu quả trong tổng thể nghiên cứu nhỏ v đề tài nhạy
cảm.
19
%
Chọn mẫu phán đoán (judgement sampling):
Phỏng vấn viên tự đưa ra phán đoán về đối tượng cần
chọn vào mẫu.
Tính đại diện của mẫu phụ thuộc nhiều vào kinh nghiệm
và sự hiểu biết của người tổ chức việc điều tra và cả
người đi thu thập dữ liệu.
Ví dụ: nhân viên phỏng vấn được yêu cầu tìm đến ký túc
xá đại học phỏng vấn những nữ sinh viên có hình thức
“ưa nhìn”. => không có tiêu chuẩn cụ thể thế nào là “hình
thức ưa nhìn” mà hoàn toàn dựa vào phán đoán để chọn
ra người cần phỏng vấn.
20
'
Chọn mẫu gần xác xuất (quasi-propbability
sampling)
Cố gắng áp dụng các nguyên tắc và thủ tục của chọn mẫu
xác xuất một cách tối đa nhưng vẫn phải bỏ qua một số
nguyên tắc nào đó (do hạn chế về thông tin, hay thời gian,
kinh phí ).
Cần có bằng chứng hay lý giải việc bỏ qua một số nguyên
tắc này không ảnh hưởng nhiều đến mục tiêu nghiên cứu.
21
)
Chọn mẫu gần xác xuất (quasi-propbability
sampling)
Ví dụ: Khung lấy mẫu có thể thiếu một tỷ lệ nhỏ đơn vị
mẫu; Không tính được xác suất được chọn cho một tỷ lệ
nhỏ đơn vị mẫu.
Nhiều nghiên cứu sử dụng phương pháp này, nhất là khi
mục tiêu nghiên cứu là đánh giá mối quan hệ giữa các
biến số chứ không phải là ước lượng cho tổng thể.