BÀI 6
CHỌN MẪU NGHIÊN CỨU
Các khái niệm
Lý do chọn mẫu
Các phương pháp chọn mẫu
CÁC KHÁI NIỆM
Đơn vị (phần tử) NC (Population element)
Là đối tượng chứa đựng những thông tin về vấn đề
mà người NC quan tâm
Có thể là những cá nhân, hộ gia đình, tổ chức..
Tổng thể nghiên cứu (population)
Là tập hợp các đơn vị (phần tử) mà người NC cần
tiếp cận để thu thập thông tin
Xác định mức độ hài lòng của sinh viên tiến sĩ BK thì
tổng thể NC sẽ là tồn bộ sinh viên đã và đang học
TS tại trường ĐHBK
CÁC KHÁI NIỆM
Mẫu
Mẫu là các phần tử (đơn vị) được chọn ra từ tổng
thể nhằm phục vụ cho NC
Chọn mẫu
Là việc chọn lọc ra một số phần tử của tổng thể
nhằm phục vụ cho mục đích nghiên cứu
Khung lấy mẫu (sampling frame)
Là cơ sở dữ liệu mà người NC chọn ra mẫu cho NC
của mình
VD: Danh bạ điện thoại; danh sách sinh viên; danh
sách được công bố trên trang web...
NGHIÊN CỨU TỔNG THỂ
Số lượng tổng thể không lớn
Tổng thể khơng đồng nhất
Có đủ kinh phí và thời gian
LÝ DO CHỌN MẪU
Số lượng tổng thể là lớn, việc điều tra đối với tổng thể
là không thể do hạn chế về thời gian và kinh phí
Tiết kiệm về chi phí
Thời gian thu thập dữ liệu nhanh hơn
Trong một số trường hợp phải chọn mẫu vì các phần
tử được chọn sẽ bị phá hủy (chất lượng viên gạch –
không thể chọn tổng mẫu được)
Phần tử của tổng thể là đồng nhất hoặc có thể hình
thành các nhóm có đặc điểm tương tự
Trong nhiều trường hợp thì NC với mẫu là tốt hơn (giá
trị đo đạc tốt hơn – internal validity; kiểm sốt tốt hơn:
phỏng vấn, giám sát, qui trình, ghi chép;)
KÍCH CỠ MẪU
Phụ thuộc vào số lượng tổng thể
Phụ thuộc vào sự khác biệt của các phần tử trong
đám đơng (phương sai)
Kinh phí, tính chính xác của kết quả…
Theo qui luật ngón tay cái (kinh nghiệm)
Cần ít nhất 30 phần tử trong mẫu để giá trị thống kê
có ý nghĩa
Nếu muốn quan sát sự khác biệt của các nhóm thì
mỗi nhóm cần ít nhất 30 phần tử
CÁC PHƯƠNG PHÁP CHỌN MẪU
Có hai nhóm phương pháp chọn mẫu
Phương pháp chọn mẫu xác suất/ ngẫu nhiên
(probability sampling)
Phương pháp chọn mẫu phi xác suất (nonprobability)
CHỌN MẪU NGẪU NHIÊN
Mẫu được chọn theo một qui trình mà cho
phép các phần tử của tổng thể có cùng cơ
hội/xác suất tham gia vào mẫu
Mỗi phần tử được chọn một cách khách
quan, không phụ thuộc vào người nghiên
cứu
Yêu cầu: phải có trước danh sách tổng thể
Mẫu có tính đại diện cao
Có thể khó thực hiện, chi phí có thể cao
CHỌN MẪU PHI XÁC SUẤT
Không cho phép các phần tử của tổng thể có
cùng cơ hội tham gia vào mẫu
Có sự can thiệp của người nghiên cứu
Xác suất tham gia vào mẫu của một phần tử của
tổng thể là khơng biết trước
Về tính đại diện của mẫu: có thể đại diện rất tốt
cho tổng thể, có thể hồn tồn không đại diện
Nhưng không phải là tồi mà ngược lại được sử
dụng khá phổ biến trong NC
CÁC PHƯƠNG PHÁP CHỌN MẪU
NGẪU NHIÊN
Chọn mẫu ngẫu nhiên đơn giản (simple
random sampling)
Chọn mẫu hệ thống (systematic sampling)
Chọn mẫu phần tầng (stratified sampling)
Chọn mẫu theo cụm/khối (cluster sampling)
và chọn mẫu nhiều giai đoạn
CHỌN MẪU NGẪU NHIÊN ĐƠN GIẢN
Là PP chọn mẫu trong đó mỗi phần tử của tổng thể
được chọn với sự ngẫu nhiên như nhau hau nói cách
khác là cơ hội được chọn vào mẫu là bằng nhau
Phải có danh sách các phần tử của tổng thể cần NC;
có thể là khung lấy mẫu; được sắp xếp theo một trật
tự nào đó (abc, địa chỉ,...)
Gán số thứ tự từ 1 đến hết cho các phần tử của tổng
mẫu
Chọn mẫu bằng nhiều cách như: bốc thăm (nếu ít),
quay số, lấy hàm ngẫu nhiên từ máy tính (nếu nhiều)
CHỌN MẪU NGẪU NHIÊN HỆ THỐNG
Chuẩn bị danh sách chọn mẫu, xếp thứ tự theo
một qui ước nào đó; đánh số thứ tự cho các đơn
vị trong danh sách. Có tổng đơn vị trong danh
sách là N
Xác định cỡ mẫu muốn lấy (n)
Chia N thành k nhóm theo cơng thứ (k=N/n); k
được gọi là khoảng cách chọn mẫu
Trong k đơn vị đầu tiên, ta chọn ngẫu nhiên ra 1
đơn vị (bốc thăm hay quay số...); đây sẽ là đơn vị
mẫu đầu tiên
Các đơn vị mẫu tiếp theo được lấy cách đơn vị
này một khoảng là k; 2k; 3k...
CHỌN MẪU NGẪU NHIÊN PHÂN TẦNG
Sử dụng khi các phần tử khác nhau và có thể
được chia thành các nhóm gọi là tầng hay lớp
(strata)
Các phần tử của các tầng này sẽ được chọn
ngẫu nhiên đơn giản hay hệ thống
CHỌN MẪU NGẪU NHIÊN PHÂN TẦNG
Điểm lưu ý đối với chọn mẫu phân tầng:
Phân tầng theo đặc điểm gì?
Đặc điểm phải liên quan đến nội dung NC
Phân bổ số lượng mẫu vào các tầng như thế
nào?
Dùng phương pháp phân bổ mẫu theo tỉ lệ - cơ cấu
mẫu theo cơ cấu của tổng thể
Nếu qui mô mẫu không lớn lắm mà lại cần tách kết
quả cho từng tầng thì có thể dùng phân bổ mẫu cho
các tầng đều nhau để so sánh; còn đối với kết quả
chung thì có thể sử dụng trọng số
VD - CHỌN MẪU NGẪU NHIÊN PHÂN
TẦNG
Tại một trường ĐH có 20.000 sinh viên ở 5 hệ đào
tạo và cấp đào tạo khác nhau. Bộ phận kiểm định
chất lượng tiến hành cuộc khảo sát về đánh giá về
chất lượng và mức độ hài lòng của sinh viên. Số
lượng mẫu dự định lấy là 1.000 (5% của tổng thể)
Chọn mẫu phân tầng
Phân bổ mẫu cho từng tầng theo tỉ lệ tổng thể
Phân bổ mẫu đều và kết quả chung sẽ tính theo
trọng số
PHÂN TẦNG THEO TỈ LỆ TỔNG THỂ
Hệ/cấp đào tạo
Cử nhân hệ chính qui
Số lượng sv
% sinh viên
Số lượng sv chọn
vào mẫu của từng
tầng
10.000
50%
500
Cử nhân văn bằng
hai
2.000
10%
100
Cử nhân chuyển đổi
từ cao đẳng
2.000
10%
100
Cử nhân tại chức
5.000
25%
250
Cao học
1.000
5%
50
20.000
100%
1.000
Tổng
PHÂN BỔ MẪU ĐỀU CHO CÁC TẦNG
Hệ/cấp đào tạo
Số lượng
sv
% sinh viên
Số lượng sv
chọn vào mẫu
của từng tầng
Trọng
số
Cử nhân hệ
chính qui
10.000
50%
200
2,50
Cử nhân văn
bằng hai
2.000
10%
200
0,50
Cử nhân chuyển
đổi từ cao đẳng
2.000
10%
200
0,50
Cử nhân tại chức
5.000
25%
200
1,25
Cao học
1.000
5%
200
0,25
20.000
100%
1.000
5,00
Tổng
CHỌN MẪU THEO KHỐI CỤM
Tổng thể được chia thành nhiều khối (cluster)
Mỗi khối được xem như một tổng thể con (quận,
phường, khu phố, tổ...)
Lấy ngẫu nhiên đơn giản m khối và khảo sát hết các
phần tử lấy trong các khối mẫu đã được chọn
Ưu điểm là không cần danh sách các phần tử
VD: quận 3 có 14 phường, chọn được 2 phường mẫu
và sau đó khảo sát hết các hộ trong 2 phường này
Nhược điểm:
Cỡ mẫu khảo sát thực tế có thể q lớn và chi phí cao
Các phần tử trong cùng một khối có khuynh hướng khá
giống nhau nên không nhất thiết phải khảo sát hết
CHỌN MẪU NHIỀU GIAI ĐOẠN
Chọn mẫu 2 giai đoạn
Tổng thể được chia thành nhiều khối (cluster) (đơn vị
mẫu bậc 1)
Trong mỗi khối chỉ khảo sát một số đơn vị mà thôi (đơn vị
mẫu bậc 2)
Tương tự như vậy có thể chia thành 3 giai đoạn...
VD: Tổng thể NC là quận 3; trong quận 3 có 14
phường chia ra 700 tổ dân phố.
Đơn vị mẫu bậc 1 có thể là phường hay tổ dân phố
Trong mỗi phương hay tổ chọn các đơn vị mẫu bậc 2 là
hộ gia đình. Danh sách khó lấy – lấy mẫu trên thực địa (5
nhà lấy 1)
CÁC PHƯƠNG PHÁP CHỌN MẪU
PHI NGẪU NHIÊN
Chọn mẫu thuận tiện (convenience sampling)
Chọn mẫu định mức (quota sampling)
Chọn mẫu phán đoán (judgement sampling)
Chọn mẫu theo mạng quan hệ (snowball
sampling)
CHỌN MẪU PHI NGẪU NHIÊN
THUẬN TIỆN
Có thể lấy mẫu thuận tiện bằng cách đến những nơi
mà người NC nghĩ có nhiều khả năng gặp được đối
tượng NC
Những người khơng tới địa điểm đó trong khoảng thời
gian đó sẽ khơng có cơ hội tham gia vào mẫu
Khơng có nghĩa là chọn tùy tiện
Một qui trình rõ ràng, cụ thể là quan trọng để loại trừ
sai số
Phỏng vấn chặn đón là phương pháp phỏng vấn hay
được dùng với lấy mẫu thuận tiện
Qui trình cụ thể: các điểm chặn đón, thời gian, thủ tục
lựa chọn đối tượng tại điểm chặn đón
Là phương pháp lấy mẫu phi xác suất, nhưng có thể
cho kết quả đáng tin cậy nếu như có phương pháp lựa
chọn phù hợp với mục tiêu nghiên cứu
CHỌN MẪU ĐỊNH MỨC
Là phương pháp lấy mẫu thuận tiện, có
kèm theo chỉ tiêu số lượng theo một số tiêu
thức nào đó: giới tính, độ tuổi, sản phẩm sử
dụng…
Là phiên bản phi xác suất của phương
pháp lấy mẫu ngẫu nhiên theo lớp.
CHỌN MẪU PHÁN ĐOÁN
Nhà nghiên cứu quyết định sự thích
hợp các đối tượng để mời tham gia vào
mẫu
Tính đại diện của mẫu khảo sát thực tế
sẽ phụ thuộc nhiều vào kiến thức và
kinh nghiệm của cả người nghiên cứu
và cả của người thu thập dữ liệu
CHỌN MẪU THEO MẠNG
Chọn phần tử đầu tiên theo cách thuận
tiện
Đề nghị phần tử này giới thiệu các phần
tử khác có biết về chủ đề NC để phỏng
vấn