CÁC PHƯƠNG PHÁP CHỌN MẪU
1
Điều tra chọn mẫu
Một số khái niệm
Phần tử (element): đơn vị cần quan sát và thu
thập dữ liệu (cá nhân, hộ gia đình, tổ chức,…).
Tổng thể nghiên cứu (study population): tập hợp
các phần tử mà thực tế có thể nhận dạng và lấy
mẫu. Ví dụ tổng thể nghiên cứu là số hộ gia đình
của một địa phương, số doanh nghiệp tại một địa
phương, số sinh viên tại một trường đại học, số
người tiêu dùng tại một vùng...
Điều tra chọn mẫu
Tổng thể
Mẫu
Tóm tắt các đặc trưng
Suy diễn cho các tham số của tổng thể
Điều tra chọn mẫu
Tổng thể là
toàn bộ bóng
đèn mới mà
công ty A sản
xuất (tuổi thọ
trung bình của
bóng đèn mới
chưa biết)
Tuổi thọ trung bình của bóng
đèn mới
200 bóng đèn được chọn để
kiểm tra tuổi thọ
Mẫu
Tóm tắt các đặc trưng
Tính tuổi thọ trung bình của
200 bóng đèn này
Suy diễn cho các tham số của tổng thể
Một số khái niệm
Khung mẫu (sampling frame): Danh sách các
đơn vị lấy mẫu có sẵn để phục vụ cho việc lấy
mẫu.
STT
1
2
3
4
Hộ
Nguyễn Văn A
Trần Thị B
Trần Thị B
Lê Văn C
Chọn mẫu (sampling)
Là quá trình lựa chọn một bộ phận tương
đối nhỏ từ tổng thể với tích cách là đại
diện cho tổng thể cần nghiên cứu.
Dựa trên kết quả thu được từ mẫu, nhà
nghiên cứu sẽ suy diễn rộng ra cho tổng
thể.
Vì sao phải chọn mẫu?
Để có thông tin nhanh hơn và tiết kiệm hơn.
Vd: muốn có số liệu về thu nhập của các hộ gia
đình ở Việt Nam thì nên điều tra toàn bộ hay điều
tra chọn mẫu?
Trường hợp khi tiến hành điều tra làm biến dạng
hay phá hủy thuộc tính của đơn vị
Vd: thử độ bền của vỏ xe sản xuất
Vì sao phải chọn mẫu?
Trường hợp số đơn vị của hiện tượng vô hạn hoặc không
xác định
Vd: muốn có số liệu về những người bệnh cao huyết áp tại
TPHCM
Khi muốn so sánh các hiện tượng với nhau mà chưa có
thông tin cụ thể hoặc khi muốn kiểm định một giả thuyết
đặt ra, người ta thường dùng điều tra chọn mẫu để thu
thập dữ liệu.
Vd: kiểm tra tác dụng của một loại thuốc đối với điều trị
tim mạch
Quá trình chọn mẫu
B1: Định nghĩa tổng thể và phần tử
B2: Xác định khung lấy mẫu
B3: Xác định kích thước mẫu
B4: Xác định phương pháp chọn mẫu
B5: Tiến hành lấy mẫu theo phương pháp đã chọn
Các phương pháp chọn mẫu
1.Chọn mẫu xác suất
2.Chọn mẫu phi xác
suất
11
Chọn mẫu xác suất
Biết trước xác suất xuất hiện của các phần tử
vào trong mẫu.
Quá trình chọn mẫu tuân theo quy luật toán,
không thể tự ý thay đổi.
Các thông số của mẫu có thể dùng để ước
lượng/kiểm nghiệm các thông số của tổng thể.
Nhược điểm: ?
Hạn chế
(1) Trong nhiều trường hợp không mang tính khả
thi vì không thể có được danh sách tất cả các
đối tượng liên hệ, hoặc nhà nghiên cứu không
đủ thời gian để tiếp cận các đối tượng khi họ
phân tán ở nhiều địa bàn cách xa nhau.
(2) Tốn kém nhiều thời gian và công sức
Chọn mẫu phi xác suất
Nhà nghiên cứu chọn các phần tử vào mẫu
không theo quy luật ngẫu nhiên
Không biết xác suất xuất hiện của các phần tử.
Chọn mẫu tùy thuộc vào nhà nghiên cứu.
Ví dụ đến siêu thị phỏng vấn các bà nội trợ về
chi tiêu hàng ngày cho lương thực
Nhược điểm: ?
Hạn chế
Việc chọn mẫu phải dựa vào kỹ năng
của nhà nghiên cứu hay của nhân viên
chọn mẫu.
Phân loại
Chọn mẫu xác suất
Ngẫu nhiên đơn giản
(simple random)
Hệ thống
(systematic)
Phân tầng
(stratified random)
Theo nhóm (cụm,
chùm)
(cluster)
Chọn mẫu phi xác suất
Lấy mẫu thuận tiện
(convenience)
Lấy mẫu phán đoán
(judgment)
Lấy mẫu theo lớp
(quota)
Lấy mẫu theo mầm
(snow ball)
16
Chọn mẫu ngẫu nhiên đơn giản
Quy trình:
Cần danh sách của tất cả các
đơn vị mẫu
Số lượng các đơn vị (cỡ mẫu).
Chọn ngẫu nhiên các đơn vị
trong danh sách
Ví dụ: Khảo sát thực trạng hiểu
biết về luật giao thông đường
bộ trong 1000 học sinh tại một
trường phổ thông trung học,
chọn mẫu ngẫu nhiên 100 học
sinh để khảo sát.
17
Câu hỏi
Theo danh sách chọn mẫu, người thu thập
dữ liệu phải phỏng vấn sinh kế của hộ A.
Nhưng hộ A đi vắng, hộ B (không có
trong danh sách mẫu) sẵn sàng cung cấp
dữ liệu sinh kế của gia đình mình (hộ B) .
Người thu thập dữ liệu nên chờ hộ A về
phỏng vấn hay phỏng vấn hộ B?
Thực hành trên Excel
Cần lấy mẫu ngẫu nhiên 10 phần tử từ khung mẫu có
20 phần tử.
Thực hiện
1. Tạo một danh sách số thứ tự từ 1 đến 20 (giả sử đây
là khung mẫu)
2. Tại cột mới (cột Ngẫu nhiên) dùng hàm RAND()
3. Sắp xếp theo thứ tự cột mới
4. Chọn 10 phần tử đầu tiên vào mẫu.
Chọn mẫu hệ thống
Chọn ngẫu nhiên một
điểm xuất phát, dựa vào
bước nhảy để xác định
các phần tử tiếp theo
20
Chọn mẫu hệ thống
Chọn mẫu hệ thống
Chọn mẫu phân tầng (stratified random)
Tổng thể được chia ra nhiều tầng
(strata) theo nguyên tắc: “cùng tầng
đồng nhất, khác tầng dị biệt”.
Để chọn phần tử trong mỗi tầng: có thể
dùng p.p. hệ thống.
Số phần tử trong mỗi tầng được xác
định theo tỷ lệ hoặc không theo tỷ lệ
với kích thước tổng thể.
Ví dụ về các tầng: Theo địa lý: bắc,
trung, nam, 7 vùng kinh tế; Tôn
giáo/sắc tộc; mức thu nhập; giới tính,
nghề nghiệp…
23
Chọn mẫu phân tầng
Các phương pháp chọn mẫu ngẫu nhiên
c. Chọn mẫu phân tầng