VẤN ĐỀ MẪU KHẢO SÁT
(mẫu ngẫu nhiên)
NHỮNG CƠ SỞ CỦA LÝ THUYẾT CHỌN MẪU
Tổng thể
Các thành phần
Tổng thể đích
Đơn vị chọn mẫu
Khung mẫu
CÁC YẾU TỐ CẦN CÂN NHẮC KHI THIẾT KẾ MẪU
Các mục tiêu của nghiên cứu
Mức độ chính xác
Nguồn lực
Khung thời gian
Kiến thức về tổng thể
Phạm vị nghiên cứu
Các nhu cầu phân tích thống kê
Tổng thể điều tra là gì?
Tổng thể (population of interest) là toàn bộ các khách thể/đơn vị
nghiên cứu.
Mỗi nghiên cứu có thể có tổng thể khác nhau hoặc trùng nhau. Thí
dụ: sinh viên, nông dân, cư dân đô thị v.v.
Các tổng thể có độ phức tạp/tính thuần nhất khác nhau
Dung lượng/kích thước/qui mô tổng thể thường được ký hiệu bằng
chữ N
Tổng thể nghiên cứu hoàn toàn phụ thuộc vào vấn đề nghiên cứu,
thiết kế nghiên cứu, vấn đề quản lý
Một số cơ sở để xác định tổng thể là:
Khu vực địa lý
Đặc điểm nhân khẩu
Lối sống/tập quán
Sự nhận thức
Điều tra tổng thể
• Là dạng điều tra thực hiện với tất cả
các đơn vị của tổng thể
• Ưu điểm: Không phải quan tâm đến
tính đại diện
• Hạn chế: Tốn kém; thông tin ít tính thời
sự; độ tin cậy thấp
• Những trường hợp cần điều tra tổng
thể: Tổng thể nhỏ; vấn đề hiếm gặp
Điều tra không tổng thể
Điều tra trường hợp
•Điều tra thực hiện với 1, một vài đơn vị
•Ưu, nhược điểm: Tiết kiệm, thông tin sâu, chi tiết;
không thể nói gì về tính đại diện
•Sử dụng trong trường hợp: Nghiên cứu tìm kiếm,
phát hiện và nghiên cứu sơ bộ
Điều tra chọn mẫu
•Điều tra thực hiện với tất cả các đơn vị trong mẫu
Mẫu điều tra là gì
Là một phần của tổng
thể (tập con – subset)
đươc lựa chọn ra theo
một cách nhất định
Thông tin thu được từ
mẫu trong nghiên cứu
định lượng được dùng để
suy luận về tông thể
Dung
lượng/kích
thước/qui
mô
mẫu
thưừong được ký hiệu
bằng chữ n
Tổng thể
Mẫu
Tại sao chọn mẫu?
Ít tốn kém kinh phí
Nhanh chóng có kết quả
Tổ chức điều tra, tập huấn
điều tra viên thuận lợi hơn
Chính xác hơn (sai số phi
chọn mẫu nhỏ hơn)
Có thể dùng để tổng hợp
nhanh kết quả tổng điều tra
Định luật
số lớn?
Quan hệ giữa tổng thể –
khung mẫu – mẫu, đơn vò
Tổng
thể
Khung
Mẫu
(thực
tế)
(danh
sách
dân
cư)
Mẫu
Đơn
vò vò
mẫu
cơ
bản
Đơn
vò vò
mẫu
cơ
bản
Đơn vò
mẫu thứ
cấp
CÁC BƯỚC CỦA CHỌN MẪU
1.
2.
3.
4.
5.
Làm rõ tổng thể
Làm rõ khung chọn mẫu (nếu có thể)
Lựa chọn phương pháp chọn mẫu
Tính toán qui mô/kích thước của mẫu
Tiến hành việc chọn mẫu
Khung mẫu (sampling frame)
Là cơ sở để chọn mẫu ngẫu nhiên
Là danh sách chứa đựng toàn bộ các đơn
vị nghiên cứu trong tổng thể.
Những yêu cầu đối với khung mẫu này là:
Đầy đủ
Chính xác
Thích hợp
Các đơn vị trong danh sách không lặp lại
Thuận tiện cho sử dụng
Đơn vò mẫu
Nếu mẫu được lựa chọn
trực tiếp trong khung mẫu
mà không cần xem xét
các thành phần, các
yếu tố trong tổng thể thì
mỗi một lần chọn các
thành viên của mẫu sẽ
là một đơn vò.
HAI CÂU HỎI THƯỜNG GẶP
1. Điều tra bao nhiêu là đủ? Hoặc điều
tra với số lượng là X đã đủ hay chưa?
2. Cách chọn như thế nào mới là đúng?
ngẫu nhiên là thế nào?
I.2.Caực phửụng phaựp
choùn maóu:
Caực loaùi
maóu
xaực
suaỏt.
Caực
maóu phi
xaực
suaỏt
Caùc loaïi maãu xaùc
suaát.
KÍCH THƯỚC MẪU (SAMPLE SIZE)
Các yếu tố cần suy tính đến
Sai số tối thiểu là bao nhiêu?
Độ tin cậy tối thiểu là bao nhiêu?
Cơ cấu tổng thể có phức tạp không?
Kinh phí khảo sát là bao nhiêu?
Công thức tính qui mô mẫu
(Không biết kích thước của tổng thể)
Tính theo tỷ lệ
(với các đặc trưng định tính)
Tính theo giá trị trung bình
(với các đặc trưng định lượng)
t2*p*q
n=
ε2
t2*δ2
n=
ε2
t=1 khi độ tin cậy là 68.2%, t=2 khi độ tin cậy là 95.4% và t=3 khi
đô tin cây là 99.7%
Công thức tính qui mô mẫu
(Khi biết kích thước của tổng thể)
N*t2*p*q
Tính theo tỷ lệ
(với các đặc trưng định tính)
n=
N*ε2+t2*p*q
Tính theo giá trị trung bình
(với các đặc trưng định
lượng)
N*t2*δ2
n=
N*ε2+t2*δ2
Kính thước mẫu
Sai số mẫu ở mức … và độ tin cậy: 95%
p=
n=
50
75
100
125
150
175
200
225
250
300
350
400
450
500
600
700
800
900
1000
1200
1250
1500
1750
2000
2250
2500
5%
6.0%
4.9%
4.3%
3.8%
3.5%
3.2%
3.0%
2.8%
2.7%
2.5%
2.3%
2.1%
2.0%
1.9%
1.7%
1.6%
1.5%
1.4%
1.4%
1.2%
1.2%
1.1%
1.0%
1.0%
0.9%
0.9%
10%
8.3%
6.8%
5.9%
5.3%
4.8%
4.4%
4.2%
3.9%
3.7%
3.4%
3.1%
2.9%
2.8%
2.6%
2.4%
2.2%
2.1%
2.0%
1.9%
1.7%
1.7%
1.5%
1.4%
1.3%
1.2%
1.2%
15%
9.9%
8.1%
7.0%
6.3%
5.7%
5.3%
4.9%
4.7%
4.4%
4.0%
3.7%
3.5%
3.3%
3.1%
2.9%
2.6%
2.5%
2.3%
2.2%
2.0%
2.0%
1.8%
1.7%
1.6%
1.5%
1.4%
20%
11.1%
9.1%
7.8%
7.0%
6.4%
5.9%
5.5%
5.2%
5.0%
4.5%
4.2%
3.9%
3.7%
3.5%
3.2%
3.0%
2.8%
2.6%
2.5%
2.3%
2.2%
2.0%
1.9%
1.8%
1.7%
1.6%
25%
12.0%
9.8%
8.5%
7.6%
6.9%
6.4%
6.0%
5.7%
5.4%
4.9%
4.5%
4.2%
4.0%
3.8%
3.5%
3.2%
3.0%
2.8%
2.7%
2.5%
2.4%
2.2%
2.0%
1.9%
1.8%
1.7%
30%
12.7%
10.4%
9.0%
8.0%
7.3%
6.8%
6.4%
6.0%
5.7%
5.2%
4.8%
4.5%
4.2%
4.0%
3.7%
3.4%
3.2%
3.0%
2.8%
2.6%
2.5%
2.3%
2.1%
2.0%
1.9%
1.8%
35%
13.2%
10.8%
9.3%
8.4%
7.6%
7.1%
6.6%
6.2%
5.9%
5.4%
5.0%
4.7%
4.4%
4.2%
3.8%
3.5%
3.3%
3.1%
3.0%
2.7%
2.6%
2.4%
2.2%
2.1%
2.0%
1.9%
40%
13.6%
11.1%
9.6%
8.6%
7.8%
7.3%
6.8%
6.4%
6.1%
5.5%
5.1%
4.8%
4.5%
4.3%
3.9%
3.6%
3.4%
3.2%
3.0%
2.8%
2.7%
2.5%
2.3%
2.1%
2.0%
1.9%
45%
13.8%
11.3%
9.8%
8.7%
8.0%
7.4%
6.9%
6.5%
6.2%
5.6%
5.2%
4.9%
4.6%
4.4%
4.0%
3.7%
3.4%
3.3%
3.1%
2.8%
2.8%
2.5%
2.3%
2.2%
2.1%
2.0%
50%
13.9%
11.3%
9.8%
8.8%
8.0%
7.4%
6.9%
6.5%
6.2%
5.7%
5.2%
4.9%
4.6%
4.4%
4.0%
3.7%
3.5%
3.3%
3.1%
2.8%
2.8%
2.5%
2.3%
2.2%
2.1%
2.0%
Bài tập
1. Tính toán dung lượng mẫu cho một điều
tra toàn quốc ở Việt Nam với độ tin cậy là
95% và 99%, sai số chọn mẫu là 3%
2. Nếu một xã có 2000 hộ dân, với độ tin cậy
là 95% và 99%, sai số là 3%, cần phải chọn
bao nhiêu
3. Nếu một trường ĐH có 5000 SV với độ tin
cậy là 95%, sai số là 5%, kết quả học tập
học kỳ trước của SV là: Giỏi và XS: 20%,
khá: 30%, TB: 40%, kém: 10%, cần phải
chọn bao nhiêu SV
Vấn đề mẫu dự trữ
Mẫu dự trữ dùng để bổ sung cho
trường hợp từ chối hoặc vì lý do khách
quan không gặp được đúng người đã
chọn
Kích thước của mẫu dự trữ tuỳ thuộc
vào tổng thể và tỷ lệ rủi ro có thể có
Ở Việt Nam kích thước mẫu dự trữ
khoảng dưới 10% mẫu chính
CÁC CÁCH CHỌN MẪU
Ngẫu nhiên đơn giản (Simple Randon
Sampling)
Ngẫu nhiên hệ thống (Systematic Sampling)
Phân tầng ngẫu nhiên (Stratified Random
Sampling)
1. theo tỷ lệ (Proportional type)
2. không theo tỷ lệ (Disproportional type)
Mẫu ngẫu nhiên theo cụm (Cluster sampling)
1. Một giai đoạn
2. nhiều giai đoạn (multistage cluster
sampling)
Ngẫu nhiên đơn giản
1. Lập danh sách tổng thể
2. Gán cho mỗi đơn vị của tổng thể một
mã (số thứ tự)
3. Dùng bảng số ngẫu nhiên để chọn đủ
số lượng cần thiết (căn cứ theo số
thứ tự)
Thí dụ một phần của bảng số ngẫu
nhiều (contingency table)
1
2
4
5
6
7
8
9
10097 32533
76520 13586
34673 54876
80959 09117
37542 04805
64894 74296
24805 24037
20636 10402
08422 68953
19645 09303
23209 02560
15953 34764
99019 02529
09376 70715
38311 31165
88676 74397
12807 99970
80157 36147
64032 36653
98951 16877
39292 74945
66065 74717
34072 76850
36697 36170
00822 91665
31060 10805
45571 82406
35303 42614
35080 33606
85269 77602
02051 65692
68665 74818
04436 27659
63573 32135
05325 47048
90553 57548
12171 76833
73796 45753
03529 64778
35808 34282
65813 39885
11199 29170
98520 17767
14905 68607
86799 07439
23403 09732
11805 05431
39808 27732
73053 85247
18623 88579
83452 99634
06288 98083
28468 28709
83491 25624
88635 40200
86507 58401
60935 20344
35273 88435
99594 67348
87517 64969
Ví dụ
Trong một xã có 1700 hộ, cần chọn ngẫu nhiên 16 hộ:
Các hộ này sẽ có số thứ tự từ 0001 cho đến 2000 trong khung
mẫu
Lấy một phần bất kỳ của bảng số ngẫu nhiên để bắt đầu ví dụ
cột thứ 1;
Xem xét các số trong bảng, có thể chọn theo hàng hoặc theo
cột, nếu số nào lớn hơn các số thứ tự trong khung mẫu sẽ bị
loại bỏ, số nào trùng lặp thì chỉ lấy một lần, lấy cho tới khi nào
đủ số lượng mẫu cần chọn thì dừng lại
Trường hợp đầu tiện được chọn có số thứ tự là 0097, tiếp là
0822; 0935; 1665; 0344; 0157; 1060; 1199; 0715; 0805; 1805;
1165 (bỏ); 0200; 0959; 0636; 0553; 0402.