ĐỀ TÀI KHOA HỌC
SỐ: 03-2004
NGHIÊN CỨU CÁC NGUYÊN TẮC XÁC ĐỊNH
CỠ MẪU VÀ PHÂN BỔ MẪU ỨNG DỤNG VÀO THỰC TIỄN
ĐIỀU TRA THỐNG KÊ Ở NƢỚC TA
1. Cấp đề tài
: Tổng cục
2. Thời gian nghiên cứu : 2003-2004
3. Đơn vị chủ trì
: Viện Khoa học Thống kê
4. Đơn vị quản lý
: Viện Khoa học Thống kê
5. Chủ nhiệm đề tài
: CN. Lê Văn Duỵ
6. Những ngƣời phối hợp nghiên cứu:
PGS.TS. Tăng Văn Khiên
CN. Vũ Văn Tuấn
Ths. Nguyễn Văn Đoàn
CN. Phan Đắc Lộc
TS. Phùng Chí Hiền
CN. Cao Nhƣ Nguyệt
CN. Nguyễn Văn Minh
CN. Phan Ngọc Trâm
CN. Đỗ Văn Huân
CN. Trần Thị Thanh Hƣơng
7. Kết quả bảo vệ: Loại giỏi
72
PHẦN MỘT
CƠ SỞ LÝ LUẬN VỀ XÁC ĐỊNH CỠ MẪU VÀ PHÂN BỔ MẪU
I. XÁC ĐỊNH CỠ MẪU
1.1. Các nguyên tắc xác định cỡ mẫu cơ bản
Việc xác định cỡ mẫu của một cuộc điều đƣợc xác định dựa vào hai
nguyên tắc cơ bản sau:
a. Phải dựa vào mức độ biến động (đƣợc biểu hiện thông qua phƣơng
sai) của chỉ tiêu cần đƣợc nghiên cứu của cuộc điều tra. Mức độ biến động
này càng lớn cỡ mẫu càng lớn, ngƣợc lại mức độ biến động của chỉ tiêu
đƣợc nghiên cứu càng nhỏ, cỡ mẫu cần thiết cho điều tra cũng nhỏ theo.
b. Phải dựa vào mức độ sai số cho phép. Khi sử dụng thông tin,
ngƣời dùng tin hiểu biết thống kê thƣờng đòi hỏi chỉ tiêu cần đƣợc nghiên
cứu chỉ mắc một sai số nhất định. Điều này cũng có tính chất quyết định
đến cỡ mẫu cần cho cuộc điều tra. Mức độ sai số cho phép càng lớn cỡ
mẫu càng nhỏ. Ngƣợc lại, mức độ sai số cho phép nhỏ cỡ mẫu phải lớn.
c. Số lƣợng các chỉ tiêu thống kê cần thu thập. Số lƣợng các chỉ tiêu
thống kê cần thu thập qua cuộc điều tra ít, cỡ mẫu có thể lớn, ngƣợc lại số
lƣợng các chỉ tiêu thống kê cần thu thập qua cuộc điều tra nhiều cỡ mẫu
cần phải nhỏ. Làm ngƣợc lại sẽ ảnh hƣởng tới chất lƣợng của cuộc điều tra.
d. Cấp độ và mức độ chi tiết của thông tin cần đƣa ra, tức là thông
tin sẽ đại diện cho tới cấp độ nào (ví dụ tới cấp tỉnh/ thành phố hay tới cấp
huyện,...) hoặc mức độ chi tiết đến đâu? Cấp độ và mức độ thông tin càng
chi tiết, cỡ mẫu càng phải lớn có nhƣ vậy mới đáp ứng đƣợc yêu cầu đặt ra.
1.2. Phƣơng pháp xác định cỡ mẫu cơ bản
Trên phƣơng diện lý thuyết, xác định cỡ mẫu dựa vào mức độ biến
động của chỉ tiêu cần nghiên cứu tạo ra một bài toán cơ bản đƣợc trình bày
dƣới đây.
+ Đối với chọn mẫu ngẫu nhiên đơn giản có hoàn lại (chọn lặp):
73
Trong trƣờng hợp chọn mẫu có hoàn lại, bình phƣơng sai số của tiêu
thức đƣợc nghiên cứu có dạng có dạng: D 2 ( x)
S2
. Thay giá trị này vào
n
công thức (1.5) rồi giải phƣơng trình ta có công thức tính cỡ mẫu nhƣ sau:
n
u 2 S 2
d2
;
(1.6)
+ Đối với chọn mẫu ngẫu nhiên đơn giản không hoàn lại (chọn
không lặp):
Bình phƣơng sai số của chọn mẫu ngẫu nhiên đơn giản trong trƣờng
1
n
hợp chọn không hoàn lại có dạng: D 2 ( x) S 2 (
1
) . Thay giá trị của
N
1 1
D 2 ( x ) vào phƣơng trình xác định cỡ mẫu ta có: u2 S 2 ( ) d 2 0 . Giải
n N
phƣơng trình này với ẩn số là n thu đƣợc kết quả sau:
n
Nu 2 S 2
u 2 S 2 Nd 2
;
(1.7)
+ Đối với chọn mẫu ngẫu nhiên phân tổ:
a. Trong trƣờng hợp chọn mẫu ngẫu nhiên phân tổ không hoàn lại và
cơ chế phân bổ mẫu là phân bổ tỷ lệ với quy mô thì phƣơng sai chung của
mẫu có dạng:
1 1 k
D 2 x m Wi S i2 , với k là số tổ
n N i
Thay D2 ở công thức này vào phƣơng trình (1.5) rồi giải với ẩn số là
n ta sẽ có công thức xác định cỡ mẫu cho trƣờng hợp "mẫu phân tổ với cơ
chế chọn ngẫu nhiên không hoàn lại và phân bổ mẫu tỷ lệ thuận với quy
mô tổ". Sau khi giải phƣơng trình có công thức xác định cỡ mẫu nhƣ sau:
k
n
W S
i 1
d2 1
u2 N
i
2
i
,
k
W S
i 1
i
;
2
i
74
(1.8)
b. Trong trƣờng hợp chọn mẫu ngẫu nhiên phân tổ không hoàn lại và
cơ chế phân bổ mẫu là phân bổ Neyman thì phƣơng sai chung của mẫu có
dạng:
D2 (xm )
2
1 k
1
Wi S i
n i 1
N
k
W S
i 1
i
2
i
Thay D2 ở công thức này vào phƣơng trình (1.5) rồi giải với ẩn số là
n sẽ có công thức xác định cỡ mẫu cho trƣờng hợp "mẫu phân tổ với cơ
chế chọn ngẫu nhiên không hoàn lại và phân bổ mẫu theo kiểu Neyman".
Sau khi giải phƣơng trình có công thức xác định cỡ mẫu nhƣ sau:
2
k
Wi S i
n 2 i 1 k
d
1
Wi S i2
2
u N i 1
;
(1.9)
II. PHÂN BỔ MẪU
Trong điều tra chọn mẫu có hai trƣờng hợp cần tiến hành phân bổ
mẫu, đó là khi áp dụng điều tra chọn mẫu phân tổ hoặc khi áp dụng điều tra
chọn mẫu phân tầng. Sau đây là các nguyên tắc cần chú ý khi tiến hành
phân bổ mẫu và một số phƣơng pháp phân bổ mẫu cơ bản.
2.1. Các nguyên tắc phân bổ mẫu cho các tổ
Về phƣơng diện lý thuyết, việc phân bổ mẫu cho các tổ phụ thuộc
vào mức độ biến động của chỉ tiêu cần nghiên cứu ở từng tổ. Mặt khác nó
còn phụ thuộc vào dung lƣợng thông tin từng tổ hoặc từng đơn vị điều tra.
Với lý do đó việc phân bổ mẫu cũng có những nguyên tắc nhất định. Sau
đây là những nguyên tắc cơ bản thƣờng đƣợc sử dụng khi phân bổ số lƣợng
đơn vị mẫu cho các tổ.
a. Dựa vào mức độ biến động của chỉ tiêu cần thu thập trong từng
tổ. Với nguyên tắc này, tổ nào có sự biến động lớn, tổ đó cần đƣợc phân bổ
số lƣợng đơn vị mẫu nhiều hơn.
b. Dựa vào tầm quan trọng của từng cá thể, từng nhóm cá thể đối
với thông tin cần cho ra để phân bổ mẫu.
75
Với một chủ đề thông tin cần thu thập, các đơn vị điều tra thƣờng có
dung lƣợng thông tin khác nhau. Có đơn vị mang nhiều dung lƣợng thông
tin hơn, ngƣợc lại có đơn vị có rất ít lƣợng thông tin . Trong điều kiện nhƣ
vậy, thƣờng ngƣời ta dựa vào dung lƣợng thông tin để phân tổ tổng thể ra
thành các tổ có dung lƣợng thông tin khác nhau. Trên cơ sở đó, phân bổ cỡ
mẫu cho các tổ theo nguyên tắc các tổ có dung lƣợng thông tin phong phú
tỷ lệ chọn mẫu phải cao, thậm chí có khi phải chọn hết.
c. Dựa vào nhu cầu thông tin của các cấp lãnh đạo.
d. Dựa vào số lượng các đơn vị cá thể và tính đồng đều của các đơn
vị cá thể trong mỗi tổ: Số lƣợng càng lớn thì số đơn vị mẫu có thể giảm
tƣơng đối; Tính đồng đều của các đơn vị cá thể càng cao thì phân bổ cỡ
mẫu có thể giảm đi.
2.2. Các phƣơng pháp phân bổ mẫu cho các tổ
Về mặt lý luận, ngƣời ta thƣờng nhắc đến các kiểu phân bổ mẫu cơ
bản là phân bổ mẫu tỷ lệ thuận với quy mô, phân bổ mẫu tỷ lệ nghịch với
quy mô, phân bổ mẫu Neyman, phân bổ mẫu tối ƣu.
2.2.1. Phân bổ mẫu tỷ lệ thuận với quy mô
Công thức phân bổ mẫu tỷ lệ thuận với quy mô có dạng:
ni
Ni
* n Wi * n
N
với
i=1,2,...,M
;
(1.10)
Trong đó M là số tổ; n là cơ mẫu chung của tổng thể ni là cỡ mẫu
của tổ i , N là quy mô tổng thể; Ni là quy mô của tổ i; Wi là tỷ trọng của tổ i
trong tổng thể.
Phƣơng pháp phân bổ mẫu tỷ lệ thuận với quy mô thƣờng đƣợc áp
dụng khi quy mô của các tổ tƣơng đối đồng đều, phƣơng sai và chi phí cho
các tổ không quá khác biệt nhau và khi không biết trƣớc phƣơng sai cũng
nhƣ chi phí cho một đơn vị mẫu.
Phân bổ mẫu tỷ lệ thuận với quy mô có một số ƣu là quy trình phân
bổ mẫu đơn giản. Mặt khác rất phù hợp với suy nghĩ thông thƣờng của mọi
ngƣời nên dễ đƣợc chấp nhận. Quy trình ƣớc lƣợng đơn giản. Đối với các
chỉ tiêu tƣơng đối, không cần phải quyền số hoá khi ƣớc lƣợng chúng.
76
Mẫu phân bổ tỷ lệ thuận với quy mô tổ thuộc loại "tự cân đối quyền số".
Tuy nhiên, phƣơng pháp phân bổ mẫu này có một số nhƣợc điểm là trong
trƣờng hợp quy mô của các tổ chênh lệch nhau quá lớn, các tổ có quy mô
nhỏ thƣờng không đủ số lƣợng đơn vị mẫu để đại diện cho tổ mình, trong
trƣờng hợp quy mô của các tổ chênh lệch nhau quá lớn, việc tổ chức điều
tra cũng nhƣ kinh phí cần thiết cho điều tra ở các tổ có quy mô lớn sẽ rất
nặng nề, gây lãng phí không cần thiết.
2.2.2. Phân bổ mẫu tỷ lệ nghịch với quy mô
Để khắc phục nhƣợc điểm của phƣơng pháp phân bổ mẫu tỷ lệ thuận
với quy mô, ngƣời ta thƣờng phân bổ theo cách tổ có qui mô càng bé thì tỷ
lệ chọn mẫu của nó càng lớn, còn tổ có qui mô lớn thì có tỷ lệ chọn mẫu
nhỏ. Bằng cách này thông tin không những đại diện đƣợc cho toàn bộ tổng
thể mà còn có thể đại diện đƣợc cho từng tổ một.
Phƣơng pháp phân bổ mẫu tỷ lệ nghịch với quy mô có những ƣu
điểm là cho phép các tổ có quy mô nhỏ cũng có đủ số lƣợng đơn vị mẫu để
có thể có cơ may tiếp cận tốt hơn và gánh nặng điều tra và kinh phí không
dồn vào một tổ. Tuy nhiên, phƣơng pháp phân bổ mẫu này cũng có những
hạn chế là việc ƣớc lƣợng các thông số cho tổng thể phức tạp.
Nhóm các phƣơng pháp phân bổ mẫu tỷ lệ nghịch với qui mô có
một số đại diện là phƣơng pháp phân bổ mẫu Maitra (tên một học giả),
phƣơng pháp phân bổ mẫu đều và phƣơng pháp phân bổ mẫu tỷ lệ nghịch
với qui mô dựa vào phân bổ mẫu tỷ lệ thuận với qui mô.
a. Phương pháp phân bổ mẫu Maitra
Trên cơ sở giả thiết là các kết quả ƣớc lƣợng thu đƣợc ở các tổ có sai
số chọn mẫu nhƣ nhau, Maitra đã tính toán và đƣa ra công thức xác định cỡ
mẫu riêng cho từng tổ một nhƣ sau:
Tỷ lệ chọn mẫu của tổ thứ nhất (tổ nào là tổ thứ nhất là tuỳ thuộc
vào sự sắp xếp của cán bộ thiết kế mẫu và cũng không ảnh hƣởng gì tới kết
quả chung) đƣợc xác định bằng công thức:
M
f1
f (1 ai1 )
i2
;
M
77
(1.11)
Trong đó : f là tỷ lệ chọn mẫu chung, ai
N1
Ni
(i =2,3,...,M)
+ Tỷ lệ chọn mẫu của các tổ còn lại đƣợc xác định bằng công thức:
fi
ai f1
1 (ai 1) f1
(i =2,3,...,M)
;
(1.12)
Có tỷ lệ chọn mẫu của từng tổ, muốn có số lƣợng mẫu của chúng chỉ
cần nhân tỷ lệ này với quy mô của tổ:
ni f i N i , với i= 1,...,M
;
(1.13)
Phƣơng pháp phân bổ mẫu nghịch đảo này có ƣu điểm là cho phép
so sánh kết quả ƣớc lƣợng của các tổ với nhau; Cách phân bổ này loại trừ
đƣợc ảnh hƣởng của quy mô tổ chỉ còn lại ảnh hƣởng của phƣơng sai nội
bộ tổ và các đơn vị có qui mô lớn không phải điều tra một khối lƣợng lớn
đơn vị mà vẫn đảm bảo mức độ đại diện theo yêu cầu.
b. Phương pháp phân bổ mẫu đều
Ở phƣơng pháp này, số các đơn vị mẫu đƣợc chia đều cho các tổ.
Công thức phân bổ có dạng:
nh
n
, với h=1,..,M
M
;
(1.14)
Phƣơng pháp phân bổ mẫu đều thƣờng đƣợc áp dụng khi quy mô
của các tổ tƣơng đối đồng đều, phƣơng sai và chi phí cho các tổ không quá
khác biệt nhau và khi không biết trƣớc phƣơng sai cũng nhƣ chi phí cho
một đơn vị mẫu.
Phƣơng pháp phân bổ mẫu đều có những ƣu và nhƣợc điểm tƣơng tự
nhƣ phƣơng pháp phân bổ mẫu Maitra.
c. Phân bổ mẫu tỷ lệ nghịch với qui mô dựa vào phân bổ mẫu tỷ lệ
thuận với qui mô
Nhiều trƣờng hợp sau khi phân bổ mẫu cho các tổ theo phƣơng pháp
phân bổ tỷ lệ thuận với qui mô xảy ra hiện tƣợng nhiều tổ cỡ mẫu "quá
thừa số lƣợng đơn vị mẫu đại diện" trong khi đó nhiều tổ lại "chƣa đủ số
lƣợng mẫu đại diện". Trong trƣờng hợp nhƣ vậy, cần hiệu chỉnh cỡ mẫu
sao cho tiếp cận tổ không xảy ra hiện tƣợng "tốt lỏi" và không bị "lãng
78
phí". Việc hiệu chỉnh cỡ mẫu này đã chuyển phƣơng pháp phân bổ mẫu tỷ
lệ thuận với qui mô sang phƣơng pháp phân bổ mẫu tỷ lệ nghịch với qui
mô.
Lý thuyết cho thấy nếu cỡ mẫu của tổ i chuyển từ ni sang n'i thì
phƣơng sai của tổ này sẽ phải nhân với
ni
. Trong thực tế, chỉ tiêu đƣợc
n'i
quan tâm không phải là phƣơng sai mẫu mà là sai số mẫu, vì vậy sai số
ni
.
n'i
mẫu cũ phải đƣợc nhân với
Nếu quy mô mẫu chung không đổi mà việc phân bổ mẫu cho các tổ
đƣợc thực hiện theo phƣơng pháp "cỡ mẫu tỷ lệ nghịch với quy mô" thì tỷ
lệ chọn mẫu không đồng đều sẽ làm tăng sai số chọn mẫu cho mẫu chung.
Trong trƣờng hợp nhƣ vậy phƣơng sai mẫu của mẫu chung cần phải đƣợc
nhân với hệ số sau2:
M
L
M
( niWi 2 )( ni )
i 1
i 1
M
( niWi ) 2
i 1
2.2.3. Phân bổ Neyman
Để nâng cao hiệu quả của thiết kế mẫu, Neyman đã đƣa ra và giải
bài toán: với cỡ mẫu chung cho trƣớc bằng n, cần phân bổ nó cho k tổ sao
cho phƣơng sai chung của mẫu nhỏ nhất. Kết quả nghiên cứu của Neyman
đã đƣa ra công thức phân bổ mẫu sau:
ni
N i Si
n
M
N S
i 1
i
(i=1,2,3,...,M)
;
(1.15)
i
Công thức (1.15) có tên gọi là "Phân bổ Neyman". Công thức trên
cho thấy cỡ mẫu của các tổ vừa tỷ lệ thuận với phƣơng sai của các tổ vừa
tỷ lệ thuận với quy mô của các tổ. Tổ nào có qui mô hoặc phƣơng sai lớn
tổ đó sẽ có cỡ mẫu lớn. Nhƣ vậy phân bổ Neyman vừa tính đến sự khác
2
2
DHS 1987: Sampling Manual; trang 14
Leslie Kish 1995: Survey Sampling; trang 94
79
biệt về quy mô tổ vừa tính đến sự khác biệt về phƣơng sai giữa các tổ.
Phƣơng pháp phân bổ mẫu Neyman thƣờng đƣợc áp dụng khi phƣơng sai
của các tổ cũng nhƣ quy mô của các tổ tƣơng đối khác biệt nhau.
Lý thuyết đã chứng minh đƣợc là hiệu quả thiết kế mẫu theo phân bổ
Neyman cao hơn so với phân bổ tỷ lệ thuận với quy mô và càng cao hơn so
với mẫu ngẫu nhiên đơn giản có cùng quy mô (SE phân bổ Neyman < SE
phân bổ tỷ lệ thuận với quy mô < SE phân bổ ngẫu nhiên cho tổng thể).
Ngoài các ƣu điểm đã nêu trên, phân bổ Neyman còn một ƣu điểm khác
nữa là với cùng một yêu cầu về sai số và độ tin cậy, nó có cỡ mẫu nhỏ hơn
các loại phân bổ khác và vì vậy tiết kiệm đƣợc kinh phí hơn.
2.2.4. Phân bổ mẫu tối ưu
Khi tiến hành thiết kế mẫu, ngƣời thiết kế luôn hƣớng vào mục tiêu
làm sao cho kết quả thu đƣợc từ mẫu đảm bảo mức độ chính xác mong
muốn trong điều kiện sức ngƣời, sức của cho phép. Với lý do đó, khi thiết
kế mẫu ngƣời ta cố gắng tìm cách phân bổ mẫu để đạt đƣợc cùng một lúc
hai mục tiêu: sai số chọn mẫu nhỏ nhất trong điều kiện kinh phí cho phép.
Phân bổ mẫu đạt đƣợc điều kiện nhƣ vậy đƣợc gọi là phân bổ mẫu tối ƣu
(I.M. Chakravati và cộng sự: Handbook of Methods of Applied Statistics;
Volume II trang 40). Công thức phân bổ mẫu tối ƣu nhƣ sau:
N i Si
c
ni M i
NS
i i
i 1 c
i
n , với i=1,2,…,M
;
(1.16)
Công thức trên cho thấy khi các tổ chi phí bình quân cho một đơn vị
điều tra như nhau (ci=c, với i=1,2,…,M), phân bổ mẫu tối ưu trở thành
phân bổ mẫu Neyman. Trong trường hợp
Si
ci
consant (với i=1,2,…,M),
phân bổ mẫu tối ưu trở về dạng phân bổ mẫu tỷ lệ thuận với quy mô.
Phƣơng pháp phân bổ mẫu tối ƣu thƣờng đƣợc áp dụng khi phƣơng
sai của các tổ và chi phí cho một đơn vị điều tra ở các tổ có sự khác biệt
nhau đáng kể. Phân bổ mẫu tối ƣu có một ƣu điểm lớn là vừa đảm bảo yêu
cầu của phân bổ Neyman, tức là có tính đến mức độ biến động khác nhau ở
80
các tổ, vừa đảm bảo yêu cầu có sự khác nhau về mặt kinh phí của các tổ.
Tuy nhiên, cũng giống nhƣ phƣơng pháp phân bổ mẫu Neyman, phƣơng
pháp phân bổ mẫu tối ƣu cũng chỉ là tối ƣu đối với mẫu chung, chứ chƣa
chắc đã tối ƣu đối với từng tổ.
2.3. Nguyên tắc phân bổ mẫu trong điều tra chọn mẫu phân tầng
Trong điều tra chọn mẫu phân tầng, việc phân bổ mẫu là việc phân
chia số lƣợng đơn vị mẫu giữa các tầng. Công thức xác định cỡ mẫu trong
mẫu phân tầng (ở đây để dễ hiểu chỉ nghiên cứu mẫu hai tầng) có dạng:
n= m*n0,
Trong đó n là cỡ mẫu chung, m là số lƣợng đơn vị mẫu cấp I, còn n 0
là số lƣợng đơn vị mẫu cấp II bình quân.
Tuy có thể có nhiều loại mẫu phân tầng (mẫu hai tầng, mẫu ba
tầng,…), song chúng đều có nguyên tắc phân bổ chung, đó là dựa vào mật
độ của đối tƣợng điều tra trong đơn vị mẫu cấp trên. Mật độ của đối tƣợng
điều tra ở mẫu cấp trên thấp, số lƣợng đơn vị mẫu của nó phải nhiều và số
lƣợng đơn vị mẫu cấp dƣới sẽ giảm đi (vì cỡ mẫu chung n không đổi).
PHẦN HAI
THỰC TẾ XÁC ĐỊNH CỠ MẪU VÀ PHÂN BỔ MẪU TRONG CÁC
CUỘC ĐIỀU TRA CHỌN MẪU CỦA TỔNG CỤC THỐNG KÊ
I. THỰC TẾ XÁC ĐỊNH CỠ MẪU
Các vụ thống kê nghiệp vụ của Tổng cục Thống kê từ nhiều năm nay
đã tiến hành điều tra chọn mẫu. Nhiều cuộc điều tra do chính các vụ tự
thiết kế và thực hiện. Mặt khác, có nhiều cuộc điều tra việc thiết kế mẫu có
sự trợ giúp của các chuyên gia trong và ngoài nƣớc. Phần này đƣợc viết
dựa trên các báo cáo do các vụ thống kê nghiệp vụ của Tổng cục Thống kê
viết và các phƣơng án điều tra đã đƣợc công bố.
1.1. Trong điều tra chọn mẫu của Vụ Thống kê Dân số và Lao động
Vụ Thống kê Dân số và Lao động tiến hành các cuộc điều tra chọn
mẫu nhƣ điều tra chọn mẫu lồng ghép trong tổng điều tra dân số 1989,
1999, điều tra chọn mẫu nhân khẩu học giữa kỳ, điều tra biến động dân số
hàng năm, điều tra nhiều vòng.
81
Đối với cuộc điều tra chọn mẫu lồng trong tổng điều tra dân số 1999,
cỡ mẫu đƣợc ấn định là 3% số dân số của toàn quốc. Tỷ lệ chọn mẫu của
năm 1999 giảm đi là do sau khi nghiên cứu kết quả điều tra chọn mẫu lồng
trong tổng điều tra dân số 1989, các chuyên gia thấy chỉ cần điều tra với tỷ
lệ mẫu nhƣ vậy là đủ. Tƣơng tự nhƣ điều tra chọn mẫu lồng trong tổng điều
tra của năm 1989, tỷ lệ chọn mẫu của các tỉnh đƣợc xác định dựa vào số
dân do hệ thống báo cáo dân số thƣờng xuyên và tỷ lệ chọn mẫu chung của
toàn quốc.
1.2. Trong điều tra chọn mẫu của Vụ Thống kê Xã hội và Môi trƣờng
Vụ Thống kê Xã hội và Môi trƣờng từ lâu đã tiến hành điều tra chọn
mẫu về hộ gia đình. Bắt đầu từ năm 1994 cuộc điều tra này đƣợc tiến hành
thƣờng xuyên hơn. Trong giai đoạn 1994-2000, nội dung điều tra gồm
nhiều lĩnh vực khác nhau nên các cuộc điều tra về hộ gia đình trên có tên
gọi là điều tra đa mục tiêu. Phƣơng pháp điều tra là phƣơng pháp chọn
mẫu. Cỡ mẫu đƣợc ấn định cho cả nƣớc là 45.000 hộ. Từ năm 2002, cơ
quan có chủ trƣơng cứ hai năm tiến hành điều tra một lần và nội dung chủ
yếu tập trung vào mức sống của dân cƣ nên cuộc điều tra này đƣợc gọi là
"Khảo sát mức sống hộ gia đình". Việc xác định cỡ mẫu của Vụ Thống kê
Xã hội và Môi trƣờng trƣớc đây hoặc dựa vào kinh nghiệm của các chuyên
gia nƣớc ngoài, hoặc dựa vào kinh nghiệm của mình.
1.3. Trong điều tra chọn mẫu của Vụ Thống kê Nông, Lâm nghiệp và
Thủy sản
Vụ Thống kê Nông, Lâm nghiệp và Thủy sản điều tra thu thập thông
tin về năng suất, sản lƣợng cây trồng, số lƣợng đầu gia súc và năng suất,
sản lƣợng thủy hải sản. Phƣơng pháp điều tra chọn mẫu cũng đƣợc áp dụng
trong lĩnh vực này. Trong cuộc điều tra thực thu của các hộ gia đình
phƣơng pháp điều tra chọn mẫu phân tổ kết hợp với phân tầng đã đƣợc áp
dụng. Số các đơn vị điều tra đƣợc ấn định là mỗi huyện chọn khoảng 1/3 số
xã; mỗi xã đƣợc chọn chọn lấy 3 thôn và mỗi thôn đƣợc chọn lại chọn lấy
một số hộ. Tổng số hộ đƣợc chọn để điều tra cho một huyện dao động từ
100-300 hộ. Trong cuộc điều tra năng suất, sản lượng lúa giai đoạn 19961997 việc xác định số đơn vị để điều tra cũng dựa vào việc xác định tỷ lệ
82
các xã, thôn và hộ cần chọn. Tuy nhiên, tỷ lệ chọn các đơn vị điều tra ở các
cấp đƣợc xác định cho từng loại tổ theo quy mô của chúng. Trong cuộc
điều tra chăn nuôi áp dụng hai hình thức điều tra: điều tra toàn bộ và điều
tra chọn mẫu tuỳ thuộc vào vật nuôi và sản phẩm chăn nuôi. Điều tra toàn
diện thƣờng ứng dụng đối với các trang trại, còn điều tra chọn mẫu áp dụng
đối với khu vực hộ gia đình. Phƣơng pháp chọn mẫu cũng là phân tổ kết
hợp với phân tầng (cấp). Mỗi huyện là một tổ. Xã là đơn vị chọn mẫu cấp I
(coi mỗi tổ là một tổng thể), thôn là đơn vị chọn mẫu cấp II và hộ là đơn vị
chọn mẫu cấp III. Điều tra lâm nghiệp ngoài quốc doanh, các xã trong
huyện đƣợc chia ra thành 3 hoặc 4 vùng. Mỗi vùng chọn 1 hoặc 2 thôn
bản, mỗi thôn bản đƣợc chọn lại chọn từ 10-15% số hộ để điều tra. Điều
tra thủy sản ngoài quốc doanh, các xã trong huyện đƣợc chia ra thành các
vùng tùy thuộc vào điều kiện đánh bắt hoặc nuôi trồng thủy sản. Mỗi vùng
chọn từ 2 đến ba 3 xã đại diện, mỗi xã chọn từ 15 đến 20 cơ sở để điều tra.
1.4. Trong điều tra chọn mẫu của Vụ Thống kê Thƣơng mại, Dịch vụ
và Giá cả
Các cuộc điều tra do Vụ Thống kê Thƣơng mại, Dịch vụ và Giá cả
tiến hành hầu hết thuộc dạng "điều tra phân tổ kết hợp với điều tra nhiều
cấp". Mỗi huyện/ quận đƣợc coi là một tổ. Đơn vị chọn mẫu cấp I là xã/
phƣờng. Việc xác định cỡ mẫu đƣợc quy định là các quận, huyện dƣới
2000 cơ sở SXKD cá thể điều tra 40% số xã/ phƣờng, các quận, huyện có
từ 2000 đến dƣới 5000 cơ sở SXKD cá thể điều tra 35% số xã/ phƣờng, các
quận, huyện có từ 5000 cơ sở SXKD cá thể trở lên điều tra 30% số xã/
phƣờng.
1.5. Trong điều tra chọn mẫu của Vụ Thống kê Công nghiệp và Xây dựng
Tƣơng tự nhƣ ở các vụ thống kê nghiệp vụ khác, việc xác định cỡ
mẫu cho điều tra các doanh nghiệp của Vụ Thống kê Công nghiệp và Xây
dựng cũng ở dạng đƣa ra các tỷ lệ chọn mẫu cho các tổ có quy mô khác
nhau. Ví dụ, trong điều tra mẫu hàng tháng cỡ mẫu được xác định là đối
với điều tra mẫu trong các doanh nghiệp ngoài quốc doanh, tỷ lệ chọn mẫu
quy định là 15%; Đối với điều tra mẫu trong các cơ sở cá thể, tỷ lệ mẫu của
từng tỉnh, thành phố đƣợc quy định theo số lƣợng các cơ sở hiện có: Dƣới
83
10.000 cơ sở tỷ lệ chọn mẫu là 2%; Từ 10.000 đến dƣới 30.000 cơ sở tỷ lệ
chọn mẫu là 1,5%; Từ 30.000 cơ sở trở lên tỷ lệ chọn mẫu là 1%.
1.6. Một số nhận xét về cách xác định cỡ mẫu ở các vụ
Trong các cuộc điều tra do các vụ thống kê nghiệp vụ tự thiết kế
mẫu, việc xác định cỡ mẫu thƣờng theo một trong hai xu hƣớng sau:
a. Quy định tỷ lệ chọn mẫu chung hoặc tỷ lệ chọn mẫu cho từng cấp
(các vụ thƣờng tổ chức điều tra chọn mẫu nhiều cấp).
b. Quy định sẵn số đơn vị chọn mẫu cho cuộc điều tra.
Ở xu hƣớng thứ nhất việc xác định cỡ mẫu (n) hoàn toàn dựa vào
suy nghĩ chủ quan của ngƣời thiết kế mẫu bởi lẽ cỡ mẫu theo lý thuyết
không phụ thuộc vào quy mô của tổng thể (N) mà chỉ phụ thuộc vào mức
độ biến động của chỉ tiêu cần đƣợc điều tra. Cách quy định nhƣ vậy đồng
nghĩa với việc coi cỡ mẫu phụ thuộc vào quy mô của tổng thể: quy mô của
tổng thể lớn số lƣợng đơn vị đƣợc chọn vào mẫu lớn, ngƣợc lại quy mô của
tổng thể nhỏ số lƣợng đơn vị đƣợc chọn vào mẫu ít (vì cỡ mẫu n fN ).
Thật vậy, lý thuyết điều tra chọn mẫu cho thấy công thức xác định cỡ mẫu
2
t S2
nhƣ sau (đối với cách chọn mẫu có hoàn lại): n 2 đối với chỉ tiêu giá
d
t P (1 P )
đối với chỉ tiêu tỷ lệ.
trị trung bình hoặc n
d2
2
Trong công thức trên, t là mức độ tin cậy (ở đây giả thiết hiện tƣợng
có dạng phân bố chuẩn), d là mức độ sai số cho phép và s 2 là phƣơng sai
của chỉ tiêu cần điều tra.
Các công thức trên cho thấy rõ ràng là cỡ mẫu chỉ phụ thuộc vào
mức độ biến động của chỉ tiêu (thể hiện thông qua phƣơng sai S2), mức độ
tin cậy (thể hiện bằng t trong công thức) và sai số cho phép (thể hiện bằng
d trong công thức) chứ hoàn toàn không phụ thuộc vào quy mô của tổng
thể vì trong các công thức trên hoàn toàn không thấy xuất hiện N (quy mô
của tổng thể). Ở xu hƣớng thứ hai việc xác định cỡ mẫu cũng dựa vào cảm
nhận và kinh nghiệm của những ngƣời thiết kế điều tra.
II. THỰC TẾ PHÂN BỔ MẪU
84
Trong những năm qua nhiều vụ thống kê nghiệp vụ cũng tiến hành
điều tra chuyên đề theo phƣơng pháp điều tra chọn mẫu. Phƣơng pháp điều
tra chủ yếu là điều tra phân tổ theo đơn vị hành chính (tỉnh, huyện,…).
Nhìn một cách tổng thể, việc phân bổ mẫu không đặt ra với các cuộc điều
tra này. Điều này đƣợc thể hiện ở chỗ hầu hết các vụ đều định sẵn một tỷ lệ
chọn mẫu chung cho tất cả các tỉnh/ thành phố.
2.1. Trong điều tra của Vụ Thống kê Dân số và Lao động.
Vụ Thống kê Lao động và Dân số đã tiến hành tổ chức nhiều cuộc
điều tra chọn mẫu hộ gia đình. Đối với cuộc điều tra chọn mẫu lồng trong
tổng điều tra dân số 1989, 1999 cỡ mẫu đƣợc ấn định tƣơng ứng là 5% và
3% số dân số của toàn quốc. Phƣơng pháp phân bổ mẫu là phƣơng pháp
phân bổ mẫu Maitra. Đối với các cuộc điều tra biến động dân số đƣợc tiến
hành trƣớc năm 1989 việc phân bổ cỡ mẫu hoàn toàn dựa vào ý muốn chủ
quan của ngƣời thiết kế.
2.2. Trong điều tra của Vụ Thống kê Xã hội và Môi trƣờng
Vụ Thống kê Xã hội và Môi trƣờng từ lâu đã tiến hành điều tra về
hộ gia đình. Bắt đầu từ năm 1994 cuộc điều tra này đƣợc tiến hành thƣờng
xuyên hơn. Phƣơng pháp điều tra là phƣơng pháp chọn mẫu. Trƣớc năm
2001, các cuộc điều tra chọn mẫu hộ gia đình do vụ chỉ đạo việc phân bổ
mẫu đƣợc tiến hành theo phƣơng pháp "phân bổ mẫu tỷ lệ với quy mô dân
số của các tỉnh/ thành phố". Tuy nhiên, trong những trƣờng hợp nhất định
có sử dụng đến ý kiến chuyên gia để hiệu chỉnh cỡ mẫu cho một số tỉnh/
thành phố cho thích hợp. Năm 2001-2002 vụ tiến hành điều tra mức sống
hộ gia đình. Phƣơng pháp phân bổ mẫu đƣợc áp dụng là "phân bổ mẫu tỷ lệ
với tỷ trọng của căn bậc hai của dân số":
ni n
Ni
M
i 1
, với i=1,…,M; M là số tổ; N quy mô dân số; n quy mô mẫu
Ni
Phƣơng pháp phân bổ mẫu này có ƣu điểm là vừa tận dụng đƣợc ƣu
thế của phƣơng pháp phân bổ mẫu tỷ lệ thuận với quy mô vừa làm cho cỡ
mẫu của các tổ không bị chênh nhau nhiều quá. Tức là khắc phục đƣợc
85
nhƣợc điểm của phƣơng pháp phân bổ mẫu tỷ lệ thuận với quy mô trong
điều kiện quy mô của các tổ quá chênh lệch nhau.
2.3. Trong điều tra của Vụ Thống kê Nông, Lâm nghiệp và Thủy sản
Vụ Thống kê Nông, Lâm nghiệp và Thủy sản điều tra thu thập thông
tin về năng suất, sản lƣợng cây trồng, số lƣợng đầu gia súc và năng suất,
sản lƣợng thủy hải sản. Phƣơng pháp điều tra không toàn bộ cũng đƣợc áp
dụng trong lĩnh vực này. Trong cuộc điều tra thực thu của các hộ gia đình,
số các đơn vị điều tra ở các tổ đƣợc ấn định là mỗi huyện chọn khoảng 1/3
số xã; mỗi xã đƣợc chọn chọn lấy 3 thôn để điều tra và mỗi thôn đƣợc chọn
lại chọn lấy một số hộ. Tổng số hộ đƣợc chọn để điều tra cho một huyện
dao động từ 100-300 hộ. Nhƣ vậy, việc phân bổ các đơn vị mẫu hoàn toàn
dựa vào kinh nghiệm hoặc thói quen của vụ đã tiến hành từ trƣớc đến nay,
còn tỷ lệ phân bổ là bao nhiêu thì không có nguyên tắc để đƣa ra.
2.4. Trong điều tra của Vụ Thống kê Thƣơng mại, Dịch vụ và Giá cả
Mẫu của vụ lấy xã phƣờng làm đơn vị chọn mẫu cấp I. Số lƣợng
mẫu đƣợc ấn định và phân bổ theo mức độ nhiều hay ít xã phƣờng của tỉnh.
Các tỉnh có từ 100-200 xã phƣờng cỡ mẫu sẽ đƣợc phân bổ là 25 đơn vị
cấp I. Các tỉnh/ thành phố có số xã phƣờng trên 200 thì đƣợc phân bổ 30
đơn vị cấp I. Việc phân bổ mẫu cấp II đƣợc tiến hành bằng cách chia các
tỉnh ra thành các loại: I, II và III. Ở nhóm tỉnh loại I chọn điều tra 30 ngành
hàng và mỗi ngành chọn 30 hộ để điều tra. Ở nhóm tỉnh loại II chọn điều
tra 20 ngành hàng và mỗi ngành chọn 25 hộ để điều tra. ở nhóm tỉnh loại
III chọn điều tra 14 ngành hàng và mỗi ngành chọn 20 hộ để điều tra.
Trong thực tế điều tra chi phí SXKD ngành công nghiệp (phiếu
02/ĐT-CP) tháng 10 năm 2003, việc phân bổ mẫu cho các ngành (26
ngành) đƣợc thực hiện theo phƣơng pháp phân bổ mẫu tỷ lệ thuận với quy
mô sản xuất (giá trị sản xuất) và tính đồng đều của các cơ sở sản xuất trong
từng ngành kinh tế. Việc phân bổ mẫu nhƣ vậy không phù hợp với thực tế
vì quy mô giữa các ngành rất khác nhau (có ngành có trên 179 nghìn đơn
vị, có ngành chỉ có dƣới 10 đơn vị). Cách phân bổ này đã dẫn đến tình
trạng có ngành quá thừa mức độ đại diện và có ngành lại không đủ mức độ
đại diện.
86
2.5. Trong điều tra của Vụ Thống kê Công nghiệp và Xây dựng
Việc phân bổ mẫu của Vụ Thống kê Công nghiệp và Xây dựng đƣợc
thực hiện theo ba bƣớc. Bƣớc thứ nhất, dựa vào tỷ lệ chọn mẫu của từng
tỉnh tính cỡ mẫu cho từng tỉnh. Bƣớc thứ hai, trên cơ sở cỡ mẫu tính đƣợc
của các tỉnh phân bổ mẫu về cho các quận, huyện theo tỷ trọng giá trị sản
xuất của mỗi quận huyện ở năm trƣớc. Bƣớc thứ ba, trên cơ sở cỡ mẫu tính
đƣợc của các quận, huyện phân bổ mẫu về cho các ngành công nghiệp cấp
II theo tỷ trọng giá trị sản xuất của từng ngành trong quận, huyện ở năm
trƣớc.
2.6. Nhận xét về cách phân bổ mẫu ở các vụ thống kê nghiệp vụ
Từ xem xét các cuộc điều tra chọn mẫu do các vụ thống kê nghiệp
vụ tiến hành thấy có một số cuộc điều tra việc phân bổ mẫu do các cán bộ
của các vụ tự tiến hành. Một số khác do các chuyên gia nƣớc ngoài đề xuất
phƣơng pháp phân bổ mẫu.
Các cán bộ thuộc các vụ thống kê nghiệp vụ thƣờng phân bổ mẫu
theo phƣơng pháp phân bổ mẫu tỷ lệ thuận với quy mô hoặc dựa vào kinh
nghiệm mà chƣa dựa vào mức độ biến động của chỉ tiêu cần thu thập thông
tin ở các tổ. Mặt khác cũng không xem xét đến sự khác biệt quá lớn về quy
mô của các tổ để lựa chọn phƣơng pháp phân bổ mẫu cho thích hợp. Tuy
nhiên, Vụ Thống kê công nghiệp và Xây dựng khi tiến hành phân bổ mẫu
đã chú ý tới tầm quan trọng của các cá thể. Các chuyên gia nƣớc ngoài khi
tiến hành phân bổ mẫu cho các tổ đã vận dụng tƣơng đối tốt các nguyên tắc
phân bổ mẫu khác nhau, nên kết quả điều tra thu đƣợc có hiệu quả thiết kế
mẫu cao và sai số chọn mẫu tƣơng đối thấp.
PHẦN BA
NHỮNG NGUYÊN TẮC XÁC ĐỊNH CỠ MẪU VÀ PHÂN BỔ MẪU
RÚT RA ĐƢỢC TỪ KẾT QUẢ NGHIÊN CỨU ĐỀ TÀI
Trong thực tế điều tra chọn mẫu thƣờng chỉ có ba phƣơng pháp chọn
mẫu đƣợc ứng dụng. Đó là phƣơng pháp điều tra chọn mẫu phân tổ,
phƣơng pháp điều tra chọn mẫu phân tầng và phƣơng pháp điều tra chọn
mẫu chùm. Phƣơng pháp điều tra chọn mẫu ngẫu nhiên đơn giản tuy không
87
hay đƣợc ứng dụng trực tiếp trong thực tế, song dƣờng nhƣ trong bất kỳ
cuộc điều tra nào nó cũng đƣợc ứng dụng. Cụ thể là nó đƣợc ứng dụng ở
từng tổ trong điều tra chọn mẫu phân tổ hoặc đƣợc ứng dụng ở cấp thấp
nhất trong điều tra chọn mẫu phân tầng.
Kết quả cần đạt đƣợc của đề tài này là phải đề ra đƣợc các nguyên
tắc xác định cỡ mẫu và phân bổ mẫu khả dĩ có thể ứng dụng đƣợc vào thực
tiễn công tác thống kê ở nƣớc ta, vì vậy thay cho phần kết luận và khuyến
nghị nhƣ ở các đề tài khác, đề tài này sẽ tổng kết các nguyên tắc và phƣơng
pháp xác định cỡ mẫu và phân bổ mẫu mà đề tài cho rằng thích hợp trong
điều kiện ở nƣớc ta.
I. CÁC NGUYÊN TẮC VÀ PHƢƠNG PHÁP XÁC ĐỊNH CỠ MẪU
1.1. Các nguyên tắc xác định cỡ mẫu
Giữa lý luận và thực tế có sự khác biệt nhất định, vì vậy không thể
dựa hoàn toàn vào lý luận để xác định cỡ mẫu cho cuộc điều tra. Nếu cứ
máy móc làm theo lý thuyết, chắc chắn nhiều khi không thể xác định đƣợc
cỡ mẫu cho cuộc điều tra. Điều đó có nghĩa là thực tiễn có tiêu chuẩn riêng
của mình. Với lý do đó, khi tiến hành xác định cỡ mẫu cho một cuộc điều
tra cần kết hợp giữa tiêu chuẩn riêng của thực tiễn và đòi hỏi của lý thuyết.
Trong thực tế, khi xác định cỡ mẫu các nhà thiết kế mẫu thƣờng dựa
vào các nguyên tắc sau đây:
a. Khả năng kinh phí của cuộc điều tra: Nếu khả năng kinh phí của
cuộc điều tra cao, có thể mở rộng cỡ mẫu theo mong muốn của ngƣời thiết
kế. Ngƣợc lại nếu khả năng kinh phí có hạn thì cỡ mẫu chỉ đƣợc xác định
phù hợp với mức kinh phí cho phép. Trong trƣờng hợp nhƣ vậy mức độ đại
diện của các kết quả thu đƣợc từ mẫu bị hạn chế.
b. Thời hạn cần có thông tin: Thời hạn cần cho ra thông tin có ảnh
hƣởng rất lớn tới cỡ mẫu cần điều tra. Thời hạn ngắn, thì cỡ mẫu không thể
lớn. Vì cỡ mẫu lớn khối lƣợng công việc sẽ nhiều, thời gian cần thiết để
thực hiện khối lƣợng công việc đó cũng phải dài, nhƣ vậy khó có thể có
thông tin nhanh đƣợc.
88
c. Nhu cầu thông tin của các cấp quản lý: ở Việt nam có bốn cấp
quản lý nhà nƣớc, bao gồm cấp quốc gia, cấp tỉnh, cấp huyện và cấp xã.
Khi xác định cỡ mẫu cần phải xét xem thông tin cần cho tới cấp nào. Về
mặt nguyên tắc, cấp quản lý cần thông tin càng thấp, thì cỡ mẫu càng lớn.
Ngƣợc lại, cấp quản lý cần thông tin càng cao thì cỡ mẫu càng nhỏ. Trong
thực tế xác định cỡ mẫu, rất nhiều trƣờng hợp các chuyên gia dựa vào
nguyên tắc này để xác định cỡ mẫu cho cuộc điều tra.
d. Nhu cầu phân tích chi tiết của các chỉ tiêu thống kê cần thu
thập: Về mặt nguyên tắc, nhu cầu phân tích càng sâu, cỡ mẫu càng lớn. Ví
dụ, nếu chỉ cần nghiên cứu tỷ lệ sinh đặc trƣng theo nhóm tuổi 5 năm một
(có 7 nhóm tuổi) của dân số toàn quốc thì cỡ mẫu chỉ cần khoảng 5000 hộ.
Tuy nhiên, nếu cần nghiên cứu tỷ lệ sinh đặc trƣng theo từng độ tuổi một
(gồm có 35 độ tuổi) thì cỡ mẫu phải tăng lên tới trên 100 nghìn hộ. Nhƣ
vậy, nếu thiết kế mẫu dùng để phân tích vĩ mô, chỉ cần cỡ mẫu nhỏ, còn
nếu dùng để phân tích vi mô cỡ mẫu cần phải lớn.
e. Dựa vào mức độ biến động của chỉ tiêu và sai số cho phép
Mức độ biến động của chỉ tiêu cần thu thập thông tin đƣợc thể hiện
thông qua phƣơng sai. Chỉ tiêu có mức độ biến động lớn, cỡ mẫu cần thiết
phải lớn. Ngƣợc lại mức độ biến động của chỉ tiêu nhỏ không cần thiết phải
điều tra một số lƣợng mẫu lớn.
f. Dựa vào số lượng các chỉ tiêu thống kê cần thu thập
Trong một cuộc điều tra, tiến hành thu thập thông tin về nhiều chỉ
tiêu thống kê khác nhau cũng đồng nghĩa với việc phải tiến hành thu thập
thông tin của nhiều tiêu thức điều tra khác nhau (thông thƣờng để thu đƣợc
thông tin của một chỉ tiêu thống kê cần thu thập thông tin của vài ba tiêu
thức thống kê khác nhau). Điều này đòi hỏi phải mất nhiều thời gian. Vì
vậy để đảm bảo về mặt thời gian, nếu số lƣợng tiêu thức điều tra nhiều, cỡ
mẫu cần phải nhỏ. Trong trƣờng hợp số lƣợng các tiêu thức điều tra ít, có
thể tăng cỡ mẫu lên một mức thích hợp. Khi xác định cỡ mẫu không lƣu ý
tới nguyên tắc này có thể sẽ làm ảnh hƣởng tới thời gian cho ra thông tin
(thời hạn của một cuộc điều tra thƣờng không dài) cũng nhƣ chất lƣợng của
chúng.
89
g. Dựa vào khả năng tổ chức thực hiện cuộc điều tra
Trình độ tổ chức cũng là một yếu tố cần phải đƣợc cân nhắc khi xác
định cỡ mẫu cho một cuộc điều tra. Nếu trình độ tổ chức và thực hiện điều
tra thấp thì không đƣợc phép lấy cỡ mẫu lớn. Bởi làm nhƣ vậy sẽ dễ dẫn
đến thất bại.
h. Dựa vào việc cân đối giữa sai số phi chọn mẫu và sai số mẫu
Trong điều kiện hiện nay của các nƣớc đang phát triển, sai số phi
chọn mẫu thƣờng tỷ lệ thuận với quy mô mẫu. Cỡ mẫu càng lớn khả năng
mắc sai số phi chọn mẫu càng lớn. Với lý do này khi xác định cỡ mẫu
ngƣời ta thƣờng cân nhắc sao cho hài hoà giữa sai số mẫu và sai số phi
chọn mẫu.
i. Xác định cỡ mẫu dựa vào kinh nghiệm
Trong thực tế công tác điều tra ngƣời ta thƣờng dựa vào kinh
nghiệm để xác định sẵn cỡ mẫu cần thiết. Thực chất đây là dựa vào kinh
nghiệm đúc rút ra từ nhiều lần điều tra để quyết định cỡ mẫu chuẩn dùng
cho các lần điều tra tiếp theo.
1.2. Các phƣơng pháp xác định cỡ mẫu
Qua nghiên cứu lý luận và thực tiễn rút ra đƣợc các phƣơng pháp cơ
bản để xác định cỡ mẫu nhƣ sau:
a. Dựa vào các công thức xác định cỡ mẫu đã được trình bày ở
chương II phần một. Để xác định cỡ mẫu bằng các công thức đã đƣợc
trình bày cần có thông tin về phƣơng sai, quy mô của tổng thể và mức độ
sai số cho phép.
b. Dựa vào khả năng kinh phí của cuộc điều tra. Có mức kinh phí
và các định mức về chi phí cho một đơn vị điều tra, mức chi phí cố định
(chi phí dành để chuẩn bị cho cuộc điều tra, tổng hợp số liệu, quản lý
phí,…), mức chi phí đi lại giữa các địa bàn điều tra,… ta có thể tính đƣợc
số lƣợng đơn vị mẫu.
c. Dựa vào kinh nghiệm của các cuộc điều tra cùng loại đã được
tiến hành. Nếu trong nƣớc hoặc trên thế giới đã có các cuộc điều tra cùng
90
loại đƣợc tiến hành thì ta có thể mƣợn cỡ mẫu của các cuộc điều tra này
làm cỡ mẫu cho cuộc điều tra của ta.
II. CÁC NGUYÊN TẮC VÀ PHƢƠNG PHÁP PHÂN BỔ MẪU
2.1. Các nguyên tắc phân bổ mẫu
Qua nghiên cứu thấy việc phân bổ mẫu cho các tổ phụ thuộc vào
mức độ biến động của chỉ tiêu cần nghiên cứu ở từng tổ. Mặt khác nó cũng
phụ thuộc vào dung lƣợng thông tin từng tổ hoặc từng đơn vị điều tra. Khái
quát lại các nguyên tắc cơ bản sau đây thƣờng đƣợc sử dụng khi phân bổ số
lƣợng đơn vị mẫu cho các tổ.
a. Dựa vào mức độ biến động của chỉ tiêu cần thu thập trong từng
tổ. Với nguyên tắc này, tổ nào có sự biến động lớn, tổ đó cần đƣợc phân bổ
số lƣợng đơn vị mẫu nhiều hơn.
b. Dựa vào tầm quan trọng của từng cá thể, từng nhóm cá thể đối
với thông tin cần cho ra để phân bổ mẫu.
Trong điều kiện các đơn vị điều tra có dung lƣợng thông tin khác
nhau, việc phân bổ cỡ mẫu cho các tổ tuân theo nguyên tắc các tổ có dung
lƣợng thông tin phong phú tỷ lệ chọn mẫu phải cao, thậm chí có khi phải
chọn hết.
c. Dựa vào nhu cầu thông tin của các cấp lãnh đạo.
d. Dựa vào số lượng các đơn vị cá thể và tính đồng đều của các
đơn vị cá thể trong mỗi tổ: Số lƣợng càng lớn thì số đơn vị mẫu có thể
giảm tƣơng đối; Tính đồng đều của các đơn vị cá thể càng cao thì phân bổ
cỡ mẫu có thể giảm đi.
e. Dựa vào mật độ của đối tượng điều tra trong đơn vị mẫu cấp
trên. Mật độ của đối tƣợng điều tra ở mẫu cấp trên thấp, số lƣợng đơn vị
mẫu của nó phải nhiều và số lƣợng đơn vị mẫu cấp dƣới sẽ giảm đi (vì cỡ
mẫu chung n không đổi).
2.2. Các phƣơng pháp phân bổ mẫu
Khi áp dụng phƣơng pháp điều tra chọn mẫu phân tổ thì ta cần tiến
hành phân bổ mẫu cho các tổ. Trong thực tế, việc phân bổ số lƣợng các đơn
91
vị mẫu cho các tổ của tổng thể cần đƣợc tiến hành dựa vào tình hình thực tế
đang diễn ra. Các nguyên tắc cơ bản có thể sử dụng để phân bổ mẫu trong
thực tế nhƣ sau:
a. Phân bổ mẫu tỷ lệ thuận với quy mô: Phƣơng pháp phân bổ
mẫu này thƣờng đƣợc áp dụng khi quy mô hoặc phƣơng sai của các tổ
tƣơng đối đồng đều. Trong trƣờng hợp này công thức (10) đƣợc áp dụng.
b. Phân bổ mẫu Maitra: Phƣơng pháp phân bổ mẫu này thƣờng
đƣợc áp dụng khi quy mô hoặc phƣơng sai của các tổ tƣơng đối khác biệt,
mặt khác ngƣời dùng tin muốn so sánh kết quả ƣớc lƣợng của các tổ với
nhau. Trong trƣờng hợp này công thức (11) và (12) đƣợc áp dụng.
c. Phân bổ mẫu đều: Phƣơng pháp phân bổ mẫu này thƣờng đƣợc
áp dụng khi quy mô hoặc phƣơng sai của các tổ tƣơng đối đồng đều và khả
năng kinh phí và tổ chức thực hiện dành cho các tổ tƣơng tự nhƣ nhau.
Trong trƣờng hợp này công thức (14) đƣợc áp dụng.
d. Phân bổ mẫu Neyman: Phƣơng pháp phân bổ mẫu này thƣờng
đƣợc áp dụng khi quy mô và phƣơng sai của các tổ tƣơng đối khác nhau.
Trong trƣờng hợp này công thức (15) đƣợc áp dụng.
e. Phân bổ mẫu tối ưu: Phƣơng pháp phân bổ mẫu này thƣờng đƣợc
áp dụng khi quy mô, phƣơng sai và khả năng kinh phí của các tổ tƣơng đối
khác nhau. Trong trƣờng hợp này công thức (16) đƣợc áp dụng.
f. Phân bổ mẫu có sự ưu tiên cho các tổ được đánh giá là quan
trọng: Phƣơng pháp phân bổ mẫu này thƣờng đƣợc áp dụng khi có sự khác
nhau đáng kể giữa các tổ về hàm lƣợng thông tin mà chung có. Theo
nguyên tắc này, các tổ chứa hàm lƣợng thông tin cao sẽ đƣợc phân bổ cỡ
mẫu lớn, còn các tổ chứa hàm lƣợng thông tin thấp đƣợc phân bổ cỡ mẫu
nhỏ.
KHUYẾN NGHỊ
Để xác định cỡ mẫu phù hợp với thực tế và có cơ sở khoa học cần:
+ Lƣu trữ thông tin của tất cả các cuộc điều tra. Đây là cơ sở giúp
các nhà thiết kế mẫu có đƣợc dàn chọn mẫu và tính toán sai số mẫu của các
cuộc điều tra đó rồi xác định cỡ mẫu cần thiết cho các cuộc điều tra sau;
92
+ Việc xác định cỡ mẫu và phân bổ mẫu là vấn đề phức tạp. Trong
điều kiện hiện nay công việc này nên đƣợc tiến hành tại cơ quan Tổng cục.
Các cục thống kê có đủ khả năng tiến hành công việc này cũng nên lấy ý
kiến của các đơn vị chức năng của Tổng cục;
+ Việc xác định cỡ mẫu và phân bổ mẫu cần có sự phối hợp giữa các
đơn vị nghiệp vụ và Viện Khoa học Thống kê. Sự phối hợp này vừa đảm
bảo cơ sở khoa học lẫn cơ sở thực tiễn của một thiết kế mẫu;
+ Trong bối cảnh hiện thời, các thông tin thu thập chỉ dừng lại ở mức
đại diện cho cấp tỉnh và toàn quốc;
+ Việc phân bổ mẫu không nên tiến hành một cách máy móc mà cần
có sự xem xét cụ thể đặc điểm của từng tổ để có sự điều chỉnh hợp lý;
+ Các phƣơng án phân bổ mẫu nên có sự đóng góp ý kiến của các
cục thống kê địa phƣơng.
TÀI LIỆU THAM KHẢO
1. Sharon I. Lohr: Sampling Desgin and analysis, NXB Duxbury
Press;
2. Paul S. Levy: Sampling of population, NXB John Wiley & Son
3. M. Mosleh Uddin: Sampling theory and application
4. IRD: Sampling manual
5. I.M. Chakravarti; R.G. Kaha; J. Roy: Hand book of method of
applied statistics
6. Tổng cục Thống kê, Hà nội 1977: Từ điển thống kê
7. Maurice G.Kendall and other, London 1957: A dictionary of
statistical terms
8. Trung tâm nghiên cứu thông tin và tƣ liệu dân số (Lê Văn Dụy
Chủ biên): Điều tra chọn mẫu - lý luận và ứng dụng trọng công tác dân số
và kế hoạch hóa gia đình, NXB Thống kê 1998.
9. Trƣờng đại học kinh tế quốc dân, bộ môn điều khiển học kinh tế:
Lý thuyết xác suất và thống kê toán; NXB Khoa học kỹ thuật, 1996
93