Tải bản đầy đủ (.pdf) (229 trang)

Ứng dụng phương pháp chon mẫu trong điều tra chăn nuôi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (800.61 KB, 229 trang )


1
MỞ ĐẦU

1. Lý do chọn đề tài
Nhu cầu nắm bắt thông tin trong nền kinh tế thò trường đònh hướng Xã Hội
Chủ Nghóa là rất lớn. Nếu như trước đây trong nền kinh tế bao cấp, với thành
phần kinh tế Quốc Doanh chiếm đa số, việc thu thập thông tin chủ yếu bằng
hình thức báo cáo thống kê đònh kỳ, thì nay với nền kinh tế nhiều thành phần đòi
hỏi phải cải tiến phương pháp thu thập số liệu sao cho vừa đảm bảo tính chính
xác, kòp thời và đầy đủ vừa phải tính đến hiệu quả của chi phí thu thập và xử lý
số liệu.
Nền kinh tế nước ta, trước mắt nông nghiệp vẫn được xem là quan trọng,
tạo tiền đề cho công nghiệp hóa, hiện đại hóa đất nước. Trong cơ cấu tổng thu
của ngành nông nghiệp: Thu từ trồng trọt chiếm 68,53%, thu từ chăn nuôi chiếm
29,75% (theo số liệu tổng điều tra nông thôn, nông nghiệp và thủy sản năm
2001). Mặc dù chiếm tỷ trọng không lớn trong nông nghiệp nhưng sản phẩm
chăn nuôi đóng vai trò quan trọng trong đời sống của nhân dân. Do đó việc thu
thập thông tin về chăn nuôi là rất cần thiết để có các chính sách khuyến khích,
đầu tư và phát triển chăn nuôi một cách hợp lý. Trong chăn nuôi tỷ lệ hộ chăn
nuôi cá thể chiếm 80%, do vậy để thu thập số liệu về tình hình chăn nuôi trong
điều kiện nguồn kinh phí hạn hẹp, thì việc tiến hành điều tra toàn bộ để nắm
thông tin là một việc làm hết sức khó khăn. Hơn nữa nước ta chuyển từ nền
kinh tế kế hoạch sang kinh tế thò trường, lượng thông tin ngày càng nhiều, nhu
cầu sử dụng thông tin lại càng cao thì việc điều tra để nắm thông tin đã trở thành
nhu cầu bức thiết đối với tất cả các ngành, các cấp. Trong điều kiện như vậy
phương pháp điều tra chọn mẫu lại tỏ ra có nhiều ưu thế, nó phù hợp với xu thế

2
của thống kê hiện đại.
Nếu so với nhiều nước trên thế giới thì việc ứng dụng phương pháp chọn


mẫu ở Việt Nam có chậm hơn. Ở các nước phát triển và đang phát triển theo
nền kinh tế thò trường, với thành phần kinh tế tư nhân chiếm vò trí chủ yếu, thì
hầu như tất cả các cuộc điều tra trên mọi lónh vực như: công nghiệp, nông
nghiệp, thương nghiệp, dòch vụ,... đều tiến hành theo phương pháp điều tra chọn
mẫu. Điều này nói lên tính hiệu quả và tầm quan trọng của điều tra chọn mẫu.
Ở nước ta phương pháp điều tra chọn mẫu ngày càng được ứng dụng rộng
rãi trong một số cuộc điều tra thực tế, trong đó có cả điều tra ngành chăn nuôi.
Tuy nhiên có thể nói cho đến nay, nhìn chung các phương pháp chọn mẫu áp
dụng trong điều tra chăn nuôi là những phương pháp chọn mẫu không ngẫu
nhiên, do đó kết quả điều tra không đánh giá được độ chính xác, độ tin cậy.
Việc chọn mẫu còn mang tính chủ quan, do đó kết quả điều tra nhiều khi không
phản ánh đúng tình hình thực tế.
Chính vì những lý do trên, bản thân tác giả quyết đònh chọn đề tài: “ Ứng
dụng phương pháp chọn mẫu trong điều tra chăn nuôi “ làm vấn đề nghiên
cứu, và mong muốn bằng những kiến thức tích lũy được của mình sẽ trình bày
những vấn đề lý luận về phương pháp chọn mẫu một cách rõ ràng, dễ hiểu, và
việc ứng dụng phương pháp chọn mẫu vào trong điều tra chăn nuôi, nhằm góp
phần nhỏ trong việc cải tiến các phương pháp điều tra chăn nuôi của ngành
Thống Kê tiến hành hàng năm.
2. Những công trình nghiên cứu đã có của các tác giả có liên quan đến đề tài
nghiên cứu
Nhìn chung, trong phạm vi tài liệu mà tác giả tiếp cận được cho đến nay thì vấn
đề ứng dụng phương pháp chọn mẫu trong điều tra chăn nuôi không có nhiều tác

3
giả nghiên cứu. Một số bài báo trong các tạp chí chuyên ngành có đề cập đến
điều tra chăn nuôi như: “ Một số ý kiến về nghiên cứu cải tiến hệ thống chỉ tiêu
thống kê và phương án điều tra chăn nuôi ” của tác giả Nguyễn Hòa Bình trong
Thông tin Khoa Học Thống Kê số 6/2004, hay: “ Một số ý kiến về hệ thống chỉ
tiêu thống kê chăn nuôi và phương pháp thu thập số liệu chăn nuôi ở nước ta “

của tác giả Tiến Só Phùng Chí Hiền trong Thông tin Khoa Học Thống Kê số
3/2004. Các công trình có liên quan đến ứng dụng phương pháp chọn mẫu trong
nghiên cứu kinh tế, theo danh sách lưu trữ của thư viện Quốc Gia Thành Phố Hồ
Chí Minh, có 2 công trình:
- Luận án phó tiến só khoa học với đề tài: “ Điều tra chọn mẫu và sự vận dụng
trong thống kê Việt Nam “ (1983) của tác giả Tô Phi Phượng đã trình bày khá
đầy đủ về lòch sử phát triển của phương pháp điều tra chọn mẫu. Ngoài ra tác
giả cũng đã tóm lược quá trình vận dụng điều tra chọn mẫu trong thống kê Việt
Nam, nêu lên phương hướng hoàn thiện về điều tra chọn mẫu.
- Luận án phó tiến só khoa học kinh tế với đề tài: “ Ứng dụng phương pháp điều
tra chọn mẫu trong nghiên cứu kinh tế “ (1992) của tác giả Lê Thò Thanh Loan
đã trình bày cơ sở khoa học của phương pháp chọn mẫu, đặc biệt là cơ sở toán
học. Ngoài ra tác giả còn phân loại được các cuộc điều tra chọn mẫu và cách
thực hiện một cuộc điều tra mẫu trong kinh tế.
Riêng về bản thân, ngoài những bài báo bàn luận về phương pháp chọn mẫu
trong điều tra chăn nuôi được đăng trên tạp chí chuyên ngành thì tác giả có tham
gia viết chương điều tra chọn mẫu trong Giáo trình Lý Thuyết Thống Kê.
Nhìn chung, những vấn đề lý luận về điều tra chọn mẫu đã có các tác giả nghiên
cứu nghiêm túc được thể hiện trong các công trình nghiên cứu khoa học. Tuy
nhiên việc hoàn thiện lý luận về các phương pháp chọn mẫu, sao cho dễ hiểu,
dễ làm, và phải có những ứng dụng “mẫu” trong thực tế để cho các đơn vò thực

4
tế tham khảo là hướng nghiên cứu của tác giả. Với đề tài này, tác giả đã tập
trung nghiên cứu giải quyết những vấn đề mà các tác giả trước đây chưa đề cập
hoặc chưa giải quyết một cách thỏa đáng nhằm bổ sung đầy đủ hơn cả về lý
luận cũng như ứng dụng thực tiễn.
3. Mục đích nghiên cứu
Việc nghiên cứu các vấn đề lý luận trong lý thuyết điều tra chọn mẫu là
một vấn đề khó, việc vận dụng nó vào thực tế để nghiên cứu các hiện tượng

kinh tế xã hội phức tạp trên một phạm vi rộng với các điều kiện đáp ứng chưa
thỏa đáng thì lại càng khó hơn. Luận án trình bày các vấn đề lý luận về điều tra
chọn mẫu một cách có hệ thống, những ưu nhược điểm của điều tra chăn nuôi
hiện nay và để tìm hiểu những khó khăn, lý do vì sao các phương pháp chọn
mẫu ngẫu nhiên ít được áp dụng trong chăn nuôi, được sự giúp đỡ của Cục
Thống Kê Thành Phố Hồ Chí Minh, Cục Thống Kê tỉnh Tây Ninh tác giả thực
hiện cuộc điều tra chọn mẫu về chăn nuôi heo, từ khâu lập phương án điều tra,
thiết kế mẫu, triển khai thu thập số liệu, tổng hợp và suy rộng số liệu để từ đó
có những nhận đònh, đánh giá và đề ra những biện pháp thích hợp.
4. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của luận án là việc ứng dụng các phương pháp chọn mẫu
trong điều tra chăn nuôi. Phạm vi nghiên cứu luận án giới hạn trong việc ứng
dụng phương pháp chọn mẫu trong điều tra đàn gia súc ở phạm vi hộ gia đình,
cụ thể là điều tra số lượng heo chăn nuôi ở các hộ gia đình của Thành Phố Hồ
Chí Minh và tỉnh Tây Ninh. Ta biết trong cơ cấu tổng thu của ngành chăn nuôi,
thu về chăn nuôi gia súc (trâu, bò, heo) chiếm tỷ lệ lớn nhất 67,87%. Trong cơ
cấu tổng thu chăn nuôi gia súc, thu chăn nuôi heo chiếm tỷ trọng lớn nhất
76,82%, sau đó đến thu chăn nuôi bò 9,49%, thu chăn nuôi trâu 4,4% (theo số

5
liệu tổng điều tra nông thôn, nông nghiệp và thủy sản năm 2001). Luận án tập
trung nghiên cứu cách thu thập số liệu mẫu của một gia súc chủ yếu là heo, các
gia súc còn lại cũng thực hiện tương tự như vậy.
5. Nguồn tài liệu
Nguồn số liệu trình bày minh họa trong luận án lấy từ cuộc điều tra mẫu
và kết hợp với số liệu của hai phòng nông nghiệp Cục Thống Kê Thành Phố Hồ
Chí Minh và Cục Thống Kê tỉnh Tây Ninh. Ngoài ra luận án cũng sử dụng số
liệu từ các niên giám Thống Kê, các tạp chí chuyên ngành Thống Kê như: Con
Số và Sự Kiện, Thông Tin Khoa Học Thống Kê, các tài liệu trên mạng Internet.
Tất cả những tài liệu này nhằm dẫn chứng cho đề tài thêm phong phú và có tính

thuyết phục.
6. Phương pháp luận nghiên cứu
Phương pháp nghiên cứu nhất quán toàn bộ đề tài dựa trên cơ sở chủ
nghóa duy vật biện chứng, các phương pháp toán học, đặc biệt là lý thuyết xác
suất và thống kê toán, và các phương pháp phân tích thống kê. Ngoài ra đề tài
cũng sử dụng các phần mềm tin học như Excel, Spss để xử lý số liệu.
Một số ký hiệu thống kê cập nhật theo giáo trình thống kê các nước và
các giáo trình xác suất - thống kê toán. Ví dụ: Sai số trung bình chọn mẫu (còn
gọi là sai số chọn mẫu) ký hiệu: μ, sẽ được ký hiệu là
y
σ
(hoặc
y
s
). Trung bình
của tổng thể ký hiệu
Y
, sẽ được ký hiệu là μ . Trung bình mẫu ký hiệu
y
~
, sẽ
được ký hiệu là
y
. Hệ số tin cậy t theo phân phối chuẩn sẽ được ký hiệu là z.
7. Những đóng góp chính của luận án thể hiện trên các mặt:
- Triển khai hoàn chỉnh một cuộc điều tra chọn mẫu ngẫu nhiên vào điều tra
chăn nuôi, từ khâu lập phương án điều tra đến khâu cuối cùng là tính toán suy

6
rộng số liệu với độ tin cậy cho trước. Qua đó cho thấy tính khả thi của việc ứng

dụng các phương pháp chọn mẫu ngẫu nhiên vào điều tra chăn nuôi.
- Thực hiện kiểm đònh
2
χ
để kiểm đònh tính chuẩn của mẫu. Đây là phương
pháp tính toán phức tạp nhưng cho kết quả chính xác. Trong thực tế khi áp dụng
phương pháp chọn mẫu, người ta thường bỏ qua công đoạn này. Nghóa là sau khi
tính toán, số liệu của mẫu sẽ được suy rộng cho tổng thể mà không cần biết qui
luật phân phối của mẫu có phù hợp với qui luật phân phối của tổng thể hay
không. Chính vì vậy mà số liệu suy rộng nhiều khi kém chính xác.
- Về phần lý luận, bản luận án đã sắp xếp, trình bày các vấn đề lý luận của
điều tra chọn mẫu một cách có hệ thống, rõ ràng, dễ hiểu. Về các phương pháp
chọn mẫu, luận án đã trình bày được những ưu nhược điểm của từng phương
pháp khá cặn kẽ làm cơ sở cho việc lựa chọn các phương pháp chọn mẫu ứng
dụng vào thực tế điều tra chăn nuôi. Ngoài ra luận án cũng chỉ ra được trong vô
số các công thức trong điều tra chọn mẫu, thì việc xác đònh sai số chọn mẫu của
từng phương pháp là trọng tâm trong việc tính toán và phân tích các chỉ tiêu
khác. Luận án cũng đã tính toán cụ thể sai số chọn mẫu theo các phương pháp
chọn mẫu khác nhau.
- Luận án cũng nêu lên một số kiến nghò, giải pháp góp phần cải tiến phương
pháp điều tra trong chăn nuôi.
- Thông qua nội dung của bản luận án sẽ giúp cho lãnh đạo các cấp cả về mặt
nhận thức khoa học cũng như thấy được hiệu quả và tính khả thi của việc ứng
dụng các phương pháp chọn mẫu trong điều tra chăn nuôi.




7



CHƯƠNG I

MỘT SỐ VẤN ĐỀ LÝ LUẬN
VỀ ĐIỀU TRA CHỌN MẪU
1.1 MỘT SỐ KHÁI NIỆM VÀ ĐỊNH NGHĨA DÙNG TRONG ĐIỀU TRA
CHỌN MẪU
Để thu thập tài liệu ban đầu, hiện nay ngành thống kê thực hiện hai hình
thức: Báo cáo thống kê đònh kỳ và điều tra chuyên môn. Chế độ báo cáo thống
kê đònh kỳ áp dụng chủ yếu đối với các đơn vò kinh tế nhà nước, các cơ quan
nhà nước. Điều tra chuyên môn được áp dụng để thu thập thông tin đối với
những trường hợp không thể hoặc không nhất thiết phải thực hiện chế độ báo
cáo thống kê đònh kỳ. Điều tra chuyên môn có thể tiến hành trên tất cả các đơn
vò của tổng thể nghiên cứu, gọi là điều tra toàn bộ hoặc chỉ tiến hành trên một
số đơn vò thuộc tổng thể nghiên cứu gọi là điều tra không toàn bộ. Điều tra
không toàn bộ bao gồm các loại: điều tra chọn mẫu, điều tra trọng điểm, điều
tra chuyên đề.
1.1.1 Khái niệm điều tra chọn mẫu
Điều tra chọn mẫu là một loại điều tra không toàn bộ, trong đó người ta chỉ
chọn ra một số đơn vò từ tổng thể để điều tra thực tế, rồi sau đó bằng các phương
pháp khoa học, tính toán và suy rộng kết quả cho toàn bộ tổng thể.
Như vậy trong điều tra chọn mẫu người ta đặc biệt lưu ý tới hai vấn đề cơ bản:
- Quy tắc lựa chọn các đơn vò sao cho có thể đại diện cho toàn bộ tổng thể.

8
- Dùng công thức suy rộng thành các đặc điểm của tổng thể.
Cơ sở khoa học của phương pháp chọn mẫu là lý thuyết xác suất và thống kê
toán. Lý thuyết xác suất và thống kê toán đã chứng minh là bằng phương pháp
điều tra chọn mẫu ta có thể biết được các tham số của tổng thể theo một đặc
trưng nào đó với một mức độ chính xác, mức độ tin cậy tính toán được.

Như vậy dựa trên cơ sở khoa học này ta thấy phương pháp điều tra chọn mẫu
hoàn toàn có thể thay thế được điều tra toàn bộ trong một số trường hợp.
1.1.2 Ưu điểm và nhược điểm của điều tra chọn mẫu so với điều tra toàn bộ
Trong điều tra chọn mẫu, người ta chỉ thực hiện điều tra trên một bộ phận
của tổng thể. Do đó so với điều tra toàn bộ, điều tra chọn mẫu có các ưu điểm
chủ yếu sau:
- Chi phí điều tra giảm. Do số đơn vò phải điều tra ít, điều tra chọn mẫu tiết kiệm
được khá nhiều sức người, vật tư và tiền của.
- Đảm bảo được tính đầy đủ và chính xác hơn của tài liệu thu thập. Tài liệu thu
thập bằng điều tra chọn mẫu có tính đầy đủ và chính xác cao bởi vì số nhân viên
điều tra ít, có thể lựa chọn những người có trách nhiệm, có kinh nghiệm điều tra
và huấn luyện nghiệp vụ kỹ lưỡng cho họ. Đồng thời việc giám sát điều tra,
kiểm tra số liệu vừa thu thập được có thể thực hiện tỷ mỷ và tập trung, khiến
cho nguồn sai số do đăng ký, ghi chép giảm nhiều, tức là làm giảm sai số phi
chọn mẫu.
- Có thể mở rộng nội dung điều tra. Do số lượng đơn vò điều tra ít, các nhân viên
điều tra đïc chọn lựa và huấn luyện nghiệp vụ kỹ lưỡng nên có thể thu thập
được nhiều thông tin chi tiết hơn so với điều tra toàn bộ.
- Tiến độ công việc nhanh hơn. Chính vì chỉ điều tra trên quy mô nhỏ nên trong
điều tra chọn mẫu, số liệu có thể thu thập và tổng hợp nhanh hơn so với điều tra

9
toàn bộ. Đây cũng là một ưu điểm quan trọng cùa điều tra chọn mẫu, đáp ứng
được tính kòp thời của thông tin cần thu thập.
Trong một nền kinh tế hoạt động theo cơ chế thò trường thì điều tra chọn
mẫu là công cụ cơ bản trong việc thu thập số liệu gốc. Tuy nhiên điều tra chọn
mẫu không hoàn toàn có thể thay thế được điều tra toàn bộ vì những lý do sau:
- Trong điều tra toàn bộ, người ta thu thập thông tin trên từng đơn vò tổng thể, do
đó có thể nghiên cứu tổng thể và các bộ phận của nó theo tất cả các đặc trưng
cần nghiên cứu. Chính vì vậy đối với những nguồn thông tin thống kê quan trọng

người ta vẫn phải tiến hành tổng điều tra.
- Do chỉ tiến hành trên một số đơn vò điều tra rồi dùng kết quả để suy rộng cho
toàn bộ tổng thể nên kết quả điều tra chọn mẫu bao giờ cũng có sai số đại diện
nhất đònh, còn gọi là sai số chọn mẫu, mà loại sai số này không có trong điều tra
toàn bộ.
Tuy điều tra chọn mẫu có nhược điểm là các tham số ước lượng cho tổng thể
luôn có sai số, nhưng sai số này có thể tính toán được và khống chế với mức độ
tin cậy cho phép.
Điều tra chọn mẫu thường được dùng trong những trường hợp sau đây:
- Khi nội dung nghiên cứu vừa có thể điều tra chọn mẫu, vừa có thể điều tra
toàn bộ thì người ta thường quyết đònh dùng điều tra chọn mẫu vì những ưu
điểm của nó.
- Một số trường hợp không thể dùng điều tra toàn bộ mà chỉ có thể áp dụng
điều tra chọn mẫu: Khi tổng thể quá lớn hoặc không xác đònh trước được; khi
điều tra làm phá hủy hoặc biến dạng đơn vò được điều tra (Điều tra chất lượng
đồ hộp, chất lượng thuốc, chất lượng bóng đèn, phích nước v.v… ).
- Trong một số cuộc tổng điều tra (chẳng hạn như tổng điều tra dân số, tổng
điều tra nông nghiệp...) người ta kết hợp điều tra chọn mẫu nhằm mục đích: Mở

10
rộng nội dung điều tra; để kiểm tra, đánh giá chất lượng của số liệu điều tra
toàn bộ; xử lý nhanh một số số liệu cần thiết.
- Khi tổng thể nghiên cứu được điều tra toàn bộ đònh kỳ, nhưng khoảng cách
thời gian giữa hai cuộc điều tra là quá lớn (chẳng hạn 10 năm đối với điều tra
dân số, 5 năm đối với điều tra nông thôn, nông nghiệp và thủy sản) thì đan xen
với điều tra toàn bộ, người ta thường tiến hành điều tra chọn mẫu để kòp thời
nắm bắt sự vận động, biến đổi của tổng thể.
Để bảo đảm tiến hành cuộc điều tra chọn mẫu thành công, trước hết phải làm
tốt công tác chuẩn bò. Yêu cầu của khâu này là phải có những thông tin tiên
nghiệm về tổng thể để làm căn cứ xây dựng lược đồ chọn mẫu như xác đònh cỡ

mẫu, lựa chọn phương pháp tổ chức chọn mẫu, lập dàn chọn mẫu… . Do vậy điều
tra chọn mẫu phải được kết hợp với điều tra toàn bộ. Trong thực tế nguồn số
liệu do các cuộc tổng điều tra (điều tra toàn bộ) mang lại là hết sức q, ví dụ
trong chăn nuôi có các số liệu về số hộ chăn nuôi từng loại gia súc, gia cầm.
Phương pháp chọn mẫu có thể ứng dụng rộng rãi trong các lónh vực
nghiên cứu kinh tế xã hội. Trên giác độ quản lý kinh tế vó mô, phương pháp
chọn mẫu được áp dụng cho việc thu thập thông tin trên các lónh vực sau:
- Tình hình thu nhập và chi tiêu của các hộ gia đình, mức sống của các tầng lớp
dân cư.
- Nhu cầu tiêu dùng các loại hàng hóa.
- Giá cả thò trường.
- Tình hình biến động tự nhiên và cơ học của dân số.
- Điều tra dư luận xã hội.
- …
Đối với quản lý cấp vi mô, phương pháp chọn mẫu có thể được ứng dụng cụ thể
trong từng ngành như:

11
- Công nghiệp: Kiểm tra chất lượng sản phẩm, năng suất lao động...
- Xây dụng cơ bản: Kiểm tra tiến độ xây dựng công trình, kiểm tra chất lượng
xây dựng.
- Nông nghiệp: Xác đònh năng suất sản lượng cây trồng, tình hình thâm canh,
xác đònh năng suất sản lượng chăn nuôi.
- Thương nghiệp: Kiểm tra chất lượng hàng hóa ở các kho hàng, cửa hàng.
Nhìn chung, phương pháp chọn mẫu có thể ứng dụng trên phạm vi rộng và đảm
bảo cung cấp được những thông tin chính xác, đầy đủ, kòp thời với chi phí thấp
theo đúng như yêu cầu đặt ra.
1.1.3 Các tham số của tổng thể và mẫu, mối liên hệ giữa tổng thể và mẫu
1.1.3.1 Các tham số của tổng thể
Để có kết luận thống kê về tổng thể, ta không trực tiếp nghiên cứu tổng thể

mà nghiên cứu mẫu, bao gồm những đơn vò tổng thể được chọn ra từ tổng thể
theo nguyên tắc chọn ngẫu nhiên. Như vậy phải căn cứ vào các tham số tính
được từ số liệu điều tra mẫu để suy ra các tham số của tổng thể với sai số và độ
tin cậy nhất đònh.
Tổng thể bao gồm N đơn vò, được tập hợp lại theo một tiêu thức Y nào đó, đứng
trên giác độ tiêu thức Y mà xét, các đơn vò của tổng thể là đồng chất, nhưng về
mặt lượng thì mỗi đơn vò tổng thể có những giá trò khác nhau.
Nếu gọi
y
i
(i=
1,N
) là trò số cụ thể của đơn vò tổng thể và giả đònh rằng nếu điều
tra toàn bộ N đơn vò của tổng thể thì cuối cùng sẽ biết được tất cả các trò số cụ
thể đó, và từ đó tính ra được các tham số mô tả tổng thể. Trong số các tham số
đó, ở đây chỉ chú ý tới một số tham số chủ yếu sau:
- Số trung bình tổng thể (The population mean), ký hiệu μ, biểu hiện mức độ
điển hình theo tiêu thức Y của tổng thể, được tính theo công thức:

12
μ =
y y ... y
N
12 N
+ + +
=
N
y
N
1i

i

=

- Phương sai tổng thể (The population variance), ký hiệu
σ
Y
2
, biểu hiện mức độ
biến thiên của tiêu thức Y trong tổng thể, được tính theo công thức:


=
μ−=σ
N
1i
2
i
2
Y
)(y
N
1

- Tỷ lệ tổng thể, ký hiệu p, giả sử trong N đơn vò tổng thể có thể thống kê được
M đơn vò có mang dấu hiệu cần nghiên cứu (đương nhiên M < N) khi đó tỷ lệ
tổng thể được tính theo công thức:
p =
M
N


Đương nhiên điều giả đònh như trên là không thể có, do ta không điều tra toàn
bộ N đơn vò tổng thể. Các tham số nói trên là chưa biết, nhưng chắc chắn chúng
tồn tại khách quan và ta phải xác đònh chúng bằng phương pháp chọn mẫu, tức
là xác đònh thông qua các tham số của mẫu.
Tất cả các tham số của tổng thể có thể được trừu tượng hóa dưới một tên gọi
chung là tham số θ.
1.1.3.2 Các tham số của mẫu
Mẫu bao gồm n đơn vò tổng thể được tập hợp lại theo cùng tiêu thức Y với
tổng thể. Các đơn vò mẫu được chọn ra từ tổng thể theo nguyên tắc chọn ngẫu
nhiên, theo một phương pháp tổ chức chọn mẫu nào đó.
Vì chọn ra các đơn vò mẫu một cách ngẫu nhiên nên bản thân mẫu cũng
mang tính chất ngẫu nhiên, và do đó các tham số tính được từ số liệu của mẫu
cũng mang tính chất ngẫu nhiên, do đó có thể áp dụng các công thức suy rộng
để tính các tham số của tổng thể được.
Khi chọn một mẫu gồm n đơn vò từ tổng thể có N đơn vò bằng phương

13
pháp chọn không lặp ta có thể lấy ra được
C
N
n
mẫu có kết cấu khác nhau.
C
N
n

tổ hợp chập n của N phần tử và
()
C

N!
n! N n !
N
n
=


Tuy nhiên đối với mỗi mẫu cụ thể chọn ra thì có thể tính được các tham số mẫu
cụ thể xác đònh.
Gọi
()
U i 1,2,...,n
i
=
là các đơn vò thuộc đối tượng điều tra được chọn vào mẫu
với
()
yi 1,n
i
=
là các trò số cụ thể của tiêu thức nghiên cứu trên từng đơn vò mẫu,
sau khi điều tra, có thể tính được các tham số mô tả của mẫu. Trong số các tham
số đó, ở đây chỉ chú ý tới những tham sốø chủ yếu sau:
- Số trung bình mẫu (The sample mean), ký hiệu
y
biểu hiện mức độ điển hình
theo tiêu thức Y của mẫu , được tính theo công thức trung bình cộng giản đơn:

y
=

y y ... y
n
y
n
12 n
i
i1
n
+++
=
=


- Phương sai mẫu (The sample variance), ký hiệu
2
y
s
ˆ
biểu hiện mức độ biến
thiên của tiêu thức Y trong mẫu, được tính theo công thức:

( )

=
−=
n
1i
2
i
2

y
yy
n
1
s
ˆ

- Tỷ lệ mẫu, ký hiệu
p
ˆ
, giả sử sau khi điều tra trên n đơn vò mẫu, thống kê được
m đơn vò mang dấu hiệu cần nghiên cứu, khi đó tỷ lệ mẫu sẽ là:
n
m
p
ˆ
=

Tất cả các tham số của mẫu có thể được trừu tượng hóa dưới một tên chung là
tham số
θ
'
. Như vậy tham số
θ
'
là một tham số nào đó của mẫu, là một đại
lượng ngẫu nhiên mà một trong các giá trò có thể có của nó chính là trò số cụ thể
tính ra được từ một mẫu cụ thể mà ta vừa chọn ra.

14


1.1.3.3 Mối liên hệ giữa tổng thể và mẫu
Tổng thể là một tồn tại khách quan, các tham số của chúng (như trung bình, tỉ
lệ, phng sai) cũng tồn tại khách quan.
Từ tổng thể, nếu theo cách chọn có trả lại, hoặc theo cách chọn không trả lại, có
thể xây dựng được nhiều mẫu khác nhau. Từ tổng thể, về mặt lý thuyết, nếu lấy
theo cách chọn có trả lại, có thể chọn ra
N
n
mẫu khác nhau, và nếu lấy theo
cách chọn không trả lại, thì có thể chọn ra
C
N
n
mẫu khác nhau. Mỗi mẫu ấy đều
được chọn một cách ngẫu nhiên, nên các tham số của nó (như trung bình, tỷ lệ,
phương sai) là những đại lượng ngẫu nhiên tuân theo những quy luật phân phối
nhất đònh.
Từ nhận xét trên, có thể tìm được kỳ vọng toán và phương sai của các tham số
của mẫu, từ đó rút ra nhận xét về mối liên hệ cụ thể giữa các tham số của mẫu
và các tham số của tổng thể. Ở đây, chúng ta chỉ chú ý đến kỳ vọng toán và
phương sai của một số tham số mẫu như sau:
a) Kỳ vọng toán của trung bình mẫu ngẫu nhiên, trong trường hợp chọn có trả lại
và không trả lại đều là:
μ=
)Y(E

Phương sai của trung bình mẫu ngẫu nhiên trong trường hợp chọn có trả lại:
n
)Y(Var

2
Y
σ
=

Và trong trường hợp chọn không trả lại:








σ









σ
=
N
n
1
n1N

nN
n
)Y(Var
2
Y
2
Y

b) Kỳ vọng toán của tỷ lệ mẫu ngẫu nhiên trong trường hợp chọn có trả lại và
không trả lại đều là:
p)P
ˆ
(E
=


15
Phương sai của tỷ lệ mẫu ngẫu nhiên trong trường hợp chọn có trả lại:

n
pq
)P
ˆ
(Var =
(với q =1-p)
Và trong trường hợp chọn không trả lại:








−≈








=
N
n
1
n
pq
1N
nN
n
pq
)P
ˆ
(Var

c) Kỳ vọng toán của phương sai mẫu ngẫu nhiên trong trường hợp chọn có trả
lại:

2

Y
2
y
n
1n
)S
ˆ
(E σ

=

Và trong trường hợp chọn không trả lại:

2
Y
2
y
1N
N
n
1n
)S
ˆ
(E σ

×

=

Để ý rằng, nếu số đơn vò tổng thể N là khá lớn, số đơn vò mẫu n là khá nhỏ so

với N, thì tỷ số
n
N
là khá nhỏ và sự sai khác giữa N và N-1 là không đáng kể,
khi đó các công thức dùng trong trường hợp chọn không trả lại sẽ xấp xỉ công
thức dùng trong trường hợp chọn có trả lại. Do đó trong thực tế, khi số đơn vò
tổng thể khá lớn, số đơn vò mẫu là khá nhỏ so với số đơn vò tổng thể, thì dù lấy
mẫu theo cách chọn không trả lại, ta vẫn có thể sử dụng các công thức của cách
chọn có trả lại để dễ dàng tính toán mà vẫn bảo đảm chính xác.
Một vấn đề rất quan trọng khác là: giữa quy luật phân phối của các tham số của
tổng thể với quy luật phân phối của các tham số của mẫu có mối liên hệ với
nhau. Để có thể tìm được các tham số của tổng thể bằng cách suy đoán từ các
tham số của mẫu, cằn phải nắm được những mối liên hệ đó, nắm được quy luật
phân phối của các tham số của mẫu.
Nhìn chung trong việc ứng dụng phương pháp chọn mẫu trong kinh tế, ta thường
quan tâm nhiều nhất đến hai tham số là trung bình và tỷ lệ. Vì vậy ở đây cũng

16
chỉ chú ý đến việc nắm quy luật phân phối của trung bình mẫu và tỷ lệ mẫu.
Mặt khác, tìm quy luật phân phối của mẫu là một vấn đề rất phức tạp, vì vậy ta
đặc biệt chú ý đến giả thuyết là tổng thể được phân phối theo quy luật chuẩn, vì
đó là trường hợp đơn giản nhất và những quy luật mẫu xuất phát từ giả thuyết đó
đều là những quy luật thông dụng. Nhờ thống kê toán, ta có các kết luận sau:
- Phân phối của tỷ lệ mẫu
P
ˆ
.
Với n khá lớn có thể xem
P
ˆ

có phân phối chuẩn với kỳ vọng p và phương
sai
n
pq
. Tức
P
ˆ
∼ N(p,
n
pq
)
- Phân phối của trung bình mẫu
Y
.
Chia ra 4 trường hợp:
* n ≥ 30,
σ
Y
2
đã biết, khi đó có thể xem:
Y
∼ N(
n
,
2
Y
σ
μ
)
* n ≥ 30,

σ
Y
2
chưa biết, khi đó có thể xem:
Y
∼ N








μ
n
s
,
2

μ=
)Y(E
;
n
)Y(Var
2
Y
σ
=


σ
Y
2
là phương sai tổng thể chưa biết, nhưng n ≥ 30 là
khá lớn nên phương sai mẫu
2
y
s
ˆ
và phương sai mẫu có hiệu chỉnh
s
2
đều xấp xỉ
σ
Y
2
, ta thay
σ
Y
2
bằng
s
2
. Và ta có
s
2
là ước lượng không chệch của
σ
Y
2

.
Phương sai mẫu hiệu chỉnh được tính:
s
2
=
()
1
1
2
1
n
yy
i
i
n


=


* n<30 , ta chỉ xét tổng thể Y có phân phối chuẩn ,
σ
Y
2
đã biết khi đó
Y
∼ N(
n
,
2

Y
σ
μ
)
* n<30, Y có phân phối chuẩn,
σ
Y
2
chưa biết. Ta xét:
n
s
Y
T
1n
μ−
=


sẽ có phân phối Student với n-1 bậc tự do, phân phối này cũng được lập bảng

17
sẵn, cứ cho trước 1-α và biết n ta tính được
2/,1n
t
α−
.
Khi n N các đặc trưng mẫu sẽ tiến tới các đặc trưng tương ứng của tổng thể,
vì vậy trong thực tế, với một mẫu cụ thể có n khá lớn, ta có:
μ ≈
y

; p ≈
p
ˆ
;
σ
Y
2

2
y
s
ˆ
hoặc
2
y
s

Những mối liên hệ giữa tổng thể và mẫu sẽ được dùng làm cơ sở để xây dựng
các công thức tính toán, nhằm suy rộng ra các tham số của tổng thể từ mẫu. Tuy
nhiên việc ước lượng này bao giờ cũng phát sinh sai số. Vậy trong điều tra chọn
mẫu có những loại sai số nào?
1.1.4 Sai số trong điều tra chọn mẫu
Trong các cuộc điều tra chọn mẫu, sai số bao gồm:
- Sai số chọn mẫu.
- Sai số phi chọn mẫu (sai số ngoài chọn mẫu).
Sai số chọn mẫu còn được gọi là sai số đại diện, tồn tại ngay trong bản thân
cuộc điều tra chọn mẫu, bởi vì việc điều tra chỉ được thực hiện trên một số ít đơn
vò, nhưng kết quả thu được lại được tính toán suy rộng cho toàn bộ tổng thể. Sai
số chọn mẫu là điều khó tránh khỏi vì dù cho có tổ chức khoa học chu đáo đến
đâu, thì việc lấy ra một mẫu có kết cấu giống như kết cấu của tổng thể là điều

khó thực hiện, mà chỉ cần có sự sai khác nhỏ về kết cấu của hai tổng thể là đã
phát sinh sai số rồi.
Như vậy sai số chọn mẫu là chênh lệch về trò số giữa các chỉ tiêu tính ra được
trong điều tra chọn mẫu và các chỉ tiêu tương ứng của tổng thể, tức là chênh
lệch giữa các số
y
và μ,
p
ˆ
và p,
2
y
s

2
σ
. Rõ ràng là mẫu càng lớn, sai số trung
bình chọn mẫu càng nhỏ. Thước đo chung nhất của sai số chọn mẫu là căn bậc
hai giá trò trung bình của bình phương các sai số chọn mẫu, giá trò này được coi
là sai số chuẩn, ký hiệu SE (Standard error of sample mean) của ước lượng.

18
Theo cách chúng ta đònh nghóa sai số chuẩn SE như trên, thì chúng ta phải có giá
trò ước lượng của tất cả các mẫu có thể có, nghóa là, giả sử từ tổng thể ta thiết
lập tất cả mẫu có thể thiết lập được, giả sử ta lấy ra K mẫu, mỗi mẫu ta tính
được các tham số của nó:
n
1
θ
1


n
2
θ
2

................
n
K
θ
K

Sai số chuẩn được tính theo công thức: SE =
()
θθ−
=

i
i
K
K
2
1

Điều này không thể thực hiện được trong thực tế. Thật may mắn là nếu chấp
nhận một phương pháp chọn mẫu phù hợp ta có thể tính ước lượng của SE chỉ
cần từ một mẫu được rút ra để nghiên cứu.
Loại sai số thứ hai xuất hiện cả trong điều tra chọn mẫu lẫn trong điều tra toàn
bộ, được gọi là sai số phi chọn mẫu. Việc lập danh sách tất cả các nguồn sai số
phi chọn mẫu là rất khó. Những sai số này xảy ra do nhiều nguyên nhân: Do đơn

vò điều tra trả lời sai vì không hiểu đúng nội dung, hoặc do cố ý khai sai. Do
nhân viên điều tra vô tình ghi chép sai. Do tỷ lệ không trả lời quá cao. Do dụng
cụ đo lường sai… . Rõ ràng rằng, với một đội ngũ nhân viên được huấn luyện tốt
ở cả hai lónh vực thu thập và xử lý số liệu, nên các sai số phi chọn mẫu ở các
cuộc điều tra chọn mẫu có thể ít nghiêm trọng hơn so với các cuộc điều tra toàn
bộ.
Giữa sai số chọn mẫu và sai số phi chọn mẫu có mối quan hệ sau: sai số chọn
mẫu sẽ giảm khi cỡ mẫu tăng lên. Và như vậy, khối lượng công việc điều tra
tăng lên và sai số phi chọn mẫu sẽ tăng lên.

19
Sai số chọn mẫu còn có thể chia thành sai số ngẫu nhiên và sai số hệ thống.
- Sai số ngẫu nhiên: xuất hiện do mẫu được xây dựng theo nguyên tắc ngẫu
nhiên. Sai số này được tính theo công thức tương ứng với thiết kế mẫu. Sai số
này không phụ thuộc vào ý đònh của người điều tra cho nên chênh lệch giữa các
chỉ tiêu của mẫu và của tổng thể không bao giờ xác đònh được trước là sẽ nhiều
hơn hoặc ít hơn.
- Sai số có hệ thống: Xuất hiện khi mẫu được thiết kế có chủ đích, hoặc mẫu
được thiết kế theo nguyên tắc ngẫu nhiên nhưng không bao quát được toàn bộ
tổng thể. Loại sai số này chính là do có dụng ý trước của người điều tra làm cho
kết quả điều tra luôn luôn lệch về một hướng hoặc nhiều hơn, hoặc ít hơn so với
thực tế.
Nguyên nhân sâu xa của sai số có hệ thống thường liên quan đến khâu lập dàn
mẫu và việc chọn mẫu. Chẳng hạn dùng mẫu cố đònh nhiều năm đối với tổng
thể có biến động lớn về các đơn vò, hoặc điều tra viên vì ngại đi lại từ vò trí quan
sát này sang vò trí quan sát khác, tự ý thay đổi vò trí quan sát.
Nói chung khái niệm sai số chọn mẫu thường được hiểu là sai số ngẫu nhiên.
Như vậy đối với mỗi mẫu được chọn ra một cách ngẫu nhiên từ tổng thể sẽ có
một trò số cụ thể của sai số, nếu giả đònh rằng không có sai số nói chung và
không có sai số hệ thống, sai số ngẫu nhiên là một đại lượng ngẫu nhiên và

thông thường người ta coi nó được phân phối theo quy luật phân phối chuẩn.
- Khi nhiệm vụ chọn mẫu là để ước lượng số trung bình về một tiêu thức nào đó,
giả sử với cách chọn lặp và theo phương pháp chọn mẫu ngẫu nhiên đơn giản,
tức là khi mẫu được chọn ngẫu nhiên, giá trò trung bình sẽ khác nhau từ
mẫu này sang mẫu khác. Độ lệch tiêu chuẩn của các giá trò trung bình mẫu dùng
để đo lường độ biến thiên giữa các giá trò trung bình mẫu với giá trò trung bình

20
của tổng thể gọi là sai số trung bình chọn mẫu (sai số chọn mẫu) ký hiệu
y
σ

được xác đònh theo công thức:
n
n
2
y
σ
=
σ


(Nếu σ
2
chưa biết ta thay bằng s
2
)
- Khi nhiệm vụ chọn mẫu là để ước lượng tỷ lệ theo một tiêu thức nào đó, sai số
trung bình chọn mẫu sẽ là:
n

)p-1(p
p
ˆ


(Nếu p chưa biết ta thay bằng
p
ˆ
)
Trong trường hợp chọn không hoàn lại sai số trung bình chọn mẫu sẽ nhân cho
hệ số điều chỉnh tổng thể hữu hạn fpc (finite population correction factor)
fpc =
N
n
-1

Gọi ε là phạm vi sai số chọn mẫu.
- Khi nhiệm vụ chọn mẫu là để ước lượng số trung bình về một tiêu thức nào đó
thì:
n
zz
2/
y
2/y
σ
=σ=ε
αα

- Khi nhiệm vụ chọn mẫu là để ước lượng tỷ lệ theo một tiêu thức nào đó thì:


n
)p-1(p
zz
2/
P
ˆ
2/p αα
=σ=ε

Tuy sai số chọn mẫu là tất yếu nhưng ta có thể hạn chế được sai số này nếu nắm
vững các nhân tố ảnh hưởng đến sai số chọn mẫu.
Theo công thức trên ta thấy sai số chọn mẫu lớn hay nhỏ phụ thuộc vào các
nhân tố sau:
- n : cỡ mẫu, cỡ mẫu càng lớn thì sai số chọn mẫu càng nhỏ, và ngược lại.
- σ
2
: tính chất đồng đều của tổng thể, tổng thể càng có kết cấu phức tạp, các
lượng biến của tiêu thức biến thiên càng nhiều, thì phương sai càng lớn và do đó
sai số chọn mẫu càng lớn và ngược lại.

21
- Phương pháp tổ chức chọn mẫu khác nhau: mỗi phương pháp tổ chức chọn mẫu
khác nhau sẽ có công thức tính sai số chọn mẫu khác nhau (cụ thể sẽ trình bày
trong phần các phương pháp chọn mẫu).
Thông thường phương pháp tổ chức chọn mẫu nào càng thuận tiện cho việc lập
dàn chọn mẫu và tổ chức điều tra bao nhiêu thì sai số chọn mẫu càng lớn.
Rõ ràng hầu như mọi sự phức tạp của các công thức chọn mẫu đều tập trung ở
việc tính sai số chọn mẫu. Nếu tính được sai số chọn mẫu rồi thì việc tính toán
các chỉ tiêu khác trở nên đơn giản hơn.
* Ý nghóa của việc tính toán sai số chọn mẫu:

- Sai số chọn mẫu dùng để ước lượng khoảng chỉ tiêu nghiên cứu.
- Sai số chọn mẫu còn dùng để đánh giá tính đại diện của chỉ tiêu nghiên cứu
qua tính toán tỷ lệ sai số chọn mẫu H :
100x
y
s
H
y
=

H càng nhỏ thì chỉ tiêu có tính đại diện càng cao, ngược lại H càng lớn thì tính
đại diện của chỉ tiêu càng thấp.
- Là cơ sở xác đònh cỡ mẫu cho các cuộc điều tra được tiến hành về sau.
1.1.5 CÁC PHƯƠNG PHÁP ƯỚC LƯÏNG
Khi nghiên cứu điều tra chọn mẫu, cái chính không phải nhằm nghiên cứu mẫu
đại diện được chọn ra từ tổng thể, mà chính là qua mẫu đó để nghiên cứu được
tính quy luật và trạng thái của tổng thể chứa nó. Nghóa là dựa vào sự hiểu biết
về tham số
θ
'
của mẫu đã tính ra được, để suy luận về tham số θ của tổng thể.
Việc làm như vậy gọi chung là ước lượng.
Các phương pháp ước lượng có thể chia ra:
- Ước lượng trực tiếp.
- Ước lượng gián tiếp.

22
1.1.5.1 Ước lượng trực tiếp
Được gọi là ước lượng trực tiếp khi dùng các tham số mẫu theo một đặc trưng để
ước lượng cho các tham số của tổng thể cũng theo đặc trưng đó. Như dùng số

trung bình mẫu
y
để ước lượng cho số trung bình tổng thể μ, hay tỷ lệ mẫu
p
ˆ
để
ước lượng cho tỷ lệ tổng thể p.
1..1.5.1.1 Ước lượng điểm
Theo phương pháp ước lượng này, thống kê toán đã chứng minh được rằng:
- Để ước lượng số trung bình chung μ ta dùng số trung bình mẫu
y
làm ước
lượng, vì
y
là ước lượng không chệch của μ (
μ=)Y(E
).
- Để ước lượng tỷ lệ chung p, ta dùng tỷ lệ mẫu
p
ˆ
làm ước lượng vì
p
ˆ
là ước
lượng không chệch của p (
p)P
ˆ
(E =
).
- Để ước lượng phương sai tổng thể

σ
Y
2
ta không dùng phương sai mẫu
2
y
s
ˆ

dùng phương sai mẫu hiệu chỉnh
s
y
2
làm ước lượng, nhằm bảo đảm
s
y
2
là ước
lượng không chệch của
σ
Y
2
.
Tức là:
2
Y
2
y
)S(E
σ=


Ta có : E(
2
y
s
ˆ
) =
n
n
− 1
σ
Y
2

Gọi
s
y
2
=
n
n
− 1
2
y
s
ˆ

Do đó : E(
s
y

2
) = E(
n
n
− 1
2
y
s
ˆ
) =
σ
Y
2

Chứng tỏ
s
y
2
là ước lượng không chệch của
σ
Y
2
.
Tóm lại khi cần tìm các tham số của tổng thể mà không muốn hay không thể
dùng phương pháp điều tra toàn bộ, thì có thể từ tổng thể đó lấy ra một mẫu
theo nguyên tắc chọn ngẫu nhiên, sau đó căn cứ vào số liệu điều tra trên mẫu

23
để tính ra tham số mẫu rồi dùng các tham số mẫu này để ước lượng các tham số
của tổng thể.

μ chưa biết, lấy
y
; p chưa biết, lấy
p
ˆ
;
σ
Y
2
chưa biết, lấy
s
y
2
.
Đó là cách làm đơn giản nhất, có tên là ước lượng điểm.
1.1.5.1.2 Ước lượng khoảng
Ước lượng điểm không thật chính xác, nói đúng hơn là không thể đánh giá được
mức độ chính xác của việc ước lượng các tham số của tổng thể, bởi vì bản thân
việc rút ra một mẫu cụ thể làm đại diện cho tổng thể đã chứa đựng sự sai khác
dù là rất nhỏ giữa kết cấu của mẫu so với kếùt cấu của tổng thể. Do đó, chắc
chắn xuất hiện một sai số nào đó mà chưa đánh giá được. Vì vậy rất cần thiết
phải chuyển từ ước lượng điểm sang ước lượng khoảng nhằm nâng cao độ tin
cậy của các kết luận thống kê.
* Ước lượng trung bình của tổng thể:

[ ]
α−=σ≤μ−
α
1zYP
y

2/

Hay
n
zy
n
zy
Y
2/
Y
2/
σ
+≤μ≤
σ

αα
với độ tin cậy là 1-α
Trong đó:
σ
y
: sai số trung bình chọn mẫu.
y
2/
z σ=ε
α
: phạm vi sai số chọn mẫu.
1-α : độ tin cậy của ước lượng.
Trong trường hợp ước lượng trung bình của tổng thể, ta có 4 trường hợp sau:
a) n ≥ 30 ,
σ

Y
2
đã biết. Khi đó
Y
∼ N(
n
,
2
Y
σ
μ
)

α−=






σ
≤μ−
α
1
n
zYP
Y
2/



24
Hay
α−=






σ
+≤μ≤
σ

αα
1
n
zY
n
zYP
Y
2/
Y
2/

b) n ≥ 30,
σ
Y
2
chưa biết, khi đó ta thay
σ

Y
2
bằng
s
y
2


α−=






+≤μ≤−
αα
1
n
S
zY
n
S
zYP
y
2/
y
2/

c) n < 30, Y phân phối chuẩn,

σ
Y
2
đã biết, kết quả giống như phần a.
d) n < 30, Y phân phối chuẩn,
σ
Y
2
chưa biết, ta tra vào bảng phân phối student
với n-1 bậc tự do:

[]
α−=≤
α−−
1tTP
2/,1n1n

Khi đó
α−=






≤μ−
α−
1
n
S

tYP
y
2/,1n

Hay
α−=






+≤μ≤−
α−α−
1
n
S
tY
n
S
tYP
y
2/,1n
y
2/,1n

* Ước lượng tỷ lệ tổng thể:
Để ước lượng tỷ lệ p của tổng thể ta dùng tỷ lệ mẫu
p
ˆ

. Ta biết với n khá lớn
P
ˆ

N(p,
n
pq
)

α−=






≤−
α
1
n
pq
zpP
ˆ
P
2/

Vì n khá lớn nên ta có thể thay p bằng
p
ˆ


Khi đó
α−=









≤−
α
1
n
)P
ˆ
1(P
ˆ
zpP
ˆ
P
2/

Hay
( ) ( )
α−=










+≤≤


αα
1
n
P
ˆ
1P
ˆ
zP
ˆ
p
n
P
ˆ
1P
ˆ
zP
ˆ
P
2/2/

1.1.5.2 Ước lượng gián tiếp:


25
Sai số chọn mẫu của các ước lượng có thể giảm xuống nhờ việc sử dụng thêm
những thông tin bổ sung có liên quan đến đặc trưng nghiên cứu, như khi ước
lượng tham số của tổng thể theo đặc trưng Y có thể dùng thêm thông tin về đặc
trưng X có liên quan với Y. Phương pháp ước lượng như thế gọi là ước lượng
gián tiếp.
Các phương pháp ước lượng gián tiếp gồm có: ước lượng tỷ lệ, ước lượng hồi
quy và ước lượng sai phân. Trong đó phương pháp ước lượng tỷ lệ thường được
sử dụng hơn cả.
Phương pháp ước lượng tỷ lệ sử dụng đặc trưng X bổ sung, nhằm mục đích dựa
vào các đặc điểm thuận lợi của mối liên hệ giữa X và Y để làm tăng độ chính
xác của ước lượng.
Ước lượng tỷ lệ dựa trên cơ sở thừa nhận tỷ lệ
R
Y
X
=
của tổng thể hoàn toàn ổn
đònh đối với tất cả các đơn vò của tổng thể. Trong thực tế x
i
thường là giá trò của
y
i
ở thời điểm điều tra trước, khi đó ta tính tỷ lệ r của mẫu:
r =
x
y
x
y

n
1i
i
n
1i
i
=


=
=

yx,
: là số trung bình của mẫu.
Tỷ lệ R của tổng thể được ước lượng bởi tỷ lệ r của mẫu.
Với số tổng X (hoặc số trung bình
x
μ
) của tổng thể đã biết ước lượng tỷ lệ của
số tổng Y, số tổng của tổng thể là:
X
x
y
X
x
y
Y
ˆ
n
1i

i
n
1i
i
==


=
=
(∧ : là ký hiệu ước lượng)

×