Tải bản đầy đủ (.pdf) (61 trang)

PHƯƠNG PHÁP THU THẬP DỮ LIỆU SƠ CẤP-CÁC PHƯƠNG PHÁP CHỌN MẪU

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.03 MB, 61 trang )

CÁC PHƯƠNG PHÁP CHỌN MẪU

1


Điều tra chọn mẫu


Một số khái niệm

 Phần tử (element): đơn vị cần quan sát và thu

thập dữ liệu (cá nhân, hộ gia đình, tổ chức,…).
 Tổng thể nghiên cứu (study population): tập hợp
các phần tử mà thực tế có thể nhận dạng và lấy
mẫu. Ví dụ tổng thể nghiên cứu là số hộ gia đình
của một địa phương, số doanh nghiệp tại một địa
phương, số sinh viên tại một trường đại học, số
người tiêu dùng tại một vùng...


Điều tra chọn mẫu
Tổng thể

Mẫu

Tóm tắt các đặc trưng

Suy diễn cho các tham số của tổng thể



Điều tra chọn mẫu
Tổng thể là
toàn bộ bóng
đèn mới mà
công ty A sản
xuất (tuổi thọ
trung bình của
bóng đèn mới
chưa biết)

Tuổi thọ trung bình của bóng
đèn mới

200 bóng đèn được chọn để
kiểm tra tuổi thọ

Mẫu

Tóm tắt các đặc trưng

Tính tuổi thọ trung bình của
200 bóng đèn này

Suy diễn cho các tham số của tổng thể


Một số khái niệm

Khung mẫu (sampling frame): Danh sách các
đơn vị lấy mẫu có sẵn để phục vụ cho việc lấy

mẫu.
STT
1
2
3
4

Hộ
Nguyễn Văn A
Trần Thị B
Trần Thị B
Lê Văn C


Chọn mẫu (sampling)

 Là quá trình lựa chọn một bộ phận tương

đối nhỏ từ tổng thể với tích cách là đại
diện cho tổng thể cần nghiên cứu.
 Dựa trên kết quả thu được từ mẫu, nhà
nghiên cứu sẽ suy diễn rộng ra cho tổng
thể.


Vì sao phải chọn mẫu?

 Để có thông tin nhanh hơn và tiết kiệm hơn.

Vd: muốn có số liệu về thu nhập của các hộ gia

đình ở Việt Nam thì nên điều tra toàn bộ hay điều
tra chọn mẫu?
 Trường hợp khi tiến hành điều tra làm biến dạng
hay phá hủy thuộc tính của đơn vị
Vd: thử độ bền của vỏ xe sản xuất


Vì sao phải chọn mẫu?

 Trường hợp số đơn vị của hiện tượng vô hạn hoặc không
xác định

Vd: muốn có số liệu về những người bệnh cao huyết áp tại
TPHCM
 Khi muốn so sánh các hiện tượng với nhau mà chưa có
thông tin cụ thể hoặc khi muốn kiểm định một giả thuyết
đặt ra, người ta thường dùng điều tra chọn mẫu để thu
thập dữ liệu.
Vd: kiểm tra tác dụng của một loại thuốc đối với điều trị
tim mạch


Quá trình chọn mẫu

B1: Định nghĩa tổng thể và phần tử
B2: Xác định khung lấy mẫu

B3: Xác định kích thước mẫu

B4: Xác định phương pháp chọn mẫu


B5: Tiến hành lấy mẫu theo phương pháp đã chọn


Các phương pháp chọn mẫu

1.Chọn mẫu xác suất

2.Chọn mẫu phi xác

suất

11


Chọn mẫu xác suất

 Biết trước xác suất xuất hiện của các phần tử

vào trong mẫu.
 Quá trình chọn mẫu tuân theo quy luật toán,
không thể tự ý thay đổi.
 Các thông số của mẫu có thể dùng để ước
lượng/kiểm nghiệm các thông số của tổng thể.
 Nhược điểm: ?


Hạn chế

(1) Trong nhiều trường hợp không mang tính khả

thi vì không thể có được danh sách tất cả các
đối tượng liên hệ, hoặc nhà nghiên cứu không
đủ thời gian để tiếp cận các đối tượng khi họ
phân tán ở nhiều địa bàn cách xa nhau.
(2) Tốn kém nhiều thời gian và công sức


Chọn mẫu phi xác suất

 Nhà nghiên cứu chọn các phần tử vào mẫu

không theo quy luật ngẫu nhiên
 Không biết xác suất xuất hiện của các phần tử.
Chọn mẫu tùy thuộc vào nhà nghiên cứu.
Ví dụ đến siêu thị phỏng vấn các bà nội trợ về
chi tiêu hàng ngày cho lương thực
 Nhược điểm: ?


Hạn chế
Việc chọn mẫu phải dựa vào kỹ năng
của nhà nghiên cứu hay của nhân viên
chọn mẫu.


Phân loại

Chọn mẫu xác suất
Ngẫu nhiên đơn giản
(simple random)

Hệ thống
(systematic)
Phân tầng
(stratified random)
Theo nhóm (cụm,
chùm)
(cluster)

Chọn mẫu phi xác suất
Lấy mẫu thuận tiện
(convenience)
Lấy mẫu phán đoán
(judgment)
Lấy mẫu theo lớp
(quota)
Lấy mẫu theo mầm
(snow ball)
16


Chọn mẫu ngẫu nhiên đơn giản
Quy trình:
 Cần danh sách của tất cả các
đơn vị mẫu
 Số lượng các đơn vị (cỡ mẫu).
 Chọn ngẫu nhiên các đơn vị
trong danh sách
Ví dụ: Khảo sát thực trạng hiểu
biết về luật giao thông đường
bộ trong 1000 học sinh tại một

trường phổ thông trung học,
chọn mẫu ngẫu nhiên 100 học
sinh để khảo sát.

17


Câu hỏi

 Theo danh sách chọn mẫu, người thu thập

dữ liệu phải phỏng vấn sinh kế của hộ A.
Nhưng hộ A đi vắng, hộ B (không có
trong danh sách mẫu) sẵn sàng cung cấp
dữ liệu sinh kế của gia đình mình (hộ B) .
Người thu thập dữ liệu nên chờ hộ A về
phỏng vấn hay phỏng vấn hộ B?


Thực hành trên Excel

 Cần lấy mẫu ngẫu nhiên 10 phần tử từ khung mẫu có
20 phần tử.
 Thực hiện

 1. Tạo một danh sách số thứ tự từ 1 đến 20 (giả sử đây
là khung mẫu)
 2. Tại cột mới (cột Ngẫu nhiên) dùng hàm RAND()
 3. Sắp xếp theo thứ tự cột mới


 4. Chọn 10 phần tử đầu tiên vào mẫu.


Chọn mẫu hệ thống

Chọn ngẫu nhiên một
điểm xuất phát, dựa vào
bước nhảy để xác định
các phần tử tiếp theo

20


Chọn mẫu hệ thống


Chọn mẫu hệ thống


Chọn mẫu phân tầng (stratified random)
 Tổng thể được chia ra nhiều tầng

(strata) theo nguyên tắc: “cùng tầng
đồng nhất, khác tầng dị biệt”.
 Để chọn phần tử trong mỗi tầng: có thể
dùng p.p. hệ thống.
 Số phần tử trong mỗi tầng được xác
định theo tỷ lệ hoặc không theo tỷ lệ
với kích thước tổng thể.
Ví dụ về các tầng: Theo địa lý: bắc,

trung, nam, 7 vùng kinh tế; Tôn
giáo/sắc tộc; mức thu nhập; giới tính,
nghề nghiệp…

23


Chọn mẫu phân tầng


Các phương pháp chọn mẫu ngẫu nhiên
c. Chọn mẫu phân tầng


×