Tải bản đầy đủ (.ppt) (49 trang)

Phương Pháp Thu Thập Dữ Liệu Sơ Cấp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (623.93 KB, 49 trang )

CÁC PHƯƠNG PHÁP CHỌN MẪU

1


Nội dung
 Chọn mẫu xác suất
 Chọn mẫu phi xác suất

2


Chọn mẫu (sampling)
 Là quá trình lựa chọn một bộ phận tương đối nhỏ từ

tổng thể với tích cách là đại diện cho tổng thể cần
nghiên cứu.
 Dựa trên kết quả thu được từ mẫu, nhà nghiên cứu sẽ
suy diễn rộng ra cho tổng thể.


Vì sao phải chọn mẫu?
 Để có thông tin nhanh hơn và tiết kiệm hơn.

Vd: muốn có số liệu về thu nhập của các hộ gia đình ở Việt
Nam thì nên điều tra toàn bộ hay điều tra chọn mẫu?
 Trường hợp khi tiến hành điều tra làm biến dạng hay phá
hủy thuộc tính của đơn vị
Vd: thử độ bền của vỏ xe sản xuất



Vì sao phải chọn mẫu?
 Trường hợp số đơn vị của hiện tượng vô hạn hoặc không xác

định
Vd: muốn có số liệu về những người bệnh cao huyết áp tại
TPHCM
 Khi muốn so sánh các hiện tượng với nhau mà chưa có thông
tin cụ thể hoặc khi muốn kiểm định một giả thuyết đặt ra,
người ta thường dùng điều tra chọn mẫu để thu thập dữ liệu.
Vd: kiểm tra tác dụng của một loại thuốc đối với điều trị tim
mạch


Một số khái niệm
 Phần tử (element): đơn vị cần quan sát và thu thập dữ liệu

(cá nhân, hộ gia đình, tổ chức,…).
 Tổng thể nghiên cứu (study population): tập hợp các phần
tử mà thực tế có thể nhận dạng và lấy mẫu. Ví dụ tổng thể
nghiên cứu là số hộ gia đình của một địa phương, số
doanh nghiệp tại một địa phương, số sinh viên tại một
trường đại học, số người tiêu dùng tại một vùng...
 Khung mẫu (sampling frame): Danh sách các đơn vị lấy
mẫu có sẵn để phục vụ cho việc lấy mẫu.


Quá trình chọn mẫu
B1: Định nghĩa tổng thể và phần tử
B2: Xác định khung lấy mẫu
B3: Xác định kích thước mẫu

B4: Xác định phương pháp chọn mẫu
B5: Tiến hành lấy mẫu theo phương pháp đã chọn


Chọn mẫu xác suất
 Biết trước xác suất xuất hiện của các phần tử vào

trong mẫu.
 Quá trình chọn mẫu tuân theo quy luật toán, không thể
tự ý thay đổi.
 Các thông số của mẫu có thể dùng để ước lượng/kiểm
nghiệm các thông số của tổng thể.
 Nhược điểm: ?


Hạn chế
(1) Trong nhiều trường hợp không mang tính khả thi vì
không thể có được danh sách tất cả các đối tượng liên
hệ, hoặc nhà nghiên cứu không đủ thời gian để tiếp
cận các đối tượng khi họ phân tán ở nhiều địa bàn
cách xa nhau.
(2) Tốn kém nhiều thời gian và công sức


Chọn mẫu phi xác suất
 Nhà nghiên cứu chọn các phần tử vào mẫu không theo

quy luật ngẫu nhiên
 Không biết xác suất xuất hiện của các phần tử. Chọn
mẫu tùy thuộc vào nhà nghiên cứu.

Ví dụ đến siêu thị phỏng vấn các bà nội trợ về chi tiêu
hàng ngày cho lương thực
 Nhược điểm: ?


Hạn chế
 Việc chọn mẫu phải dựa vào kỹ năng của nhà nghiên

cứu hay của nhân viên chọn mẫu.


Chọn mẫu xác suất
Ngẫu nhiên đơn giản
Phân(simple
loại random)
Hệ thống
(systematic)
Phân tầng
(stratified random)
Theo nhóm (cụm,
chùm)
(cluster)

Chọn mẫu phi xác suất
Lấy mẫu thuận tiện
(convenience)
Lấy mẫu phán đoán
(judgment)
Lấy mẫu theo lớp
(quota)

Lấy mẫu theo mầm
(snow ball)
12


Chọn mẫu ngẫu nhiên đơn giản
Quy trình:
Cần danh sách của tất cả các đơn vị
mẫu
Số lượng các đơn vị (cỡ mẫu).
Chọn ngẫu nhiên các đơn vị trong
danh sách
Ví dụ: Khảo sát thực trạng hiểu biết
về luật giao thông đường bộ trong
1000 học sinh tại một trường phổ
thông trung học, chọn mẫu ngẫu
nhiên 100 học sinh để khảo sát.
13


Câu hỏi
 Theo danh sách chọn mẫu, người thu thập dữ liệu phải

phỏng vấn sinh kế của hộ A. Nhưng hộ A đi vắng, hộ
B (không có trong danh sách mẫu) sẵn sàng cung cấp
dữ liệu sinh kế của gia đình mình (hộ B) . Người thu
thập dữ liệu nên chờ hộ A về phỏng vấn hay phỏng
vấn hộ B?



Thực hành trên Excel
 Cần lấy mẫu ngẫu nhiên 10 phần tử từ khung mẫu có

20 phần tử.
 Thực hiện
 1. Tạo một danh sách số thứ tự từ 1 đến 20 (giả sử đây
là khung mẫu)
 2. Tại cột mới (cột Ngẫu nhiên) dùng hàm RAND()
 3. Sắp xếp theo thứ tự cột mới
 4. Chọn 10 phần tử đầu tiên vào mẫu.


Chọn mẫu hệ thống
Chọn ngẫu nhiên một điểm xuất phát, dựa vào bước nhảy
để xác định các phần tử tiếp theo

16


Chọn mẫu hệ thống


Chọn mẫu phân tầng (stratified random)
Tổng thể được chia ra nhiều tầng (strata)

theo nguyên tắc: “cùng tầng đồng nhất,
khác tầng dị biệt”.
Để chọn phần tử trong mỗi tầng: có thể
dùng p.p. hệ thống.
Số phần tử trong mỗi tầng được xác định

theo tỷ lệ hoặc không theo tỷ lệ với kích
thước tổng thể.
Ví dụ về các tầng: Theo địa lý: bắc, trung,
nam, 7 vùng kinh tế; Tôn giáo/sắc tộc;
mức thu nhập; giới tính, nghề nghiệp…
18


Chọn mẫu phân tầng


Chọn mẫu theo nhóm (cluster)
Tổng thể được chia làm nhiều nhóm (mỗi

nhóm mang tính đại diện cho tổng thể) và
tuân theo nguyên tắc: “cùng nhóm dị biệt,
khác nhóm đồng nhất”.
Các nhóm sẽ được chọn một cách ngẫu
nhiên để tạo thành mẫu
Ví dụ: Chọn mẫu điều tra hộ gia đình
Bước 1: lựa chọn ngẫu nhiên một số huyện.
Bước 2: các hộ gia đình được lựa chọn trong
các huyện vừa được chọn.
Bước 3: những cá nhân được lựa chọn từ hộ.

20


Chọn mẫu theo nhóm (cluster)
 Ví dụ 2: Chuỗi cửa hàng thức ăn nhanh muốn tìm hiểu


món ăn nào được đặt nhiều nhất.
 B1: Chọn ngẫu nhiên một vài cửa hàng
 B2: Hỏi ý kiến tất cả khách hàng tại các cửa hàng
được chọn.


Ví dụ
Một nhà phân tích thị trường ô tô khảo sát mức độ hài
lòng của những người mới mua ô tô. Danh sách có tên
của 10.000 chủ xe, trong đó 2.500 người mua Ford,
2.500 người mua Honda, 2.500 người mua Toyota,
2.500 người mua GM. Nhà phân tích này lấy một mẫu
danh sách 400 chủ xe bằng cách chọn ngẫu nhiên 100
chủ xe ở mỗi nhãn hiệu. Nhà phân tích đang sử dụng
phương pháp chọn mẫu nào? Giải thích.

22


Câu hỏi
 Giống và khác giữa chọn mẫu phân tầng và chọn mẫu

theo nhóm?


Trả lời
 Giống: Chia tổng thể thành nhiều nhóm (tầng)
 Khác:


Phân tầng: Khi lấy mẫu thì chọn một vài quan sát trong
tầng
Nhóm: Khi lấy mẫu thì chọn tất cả quan sát trong nhóm


Chọn mẫu thuận tiện (convenience)
 Chọn phần tử dựa trên sự thuận tiện, dễ tiếp cận, dễ

lấy thông tin.
 Nhược điểm: Không xác định được sai số lấy mẫu và
không thể kết luận cho tổng thể từ kết quả mẫu.
 Sử dụng phổ biến khi bị giới hạn về thời gian và chi
phí.
Vd: phỏng vấn các bà nội trợ tại các siêu thị để tìm hiểu
về hành vi tiêu dùng của người nội trợ.
25


×