Tải bản đầy đủ (.pdf) (33 trang)

phuong phap Lay mau phan lop 1

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.03 MB, 33 trang )

Phương pháp chọn mẫu phân lớp


Phương pháp chọn mẫu phân lớp
Khi không có thông tin về tổng thể, chọn mẫu ngẫu nhiên là giải
pháp tối ưu.


Thông tin bổ xung
Nhóm các phần tử hoặc ô
tiêu chuẩn giống nhau
Có thể chia tổng thể
thành các nhóm nhỏ
o Gọi là Lớp
 Nếu chọn mẫu ngẫu nhiên từ
các lớp này, độ chính xác sẽ tăng
đáng kể.

Danh giới khu vực nghiên
cứu

Rừng
Đồng cỏ

Ô dạng tc

Rừng


Ví dụ
Lấy mẫu phân lớp rât hữu ích khi


ta có thể chia khu vực nghiên
cứu thành các phần riêng biệt
và đồng nhất.
Ví dụ, bạn quan tâm đến việc
điều tra sinh khối của của một
loài cây LSGN trong 20 ha
nghiên cứu.
Trong ví dụ này, đồng cỏ và rừng
là các lớp.
Sự phân lớp này có thể tăng độ
chính xác của ước lương sinh
khối

Danh giớ khu vực nghiên
cứu

Rừng
Đồng cỏ

Ô dạng bản

Rừng


Ví dụ khác?


Phương pháp chọn mẫu phân lớp
Tăng độ chính xác
• Hiệu quả phụ thuộc rất nhiều vào kỹ năng chọn lớp

Ví dụ
Kích thước mẫu là 4, số lớp là 2.


Kích thước mẫu là 4, chọn 2 từ mỗi lớp
Danh giới khu vực nghiên
cứu

ôtc

Số

Lớp

A

2

1

B

6

1

C

8


2

D

10

1

E

10

2

F

12

2

TB

8

Rừng
Đồng cỏ

Ô dạng bản

Rừng



Ước lượng trung bình của tổng thể
Uớc lượng trung bình của tổng thể


Một công ty quang cáo quyết định thực hiện 1 cuộc điều tra để ước lượng thời gian
những hộ gia đình trong một khu vực xem ti vi trung bình bao nhiêu giờ 1 tuần. Khu
vực có 2 thị trấn, A và B và 1 vùng nông thôn. Thị trấn A được xây dựng gần 1 nhà
máy, hầu hết các gia đình đều có người làm công nhân trong nhà máy và có trẻ em
đang tuổi đi học. Thị trấn B là vùng ngoại ô của 1 thành phố gần đó, các gia đình
thường có người già và chỉ có ít trẻ em ở nhà. Có 155 gia đình ở thị trấn A, 62 gia
đình ở thị trấn B, 93 gia đình ở khu vực nông thôn. Thảo luận hiệu quả của phương
pháp lấy mẫu theo lớp ngẫu nhiên trong trường hợp này.
Giả sử kế hoạch điều tra đã được thực hiện. Công ty quảng cáo đủ kinh phí và thời
gian để phỏng vấn n=40 gia đình và chọn các mẫu ngẫu nhiên với kích thước n1=20
từ thị trấn A, n2=8 từ thị trấn B, n3=12 từ khu vực nông thôn. Sau khi chọn mẫu
ngẫu nhiên và thực hiện phỏng vấn. Kết quả điều tra được biểu thị trên bảng 5.1.


Bảng 5.1
số giờ xem ti vi trong vùng (giờ/tuần)
thị trấn A

Hình

Đồ thị về thời lượng xem ti vi
Thị trấn B
T.T A


N. Thôn

Số giờ

thị trấn B

k.vực nông thôn


Bảng
Tổng hợp só liệu từ bảng 5.1
Trung bình
T.T A
T.T B
N. thôn

Trung vị

Độ lệch chuẩn


Ví dụ:
1. Những kết quả dưới đây có được sau khi thực hiện thu thập
mẫu bằng phương pháp lấy mẫu ngẫu nhiên theo lớp:
Lớp 1: N1= 100, n1= 50, Ӯ1= 10, S12 = 2800
Lớp 2: N2= 50, n2= 50, Ӯ2= 20, S22 = 700
Lớp 3: N3= 300, n3= 50, Ӯ3= 30, S32 = 600
a) Ước lượng giá trị trung bình của tổng thể.
b) Ước lượng với khoảng tin cậy là 95%.



Ước lượng giá trị tổng số
Ước lượng :

Phương sai của ước lượng


Ví dụ:
Sử dụng số liệu ở ví dụ trước và ước lượng tổng số giờ xem ti vi mỗi tuần của
người dân thành phố với khoảng tin cậy 95%.
với số liệu trong bảng 5.1:

Phương sai của ước lượng NӮst :

Ước lượng của tổng thể cùng với sai số cận biên:


Ví dụ:
với số liệu trong bảng 5.1:

Phương sai của ước lượng NӮst :

Ước lượng của tổng thể với độ tin cậy 95%:


Ví dụ:
Một nhân viên kiểm lâm muốn ước lượng tổng diện tích rừng được
trồng trong các trang trại của 1 bang. Vì diện tích cây trồng thay đổi
theo kích thước của trang trại nên nhân viên đó đã quyết định lấy mẫu
theo lớp, với các lớp bao gồm các trang trại có kích thước khác nau.

240 trang trại trong bang được phân ra thành 4 nhóm theo kích thước.
1 mẫu 40 trang trại được chọn, kết quả được trình bày trong bảng
dưới. Ước lượng tổng diện tích rừng trong các trang trại và với khoảng
tin cậy 95%.

lớp I
0-200 mẫu

lớp II
200-400 mẫu

lớp III
400-600 mẫu

lớp IV
trên 600 mẫu


Dung lượng mẫu
Kích thước mẫu gần đúng cần thiết để ước lượng µ hoặc T với sai số
cận biên B của ước lượng:

ai là tỉ lệ mẫu phân phối cho lớp i, Ϭi2 là phương sai của tổng thể
của lớp i, và :
khi ước lượng µ

khi ước lượng 


ví dụ:

Người ta thức hiện cuộc khảo sát về thời gian phỏng vấn và cho thấy phương sai của
các lớp là: Ϭ12 = 25, Ϭ22 = 225, Ϭ32 = 100. Chúng ta sử dụng Ӯst để ước lượng trung
bình của tổng thể. Xác định dung lượng mẫu cần thiết khi sai số cận biên mong
muốn của ước lượng là 2 giờ và tỉ lệ mẫu cho các lớp lần lượt là: a1= 1/3, a2=1/3,
a3=1/3. (Lấy mẫu cùng tỉ lệ)
sai số cận biên = 2h:

do đó


ví dụ:


ví dụ

Do đó, người điều tra nên lấy n=57, với:


Như ví dụ 5.5, giả sử phương sai trong ví dụ 5.1 là Ϭ12 = 25, Ϭ22 = 225, Ϭ32 =
100. Chúng ta muốn ước lượng T với sai số cận biên của ước lượng là 400 giờ.
Chọn dung lượng mẫu cần thiết nếu số lượng khảo sát được chia đều cho từng
lớp mẫu.
Sai số cận biên của ước lượng là 400 giờ, vì vậy ta có,

Để tính n trong công thức 5.6, ta cần tính những giá trị sau:

ví dụ 5.5

với n1=n2=n3= 35



Phân bổ mẫu
Mục đích của ta, xác định số phần tử phân bổ cho từng lớp bị ảnh hưởng bởi 3 yếu tố
sau:
1. Tổng số phần tử trong mỗi lớp của tổng thể
2. Mức độ biến động của các giá trị quan sát trong từng lớp
3. Chi phí thu thập/mẫu trong mỗi lớp
Dung lượng mẫu gần đúng để chi phí thu thập mẫu nhỏ nhất ứng với
1 giá tri V(ȳ st) cố định hoặc V(ȳ st) nhỏ nhất ứng với một lượng kinh
phí cố định được xác định dựa vào công thức:

Trong đó Ni biểu thị cho kích thước của lớp thứ I, Ϭi 2 biểu thị cho phương sai của lớp thứ i,
và ci biểu thị cho chi phí thu thập một giá trị quan sát của lớp thứ i.


ví dụ:
Một cuộc khảo sát thăm dò cho thấy phương sai của các lớp là: Ϭ12 = 25, Ϭ22 = 225,
Ϭ32 = 100. Chúng ta sử dụng Ӯst để ước lượnggiá trị trung bình của tổng thể. Xác
định dung lượng mẫu cần thiết khi sai số cận biên mong muốn của ước lượng là 2
giờ. Chi phi để phỏng vấn mỗi người lần lượt là: c1= 10$, c2=15$, c3=20$.
N1=155, N2=62, N3=93
sai số cận biên = 2h:

do đó


Thay thế

ai vào công thức 5.6 ta có:



Ví dụ
Một cơ quan lâm nghiệp của 1 bang thực hiện 1 nghiên cứu những
người sử dụng công cụ cám trại của Bang. Bang có 2 khu cắm trại, một
ở trên núi và một ở dưới chân núi. Cơ quan này muốn ước lượng số
người trung bình trên 1 điểm cắm trại và tỉ lệ những điểm cắm trại
được sử dụng bởi những người cắm trại đến từ những Bang khác. Sai
số cận biên trong ước lượng số người trung bình trên một điểm cắm trại

là 1 và tỉ lệ người ngoài bang là 0.1. Hai khu cắm trại có thể được coi
là 2 lớp. Với N1 = 120 và N2 = 80 điểm cắm trại. Ước lượng dung lượng
mẫu cần thiết để đạt được các sai số ước lượng cận biên như trên. Giả

sử mẫu được phân phối theo cùng tỉ lệ cho các lớp.


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×