Tải bản đầy đủ (.ppt) (40 trang)

Lý thuyết lấy mẫu doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (281.95 KB, 40 trang )

LÝ THUYẾT
LẤY MẪU

Dân số (tổng thể): Tập hợp tất cả
các phần tử (cá thể) chúng ta cần
nghiên cứu.

Mẫu: Một số phần tử (cá thể)
được chọn ngẫu nhiên trong dân
số để khảo sát.
I. ĐẠI CƯƠNG
Ta chỉ tính toán và xử lý trên mẫu
rồi suy ra kết quả cho toàn bộ dân số
nên có thể mắc sai lầm.
Để tránh khỏi sai lầm, việc lấy mẫu
phải thực hiện sao cho mọi phần tử có
cơ hội đồng đều được quan sát.
Có 2 cách lấy mẫu
a.Lấy mẫu có hoàn lại:
Phần tử vừa quan sát được trả lại cho
tổng thể trước khi quan sát lần sau.
b.Lấy mẫu không hoàn lại:
Phần tử vừa quan sát không trả lại
cho tổng thể trước khi quan sát lần sau.
° Nếu tổng thể có rất nhiều phần tử thì
2 cách lấy mẫu được được coi như nhau.

Thông thường, ta lấy mẫu để ước
lượng những đại lượng chưa biết như: tỉ
lệ, trung bình, phương sai,…


Gọi X
1
, X
2
, X
3
,…,X
n
là những kết quả
quan sát. Thông thường chúng ta lấy mẫu
trong 1 tổng thể rất nhiều nên các biến số
ngẫu nhiên X
1
, X
2
,…, X
n
được coi như
độc lập và cùng phân phối.
II. THỐNG KÊ

Để nghiên cứu một đặc tính nào đó
của một dân số, ta lấy mẫu ngẫu nhiên
(X
1
, X
2
, … ,X
n
) từ dân số đó và tính các

giá trị tương ứng những giá trị này, là
một hàm theo mẫu, ta gọi là thống ke

Ký hiệu:
( )
1 2 n
T T(X ,X , X ) T X= =
r
L
Khi đã quan sát được mẫu, ta có thể tính ra
giá trị của một thống kê.
Vì mẫu là ngẫu nhiên, nên T cũng là đại
lượng ngẫu nhiên, nghĩa là T có qui luật xác
suất, có vọng trị, có phương sai, có hàm mật
độ…
Tùy theo từng vấn đề nghiên cứu, ta có thể
đặt ra một hay nhiều thống kê khác nhau.
Các thống kê thường dùng là:
1. Trung bình mẫu:
2. Phương sai mẫu:
3.Hiệu hai trung bình:
4.Tỉ số hai phương sai:
1 2 n
X X X
X
n
+ + +
=
L
( ) ( )

2 2
1 n
2
X X X X
S
n 1
− + + −
=

L
XY −
2
1
2
2
S
S
Thí dụ:
Quan sát chiều cao X (cm) của 10 người,
ta ghi được:
158cm, 163cm, 157cm, 162cm,
154cm, 152cm, 160cm, 159cm,
165cm, 156cm
Với mẫu trên ta tính được:
Trung bình mẫu:
Phương sai của mẫu:
X 158.60 cm=
2 2
S 16.49 cm=
III. THỐNG KÊ TRUNG BÌNH MẪU

1. Định nghĩa:
Cho mẫu (X
1
, X
2
, …, X
n
) trung bình mẫu là:
2. Qui luật xác suất của :

a. Định lý:
Nếu mẫu ngẫu nhiên (X
1
, X
2
, …, X
n
) rút từ
1 dân số có phân phối bất kỳ, với trung
bình và biến trị
n
1 2 n
i
i 1
X X X
1
X X
n n
=
+ + +

= =

L
X
µ
( )
E X = µ
2
σ
( )
2
Var X
n
σ
=
: gọi là độ lệch chuẩn của
Giá trò này còn gọi là sai số chuẩn
của số trung bình. Sai số này cũng còn
gọi là sai số do chọn mẫu.
Thật vậy nếu , mẫu trở thành
chính dân số đó,
không còn sai số nữa.
( )
Var X
n
σ
=
X
n → ∞
0 và X

n
σ
→ → µ
b. Định lý:
Nếu mẫu ngẫu nhiên (X
1
, X
2
, …,X
n
)
rút từ một dân số có phân phối bình
thường:
thì
( )
2
X ~ N ,µ σ
2
X ~ N ,
n
 
σ
µ
 ÷
 

c. Định lý giới hạn trung tâm:
Với mẫu (X
1
, X

2
, …, X
n
) rút từ dân số có
vọng trị , phương sai
thì khi n ∞
nên
Định lý này rất quan trọng đối với người
làm thống kê, Với mẫu lớn thì gần như có
phân phối Bình thường, bất chấp đặc tính X
trong dân số có phân phối gì.
µ
2
σ < ∞
2
X ~ N ,
n
 
σ
µ
 ÷
 
X
n ~ N(0;1) khi n
−µ
→ ∞
σ
X
IV. THỐNG KÊ PHƯƠNG SAI MẪU
1. Định nghĩa:

Cho mẫu (X
1
, X
2
, …, X
n
), ta có
phương sai mẫu là:
( )
n
2
2
i
i 1
1
S X X
n 1
=
= −



Ý nghĩa của phương sai:
Ta có là các
khoảng cách từ các giá trị đến
số trung bình .
Nếu số liệu phân tán rộng, thì S
2
sẽ
lớn.

Nếu số liệu phân tán hẹp, thì S
2
sẽ nhỏ.
Do đó: S
2
đo lường mức độ phân tán
của số liệu.
i 2 n
X X, X X, ,X X− − −
1 2 n
X ,X , XL
X

2. Cách tính S
2
Thông thường là một số lẻ, do đó
lẻ , vậy nếu dùng công thức
định nghĩa để tính S
2
thì rất vất vả.
Ta có thể tính phương sai bằng công
thức.
X
i
X X−
2
2
i
2
X nX

S
n 1

=


3. Qui luật xác suất của S
2
:
• Vọng trị của S
2
:
• Định lý: Các phân phối liên quan tới
S
2
:
Nếu mẫu (X
1
, X
2
, …, X
n
) rút từ dân số
có phân phối chuẩn thì:
i)

ii)
( )
2 2
E S = σ

( )
2
N ,µ σ
2
2
2
S
Y (n 1) ~ (n 1)= − χ −
σ
X
T . n ~ Student(n 1)
S
−µ
= −
TÓM TẮT
LÝ THUYẾT LẤY MẪU
I. ĐẠI CƯƠNG

Dân số : Tập hợp tất cả các phần
tử chúng ta cần nghiên cứu.

Mẫu: Một số phần tử được chọn
ngẫu nhiên trong dân số để khảo
sát.

II. THỐNG KÊ TRUNG BÌNH MẪU .
1.Định nghĩa:
Cho mẫu (X
1
, X

2
, …, X
n
) trung bình mẫu là:

2.Qui luật xác suất của :
a. Định lý:
Nếu mẫu ngẫu nhiên (X
1
, X
2
, …, X
n
) rút từ 1
dân số có phân phối bất kỳ,với trung bình và
phương sai thì:

n
1 2 n
i
i 1
X X X
1
X X
n n
=
+ + +
= =

L

X
µ
2
σ
( )
E X = µ
( )
2
Var X
n
σ
=
X

b.Định lý:
Nếu mẫu ngẫu nhiên (X
1
, X
2
, …, X
n
) rút
từ một dân số có phân phối bình thường:
thì
c.Định lý giới hạn trung tâm:
Với mẫu (X
1
, X
2
, …, X

n
) rút từ dân số có
vọng trị ,phương sai ,
thì
nên
( )
2
X ~ N ,µ σ
2
X ~ N ,
n
 
σ
µ
 ÷
 
µ
2
σ < ∞
2
X ~ N ,
n
 
σ
µ
 ÷
 
X
n ~ N(0;1) khi n
−µ

→ ∞
σ
III. THỐNG KÊ PHƯƠNG SAI MẪU S
2
1.Định nghĩa:
Cho mẫu (X
1
, X
2
, …, X
n
), ta có phương sai mẫu
là:
2.Cách tính S
2

( )
n
2
2
i
i 1
1
S X X
n 1
=
= −


1n

XnX
S
2
2
i
2


=


3.Qui luật xác suất của S
2
:
• Vọng trị của S
2
:
• Định lý: Các phân phối liên quan
tới S
2
:
Nếu mẫu (X
1
, X
2
, …, X
n
) rút từ dân
số có phân phối chuẩn thì.
i)


ii)
( )
2 2
E S = σ
( )
2
N ,µ σ
2
2
2
S
Y (n 1) ~ (n 1)= − χ −
σ
X
T . n ~ Student(n 1)
S
−µ
= −

1. Đo lượng cholesterlemie (đơn vị: mg%)
của một số người, ta được:

a.Tính trung bình mẫu và độ lệch tiêu
chuẩn của .

b.Một mẫu thứ nhì cũng quan sát lượng
cholesterlemie Y (mg%) của 30 người,
tính được = 180 mg%, .
Nhập 2 mẫu lại, tính trung bình và độ

lệch chuẩn của mẫu nhập.
X(mg%) 150-160 160-170 170-180 180-190 190-200 200-210
Soá ngöôøi 2 4 5 6 4 3
%mg16S
Y
=
Y
X
X
S
1.Giải

a. Ta có:

n = 24 người

mg%

mg%

b. Nhập mẫu

Số lần quan sát N = 24 + 30 = 54 người
25,181X =
98,14S
X
=
Quan saùt Trung bình Ñoä leäch
Maãu 1
Maãu 2

24
30
181.25 mg%
180 mg%
14.98 mg%
16 mg%

Nhập trung bình :

Mẫu 1: = (24)(181,25) = 4350 mg%

Mẫu 2: = (30)(180) = 5400 mg%
• Mẫu nhập:

= = 9750 mg%

Trung bình mẫu nhập:

X

Y

Z
∑∑
+ YX
Z
9750
Z 180,56mg%
N 54
= = =


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×