Tải bản đầy đủ (.docx) (6 trang)

Lý thuyết xác suất và thống kê Chương lý thuyết mẫu (word)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (146.77 KB, 6 trang )

X
Chương
LÝ THUYẾT MẪU
Bài 1: KHÁI NIỆM VỀ ĐÁM ĐÔNG VÀ MẪU
1.1. Đám đông
Giả sử ta cần nghiên cứu một dấu hiệu X thể hiện trên một tập hợp gồm N phần tử , thì
tập hợp N phần tử này được gọi là đám đông, N được gọi là kích thước của đám đông.
1.2. Mẫu
Từ đám đông ta lấy ra một tập hợp nhỏ hơn gồm n phần tử để nghiên cứu. Tập hợp n
phần tử này được gọi là mẫu, n được gọi là kích thước mẫu.
1.3. Mẫu ngẫu nhiên
Giả sử ta lấy mẫu kích thước n. Gọi X
i
là giá trị quan sát của dấu hiệu cần nghiên cứu
Xthể hiện trên phần tử thứ I của mẫu i = 1,…,n. Nếu mẫu lấy theo phương pháp ngẫu
nhiên đơn giản có hoàn lại thì X
i
(i = 1,2…,n) là các ĐLNN độc lập có cùng luật phân
phối xác xuất với ĐLNN gốc X.
Định nghĩa 1.1:Mẫu ngẫu nhiên kích thước n là tập hợp n ĐLNN độc lập X
1,
X
2…,
X
n
được
rút ra từ ĐLNN gốc X và có cùng luật phân phối xác suất với X.
Mẫu ngẫu nhiên kích thước n được kí hiệu là: W = (X
1
,X
2


,…,X
n
).
Trong một lần lấy mẫu, ĐLNN X
i
nhận giá trị x
i
(i=1,2…,n). Khi đó tập hợp n giá
trị x
1
,x
2
,…,x
n
tạo nên một mẫu cụ thể, kí hiệu là:
), ,,(
21 n
xxx
=
ω
1.4. Một số phương pháp cơ bản mô tả mẫu
Giả sử trong một lần lấy mẫu kích thước n ta được một mẫu cụ thể:
), ,,(
21 n
xxx
=
ω
Trong đó xi chính là giá trị quan sát của dấu hiệu X thể hiện trên phần tử thứ I của mẫu
cụ thể này (i=1,2…,n).
a.

Bảng phân phối thực nghiệm
Các giá trị quan sát x1,x2,…,xn sau khi được sắp xếp và hệ thống lại theo thứ tự tăng
dần hoặc giảm dần rồi trình bày dưới dạng bảng, ta có bảng phân phối thực nghiệm
(hay còn gọi là bảng phân phối mẫu):
xi(hoặc X) x1 x2 … xi … xk
ni n1 n2 … ni … nk
Bảng 1.1
Trong đó ni, (i=1,2…,n) là tần số của gái trị quan sát xi.
Ta có:

=
=
k
i
i
nn
1
b.
Hàm phân phối thực nghiệm
Định nghĩa 1.2: Hàm phân phối thực nghiệm kí hiệu là F* (x) được định nghĩa là :
n
n
xF
x
=
)(
*
Trong đó x là số thực bất kì, nx là số quan sát có giá trị nhở hơn x trong mẫu kích
thước n.
Hàm phân phối thực nghiệm có các tính chất:

1)
1)(0
*
≤≤ xF
2)
F*(x) là hàm không giảm
3)
Nếu xi là giá trị quan sát nhỏ nhất và xk là giá trị quan sát lớn nhất của X
trên mẫu thì F*(x)=0 với
1
xx ≤
và F*(x)=1 với x > xk.
2.
Các đặc trưng mẫu quan trọng
2.1.
Trung bình mẫu
Định nghĩa 1.3: Trung bình mẫu, kí hiệu là được định nghĩa bằng công thức:
1
1

n
i
i
X X
n
=
=

Ta chú ý rằng trung bình mẫu là trung bình cộng của n ĐLNN nên nó cũng là một
ĐLNN. Khi mẫu ngẫu nhiên nhận một giá trị cụ thể :

), ,,(
21 n
xxx=
ω
Thì trung bình mẫu cung nhận một giá trị cụ thể:
1
1

n
i
i
x x
n
=
=

hoặc
1
1

n
i i
i
x x n
n
=
=

nếu có bảng 1.1
Trung bình mẫu có tính chất:

( )E X
µ
=
(1)
2
ar( )V X
n
σ
=
(2)
2.2.
Phương sai mẫu và phương sai mẫu điều chỉnh
Định nghĩa 1.4: Phương sai mẫu, kí hiệu là S2 được đinh nghĩa bằng công thức:
2 2
1
1
( )
n
i
i
S X X
n
=
= −


Phương sai mẫu có tính chất:
2 2
1
(S )

n
E
n
σ

=

Định nghĩa 1.5: Phương sai mẫu điều chỉnh, kí hiệu S’2 và được định nghĩa:
'2 2
1
1
( )
1
n
i
i
S X X
n
=
= −



Từ tính chất của phương sai mẫu, ta có:
'2 2
( ) .E S
σ
=

Chú ý 1.1: Ta có thể tính s’2 theo công thức:

2
'2
1
ns
s
n
=


Chú ý 1.2: Để tính giá trị của phương sai mẫu cung như phương sai mẫu điều chỉnh người
ta còn dung công thức sau:
2 2 2
1
1
( )
k
i i
i
s n x n x
n
=
 
= −
 
 


'2 2 2
1
( )

1
i i
s n x n x
n
 
= −
 

 

Định nghĩa 1.6: Căn bậc hai của phương sai mẫu được gọi là độ lệch tiêu chuẩn mẫu và
được kí hiệu là S
2
1
1
( )
n
i
i
S X X
n
=
= −

Căn bậc hai của phương sai mẫu điều chỉnh được gọi là độ lệch tiêu chuẩn mẫu
điều chỉnh và được kí hiệu là S’
' 2
1
1
( )

1
n
i
i
S X X
n
=
= −


Độ lệch tiêu chuẩn mẫu cũng như độ lệch tiêu chuẩn mẫu điều chỉnh là những
ĐLNN. Còn các giá trị của chúng trên một mẫu cụ thể là những số xác định, kí hiệu
tương ứng là s và s’. Ta có:
2
1
1
(x )
n
i
i
s x
n
=
= −


' 2
1
1
(x )

1
n
i
i
s x
n
=
= −


Chú ý 1.3: Trong trương hợp các giá trị của X được chia thành từng lớp, khi đó người ta
lấy giá trị trung tâm của mỗi lớp đại diện cho lớp đó để tính các đặc trưng mẫu (cũng như
để tìm hàm phân phối thực nghiệm).
3.
Quy luật phân phối xác xuất của một số thống kê quan trọng
Giả sử dấu hiệu cần nghiên cứu X có E(X)=
µ
và Var(X)=
σ
2 .Từ đám đông ta lấy ra
một ngẫu nhiên kích thước n:
W = (X
1
,X
2
,…,X
n
).
Định nghĩa 1.7: Một hàm của các ĐLNN thành phần
X

1
,X
2
,…,X
n
được gọi là một thống
kê và được kí hiệu là:
G=f
(X
1
,X
2
,…,X
n
)
3.1.
Trường hợp ĐLNN gốc X phân phối theo quy luật chuẩn
Vì X có phân phối chuẩn, nên
X
cũng có phân phối chuẩn. Mặt khác theo (1) và (2), ta
có:
( )E X
µ
=

2
ar( )V X
n
σ
=



2
( , )X N
n
σ
µ
:

Vì vậy:
(0,1)
X
U N
n
µ
σ

= :
(3)
Ta cũng có:
'2
2 2( 1)
2
( 1)
n
n S
X X
σ



= :
(4)
( 1)
'
n
X
T T
S
n
µ


= :
(5)
Chú ý 4: Khi n > 30 thống kê T phân phối xấp xỉ chuẩn N(0,1). Khi đó ta có thể lấy
( )n
t u
α α


3.2.
Trương hợp chưa biết quy luật phân phối xác suất của X nhưng kích thước mẫu n
khá lớn ( thường đòi hỏi n > 30)
Khi n lớn,
X
có phân phối xấp xỉ chuẩn. Mặt khác ta luôn có
( )E X
µ
=


2
ar( )V X
n
σ
=

2
,X N
n
σ
µ
 
 ÷
 
;
Vì vậy:
(0,1)
X
U N
n
µ
σ

= ;
3.3.
Trường hợp có hai ĐLNN gốc cùng phân phối theo quy luật chuẩn
Giả sử có hai đám đông, trên đám đông thứ nhất dấu hiệu cần nghiên cứu là X1 có phân
phối chuẩn với E(X1)=
1
µ

,Var(X1)=
2
1
σ
, còn trên đám đông thứ hai dấu hiệu cần
nghiên cứu là X2 cũng có phân phối chuẩn với
2 2
( )E X
µ
=
,
2
2 2
ar( )V X
σ
=
. Từ hai đám
đông trên ta lấy ra hai mẫu độc lập với kích thước tương ứng là n1 và n2:
W1=(X11,X12,…,X1n1)
Từ mẫu này ta lập được
1
X
và S’22
W2=(X21,X22,…,X2n1)
Từ mẫu này ta lập được
2
X
và S’22

2

1 1 1
( , )X N
µ σ
:

2
2 2 2
( , )X N
µ σ
:
nên
2
1
1
1
1
,X N
n
σ
µ
 
 ÷
 
:

2
2
2
2
2

,X N
n
σ
µ
 
 ÷
 
:
Do đó
( )
1 2 1 2
2 2
1 2
1 2
( )
(0,1)
X X
U N
n n
µ µ
σ σ
− − −
=
+
:
(8)
Nếu
2 2 2
1 2
σ σ σ

= =
thì
( )
1 2
1 2 1 2
( 2)
'2 '2
1 1 2 2
1 2 1 2
( )
( 1) ( 1) 1 1
1
n n
X X
T T
n S n S
n n n n
µ µ
+ −
− − −
=
− + −
+
+ −
:
(9)
Chú ý 5: Khi n1 và n2 khá lớn (thường đòi hỏi lớn hơn 30), mặc dù không biết quy luật
phân phối của X1 cũng như của X2, lập luận tương tự như trên, ta cũng có công thức (7)
3.4. Quy luật phân phối xác xuất của tần suất mẫu
Khi n khá lớn,thì

,
pq
f N p
n
 
 ÷
 
;


(0,1)
f p
U N
pq
n

= ;
(10)

×