Tải bản đầy đủ (.pdf) (29 trang)

Bài giảng lý thuyết xác suất và thống kê toán học chương 5 phan văn tân

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (293.02 KB, 29 trang )

LÝ THUYẾT
XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌC
Phan Văn Tân
Bộ mơ Khí tượng


CHƯƠNG 5. KHÔNG GIAN MẪU VÀ THỐNG KÊ
TRÊN KHÔNG GIAN MẪU
5.1 Khơng gian mẫu
• Mẫu là gì?
– Là tập hợp hữu hạn các phần tử lấy từ tập tất cả các phần tử có
thể có nào đó
• Tại sao phải lấy mẫu?
– Để nghiên cứu một hiện tượng, một sự kiện nào đó ta khơng
thể xem xét tất cả các thành phần cấu thành nó, vì số thành
phần là vơ hạn hoặc q nhiều
– Ví dụ:





Nghiên cứu tâm lý lứa tuổi
Điều tra xã hội học về một chính sách nào đó
Đánh giá chất lượng sản phNm của nhà máy



CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHƠN G GIAN MẪU
5.1 Khơng gian mẫu


• Tập tổng thể: Tập hợp tất cả các thành phần có thể có
– Tập tồn bộ, tập chính qui
• Tập mẫu: Tập hợp các thành phần được lấy ra để thí nghiệm, kiểm
tra
– Số thành phần được chọn: Dung lượng mẫu
– Tập hợp tất cả các mẫu có thể lấy được gọi là không gian mẫu
– Mỗi mẫu lấy ra là một điểm trong khơng gian mẫu
• Khơng gian mẫu ứng với khơng gian các sự kiện sơ cấp
• Mỗi mẫu ứng với một sự kiện sơ cấp trong lý thuyết xác suất
• Có hai loại mẫu:
– Mẫu có lặp
– Mẫu khơng lặp


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHƠN G GIAN MẪU
5.1 Khơng gian mẫu
• Giả sử tập tổng thể gồm N phần tử, tập mẫu gồm n phần tử (n– Mẫu được lấy bằng cách rút ngẫu nhiên n lần, mỗi lần một
phần tử từ tập tổng thể rồi trả lại tập tổng thể sau khi đã ghi
nhận kết quả
¾ Đó là cách lấy mẫu có lặp: Một phần tử có thể được lấy nhiều
lần
– Mẫu được lấy bằng cách rút ngẫu nhiên n phần tử từ tập tổng
thể, sau mỗi lần lấy ghi nhận kết quả nhưng khơng trả lại tập
tổng thể
¾ Đó là cách lấy mẫu khơng lặp: Mỗi phần tử chỉ có thể được
chọn một lần duy nhất



CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHƠN G GIAN MẪU
5.1 Khơng gian mẫu
• Đối với cách lấy mẫu lặp:
– Mỗi phần tử trong số n phần tử của mẫu có N cách chọn, vì
mỗi phần tử sau khi chọn được trả lại tập ban đầu
– Î Có tất cả N n cách lấy mẫu khác nhau
• Đối với các lấy mẫu khơng lặp:
– Có N cách chọn phần tử thứ nhất của tập mẫu
– Có (N –1) cách chọn phần tử thứ hai, vì phần tử thứ nhất không
được trả lại tập ban đầu
– …
– Có (N –n+1) cách chọn phần tử thứ n của tập mẫu
– Ỵ Có tất cả N (N –1)…(N –n+1)=AN n cách lấy mẫu


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHƠN G GIAN MẪU
5.1 Khơng gian mẫu

ANn
• N hận thấy: Khi n << N thì n ~ 1 Ỵ hai cách lấy mẫu tương
N
đương nhau

• Để có kết luận tương đối chính xác về tập tổng thể thì tập mẫu n
phải tiêu biểu
• Mẫu được coi là tiêu biểu nếu nó được lấy một cách ngẫu nhiên,
tức mọi phần tử của tập tổng thể phải có xác suất được chọn như
nhau

• N ếu mẫu được lấy để nghiên cứu đại lượng ngẫu nhiên X thì tập
mẫu (X1, X2,…, Xn) được coi là mẫu của X
• Mỗi Xi, i=1,2,..,n, đều được chọn từ tập giá trị của X nên các Xi là
những đại lượng ngẫu nhiên có cùng phân bố với X


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHƠN G GIAN MẪU
5.1 Khơng gian mẫu
• Ví dụ: Gi s X={1,2,3,4,5,6,7,8,9} ẻ N =9
ã N u n=3, vi cách lấy mẫu có lặp ta có thể có các mẫu:
– (X1, X2, X3) = (1,4,6)
X3
– (X1, X2, X3) = (2,3,8)
– (X1, X2, X3) = (9,1,7)
– (X1, X2, X3) = (4,2,1)

ã ẻ Xi={1,2,3,4,5,6,7,8,9}

X1

X2


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.2 Phân bố mẫu và phân bố chính xác
• Giả sử có mẫu (X1, X2,…, Xn) của đại lượng ngẫu nhiên X có phân
bố F(x) (F(x) được gọi là phân bố chính xác của X)
• Vì F(x) chưa biết nên cần tìm F(x) trên cơ sở tập mẫu lấy được

• Từ tập mẫu (X1, X2,…, Xn) ta lập hàm Fn(x):
nx

⎪ Fn ( x ) =
n

⎪⎩n x = Sè phÇn tư cđa (X 1 , X 2 ,..., X n ) tháa m·n X i < x
• Fn(x) được gọi là phân bố mẫu của X
• Ứng với mỗi đối số x giá trị hàm Fn(x) là tần suất của sự kiện X• N ói cách khác, Fn(x) là ước lượng của xác suất P(X• Từ luật số lớn, với ∀ε>0 ta có lim P (| Fn ( x ) − F ( x ) |< ε ) = 1
n→∞


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.2 Phân bố mẫu và phân bố chính xác

nx
suy ra P( X = X i ) = 1 , i = 1,2,..., n
n
n
• N hư vậy, có thể xem mẫu (X1, X2,…, Xn) như là tập các giá trị có
thể của biến ngẫu nhiên rời rạc X’, trong đó xác suất để X’ nhận
các giá trị có thể của nó là như nhau và bằng 1/n
• Để nghiên cứu X ta dựa vào tập mẫu (X1, X2,…, Xn), điều đó
tương đương với việc nghiên cứu biến ngẫu nhiên rời rạc X’
• Sự khác biệt cơ bản là:
– Phân bố của X là phân bố chính xác, các đặc trưng của X là các
đặc trưng chính xác

– Phân bố của X’ là phân bố mẫu, các đặc trưng của X’ là các
đặc trưng mẫu
• Từ hệ thức Fn ( x ) =


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.3 Các đặc trưng mẫu của đại lượng ngẫu nhiên
• Xét biến ngẫu nhiên X với mẫu lấy được X’={X1, X2,…, Xn}
• Ký hiệu các đặc trưng chính xác của X là:
– Hàm phân bố F(x)=P(X– Kỳ vọng: μ=M[X], phương sai: σ2=D[X]=M[(X–μ)2]
– Mômen gốc bậc k: mk=M[Xk]
– Mơmen trung tâm bậc k: μk=M[(X–μ)k]
• Cần xác định các đặc trưng mẫu của X
• Từ mục trước:
nx
Fn ( x ) =
n
1
P( X = X i ) = , i = 1,2,..., n
n


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.3 Các đặc trưng mẫu của nđại lượng ngẫu nhiên
n
• Kỳ vọng mẫu: X = M [ X ′] = ∑ X i P ( X ′ = X i ) =
i =1


1
Xi

n i =1

• Phương sai mẫu:
2
2
1 n
1 n 2
~
2
2
2
Dx = s x = D[ X ′] = ∑ ( X i − X ) = ∑ X i − X ≡ X − − X
n i =1
n i =1
n
• Mơmen gốc mẫu bậc k:
1
k
~ = M [ X ′k ] =
m
X
∑ i
k
n i =1
• Mômen trung tâm mẫu bậc k:
n

1
μ~k = M [( X ′ − X ) k ] = ∑ ( X i − X )k
n i =1


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Xét biến ngẫu nhiên X có mật độ xác suất f(x) và mẫu (X1, X2,…,
Xn) là mẫu có lặp của X
• Vì các Xi là độc lập và có cùng phân bố với X nên f(xi)≡f(x)
• Có thể xét (X1, X2,…, Xn) như là
hệ n đại lượng ngẫu nhiên hay
vector ngẫu nhiên n chiều nhận
các giá trị có thể (x1, x2,…, xn)
• Các (x1, x2,…, xn) là các hằng số
ứng với một mẫu đã được chọn
• (X1, X2,…, Xn) có mật độ
f(x1)×f(x2)×…×f(xn)
X1

X3
(x1, x2, x3)

X2


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê

• Định nghĩa: Một hàm số g(X1, X2,…, Xn) bất kỳ với các biến là
(X1, X2,…, Xn) được gọi là một đại lượng thống kê hay một đặc
trưng thống kê trên khơng gian mẫu
• Vì (X1, X2,…, Xn) là một hệ các đại lượng ngẫu nhiên nên g(X1,
X2,…, Xn) cũng là một đại lượng ngẫu nhiên
n
1
• Ví dụ: Kỳ vọng mẫu: X =
Xi

n i =1
1 n
~
2
Dx = s x = ∑ ( X i − X ) 2
• Phương sai mẫu:
n i =1
• Các mơmen gốc, mơmen trung tâm mẫu đều là những đại
lượng thống kê trên không gian mẫu


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Cho Y=g(X1, X2,…, Xn) là một đại lượng thống kê và
f(x1)×f(x2)×…×f(xn) là mật độ xác suất của (X1, X2,…, Xn)
• Cần xác định phân bố Fy(y) của Y
• Về ngun tắc ta có:

Fy ( y ) = ∫ f ( x1 )... f ( xn )dx1...dxn ,

G

G = {( x1 ,..., xn ) : g ( x1 ,..., xn ) < y}
• Sau đây sẽ xét phân bố của một số đặc trưng thống kê thông dụng


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Phân bố của một số đại lượng thống kê thường gặp
• Định lý 1: N ếu mẫu (X1, X2,…, Xn) được lấy từ đại lượng ngẫu
nhiên X có phân bố chuNn N (μ,σ) thì
1 n
X = ∑ Xi
2
n i =1
σ
có phân bố chuNn N ( μ , )
n
• Định nghĩa: N ếu (X1, X2,…, Xn) là các đại lượng ngẫu nhiên độc
lập có cùng phân bố chuNn N (0,1) thì đại lượng ngẫu nhiên
n

U = ∑ X i2
i =1

có phân bố χ2 (khi bình phương) với n bậc tự do, ký hiệu U∈χ2(n)


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ

TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Phân bố của một số đại lượng thống kê thường gặp
• Định lý 2: N ếu X có phân bố chuNn N (μ,σ) và (X1, X2,…, Xn) là
n − 1 *2
mẫu của X thì
U = 2 sx

σ

có phân bố χ2 với (n–1) bậc tự do, U∈χ2(n–1), với
1 n
1 n
*2
2
(Xi − X ) , X = ∑ Xi
sx =

n − 1 i =1
n i =1
• Định nghĩa: N ếu Z có phân bố chuNn N (0,1), U có phân bố χ2 với
n bậc tự do, χ2(n), thì
Z
Z
t=
=
n
U /n
U
có phân bố Student với n bậc tự do, ký hiệu t∈St(n)



CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Phân bố của một số đại lượng thống kê thường gặp
• Định lý 3: N ếu X có phân bố chuNn N (μ,σ) và (X1, X2,…, Xn) là
mẫu của X thì
X −μ
t= *
sx / n
có phân bố Student với (n–1) bậc tự do, t∈St(n–1), với
n
n
2
1
1
2
(
)
, X = ∑ Xi
s*x =
X

X

i
n − 1 i =1
n i =1
• Định nghĩa: N ếu U1 và U2 độc lập có phân bố χ2 với n1 và n2 bậc

tự do, U1∈χ2(n1), U2∈χ2(n2)thì
U /n
F= 1 1
U 2 / n2
có phân bố Fisher (phân bố F) với n1 và n2 bậc tự do, ký hiệu
F∈F(n1,n2) hoặc F∈Fn1,n2


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Phân bố của một số đại lượng thống kê thường gặp
• Định lý 4: N ếu X và Y đều có phân bố chuNn và có cùng phương
sai, D[X]=D[Y]=σ2, (X1, X2,…, Xn1) là mẫu của X, (Y1, Y2,…,
Yn2) là mẫu của Y, thì
*2
s
f = *x 2
sy
có phân bố F với (n1–1) và (n2–1) bậc tự do, f∈F(n1–1,n2–1), với
n1
1 n1
1
2
(
)
, X = ∑ Xi
sx =
X


X

i
n1 − 1 i =1
n1 i =1
*2

s

*2
y

1 n2
1
2
(Yi − Y ) , Y =
=

n2 − 1 i =1
n2

n2

∑Y
i =1

i


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ

TRÊN KHƠN G GIAN MẪU
Những điều cần chú ý
• Khi xét đại lượng ngẫu nhiên X với mẫu (X1, X2,…, Xn):
– Các Xi nhận các giá trị trong tập các giá trị có thể của X nên
các Xi có cùng phân bố với X, f(xi)=f(x)
– Các Xi là độc lập với nhau
– Có thể xét (X1, X2,…, Xn) như là một hệ n đại lượng ngẫu
nhiên, phân bố của hệ: f(x1,…,xn)=f(x1)×…×f(xn)
– Bộ giá trị (x1,…,xn) là những hằng số cụ thể, và là kết quả của
một lần chọn nào đó Î Khái niệm mẫu (X1, X2,…, Xn) là một
khái niệm trừu tượng
n
n
1
1
• Phân biệt:
M [ X ] ≠ X = ∑ X i ≠ x = ∑ xi
n i =1
n i =1
• Tương tự, với các đặc trưng khác: Phương sai, mômen,…


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
• Xét hệ hai đại lượng ngẫu nhiên (X,Y) với mẫu lấy được (X1,Y1),
(X2,Y2),…, (Xn,Yn)
• Khi đó, ngồi các đặc trưng riêng như kỳ vọng, phương sai,
mômen gốc, mômen trung tâm của từng đại lượng ngẫu nhiên, các
đặc trưng quan trọng cần được xem xét là mơmen tương quan và

hệ số tương quan
• Mơmen tương quan mẫu giữa hai đại lượng ngẫu nhiên được xác
n
1
định bởi μ~ =
( X i − X )(Yi − Y )

xy
n i =1
tương ứng là kỳ vọng
1 n
1 n
• Trong đó X = ∑ X i , Y = ∑ Yi
mẫu của X và Y
n i =1
n i =1
Do tính ứng dụng phổ biến của mômen tương quan mẫu nên để
thuận tiện ta sẽ sử dụng ký hiệu Rxy thay cho μ~xy


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
• Hệ số tương quan mẫu giữa X và Y được xác định bởi
1 n
( X i − X )(Yi − Y )

μ~xy
μ~xy
n i =1

=
rxy = ~ ~ =
1 n
1 n
Dx D y s x s y
2
2
(
X

X
)
(
Y

Y
)
∑ i
∑ i
n i =1
n i =1
• Trong đó

1 n
1 n
~
~
2
2
2

Dx = sx = ∑ ( X i − X ) , D y = s y = ∑ (Yi − Y )2
n i =1
n i =1

tương ứng là phương sai mẫu của X và Y


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
• Đối với hệ m đại lượng ngẫu nhiên (X1,X2,…,Xm) với mẫu lấy
được (X11,X21,…,Xn1),…, (X1m,X22,…,Xnm)
• Có thể sắp xếp mẫu thành ma trận n hàng (dung lượng mẫu) và m
cột (tương ứng với m đại lượng ngẫu nhiên)
• Các đặc trưng mẫu được xác định như sau
n
1
• Các kỳ vọng mẫu: X j = ∑ X ij , j = 1,2,..., m
n i =1
n
1
~
2
• Các phương sai mẫu: D = s 2 =
(
X

X
)


xj
xj
ij
j , j = 1,2,..., m
n i =1
~ 2
• Trong nhiều trường hợp để đơn giản ta sử dụng ký hiệu D j , s j
~
2
thay cho ký hiệu D
,
s
xj
xj


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
• Các mơmen tương quan mẫu:
n
1
μ~x j xk = ∑ ( X ij − X j )( X ik − X k ), j, k = 1,2,..., m
n i =1
• Tập hợp các mơmen tương quan mẫu lập thành ma trận tương
quan mẫu:
• Sử dụng ký hiệu R jk
~
~
~

~
thay
cho

hiệu
μ
x j xk
⎛ μ x1x1 μ x1x2 ... μ x1xm ⎞
⎜~

~
~
⎜ μ x2 x1 μ x2 x2 ... μ x2 xm ⎟
⎛ R11 R12 ... R1m ⎞
Rxx = ⎜


...
... ...
... ⎟
⎜ R21 R22 ... R2 m ⎟
⎜~

Rxx = ⎜
⎜ μ x x μ~x x ... μ~x x ⎟
...
... ... ... ⎟
m 2
m m ⎠
⎝ m1

⎜⎜
⎟⎟
⎝ Rm1 Rm 2 ... Rmm ⎠


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
• N hận thấy:
n
n
1
1
μ~x x = ∑ ( X ij − X j )( X ik − X k ) = ∑ ( X ik − X k )( X ij − X j ) = μ~x x ,
n i =1
n i =1
( j, k = 1,2,..., m )
j k

k

j

• Ma trận tương quan mẫu là ma trận đối xứng
n
n
1
1
~
• Khi j≡k: μ~x x = ∑ ( X ij − X j )( X ij − X j ) = ∑ ( X ij − X j )2 = D

xj ,
j j
n i =1
n i =1
( j = 1,2,..., m)
• Các phần tử trên đường chéo chính là phương sai của các đại
lượng ngẫu nhiên thành phần


CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
• Các hệ số tương quan mẫu:
μ~x j xk
μ~x j xk
R jk
rx j xk = ~
~ = s s ≡ s s , j, k = 1,2,..., m
D x j D xk
x j xk
j k
• Tập hợp các hệ số tương quan mẫu lập thành ma trận tương quan
mẫu chuNn hóa:
• Sử dụng ký hiệu rjk
thay cho ký hiệu rx j xk
⎛ rx1x1 rx1x2 ... rx1xm ⎞


⎜ rx2 x1 rx2 x2 ... rx2 xm ⎟
⎛ r11 r12 ... r1m ⎞

Pxx = ⎜


...
... ... ... ⎟
⎜ r21 r22 ... r2 m ⎟


Pxx = ⎜
⎜ rx x rx x ... rx x ⎟
... ... ... ... ⎟
m 2
m m ⎠
⎝ m1
⎜⎜
⎟⎟
⎝ rm1 rm 2 ... rmm ⎠


×