Tải bản đầy đủ (.pdf) (43 trang)

thống kê nhiều chiều

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.56 MB, 43 trang )

0

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA TOÁN-TIN HỌC



Tiểu luận môn:
THỐNG KÊ NHIỀU CHIỀU
Giảng Viên: PGS.TS Tô Anh Dũng



Thực hiện: Nguyễn Cao Cường
MSSV: 1111039











Tp.HCM 30.6.2014
1

MỤC LỤC


Chương 1: PHÂN PHỐI CHUẨN NHIỀU CHIỀU. 2
Bài 1: Vectơ và ma trận ngẫu nhiên. 2
1. Vectơ ngẫu nhiên và ma trận ngẫu nhiên. 2
2. Ma trận hiệp phương sai. 3
3. Ma trận hệ số tương quan. 5
4. Biểu diễn mẫu dưới dạng ma trận. 7
5. Hàm mật độ của một đại lượng ngẫu nhiên nhiều chiều. 8
6. Sự độc lập thống kê. 9
Bài 2: Phân phối chuẩn nhiều chiều. 9
1. Giới thiệu phân phối chuẩn một chiều. 9
2. Xây dựng cho trường hợp nhiều chiều. 10
Bài 3: Tính chất cũa phân phối chuẩn nhiều chiều. 15
1. Tính chất 1:Tổ hợp tuyến tính. 15
2. Tính chất 2: Tập hợp con của các biến thành phần 17
3. Tính chất 3: Hiệp phương sai 0 và sự độc lập thống kê. 18
4. Tính chất 4: phân phối có điều kiện 19
Bài 4: Mẫu từ tổng thể chuẩn nhiều chiều. 19
1. Ước lượng của



. 19
2. Phân phối mẫu của

. 20
3. Luật số lớn. 20
4. Định lý giới hạn trung tâm. 21
Chương 2:KIỂM ĐỊNH DÙNG THỐNG KÊ
2
T

(HOTELLING) 21
1. Trường hợp 1 chiều 21
2. Trường hợp 2 chiều: 22
Chương 3: PHÂN TÍCH PHƯƠNG SAI NHIỀU CHIỀU. 26
Bài 1: Phân tích một nhân tố (One-way MANOVA). 26
1. Mô hình 26
2. Tổng bình phương và tích chéo: 28
3. Kiểm định tỷ lệ hợp lý Wilk’s 29
Bài 2: Phân tích Profile 34
1. Phân tích Profile (Profile analysis) 34
2. Phân tích Profile: 2 nhóm. 35
3. Phân tích Profile với
k
2
nhóm. 40
2

Chương 1: PHÂN PHỐI CHUẨN NHIỀU CHIỀU.
Bài 1: Vectơ và ma trận ngẫu nhiên.
1. Vectơ ngẫu nhiên và ma trận ngẫu nhiên.
Véctơ ngẫu nhiên là các véctơ có các phần tử ngẫu nhiên. Véctơ ngẫu nhiên
p
-chiều:
12
' (X , , , )
p
XXX

Ma trận ngẫu nhiên là các ma trận có các phần tử là biến ngẫu nhiên. Ma trận ngẫu nhiên
:

np
X M

11 12 1
21 22 2
12


p
p
n n np
X X X
X X X
X X X








X

Kì vọng của vectơ
X
p
-chiều
1
)

()
()
(
p
X
X







E
EX
E

trong đó:
1
( ) ( , , ) , 1, , .
i i i p p
X x f x x dx dx i p
 
 


E

Tương tự, với
{}

ij n p
X

X

( ) , (i, j)
ij
X   E
thì
11 12 1
21 22 2
12
( ) ( ) ( )
( ) ( ) ( )
()
( ) ( ) ( )
p
p
n n np
X X X
X X X
X X X









E E E
E E E
EX
E E E

 Tính chất:
i. Với
1 1,
,
pp
XY

,

là các hằng số thì
( ( ) ( )) ( ) ( )
   
  E X Y E X E Y
.
ii. Với
np
A M
thì
( ) ( )E AX AE X
.
iii. Nếu
1 1,
,
pp
XY

độc lập thì
( ') ( ) ( ')E XY E X E Y
.
iv. Nếu
1p
X
,
,,A B C
là các ma trận hằng, ta có
( ) ( )  E AXB C AE X B C
.
3

Ví dụ 1: Cho
2, 1pn
và xét vectơ ngẫu nhiên
12
' [ , ].XXX
Cho biến ngẫu nhiên
1
X

hàm xác suất:
1
x

-1
0
1
11

()px

0.3
0.3
0.4

Khi đó
1
1 1 1 1
( ) ( ) ( 1)(0.3) 0(0.3) 1(0.4) 0.1
allx
X x p x     

E
.
Và của
2
X

2
x

0
1
22
()px

0.8
0.2


Ta cũng có:
2
2 2 2 2
( ) ( ) 0(0.8) 1(0.2) 0.2
all x
X x p x   

E

Và cuối cùng ta có:
1
2
()
0.1
()
()
0.2
X
X







E
EX
E


2. Ma trận hiệp phương sai.
Xét
X
là vectơ ngẫu nhiên
p
-chiều, phương sai của
X
là:
Var( ) [( )( )'] ( , ')Cov     X E X X X X

Ta gọi

là ma trận hiệp phương sai.
11 12 1
21 22 2
12
p
p
p p pp
  
  
  










,trong đó
,
( , ) [( (( ))( ( )], , j 1, ,n
i j i j i i j j
Cov X X X X X X i

    E E E
là hiệp phương sai của
các cặp biến ngẫu nhiên
( , )
ij
XX
thành phần.
 Ta có
2
( , ) ( )
ii i j i i
Cov X X Var X

  
.
 Nếu
X
có (vec tơ) kỳ vọng

và ma trận hiệp phương sai

, ta kí hiệu
( , )


X
.
4

 Với
( , )
XX

X

( , )
YY

Y
, ma trận hiệp phương sai giữa
X

Y

Cov( , ) [( )( )] ( ')
X Y X Y
   
    X Y E X X E XY

 Tính chất:
Với
' ( , , )aaa

, ( )

np
AB M
ta có:
i.
Cov( ) ( ') ( )( ( ))'X E XX E X E X

ii.
( ' ) 'Var( ) '
i j ij
ij
Var a a

   

a X a X a a a

iii.
( ) ( ) 'Var VarAX a A X A

iv.
( , ) ( , ) ( , )Cov Cov Cov  X Y Z X Z Y Z

v.
Var( ) Var( ) Var( ) ( , ) ( , )Cov Cov    X Y X Y X Y Y X

vi.
Cov( ) ( , ) 'CovAX BY A X Y B

Ví dụ 2: Tìm ma trận hiệp phương sai cho hai biến ngẫu nhiên
1

X

2
X
cho trong bài tập 2, với
hàm xác suất chung
12 1 2
( , )p x x
được thể hiện trong bảng sau:

2
x

1
x



0 1

11
()px

-1
0
1
0.24 0.06
0.16 0.14
0.4 0.00
0.3

0.3
0.4
22
()px

0.8 0.2
1

Ta có:
1 1 2 2
(X ) 0.1, (X ) 0.2EE

   
. Áp dụng công thức, ta có:
1
2
12
22
11 1 1 1 1 1
22
22 2 2 2 2 2
12 1 1 2 2 1 2 12 1 2
( , )
21 2 2
(X ) ( 0.1) ( ) 0.69
(X ) ( 0.2) ( ) 0.16
(X )(X ) ( 0.1)( 0.2) ( , )
( 1 0.1)(0 0.2)(0.24) (1 0.1)(1 0.2)(0.00) 0.8
(X
all x

all x
all x x
E x p x
E x p x
E x x p x x
E


  

    
    
     
         




1 1 1 1 2 2
)(X ) (X )(X ) 0.8E
  
     

Do đó, với
12
' [X ,X ]X
,
11
22
(X )

0.1
()
(X )
0.2
E
E
E



   

   
   


   
X

5


2
1 1 1 1 2 2
2
2 2 1 1 2 2
2
1 1 1 1 2 2
2
2 2 1 1 2 2

11 12
21 22
( )( )'
(X ) (X )(X )
(X )(X ) (X )
(X ) (X )(X )
(X )(X ) (X )
0.69 0.8
0.8 0.16
E
E
EE
EE

  
  
  
  


   

  


  


  



  










XX

 Ma trận hiệp phương sai mẫu:
- Ma trận biểu diễn dữ liệu mẫu
11 12 1
21 22 2
12
p
p
np
n n np
x x x
x x x
x x x










X

- Véctơ trung bình mẫu
x
là một ước lượng cho vec tơ kì vọng

:
1
2
p
x
x
x
x








với
,
1

n
ij
i
j
x
x
n




- Ma trận hiệp phương sai mẫu
S
là một ước lượng của

:
11 12 1
21 22 2
12
,
p
p
p p pp
s s s
s s s
s s s









S

trong đó
1
1
( )( )
1
n
ij ki i kj j
k
s x x x x
n

  


,

ij ji
ss

3. Ma trận hệ số tương quan.
Hệ số tương quan giữa hai biến ngẫu nhiên (
,
ij
XX

), được định nghĩa như sau:
( , )
( ) ( )
i j ij
ij
ij
ij
Cov X X
Var X Var X





6

Xét véctơ ngẫu nhiên
p
-chiều
1
' ( , , )
p
XXX
, ma trận hệ số tương quan của
X
là:
12 1
21 2
12
1

1
1
p
p
pp











P

Đặt
11
22
1/2
1/
1/
1/
pp












D

Ta có:
1/2 1/2
1/2 1/2



P D D
D PD

 Ma trận hệ số tương quan mẫu:
- Ma trận hệ sô tương quan mẫu
R
là một ước lượng của ma trận hệ số tương quan
P
:
12 1
21 2
12
1
1
1

p
p
pp
rr
rr
rr








P

,với
r
ij
ij
ii jj
s
ss

.
Đặt
11
22
1/2
1/

1/
1/
S
pp
s
s
s








D

,ta có:
1/2 1/2
1/2 1/2
SS
SS



S D RD
R D SD

Ví dụ 3: Cho ma trân hiệp phương sai:
7


11 12 13
21 22 23
31 32 33
4 1 2
1 9 3 ,
2 3 25
  
  
  
   
   
   
   
   

   

Tìm
1/2
D

P
.
Ta có:
11
1/2
22
33
1/

200
1/ 0 3 0
0 0 5
1/















D
;
1/2
1/ 2 0 0
0 1/ 3 0
0 0 1/5








D

Áp dụng công thức, ta có:
1/2 1/2
1/ 2 0 0 4 1 2 1/ 2 0 0
0 1/ 3 0 1 9 3 0 1/ 3 0
0 0 1/ 5 2 3 25 0 0 1/ 5
1 1/ 6 1/ 5
1/ 6 1 1/ 5
1/ 5 1/ 5 1

    
    
   
    
    

    







P D D

4. Biểu diễn mẫu dưới dạng ma trận.

Véctơ trung bình mẫu:
1
11 21 1
2
12 22 2
12
1
1
11
'1
1
n
n
n
p p np
p
x
x x x
x x x
x
x
nn
x x x
x










  











X
.
Để ý rằng:
 
12
12
'
12
12
1
1
1
1 ' 1 1 , , ,
1
p

p
p
n n n
p
x x x
x x x
x x x x
n
x x x






  







X
.
8

Do đó:
12
11 21 1

12
12 22 2
'
12
12
1
1 1 ,
p
n
p
n
nn
p
p p np
x x x x x x
x x x x x x
n
x x x x x x

  

  





  

XX


Suy ra biểu diễn dạng ma trận của ma trận hiệp phương sai là:
''
''
'
1 1 1
( 11 )'( 1 1 )
1
1 1 1
'( 1 1 )'( 11 )
1
11
'( 1 1 )
1
n n n n
n n n n
nn
n n n
n n n
nn
  

  



S X X X X
X I I X
X I X


Với
1/2
11
(1/ , ,1/ )
S pp
diag s sD

, suy ra biểu diễn dạng ma trận hệ số tương quan mẫu là:
1/2 1/2 1/2 ' 1/2
11
'( 11 )
1
S S S n n S
nn
  

R D SD D X I XD

5. Hàm mật độ của một đại lượng ngẫu nhiên nhiều chiều.
a. Định nghĩa.
Ta nói rằng đại lượng ngẫu nhiên là liên tục nếu tồn tại hàm số
: ( , ) : [0, ),
nn
f

     

sao cho
21
1 2 1 2 1 2

( ) ( ) ( , , , ) , ( , , , )
n
x
xx
x
n
X n n n
F x f t dt f t t t dt dt dt x x x x
   
    
   
.
Lúc đó hàm
f
được gọi là hàm mật độ xác suất (SX) của ve tơ NN
X
.
b. Tính chất.
i.
21
21
1 2 1 2
(( , ]) ( ) ( , , , ) , ,
n
n
b
bb
b
n
X n n

a a a
a
P a b f t dt f t t t dt dt dt a b   
   

ii.
( ) . ( )t f t dt




EX

9

iii.
Var( ) ( ( )).( ( )) . ( )t t f t dt


  

T
X E X E X
.
6. Sự độc lập thống kê.
- Xét vec tơ ngẫu nhiên
p
-chiều:
1
( , , )

p
XXX

,có hàm mật độ xác suất đồng thời là:
12
( ) ( , , , )
p
f x f x x x
.
- Nếu
i
X

j
X
độc lập thống kê thì
( , ) ( ) ( )
ij i j i i j j
f x x f x f x


Suy ra
0
ij


.
- Nếu
2
C

p
cặp biến ngẫu nhiên
( , )
ij
XX
độc lập thống kê thì
1 1 2 2
( ) ( ). ( ) ( ),
pp
f x f x f x f x

Suy ra
0 ( , )
ij
ij


.
- Hiệp phương sai của hai biến ngẫu nhiên bằng 0, suy ra hai biến đó độc lập thống kê.
Tuy nhiên chiều ngược lại chỉ đúng cho trường hơp
X
có phân phối chuẩn nhiều
chiều.

 Tổng quát
i. Độc lập thống kê suy ra hiệp phương sai bằng 0.
ii. Hiệp phương sai bằng 0, chưa thể khẳng định được độc lập thống kê
iii. Hiệp phương sai bằng 0, và phân phối chuẩn nhiều chiều suy ra độc lập thống kê.



Bài 2: Phân phối chuẩn nhiều chiều.
 Phân phối chuẩn nhiều chiều là một mô hình tốt để miêu tả phân phối cho nhiều hiện
tượng khác nhau. Theo định lý giới hạn trung tâm, nhiều biến ngẫu nhiên có thể xấp xỉ
phân phối chuẩn.
 Phân phối mẫu của các thống kê thưởng dùng được xấp xĩ bởi phân phối chuẩn ( một
chiều hay nhiều chiều) do định lý giới hạn trung tâm.
1. Giới thiệu phân phối chuẩn một chiều.
Biến ngẫu nhiên
X
nhận giá trị trong gọi là có phân phối chuẩn với kỳ vọng


phương sai
2

nếu có hàm mật độ xác suất
10

2
1
2
1
( ) ,
22
x
f x e x








    

Khi biến ngẫu nhiên
X
có hàm mật độ xác suất như trên thì ta nói rằng
X
có phân phối
chuẩn
2
N( , )

.
2. Xây dựng cho trường hợp nhiều chiều.
Đại lượng:
2
21
( )( ) ( )
x
xx

  




  




là bình phương khoảng cách từ
x
đến

theo đơn vị của độ lệch chuẩn.
Khi
1p 
,ta có:
1 2 1 2
' ( , , , ), ( , , , )
pp
X X X
   
X


11 12 1
21 22 2
12
p
p
pp
p p pp
  
  
  











Bình phương khoảng cách từ
X
đến

(nếu
1

tồn tại):
1
(x )' (x )


  

,với
, 1, , .
i
x i p    
Tích phân:
1
1
1

(x )' (x )
1/2
22
(2 )
p
p
xx
e



   



Bởi vì tổng xác suất trên tất cả các giá trị có thể nhận được có thể bằng 1, do đó ta chia
cho
1/2
2
(2 )
p


sẽ thu được hàm mật độ xác suất.
Hàm mật độ xác suất của phân phối chuẩn nhiều chiều:
1
1
(x )' (x )
2
1/2

2
1
()
(2 )
p
f x e



   



11

,với
, 1, ,
i
x i p    
.
Kí hiệu
( , )N

X
.
Khi
1p 
, ta có phân phối chuẩn một chiều.
 Khi
2p 

, ta có:
1 1 1 11 12
2 2 2 21 22
()
,,
()
XX
XX
  

  
       
     
       
       
E
XE
E

22 12
1
2
21 11
11 22 12
1


  




  





Nếu thay
12 12 11 22
   

,ta được
22 12 11 22
1
2
11 22 12
21 11 22 11
1
(1 )
   
  
   










Khoảng cách thống kê từ
x
đến


1
22 12 11 22
11
1 1 2 2
2
22
11 22 12
21 11 22 11
22
1 2 2 1 2 2
12
2
12
11 22 11 22
1
(x )' (x )
1
(( ),( ))
(1 )
1
2
(1 )
1
(1

x
xx
x
x x x x

   



  
   
   


   


  






   










      
   

  
      

      


      



22
1 2 12 1 2
2
2
( 2 )
)
z z z z



Hàm mật độ xác suất đồng thời của phân phối chuẩn
2
-chiều có dạng:

22
1 2 2 1 2 2
12
2
11 22 11 22
12
1
2
2(1 )
12
2
11 22 12
1
( , ) .
2 (1 )
x x x x
f x x e
   

   

   

      
   

        

      



      




12


Hình 1: Hàm mật độ đồng thời với
0, 1, 0
i ii
r

  
.

Hình 2: Contour với
0, 1, 0
i ii
r

  
.
13


Hình 3: Hàm mật độ đồng thời với
0, 1, 0.75
i ii

r

  


Hình 4: Contour với
0, 1, 0.75
i ii
r

  
.
 So sánh
0r 

0.75r 
.
Trong các đồ thị trên:
12
0



11 22
0


.
o Với
0r 

:
14


11 22
diag( , )


, là ma trận đường chéo
 Mật độ thì tập trung “ngẫu nhiên” trên mặt phẳng
xy
.
 Khi lấy 1 mặt cắt song song với
xy
, ta thu được một đường tròn.
o Với
0.75r 
.


không phải là ma trận đường chéo.
 Mật độ không ngẫu nhiên trên mặt phẳng
xy
.
 Mật độ có xu hướng tập trung trên một đường thẳng, góc nghiêng của đường
thẳng phụ thuộc vào giá trị của
11


22


và tỷ lệ được sử dụng để vẽ đồ thị.
 Mặt cắt của mật độ chuẩn nhiều chiều.
o Trong trường hợp phân phối chuẩn
2
-chiều, mặt cắt của mật độ chuẩn là một ellipse
có phương trình:
12
(x )' (x ) c


   

mà có xác suất hằng ứng với mọi cặp điểm
12
( , )xx
.
o Các ellipse được gọi là các contour và có tâm là

.
o Ta định nghĩa một contour với mật độ xác suất hằng là {tất cả những điểm
x
thỏa
12
(x )' (x ) c


   
}={Bề mặt của các ellipse có tâm là


}.
3. Contour xác suất.
Giả sử ta có:
2
( , )N

X
với
5 9 16
, 0.67
10 16 64

   
    
   
   

Các contour xác suất với
99%,95%,75%,50%,20%
như hình

Hình 5: Probability contour.
- Contour xác suất : trị riêng và véctơ riêng
15

Đễ tìm các trục của ellipsoid của các contour xác suất ,ta cần xác định các trị riêng và
véctơ riêng của ma trận hiệp phương sai.
 Véctơ riêng
i
e

ứng với trị riêng
i

là nghiệm của
, 1,2, ,
i i i
e e i p

  
, với
pp

đối xứng và
i
e
là véctơ cỡ
( 1)p

 Nếu

là ma trận xác định dương (tức là
1

tồn tại), thì
1
1
e e e e




    
.
- Các trục của ellipsoid
 Các trục của ellipsoid có cùng hướng với các véctơ riêng của
1

(hay

),
chiều dài tỷ lệ với căn bậc hai của các trị riêng của

.
 Cụ thể: các trục của ellipsoid là
ii
ce


với
( , )
ii
e

là (trị riêng, véctơ
riêng) thứ
i
tương ứng của ma trận

.
 Nhận xét:
1.

12
(x )' (x )
p
  

  
( nếu
0
).
2. Phần bên trong của ellipsoid của các giá trị
x
thỏa
1 2 2
x )' (x ) ( )
p
c
   

    

,có xác suất
(1 )


. Trong đó
2
()
p

là phân vị mức

(1 )100%


của biến ngẫu nhiên Chi bình phương với
p
bậc tự
do.
Bài 3: Tính chất cũa phân phối chuẩn nhiều chiều.
Nếu
( , )

X
thì
i. Tổ hợp tuyến tính của các biến thành phần của
X
có phân phối chuẩn (nhiều chiều).
ii. Tất cả các tập con chọn từ các biến thành phần của
X
có phân phối chuẩn nhiều chiều.
iii. Hiệp phương sai bằng 0, suy ra các thành phần tương ứng của
X
độc lập thống kê.
iv. Phân phối có điều kiện cúa các biến thành phần của
X
có phân phồi chuẩn nhiều chiều.
1. Tính chất 1:Tổ hợp tuyến tính.
- Nếu
( , )
p
N


X
và với
12
' ( , , , )
p
a a aa
bất kì, tổ hợp tuyến tính
1 1 2 2
'
pp
a X a X a X   aX
có phân phối
1
' ( ' , ' )N

a X a a a
.
- Ngược lại, nếu
' ( ' , ' )N

a X a a a
với mọi
a
, thì
X
thì có phân phối
( , )
p
N



.
Ví dụ 4: Xét tổ hợp tuyến tính
'aX
của vec tơ ngẫu nhiên nhiều chiều cho bởi
' [1,0, ,0]a
. Ta
có,
16

1
2
' [1,0, ,0]
p
X
X
X








aX

,và
1

2
1
' [1,0, ,0]
p












a

Ta có:
11 12 1
21 22 2
11
12
1
0
' ' [1,0, ,0]
0
p
p
p p pp

  
  

  






  







aa

Theo kết quả trên, ta có
1 1 11
( , )XN

.

- Nếu
( , )
p
N


X
thì
q
tổ hợp tuyến tính
11 12 1 1
12 22 2 2
1
12
p
p
q q p
q q qp p
a a a X
a a a X
X
a a a X

  
  
  

  
  
  
  
YA

,có phân phối
( , ')

q
N

AAA
.
- Tương tự, nếu
dY AX
với
1q
d

là một véctơ hằng, thì
Y ( , ')
p
Nd

A A A
.
Ví dụ 5: Cho
3
( , )N

X
, tìm phân phối của:
1
12
2
23
3
1 1 0

0 1 1
X
XX
X
XX
X
















AX

Theo kết quả trên, phân phối của
AX
là chuẩn nhiều chiều với trung bình:
17

1

12
2
23
3
1 1 0
0 1 1





















A

,và ma trận phương sai là:

11 12 13
11 12 22 12 23 22 13
21 22 23
12 23 22 13 22 23 33
31 23 33
10
2
1 1 0
'
11
2
0 1 1
01
  
      
  
      
  


    





  






    








AA


2. Tính chất 2: Tập hợp con của các biến thành phần.
- Nếu
( , )
p
N

X
thì tất cả tập con chọn từ các biến thành phần của
X
có phân
phối chuẩn (nhiều chiều).
Ví dụ chia
X
thành hai tập con
1
1( )

1
1
2(( ) 1)
qq
p
q
pq
p
X
X
X
X
X



















X
X

1
1( )
1
1
2(( ) 1)
qq
p
q
pq
p
X
X
X
X
X



















X
X
.
Phân chia ma trận hiệp phương sai
11( ) 12( ( ))
11 12
21(( ) ) 22(( ) ( )) 21 22
|
|
||
q p q p q
pp
p q p p q p q
  

    




  




   



Do đó:
1( )
2(( ) 1)
q
pq





X
X
X

, có phân phối của các tập con thanh phần là
1 1 11 2 2 22
( , ), ( , )NN

   XX

Nghĩa là
 Mỗi biến
, 1, ,
i
X i p

thanh phần có phân phối chuẩn 1 chiều
 Tất cả các tập con có thể có được phân phối chuẩn nhiều chiều.
 Tất cả các phân phối biên có phân phối chuẩn.
Ví dụ 6: Nếu
5
( , )N

X
, tìm phân phối của
2
4
X
X



. Chúng ta đặt,
18

2
1
4
X
X




X
,

2
1
4







,
22 24
11
24 44







, trong bài tập này
X
,

,

được sắp xếp và phân chia tương ứng là
2
4

1
3
5
X
X
X
X
X









X
,
2
4
1
3
5
















,
22 22
22 22 22
24 24
24 24 24
13 15
12 14 11
23 34 13
33 35
25 45 15
35 55

  

  

  
  

  














, hoặc
1
21
2
31
X
X









X
,

1
21
1
2
31












,
11 12
2 2 2 3
21 22
3 2 3 3













Từ kết quả trên, có
2
1
4
X
X




X

Chúng ta có phân phối
2 22 24
2 1 11 2
4 24 44
( , ) ,NN
  

  

   


   
   


.
3. Tính chất 3: Hiệp phương sai 0 và sự độc lập thống kê.
- Nếu
1
X
có cỡ
1
( 1)q 

2
X
có cỡ
2
( 1)q 
độc lập thống kê thì
1 2 12
Cov( , ) 0  XX
.
- Nếu
12
1 1 11 12
2 2 21 22
|
,
|
qq
N





     


     


     

X
X

,thì
12
,XX
độc lập thống kê khi và chỉa khi
12 21
'0   
.
- Nếu
12
,XX
độc lập thống kê và có phân phối
1 1 11
( , )
q
N



,
2 2 22
( , )
q
N


tương ứng,
thì
12
1 1 11 12
2 2 21 22
|
,
|
qq
N




     


     


     

X

X

19

Ví dụ 7: Đặt
3
31
( , )N


X
với
4 1 0
1 3 0
0 0 2







Hỏi
12
,XX
có độc lập không?
12
( , )XX
với
3

X
?
Từ
12
,XX
có sai
12
1


, ta có không đôc lập. Tuy nhiên, phân vùng của
X



1
2
3
X
X
X







X
,

11 12
2 2 2 1
21 22
1 2 1 1
4 1 0
1 3 0
0 0 2









  








Ta thấy
1
1
2
X

X




X

3
X
có hiệp phương sai là
12
0
0




. Do đó,
12
( , )XX

3
X
độc lập bởi kết
quả trên.

4. Tính chất 4: phân phối có điều kiện
Xét
1 2 1 2
1( 1) 2( 1)

' ( , ) ( , )
q q q q
N

  
X X X
với
1
2








11 12
21 22
|
|







,và
0

(

là ma trận xác định dương). Thì phân phối có điều kiện biên của
1
X
cho
trước
22
xX
là phân phối chuẩn ( nhiều chiều) có véctơ kỳ vọng và ma trận hiệp phương
sai là
12
12
| 1 12 22 2 2
| 11 12 22 21
' ( )
'
x
x
x
  
   
     
X
X


Bài 4: Mẫu từ tổng thể chuẩn nhiều chiều.
1. Ước lượng của




.
Giả sữ ta có 1 phân phối chuẩn
p
-chiều với véctơ kì vọng

và ma trận hiệp phương sai

.
20

Quan trắc ngẫu nhiên
n
vec tơ
12
, , ,
n
x x x
( mỗi véctơ có cỡ
1p
).
( , ), 1,2, ,
jp
N j n

X
và độc lập
Khi
1p 

, ta biết các ước lượng hợp lý cực đại (MEL) của


2

là :
1
1
n
j
j
X
n





22
1
1
()
n
j
j
XX
n






, trong đó
2
( , )XN
n



22
1
2
1
1
()
n
jn
j
XX






.
Khi
1p 
, ước lượng hợp lý cực đại của



1
1
n
j
j
XX
n





, và của

là:
2
1
11
( )( )'
n
n j j
j
n
XX
nn



     


SS
.
2. Phân phối mẫu của

.
Ước lượng

là tổ hợp tuyến tình của các vec tơ ngẫu nhiên chuẩn độc lập và có cùng
phân phối
( , )
p
N


:
12
1 1 1

n
X X X X
n n n

    

Do vậy,
X


có phân phối chuẩn

1
( , )
p
XN
n


.
Ước lượng của

:
1n
n

 S

Ma trận
1
(n 1) ( )( )'
n
jj
j
X X X X

   

S

,có phân phối Wishart với
(n 1)

bậc tự do.
 Phân phối Wishart:
- Là một phân phối nhiều chiều dựa theo phân phối Chi binh phương.
- Định nghĩa:
(.| )
m
W
= Phân phối Wishart với
m
bậc tự do
= Phân phối của
'
1
ZZ
n
jj
j


Với
Z (0, )
jp
N 
. Chú ý:
X

S
độc lập.
3. Luật số lớn.
- Dữ liệu khảo sát không phải luôn luôn có phân phối chuẩn nhiều chiều.

21

- Luật số lớn: Xét
12
, , ,
n
X X X
là các quan trắc độc lập từ một tổng thể có kỳ vọng
()

EX
. Khi đó:
P

X

P
n
S

,khi
n 
.
- Phát biểu trên đúng bất kể phân phối của
j
X
.
4. Định lý giới hạn trung tâm.
Xét
12

, , ,
n
X X X
là các quan trắc độc lập chọn từ một tổng thể có kỳ vọng
()

EY

ma trận hiệp phương sai

hữu hạn ( không suy biến, hạn đầy đủ).
Khi đó,
( ) (0, )
p
nN

X
khi
np

Do vậy, với
n
lớn
1
( , )N
n

X
bất kể phân phối của
j

X
.
Trường hợp

không biết, nếu
n
đủ lớn,
S
sẽ gần bằng với

, khi đó
( ) (0, )
p
nN

XS
hay
1
( , )N
n

XS
.
 Nhận xét:
- Sử dụng
S
thay vì

không làm ảnh hưởng nhiều đến sự xấp xỉ.
-

n
phải rất lớn so với
p
, nghĩa là
np
phải lớn.
- Contour xác suất của
X
chặt hơn so với
X
bởi vì ta sử dụng (
1
n

) cho
X
thay vì
dùng

cho
X
.



Chương 2:KIỂM ĐỊNH DÙNG THỐNG KÊ
2
T

(HOTELLING)

1. Trường hợp 1 chiều
 Khảo sát 1 đặc tính X được quan tâm.X là biến ngẫu nhiên có kỳ vọng

và phương sai
2


 Chọn mẫu,ta thu được n quan trắc chọn từ tổng thể:Trong đó
( 1,2, , )
i
X i n
là các biến
độc lập và có cùng phân phối
 Khi cỡ mẫu nhỏ,ta cần thêm giả thiết
2
( , )
i
XN

.
 Giả thiết:
00
:H



10
:H




Với
0

là giá trị cần kiểm định
22

Thống kê kiểm định
0
/
X
T
Sn




Nếu
0
H
đúng,
( 1)T t n 
(khi cỡ mẫu lớn thì
(0,1)TN
)
Kết luận:Bác bỏ
0
H
khi
P value



với

là mức ý nghĩa của kiểm định
Khoản tin cậy với độ tin cậy 100%(1-

) cho là tập hợp các giá trị quan trắc sao cho
1
1 /2
/
n
x
t
Sn






hay
11
1 /2 1 /2
( , )
nn
ss
x t x t
nn






2. Trường hợp 2 chiều:
 Gỉa sử X có p thành phần ,có phân phối chuẩn nhiều chiều với trung bình

và ma trận
hiệp phương sai

.Như trong trường hợp một chiều,tất cả các thành phần của

chưa
biết.
 Giả thiết:
1 01
0
0
:
pp
H


   
   

   
   
   


1 01
1
0
:
pp
H


   
   

   
   
   

 N vec-tơ quan sát độc lập được đưa vào X và ước lượng
X
và S là ước lượng của




Bình phương thống kê kiểm định:
2
2 2 1
0
00
2
()
( )( ) ( )

/
X
T n X S X
Sn




   

2
T
là bình phương khoản cách thông kê giữa trung bình mẫu và giá trị kiểm định
0


Phân phối của
2
T
:
21
0 0 1, 1
( )( ) ( )
n
n X S X F






Thống kê Hotelling’s
2
T

Ta thu được
2 2 1
00
( )( ) ( )T n X S X


  

trong đó:
1
1
1
n
p
j
j
XX
n




,
0 01 02 0
' ( , , , )
p

   

,
23

2
T
được gọi là thống kê hotelling với
2
T

,
( 1)
()
p n p
n
F
np




Kiểm định giả thiết dùng
2
T

Với mứa ý nghĩa

ta có
2

,
( 1)
[ ( )]
()
p n p
n
P T F
np






=
21
0 0 ,
( 1)
[ ( )( ) ( ) ( )]
()
p n p
n
P n X S X F
np
  



  



Bác bỏ
0
H
khi p-value


với p-value =
2
,
()
[]
( 1)
p n p
np
P F T
n





Ví dụ 8: Cho ma trận dữ liệu:
69
10 6
83







X

Kiểm định:
0
9
:
5
H






Ta có:
1
8 4 3 1/ 3 1/ 9
,,
6 3 9 1/ 9 4/27
x


     
  
     

     
SS


Tính
2
T
:
21
00
( )' ( )
1/ 3 1/ 9 1
7
3[ 1,1]
1/ 9 4 / 27 1
9
Tn


  

   
  
   
   
X S X

Với
0.05


, ta có
2,1

(0.05) 199.51F 
.
2,1
( 1)
(0.05) 4 199.51 798.04
()
np
F
np

  


Bác bỏ
0
H
khi
2
2,1
( 1)
(0.05)
()
np
TF
np



.


2
0.778 798.04T 
suy ra chưa đủ cơ sở để bác bỏ
0
H
. Tính
p
-giá trị:
p
-giá trị=
2,1
( 4 0.778) 0.625 0.05F    P

24

Ví dụ 9: Cho bảng dưới đây mô tả ba biến:
1
y
là lượng calcium khả dụng trong

đất,
2
y
là lượng calcium được chuyển hóa,
3
y
là lượng calcium có trong cây cải xanh.
Địa điểm
1
y


2
y

3
y

1
2
3
4
5
6
7
8
9
10

35
35
40
10
6
20
35
35
35
30

3.5

4.9
30.0
2.8
2.7
2.8
4.6
10.9
8.0
1.6

2.8
2.70
4.38
3.21
2.73
2.81
2.88
2.90
3.28
3.20


Ta có:
10, 3np
. Kì vọng của
1
15.0y 
,
23
6.0, 2.85yy

.
Kiểm định giả thuyết :
0
15.0
: 6.0
2.85
H







.
Ta có:
28.1 140.54 49.68 1.94
7.18 , 49.68 72.25 3.68
3.09 1.94 3.68 0.25
   
   

   
   
   
yS

Tính
2
T

:
21
00
'
( )' ( )
140.54 49.68 1.94
28.1 15 28.1 15
10 49.68 72.25 3.68 24.559
7.18 6.0 7.18 6.0
1.94 3.68 0.25
3.09 2.85 3.09 2.85
Tn


  


   

   



   

   

   

y S y


Tra bảng
2
T
, ta có giá trị tới hạn
2
0.05,3,9
16.766T 
, vậy giá trị quan sát của
2
T
vướt xa giá trị giới
hạn, ta quyết định bác bỏ giả thuyết
0
H
.

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×