Tải bản đầy đủ (.pdf) (43 trang)

Một số bài toán thống kê xử lý bằng excel luận văn thạc sĩ toán học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (438.19 KB, 43 trang )

1
MỤC LỤC
Trang
LỜI NÓI ĐẦU .................................................................................................. 3
KIẾN THỨC CƠ SỞ......................................................................................... 5
1.1. Khái niệm biến ngẫu nhiên................................................................... 5
1.1.1. Định nghĩa biến ngẫu nhiên........................................................... 5
1.1.2. Định nghĩa biến ngẫu nhiên rời rạc................................................ 5
1.1.3. Định nghĩa biến ngẫu nhiên liên tục .............................................. 5
1.2. Các quy luật phân phối xác suất thường gặp ........................................ 6
1.2.1. Quy luật không-một A(p) .............................................................. 6
1.2.2. Quy luật phân phối nhị thức B(n, p) .............................................. 6
1.2.3. Quy luật phân phối xác suất của tần suất ....................................... 6
1.2.4. Quy luật phân phối Poisson P() ................................................... 7
1.2.5. Quy luật phân phối đều U[a,b] ...................................................... 7
1.2.6. Quy luật phân phối mũ .................................................................. 7
1.2.7. Quy luật phân phối chuẩn N(, 2)................................................ 8
1.2.8. Quy luật phân phối ‘‘khi bình phương’’ 2(n) ............................... 9
1.2.9. Quy luật phân phối Student T(n).................................................... 9
1.2.10. Quy luật phân phối Fisher F(n, m) ............................................... 10
1.3. Khái niệm thống kê ............................................................................ 10
1.3.1. Định nghĩa mẫu ngẫu nhiên......................................................... 10
1.3.2. Định nghĩa thống kê .................................................................... 11
1.3.3. Giá trị quan sát của thống kê ....................................................... 11
1.3.4. Trung bình mẫu ........................................................................... 11
2
1.3.5. Phương sai mẫu S ....................................................................... 12
*2
1.3.6. Phương sai S ............................................................................. 12
1.3.7. Tần suất mẫu ............................................................................... 12
1.4. Các phân phối xác suất của một số thống kê ...................................... 13


1.4.1. Phân phối xác suất của trung bình mẫu........................................ 13
1.4.2. Phân phối xác suất của phương sai mẫu ...................................... 14
1.4.3. Phân phối Student T(n)................................................................ 15
1.4.4. Phân phối Fisher.......................................................................... 16
SỬ DỤNG EXCEL ĐỂ XỬ LÝ THỐNG KÊ MỘT SỐ BÀI TOÁN KINH TẾ
XÃ HỘI........................................................................................................... 17


2
2.1. Ước lượng tham số. Kiểm định giả thuyết thống kê. Phân tích phương
sai ………………………………………………………………………..17
2.1.1. Ước lượng tham số ...................................................................... 17
2.1.2. Kiểm định giả thuyết thống kê..................................................... 23
2.1.2.1. Kiểm định giả thuyết thống kê về giá trị trung bình..................... 25
2.1.2.2. Kiểm định giả thuyết về phương sai ............................................ 27
2.1.3. Phân tích phương sai ................................................................... 28
2.2. Ứng dụng Excel tính các đặc trưng thống kê của một số bài toán kinh
tế xã hội....................................................................................................... 30
2.2.1. Ứng dụng vào ước lượng tham số................................................ 32
2.2.2. Ứng dụng vào kiểm định giả thuyết thống kê .............................. 35
2.2.3. Ứng dụng vào phân tích phương sai ............................................ 38
KẾT LUẬN.................................................................................................... 42
TÀI LIỆU THAM KHẢO............................................................................. 43


3

LỜI NÓI ĐẦU
Ước lượng tham số, kiểm định giả thuyết thống kê, phân tích phương sai
là một trong những phép so sánh có phạm vi ứng dụng rộng rãi trong nhiều lĩnh

vực như khoa học tự nhiên, khoa học xã hội và đem lại hiệu quả trong sự phát
triển của xã hội, nhất là lĩnh vực kinh tế.
Trong thực tế, để giải quyết các bài toán kinh tế xã hội bằng cách tính
thông thường sẽ gặp khó khăn vì thường các bài toán này có số liệu khá lớn và
phức tạp.
Như chúng ta đã biết có rất nhiều phần mềm nghiên cứu xử lý các nguồn
dữ liệu thống kê một cách nhanh chóng và đem lại hiệu suất cao như
Statgraphics, Microsoft Excel…Đặc biệt từ những năm cuối thế kỷ XX, đầu thế
kỷ XXI công nghệ thông tin bùng nổ, ứng dụng của các phần mềm ngày càng
được chú trọng. Vì thế chức năng cải tiến phần mềm Excel cũng được các
chuyên gia phần mềm nghiên cứu nhằm nâng cao độ chính xác của chức năng
thống kê, điều đó sẽ giúp cho chúng ta có thể giải quyết các bài toán thống kê
có số liệu lớn, phức tạp được chính xác hơn.
Hiện đã có thêm một số bài báo mới viết về việc xử lý các nguồn dữ liệu
thống kê, tuy nhiên ở Việt Nam vẫn chưa đề cập đến những vấn đề chúng tôi
đang tìm hiểu. Trong khuôn khổ của bài luận văn này chúng tôi dựa vào bài báo
của Guy Mélard và B.D. McCullough sẽ tìm hiểu, và đi vào sử dụng phần mềm
Excel với nhiều tính năng có thể xử lý các bài toán thống kê trong đó có các bài
toán kinh tế xã hội mang tính thực tiễn cao.
Luận văn gồm hai chương:
Chương 1. Kiến thức cơ sở
1.1. Khái niệm biến ngẫu nhiên
1.2. Các quy luật phân phối xác suất thường gặp


4
1.3. Khái niệm thống kê
1.4. Các phân phối xác suất của một số thống kê
Chương 2. Sử dụng Excel để xử lý thống kê một số bài toán kinh tế xã
hội. Đây là nội dung chính của luận văn, gồm các nội dung:

2.1. Ước lượng tham số. Kiểm định giả thuyết thống kê. Phân tích phương sai
2.2. Ứng dụng Excel tính các đặc trưng thống kê của một số bài toán kinh
tế xã hội
Luận văn được hoàn thành tại trường Đại học Vinh dưới sự hướng dẫn
tận tình của thầy giáo TS. Nguyễn Trung Hoà. Tác giả xin được bày tỏ lòng
biết ơn sâu sắc đến thầy giáo đã dành cho tác giả những sự quan tâm và giúp đỡ
trong quá trình hoàn thành luận văn.
Qua đây tác giả xin chân thành cảm ơn tới các thầy cô giáo trong khoa
Toán và phòng Sau Đại học Trường Đại học Vinh, đặc biệt là các thầy cô giáo
trong tổ Xác suất và Thống kê Toán học, cùng các bạn học viên cao học 18Toán, những người đã quan tâm, giúp đỡ tạo điều kiện thuận lợi cho tác giả
trong quá trình học tập và thực hiện luận văn này.
Rất mong sự đóng góp chỉ bảo của các thầy cô giáo và bạn bè.
Vinh, tháng 10 năm 2012
Tác giả


5
CHƯƠNG I

KIẾN THỨC CƠ SỞ
Chương này trình bày một số kiến thức cơ sở xác suất thống kê. Các khái
niệm về biến ngẫu nhiên, các quy luật phân phối xác suất thường gặp, khái
niệm thống kê, các phân phối xác suất của một số thống kê.

1.1. Khái niệm biến ngẫu nhiên
1.1.1. Định nghĩa biến ngẫu nhiên
Giả sử (, , ) là không gian xác suất. Khi đó ánh xạ
:  

được gọi là biến ngẫu nhiên nếu với mọi tập con A   : ( )  r , trong

đó r   ta cũng có   
Nếu biến ngẫu nhiên X chỉ nhận hữu hạn giá trị, thì nó được gọi là biến
ngẫu nhiên đơn giản .
Biến ngẫu nhiên còn được gọi là đại lượng ngẫu nhiên.
1.1.2. Định nghĩa biến ngẫu nhiên rời rạc
Một biến ngẫu nhiên gọi là biến ngẫu nhiên rời rạc nếu nó chỉ nhận một
số hữu hạn hoặc đếm được giá trị.
1.1.3. Định nghĩa biến ngẫu nhiên liên tục
Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu hàm phân
phối F(x) của nó là hàm liên tục và tồn tại hàm số p(x) sao cho
1. p  x   0 ;   x   .
x

2. F  x    p  t dt ;   x   .
Hàm số p(x) nêu trên được gọi là hàm mật độ xác suất của X.


6

1.2. Các quy luật phân phối xác suất thường gặp
1.2.1. Quy luật không-một A(p)
Định nghĩa. Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật 0-1
với tham số p nếu X là biến ngẫu nhiên rời rạc nhận một trong hai giá trị 0 hoặc
1 với xác suất tương ứng là 1- p và p. Ký hiệu là X  A(p).
Các tham số đặc trưng của A(p) là
   ,

D  (1  ) .

1.2.2. Quy luật phân phối nhị thức B(n, p)

Định nghĩa. Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật phân
phối nhị thức với các tham số n (nguyên dương) và p (dương) nếu X là biến
ngẫu nhiên rời rạc nhận tập các giá trị là 0, 1, …, n với các xác suất
   i  Cni p i 1  p 

n i

.

Ký hiệu là X  B(n, p).
Các tham số đặc trưng của B(n, p) là
  np ,
D   np (1  p ) .

1.2.3. Quy luật phân phối xác suất của tần suất
Nếu trong n phép thử độc lập Bernulli ta thay việc đếm tần số ni bởi việc
tính tần suất ni / n thì biến ngẫu nhiên X có quy luật phân phối nhị thức theo tỉ
lệ, còn gọi là quy luật phân phối xác suất của tần suất .
Như vậy các tham số đặc trưng là
  p ,
D   p(1  p ) / n .


7
1.2.4. Quy luật phân phối Poisson P()
Định nghĩa. Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật phân
phối Poisson với tham số  (dương) nếu X là biến ngẫu nhiên rời rạc nhận tập
vô hạn các giá trị là 0 ; 1 ; 2 ; … ; n;… với các xác suất nhận giá trị i là
P{X = i} = ( i e   ) / i !
Ký hiệu là X  P ( ) .

Các tham số đặc trưng của P ( ) là
   ,
D   .

1.2.5. Quy luật phân phối đều U[a,b]
Định nghĩa. Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật phân phối
đều nếu hàm mật độ xác suất có dạng
 1
,
f(x) =  a  b
 0,

x  [a, b]

.
x  [a, b]

Trong đó: X là biến ngẫu nhiên liên tục, a là giá trị cực tiểu, b là giá trị
cực đại.
Ký hiệu X  U[a,b].
Các tham số đặc trưng của U[a,b] là
  (a  b) / 2 ,
D   (b  a )2 / 12 .

1.2.6. Quy luật phân phối mũ
Định nghĩa. Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật phân
phối mũ tham số  > 0 nếu hàm mật độ của nó có dạng

f ( x)  



 e x ,
0,

x0
x0 .


8
Các tham số đặc trưng là
 

1
,


D 

1
.
2

1.2.7. Quy luật phân phối chuẩn N(, 2)
Định nghĩa. Biến ngẫu nhiên liên tục X nhận giá trị trong khoảng
( ,  ) được gọi là tuân theo quy luật phân phối chuẩn với các tham số  và

 2 , nếu hàm mật độ xác suất có dạng
p ( x ) =

1




 2

e

( x   )2
2 2

.

Ký hiệu X  N(  ,  2 ).
Các tham số đặc trưng của X  N(  ,  2 )là
   ,
D   2 .

Bằng cách đổi biến, đặt U 




ta nhận được biến ngẫu nhiên

U  N(0, 1). Biến ngẫu nhiên U này được gọi là biến ngẫu nhiên có phân phối

chuẩn hoá.
Với U ta có hàm mật độ là
pU ( x) =


1
2

e



x2
2

.

Như vậy các tham số đặc trưng của U là
  0 ,

D  1 .

Định nghĩa. Giá trị tới hạn chuẩn mức  , ký hiệu U  , là giá trị của biến
ngẫu nhiên U  N(0, 1) thoả mãn điều kiện


9
P( U > U  ) =  .
1.2.8. Quy luật phân phối ‘‘khi bình phương’’ 2(n)
Định nghĩa. Biến ngẫu nhiên X được gọi là biến ngẫu nhiên tuân theo
quy luật phân phối ‘‘khi bình phương’’ với n bậc tự do nếu nó là tổng bình
phương của n biến ngẫu nhiên độc lập, có cùng quy luật phân phối chuẩn hoá.
Nghĩa là nếu n biến ngẫu nhiên độc lập,  i  N(0, 1) với i =1, 2, …,n và
n


 =



2
i

  2 ( n)

i1

thì X được gọi là biến ngẫu nhiên tuân theo quy luật phân phối ‘‘khi bình
phương’’ với n bậc tự do.
Ký hiệu    2 (n) .
 2 là biến ngẫu nhiên liên tục nhận giá trị trong khoảng (0, ) .

Ý nghĩa quy luật phân phối ‘‘khi bình phương’’. Nếu 1 ,  2 ,…,  n
là biến ngẫu nhiên độc lập, có phân phối chuẩn hoá thì
12 +  22 +… +  2n

có phân phối  2 với n bậc tự do.
Các tham số đặc trưng của    2 (n) là
 2  n,
D  2 = 2n.

1.2.9. Quy luật phân phối Student T(n)
Định nghĩa. Biến ngẫu nhiên T được gọi là tuân theo quy luật phân
phối Student với n bậc tự do nếu nó là biểu thức sau của biến ngẫu nhiên
T


U
.
V
n

Trong đó U là biến ngẫu nhiên có phân phối chuẩn hoá và V là biến
ngẫu nhiên tuân theo quy luật phân phối ‘‘khi bình phương’’ với n bậc tự do.


10
Ký hiệu T  T (n) .
T(n) là biến ngẫu nhiên liên tục nhận giá trị trong khoảng ( ,  ).
Hàm mật độ xác suất của nó khá phức tạp
1
x2 
f ( x) 
(1  )
1 n
n
n ( , )
2 2

n 1
2

.

1

Trong đó  (a, b)  0 x a1 (1  x )b 1 dx với a > 0, b > 0 được gọi là hàm Bêta.

Các tham số đặc trưng của T  T (n) là
T  0 ,

DT 

n
.
n2

1.2.10. Quy luật phân phối Fisher F(n, m)
Định nghĩa. Nếu  2 (n) và  2 (m) là hai biến ngẫu nhiên có phân phối
‘‘khi bình phương’’ với n, m bậc tự do thì biến ngẫu nhiên
F

 n2 / n
 m2 / m

được gọi là có phân phối Fisher với n, m bậc tự do.
Ký hiệu F ~ F(n, m).
Các tham số đặc trưng của F(n, m) là
F 

m
, với m > 2,
m2

DF 

m 2 (2m  2n  4)
, với m > 4.

n(m  2) 2 (m  4)

1.3. Khái niệm thống kê
1.3.1. Định nghĩa mẫu ngẫu nhiên
Mẫu ngẫu nhiên kích thước n đối với một biến ngẫu nhiên X là tập hợp n biến
ngẫu nhiên 1 ,  2 ,…,  n độc lập cùng phân phối xác suất với X, ký hiệu là


11
W = ( 1 ,  2 ,…,  n ).
Biến ngẫu nhiên X được gọi là biến ngẫu nhiên gốc.
Các biến ngẫu nhiên  i ( i = 1,…, n ) được gọi là các bản sao của X.
1.3.2. Định nghĩa thống kê
Thống kê về một biến ngẫu nhiên X là một hàm
G = f ( 1 ,  2 ,…,  n )
của n biến ngẫu nhiên độc lập  i (i = 1,…, n), trong đó  i là các bản sao của
biến ngẫu nhiên gốc X (cùng phân phối xác suất với biến ngẫu nhiên X).
Vì thống kê là một hàm của các biến ngẫu nhiên nên nó cũng là một biến
ngẫu nhiên.
Thống kê cũng có quy luật phân phối xác suất nhất định và cũng có các
số đặc trưng như kỳ vọng, phương sai…
1.3.3. Giá trị quan sát của thống kê
Với một mẫu quan sát W = ( 1 ,  2 ,…,  n ), ta tính được một giá trị
bằng số Gqs = f( 1 ,  2 ,…,  n ) của thống kê G, giá trị này được gọi là giá trị
quan sát của thống kê G hay còn gọi là một thể hiện của thống kê G.
1.3.4. Trung bình mẫu
Định nghĩa. Trung bình mẫu, là thống kê được cho bởi biểu thức
 =

1 n

 i .
n i 1

Vì mỗi  i , (i = 1,…, n) là một bản sao của biến ngẫu nhiên gốc X nên có
cùng kỳ vọng  , phương sai  2 , do đó kỳ vọng và phương sai của trung bình
mẫu là
   ,

D 

2
.
n


12
1.3.5. Phương sai mẫu S

2

Định nghĩa. Phưong sai mẫu là thống kê được xác định bởi biểu thức
S2 =

1 n
(  i  ) 2 .

n  1 i 1

S 2 cũng là một biến ngẫu nhiên.


Nếu X là biến ngẫu nhiên có phương sai  2 thì phương sai mẫu S 2 có kỳ
vọng
( S 2 ) =  2 .
*2
1.3.6. Phương sai S

Định nghĩa. Phương sai S *2 là thống kê được xác định bởi biểu thức
S *2 =

1 n
(  i   )2 .

n i 1

Trong đó  là kỳ vọng của biến ngẫu nhiên gốc X.
S *2 cũng là biến ngẫu nhiên .

Nếu X là biến ngẫu nhiên có phương sai  2 thì phương sai S *2 có kỳ
vọng
( S *2 ) =  2 .

1.3.7. Tần suất mẫu
Tần suất mẫu là biến ngẫu nhiên chỉ tần suất xuất hiện biến cố A.
f 

k
.
n

Trong đó k là số lần xuất hiện A, n kích thước mẫu.

Nếu A là một biến cố nào đó với xác suất xuất hiện A là p
Các giá trị đặc trưng của tần suất mẫu là
E(f) = p,
D(f) =

(1  p ) p
.
n


13

1.4. Các phân phối xác suất của một số thống kê
1.4.1. Phân phối xác suất của trung bình mẫu
Phân phối mẫu quan trọng đầu tiên được xem xét là phân phối của thống
kê trung bình mẫu  .
Định lý. Nếu các biến ngẫu nhiên 1 ,  2 ,…,  n độc lập và có cùng phân
phối theo quy luật chuẩn, thì mọi tổ hợp tuyến tính của chúng cũng có phân
phối theo quy luật chuẩn.
Chứng minh. Trước hết ta nhắc lại:
Hàm đặc trưng của biến ngẫu nhiên X có phân phối chuẩn N(  ,  2 ) là
  (t ) = e

i (  )t



1 22
 t
2


(1.1)

Tính chất hàm đặc trưng:
Nếu các biến ngẫu nhiên 1 ,  2 ,…,  n độc lập thì
n

 n (t ) =
 k
k 1



k

(t ) .

(1.2)

k 1

Để chứng minh định lý ta sẽ chứng minh định lý đúng với n = 2.
Thật vậy, giả sử 1  N ( 1 ,  12 ) ,  2  N ( 2 ,  22 ) , và 1 ,  2 độc lập, với
 ,    bất kỳ.

Theo (1.1), kết hợp (1.2) ta có:
i (1 )t




1
(1 ) 2 t 2
2

i (  2 )t



1
(  2 ) 2 t 2
2

(1 ) (t ) = e
  2 (t ) = e

Sử dụng (1.3)
(1  2 ) (t ) = 1 (t ) 2 (t )

=e

i (1   2 )t



1 2 2
( 1   2 22 ) t 2
2


14

Nghĩa là hàm đặc trưng của biến ngẫu nhiên (  1 +   2 ) có phân phối
chuẩn N (  1    2 ,  2 12   2 22 ).
Trường hợp n > 2, chứng minh hoàn toàn tương tự mọi tổ hợp tuyến tính
của chúng cũng có phân phối theo quy luật chuẩn.
Từ định lý trên ta có các kết luận sau:
Nếu biến ngẫu nhiên gốc X có quy luật phân phối chuẩn N(  ,  2 ) thì
thống kê trung bình mẫu


1 n
 i
n i 1

2
cũng có quy luật phân phối chuẩn N(  ,
).
n

Nếu  là thống kê trung bình mẫu của một mẫu ngẫu nhiên cỡ n có quy
luật phân phối chuẩn N(  ,  2 ) , khi đó thống kê
G =U =

(   ) n


có phân phối chuẩn hoá N(0, 1).
1.4.2. Phân phối xác suất của phương sai mẫu
Định lý. Nếu S 2 là phương sai của mẫu ngẫu nhiên có kích thước cỡ n có
phân phối chuẩn N(  ,  2 ), khi đó thống kê
(n  1) S 2

G =  =
2
2

có phân phối ‘‘khi bình phương’’ với (n - 1) bậc tự do.
Chứng minh. Ta có
U=

( i  )
~ N (0,1) .


Nên theo quy luật khi ‘’bình phương’’ ta có
G =2 =

n
(n  1) S 2
( i   )2

~  2 (n  1) .

2
2

i 1


15
Vậy nếu S 2 là phương sai của mẫu ngẫu nhiên có kích thước cỡ n có
phân phối chuẩn N(  ,  2 ), khi đó thống kê

G  2 

(n  1)S 2
2

có phân phối ‘‘khi bình phương’’ với (n – 1) bậc tự do.
Từ định lý trên ta có thống kê
nS *2
1
G  2  2


2

n

 (

i

  )2

i 1

cũng sẽ tuân theo quy luật ‘‘khi bình phương’’ với n bậc tự do.
1.4.3. Phân phối Student T(n)
Định lý. Giả sử các biến ngẫu nhiên 1 ,  2 ,…,  n độc lập, có cùng phân
phối chuẩn N(  ,  2 ).
Khi đó thống kê
G T 


(   ) n
S

có phân phối tuân theo quy luật Student với (n – 1) bậc tự do.
Chứng minh. Ta có
U=

(   ) n
~ N(0, 1),



2 =

(n  1) S 2
~  2 (n  1) .
2


Khi đó thống kê
G T 



(   ) n
S

(   ) n
n  1S

:

 n 1


16


U

2
n 1

~ T (n  1) .

Vậy
G T 

(   ) n
S

có phân phối tuân theo quy luật Student với (n – 1) bậc tự do.
1.4.4. Phân phối Fisher
Định lý. S12 , S 22 là phương sai của mẫu ngẫu nhiên X, Y có kích thước cỡ
n, m có phân phối chuẩn tương ứng N( 1 ,  12 ), N(  2 ,  22 ).
Khi đó thống kê
F=

 22 S12
 12 S22


theo quy luật phân phối Fisher với ( n – 1, m – 1) bậc tự do.


17
CHƯƠNG II

SỬ DỤNG EXCEL ĐỂ XỬ LÝ THỐNG KÊ MỘT SỐ BÀI
TOÁN KINH TẾ XÃ HỘI
Trong chương này trước hết chúng tôi tìm hiểu về khái niệm, các công
thức cơ bản của ước lượng tham số, kiểm định giả thuyết thống kê và phân tích
phương sai. Sau đó sẽ lấy một số bài toán kinh tế xã hội mang tính thực tiễn cần
giải quyết và xử lý các bài toán đó trên phần mềm Excel. Từ đó đưa ra một số
kết luận thống kê có ích.

2.1. Ước lượng tham số. Kiểm định giả thuyết thống kê.
Phân tích phương sai
2.1.1. Ước lượng tham số
Giả sử X là một biến ngẫu nhiên có tham số đặc trưng  nào đó chưa biết
mà ta đang quan tâm. Vấn đề đặt ra là : Căn cứ trên n giá trị 1 ,  2 ,…,  n của
X đo được trên một mẫu kích thước n lấy ra từ tập hợp chính, cần tìm một giá
trị gần đúng  * của tham số  .
Định nghĩa. Hàm
G =  * ( 1 ,  2 ,…,  n )
dùng để ước lượng tham số  của biến ngẫu nhiên thông qua mẫu ngẫu nhiên
W=( 1 ,  2 ,…,  n ) được gọi là một hàm ước lượng của tham số  .
Việc lựa chọn một ước lượng nào là ‘‘tốt’’ được căn cứ trên các tiêu
chuẩn dưới đây.
Định nghĩa. Ước lượng G =  * ( 1 ,  2 ,…,  n ) được gọi là ước lượng
không chệch của tham số  nếu

E(G) =  .


18
Tính chất không chệch có nghĩa là ước lượng G không có sai số hệ thống.
Định nghĩa 3. Ước lượng G =  * ( 1 ,  2 ,…,  n ) được gọi là ước lượng
vững nếu với mọi   0
lim P  G      = 1.
n

Tính chất vững đảm bảo cho ước lượng gần  tuỳ ý với xác suất cao khi
kích thước đủ lớn
Định nghĩa 4. Ước lượng G =  * ( 1 ,  2 ,…,  n ) được gọi là ước lượng
hiệu quả nếu G là ước lượng không chệch và có phương sai D(G) bé nhất trong
tất cả các ước lượng không chệch khác của cùng mẫu ngẫu nhiên.
Định nghĩa 5. Giá trị quan sát của thống kê G theo n giá trị quan sát
được của mẫu ngẫu nhiên được gọi là ước lượng điểm cho  .
Giả sử X là biến ngẫu nhiên với EX =  (chưa biết).
Nếu ta có một mẫu n giá trị 1 ,  2 ,…,  n của X thì trung bình mẫu


1 n
 i
n i 1

sẽ được dùng làm ước lượng cho  .
Định lý. Trung bình mẫu là ước lượng không chệch và vững cho kỳ vọng EX.
Chứng minh. Ta có  là giá trị quan sát của



1 n
 i .
n i 1

Trong đó 1 ,  2 ,…,  n là các biến ngẫu nhiên độc lập cùng phân phối với
X.
Do vậy
 

1  12  ...   n n


n
n

D 

D 1  D 12  ...  D n DX

.
n
n


19
Theo bất đẳng thức Trêbưsep ta có:



 


            



Vậy





D  D

2
n



lim        0 .
n 

Chú ý. Người ta đã chứng minh được trung bình mẫu là ước lượng hiệu
quả của EX.
Giả sử X là biến ngẫu nhiên với DX =  2 (chưa biết).
Định lý. Phương sai mẫu
S2 

1 n
 ( i  ) 2
n  1 i 1


và phương sai S *2
1 n
S   (  i   )2
n i 1
*2

là ước lượng không chệch, vững, hiệu quả của phương sai  2 .
2.1.1.1. Ước lượng bằng khoảng tin cậy
Định nghĩa. Một khoảng với hai đầu mút ngẫu nhiên 1* ( 1 ,  2 ,…,  n )
và  2* ( 1 ,  2 ,…,  n ) (phụ thuộc vào n giá trị quan sát ( 1 ,  2 ,…,  n ) của X)
gọi là khoảng tin cậy cho tham số  với độ tin cậy (1 -  ) nếu với xác suất
(1 -  ) ta có  nằm trong khoảng nói trên. Tức là
P 1* ( 1 ,  2 ,…,  n ) <  <  2* ( 1 ,  2 ,…,  n ) = 1 -  .
Như

vậy

xác

suất

để

tham

số

không


nằm

trong

khoảng

( 1* ( 1 ,  2 ,…,  n ),  2* ( 1 ,  2 ,…,  n )) chỉ bằng  .
Khoảng ( 1* ( 1 ,  2 ,…,  n ),  2* ( 1 ,  2 ,…,  n )) gọi là khoảng tin cậy.
Giá trị (1 -  ) gọi là độ tin cậy. Còn ( 1* -  2* ) gọi là độ chính xác cuả ước
lượng.


20
Rõ ràng với cùng một độ tin cậy thì khoảng tin cậy càng hẹp càng giúp
chúng ta xác định chính xác được tham số cần tìm.
2.1.1.2. Ước lượng khoảng đối với kỳ vọng của biến ngẫu nhiên
Giả sử biến ngẫu nhiên X tuân theo quy luật phân phối chuẩn với kỳ
vọng chưa biết. Ta cần phải ước lượng khoảng tin cậy của nó với độ tin cậy
(1 -  ).
Trong bài toán thực tế, ta không biết phương sai của tập hợp chính thì có
thể xấp xỉ  bởi S.
Ta thực hiện các bước sau:
Lập mẫu W = ( 1 ,  2 ,…,  n ) và chọn thống kê
G T 

(   ) n
.
S



S2 

1 n
( i  ) 2 .

n  1 i 1

Thì T có phân phối Student với (n – 1) bậc tự do, do đó với độ tin cậy cho
trước, ta luôn chọn được hai số 1 và  2 sao cho 1 +  2 =  và từ đó xác định
được các giá trị tới hạn T1 và T sao cho
1

2









 T  T(11 , n 1)  1 và  T  T( 2 ,n 1)   2 .

Từ đó ta có






 T(11 , n1)  T  T( 2 , n1)  1  1   2
 1

Do
T(11 , n 1)  T(1 , n 1) .

Nên





 T(1 , n 1)  T  T( 2 , n 1)  1   .


21

Thay
G T 

(   ) n
.
S

Ta có


P  



S
S

T( 2 , n 1)  T   
T(1 , n 1)  = 1 -  .
n
n


Hay nói cách khác khoảg tin cậy đối với độ tin cậy (1-  ) của kỳ vọng
EX =  là
S
S


T( 2 ,n 1) ;  
T(1 , n 1)  .

n
n



Trong thực tế, từ biểu thức trên người ta chỉ sử dụng một số trường hợp
đặc biệt sau:
Khoảng tin cậy đối xứng: Khi 1 =  2 =


, khoảng tin cậy của kỳ vọng
2


EX =  là


S
S
;   T  .
T

n ( 2 , n 1)
n ( 2 ,n 1) 


Khoảng tin cậy bên phải. Khi 1 = 0,  2   , thì T( , n1)  T0  
1

Do đó khoảng tin cậy của kỳ vọng EX =  là
S


T( ,n 1) ;  

n



Khoảng tin cậy bên trái. Khi  2  0, 1   thì T , n1  T0   .
2

Do đó khoảng tin cậy của kỳ vọng EX =  là

S


T( ,n 1)  .
 ;  
n



Nếu kích thước mẫu lớn thì ta có thể xấp xỉ  bởi S.
Ta thực hiện các bước sau:


22
Lập mẫu W = ( 1 ,  2 ,...,  n ) và chọn thống kê
G T 

(   ) n
.
S

Khi đó khoảng tin cậy với độ tin cậy 1-  của kỳ vọng EX =  là

S
S 
;   T
   T
.
n
n


2
2


2.1.1.3. Ước lượng khoảng đối với phương sai của biến ngẫu nhiên
Giả sử biến ngẫu nhiên X tuân theo quy luật phân phối chuẩn với phương
sai chưa biết. Ta cần phải ước lượng khoảng tin cậy của nó với độ tin cậy
(1 -  ) cho trước và với mẫu ngẫu nhiên W = ( 1 ,  2 ,…,  n ).
Nếu kỳ vọng EX =  chưa biết.
Chọn thống kê
G  2 

(n  1)S 2
.
2

Thống kê này có quy luật phân phối ‘‘khi bình phương’’  (2n1) với (n – 1)
bậc tự do.
Do đó với độ tin cậy cho trước ta luôn chọn được hai số 1 và  2 sao cho
1 +  2 =  và từ đó xác định được các giá trị tới hạn 121 ,( n 1) và 22 ,( n 1) sao cho





  2  121 ,( n 1)  1

và    2  2 ,( n1)    2 .
2


Từ đó ta có





 121 ,( n 1)   2  22 ,( n 1)  1  1   2
 1

Thay
(n  1)S 2
G 
.
2
2

Ta có


23
 (n  1)S 2
(n  1) S 2 
 2
2  2
  1   .
  ,( n 1)

11 ,( n 1) 
 2


Hay nói cách khác khoảg tin cậy đối với độ tin cậy 1-  của của phương sai
 2 là
 (n  1) S 2 (n  1)S 2 
; 2
 2
 .



,(
n

1)
1


,(
n

1)
 2
1


Trong thực tế, từ biểu thức trên người ta chỉ sử dụng một số trường hợp đặc
biệt sau:
Khoảng tin cậy trung tâm: Khi 1 =  2 =



, khoảng tin cậy của phương sai
2

 2 là


 (n  1) S 2 (n  1) S 2 
; 2
 2
.


  ,( n 1)
1 ,( n 1) 
 2
2


Khoảng tin cậy bên phải. Khi 1 = 0,  2   , khoảng tin cậy của phương
sai  2 là
 (n  1) S 2

;   .
 2

  ,( n 1)


Khoảng tin cậy bên trái. Khi  2  0 , 1   , khoảng tin cậy của phương
sai  2 là

 (n  1) S 2 
 0; 2
 .

1


,(
n

1)



2.1.2. Kiểm định giả thuyết thống kê
Định nghĩa. Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất
của biến ngẫu nhiên, về các tham số đặc trưng của biến ngẫu nhiên hoặc về tính
độc lập của các biến ngẫu nhiên.


24
Giả thuyết được đưa ra kiểm nghiệm ký hiệu là  0 , đó là một giả thuyết
mà người ta ngi ngờ muốn bác bỏ.
Đối thiết 1 là mệnh đề đối lập với giả thuyết  0 , đối thiết 1 sẽ được
chấp nhận khi  0 bị bác bỏ.
Định nghĩa. Kiểm định giả thuyết thống kê là vận dụng các phương pháp
mẫu để có thể kết luận về tính thừa nhận được hoặc không thừa nhận được của
giả thuyết đó.
Câu hỏi đặt ra là: Chúng ta bác bỏ hay chấp nhận một giả thuyết  0 bằng
cách nào? Các nhà thống kê đều nhất trí với nhau nguyên lí sau:

‘‘Nếu một biến cố A có xác suất rất nhỏ thì trong một phép thử hay một
vài phép thử, biến cố đó sẽ không xảy ra’’
Giả thuyết  0 đúng sẽ được đặt tương ứng với một biến cố A nào đó mà
xác suất xuất hiện A là khá bé.
Nếu A xảy ra thì chứng tỏ giả thuyết  0 là sai. Còn nếu A không xảy ra
thì có thể chấp nhận giả thuyết  0 .
Định nghĩa. Tìm thống kê
G = f ( 1 ,  2 ,…,  n ;  0 )
sao cho với giả thuyết  0 đúng thì phân phối xác suất của G hoàn toàn xác
định. Thống kê
G = f ( 1 ,  2 ,…, n ;  0 )
được gọi là tiêu chuẩn kiểm định.
Định nghĩa. Miền bác bỏ giả thuyết  0 là miền  sao cho
(G    0 )   .

Số thực  được gọi là mức ý nghĩa.


25
Định nghĩa. Giá trị quan sát của tiêu chuẩn kiểm định là giá trị cụ thể
Gqs của G có được từ mẫu quan sát W = ( 1 ,  2 ,…, n ):
Gqs = f ( 1 ,  2 ,…, n ;  0 ).

Nếu giá trị quan sát Gqs của tiêu chuẩn kiểm định thuộc miền bác bỏ
( Gqs   ) thì có thể coi  0 sai và thừa nhận 1 đúng.
Nếu giá trị quan sát của tiêu chuẩn kiểm định không thuộc miền bác bỏ
( Gqs   ) thì có thể chấp nhận  0 .
Các bước thực hiện kiểm định giả thuyết thống kê
1. Phát biểu giả thuyết  0 và đối thiết 1 .
2. Định rõ mức ý nghĩa  .

3. Lập thống kê G và xác định phân phối của thống kê G.
4. Xác định miền bác bỏ  .
5. Thu thập mẫu quan sát và tính giá trị quan sát của tiêu chuẩn kiểm
định Gqs .
6. So sánh giá trị tìm được với mức tới hạn (biên) của miền bác bỏ và kết luận.
2.1.2.1. Kiểm định giả thuyết thống kê về giá trị trung bình
Trong trường hợp: Phương sai  2 chưa biết.
Giả sử X ~ N(  ,  2 ) (nếu X không chuẩn thì n  30). Với phưong sai  2
chưa biết và  cũng chưa biết.
Ta đang phải muốn kiểm định giả thuyết
 0 :  = 0 .

Lập mẫu W = ( 1 ,  2 ,…, n ) và chọn thống kê:
G T 

Khi đó ta có ba bài toán sau:

(   0 ) n
~ T( n 1) .
S


×