Tải bản đầy đủ (.pdf) (61 trang)

Bài giảng toán thống kê đh nông nghiệp hà nội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.71 MB, 61 trang )

TRƢỜNG ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

Bài giảng TOÁN THỐNG KÊ
Mục lục
Chương 4. NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ .................................... 3
I. TỔNG THỂ VÀ MẪU................................................................................................................ 3
1.1. Tổng thể ............................................................................................................................... 3
1.2. Mẫu....................................................................................................................................... 3
1.3. Các phƣơng pháp lấy mẫu .................................................................................................... 3
II. BỐ TRÍ MẪU VÀ PHÂN PHỐI MẪU ..................................................................................... 3
2.1. Sắp xếp số liệu...................................................................................................................... 3
2.2. Biểu diễn hình học của mẫu ................................................................................................. 5
III. CÁC SỐ ĐẶC TRƢNG CỦA MẪU ....................................................................................... 5
3.1. Trung bình mẫu .................................................................................................................... 5
2.2. Phƣơng sai mẫu .................................................................................................................... 5
2.3. Phƣơng sai hiệu chỉnh của mẫu ............................................................................................ 6
IV. MẪU NGẪU NHIÊN .............................................................................................................. 8
4.1. Mẫu ngẫu nhiên .................................................................................................................... 8
4.2. Các đặc trƣng của mẫu ngẫu nhiên ...................................................................................... 8
4.3. Thống kê............................................................................................................................... 8
V. MỘT SỐ PHÂN PHỐI XÁC SUẤT DÙNG TRONG TOÁN THỐNG KÊ ............................ 8
5.1. Các định lý về phân phối chuẩn ........................................................................................... 8
5.2. Phân phối khi-bình phƣơng (2) ........................................................................................... 9
5.3. Phân phối Student................................................................................................................. 9
5.4. Phân phối Fisher-Snedecor................................................................................................. 10
5.5. Phân vị mức 1 –  .............................................................................................................. 10
BÀI TẬP CHƢƠNG 4 .................................................................................................................. 11
Chương 5. ƢỚC LƢỢNG THAM SỐ .......................................................................................... 12
Khái niệm về bài toán ƣớc lƣợng tham số.................................................................................. 12
I. ƢỚC LƢỢNG ĐIỂM ............................................................................................................... 12
1.1. Định nghĩa. ......................................................................................................................... 12


1.2. Các loại ƣớc lƣợng ............................................................................................................. 12
1.3. Các ƣớc lƣợng điểm thƣờng gặp. ....................................................................................... 13
a-/ Trung bình mẫu ngẫu nhiên: ............................................................................................ 13
b-/ Phƣơng sai mẫu ngẫu nhiên hiệu chỉnh: .......................................................................... 13
c-/ Tần suất ............................................................................................................................ 14
II. ƢỚC LƢỢNG KHOẢNG ....................................................................................................... 14
2.1. Khoảng tin cậy. Độ tin cậy ................................................................................................. 14
2.2. Ƣớc lƣợng kỳ vọng (giá trị trung bình) của phân phối chuẩn ............................................ 15
a) Trƣờng hợp biết phƣơng sai D(X) = 2. ........................................................................... 15
b) Trƣờng hợp không biết phƣơng sai 2 .............................................................................. 16
2.3. Ƣớc lƣợng phƣơng sai của phân phối chuẩn ...................................................................... 17
2.4. Ƣớc lƣợng xác suất (tỷ lệ) .................................................................................................. 17
2.5. Kích thƣớc mẫu cần thiết ................................................................................................... 19
BÀI TẬP CHƢƠNG 5 .................................................................................................................. 20


ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

Chương 6. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ ................................................................ 22
I. GIẢ THUYẾT, ĐỐI THUYẾT ................................................................................................. 22
1.1. Giả thuyết, đối thuyết ........................................................................................................ 22
1.2. Quy tắc kiểm định giả thuyết ............................................................................................. 22
1.3. Các loại sai lầm .................................................................................................................. 23
II. CÁC BÀI TOÁN KIỂM ĐỊNH THAM SỐ ............................................................................ 23
2.1. Kiểm định kỳ vọng của biến chuẩn ................................................................................... 23
a) Trƣờng hợp biết phƣơng sai 2......................................................................................... 23
b) Trƣờng hợp chƣa biết phƣơng sai 2................................................................................ 24
c) Chú thích: ......................................................................................................................... 25
2.2. Kiểm định một xác suất (tỷ lệ) .......................................................................................... 27
2.3. Kiểm định sự bằng nhau của kỳ vọng hai biến chuẩn, mẫu độc lập.................................. 28

a) Trƣờng hợp biết σ 2x và σ 2y . ............................................................................................... 28
b) Trƣờng hợp không biết σ 2x và σ 2y ..................................................................................... 29
c) Chú ý................................................................................................................................. 30
2.4. Kiểm định sự bằng nhau của kỳ vọng hai biến chuẩn, mẫu theo cặp ................................ 31
2.5. Kiểm định sự bằng nhau của phƣơng sai hai biến chuẩn. ................................................. 32
2.6. Kiểm định sự bằng nhau của hai xác suất (so sánh hai tỷ lệ) ............................................ 33
III. MỘT VÀI KIỂM ĐỊNH PHI THAM SỐ ............................................................................... 34
3.1. Kiểm định luật phân phối xác suất .................................................................................... 34
a) Trƣờng hợp các pi đã biết ................................................................................................. 35
b) Trƣờng hợp các pi phụ thuộc các tham số chƣa biết ........................................................ 36
3.2. Kiểm định sự độc lập của hai đặc tính định tính ............................................................... 37
BÀI TẬP CHƢƠNG 6................................................................................................................... 40
Chương 7. TƢƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH ........................................................ 45
I. MẪU THỐNG KÊ HAI CHIỀU ............................................................................................... 45
1.1. Biến ngẫu nhiên hai chiều ................................................................................................. 45
1.2. Mẫu thống kê hai chiều...................................................................................................... 45
a) Nếu mẫu nhỏ (n nhỏ) ........................................................................................................ 45
b) Nếu mẫu lớn và có nhiều số liệu trùng nhau .................................................................... 45
c) Nếu mẫu lớn và các số liệu ít trùng nhau ......................................................................... 45
II. HỆ SỐ TƢƠNG QUAN .......................................................................................................... 46
2.1. Sự liên hệ tƣơng quan ........................................................................................................ 46
2.2. Hệ số tƣơng quan lý thuyết ................................................................................................ 46
2.2. Hệ số tƣơng quan mẫu ....................................................................................................... 47
2.3. Kiểm định sự tƣơng quan .................................................................................................. 48
III. HỒI QUY TUYẾN TÍNH ....................................................................................................... 49
3.1. Hàm hồi quy lý thuyết ....................................................................................................... 49
3.2. Hàm hồi quy tuyến tính mẫu ............................................................................................. 50
3.3. Dự báo theo phƣơng trình hồi quy..................................................................................... 52
BÀI TẬP CHƢƠNG 7................................................................................................................... 54
CÁC BẢNG SỐ ................................................................................................................................ 57

Bảng1: Giá trị hàm phân phối chuẩn tắc: ................................................................................. 57
Bảng 2: Phân vị Student: .......................................................................................................... 58
Bảng 3: Phân vị khi bình phƣơng ............................................................................................. 59
Bảng 4: Phân vị Fisher – Snedecor mức 0,05 ........................................................................... 60

2


Bài giảng Toán Thống kê

Chương 4. NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ
I. TỔNG THỂ VÀ MẪU
1.1. Tổng thể .
Trong thực tế và trong khoa học chúng ta thƣờng phải khảo sát một tập hợp có rất nhiều
phần tử. Chẳng hạn khảo sát chiều cao của thanh niên Việt nam thì mọi thanh niên Việt nam
đều là đối tƣợng cần khảo sát hay khảo sát nang suất của giống lúa A thì đối tƣợng khảo sát là
mọi thửa ruộng trồng giống lúa A. Trong lý thuyết toán thống kê, ngƣời ta gọi các tập hợp đó là
tổng thể (còn gọi là tập hợp chính hoặc đám đông).
Số lƣợng các cá thể của tổng thể gọi là kích thƣớc của tổng thể, thƣờng ký hiệu bằng chữ
in hoa N.

1.2. Mẫu
Do tổng thể quá lớn, và hơn nữa có nhiều nghiên cứu phải phá huỷ đối tƣợng nghiên cứu,
chẳng hạn khi định lƣợng hàm lƣợng của một loại thuốc chữa bệnh nào đó bằng phƣơng pháp
hoá học.
Bởi vậy cần chọn ra n phần tử của tổng thể để nghiên cứu, n phần tử đƣợc chọn đó gọi là
một mẫu có kích thƣớc n (hay mẫu có dung lƣợng n).
Kích thƣớc mẫu thƣờng rất nhỏ so với kích thƣớc của tổng thể (n << N).
Tập hợp tất cả các mẫu có kích thƣớc n có thể lấy đƣợc từ tổng thể gọi là không gian mẫu
có kích thƣớc n.

Nếu đặc tính cần nghiên cứu là đặc tính định lƣợng X, ký hiệu xi là giá trị của X đo đƣợc ở
cá thể thứ i của mẫu thì đƣợc bộ số liệu (x1, x2,..., xn). Bộ số liệu (x1, x2,..., xn) gọi là một mẫu
thống kê kích thƣớc n của X. Dễ thấy khi đó đặc tính cần nghiên cứu X là một biến ngẫu nhiên.

1.3. Các phƣơng pháp lấy mẫu
Mục đích chọn mẫu là từ kết quả khảo sát các phần tử của mẫu để đƣa ra kết luận cho cả
tổng thể. Vì thế mẫu phải đại diện cho cả tổng thể. Muốn vậy mọi phần tử của tổng thể đều có
cùng khả năng đƣợc chọn vào mẫu, nói cách khác việc chọn mẫu phải dựa trên nguyên tắc ngẫu
nhiên.
Các phƣơng pháp cụ thể xem trong SGK (trang 97, 97)

II. BỐ TRÍ MẪU VÀ PHÂN PHỐI MẪU
2.1. Sắp xếp số liệu
Xét mẫu (x1, x2, ..., xn) kích thƣớc n của X. Bƣớc đầu tiên là phải sắp xếp lại các giá trị x i
của mẫu để dễ dàng cho việc xử lý tiếp theo.
a) Mẫu đơn:
Nếu dung lƣợng n nhỏ thì không cần thiết phải sắp xếp lại các số liệu thu thập đƣợc và gọi
là mẫu đơn.
Với mẫu có dung lƣợng n lớn. Khi đó có hai trƣờng hợp:
b) Mẫu có tần số:
Nếu các số liệu thu thập đƣợc có nhiều giá trị giống nhau thì đếm số các giá trị giống nhau
và xếp các số liệu thành bảng hai dòng. Chẳng hạn trong n giá trị thu đƣợc chỉ có k giá trị khác
nhau là x1, x2, …, xk (trong đó xi < xi + 1) và có ni giá trị xi thì xếp thành bảng:
3


ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

X
ni


x1
n1

x2
n2




xk
nk

Trong đó n1 + n2 + … + nk = n.
Các số ni gọi là tần số gặp giá trị xi trong mẫu và tỷ số fi 

ni
gọi là tần suất gặp giá trị xi
n

trong mẫu.
Bảng trên gọi là mẫu có tần số.
Thí dụ: Đo chiều cao của 20 thanh niên thấy có: 5 ngƣời cao 165 cm, 2 ngƣời cao 167, 3
ngƣời cao 164, 4 ngƣời cao 166, 2 ngƣời cao 163 và 1 ngƣời cao 168. Khi đó ta có bảng:
X (cm) 163
164
165
166
167
168

ni
2
3
5
5
4
1
c) Mẫu phân lớp
Nếu các số liệu thu thập đƣợc không có, hoặc ít có các giá trị trùng nhau thì tiến hành phân
khoảng các số liệu.
Gọi xmin, xmax tƣơng ứng là giá trị nhỏ nhất và lớn nhất của các số liệu thu thập đƣợc và giả
sử ta chia các số liệu thành k khoảng. Khi đó đại lƣợng:
x
 x min
h  max
k
gọi là độ rộng của lớp.
Đặt x0  xmin; xi = x0 + ih, i = 1, 2, …, k sao cho xk  xmax. Mỗi khoảng (xi – 1, xi] đƣợc gọi
là một lớp (chú ý rằng cũng có thể chọn lớp là [xi – 1, xi)). Đếm các giá trị thuộc các lớp và xếp
thành bảng:
X
x0 – x1
x1 – x2

xk – 1 – xk
ni
n1
n2

nk

Trong đó n1 + n2 + … + nk = n.
Cũng nhƣ mẫu có tần số, các số ni gọi là tần số của lớp thứ i trong mẫu và tỷ số fi 

ni
gọi
n

là tần suất của lớp i.
Giá trị giữa lớp gọi là giá trị đại diện của lớp.
Bảng trên gọi là mẫu phân lớp.
Thí dụ: Cân thử 40 con gà 3 tháng tuổi đƣợc kết quả (đơn vị tính kg/con):
1,20 1,26 1,21 1,17 1,19 1,25 1,22 1,22 1,19 1,18 1,25 1,19 1,22 1,20
1,21 1,21 1,20 1,20 1,25 1,18 1,24 1,15 1,23 1,21 1,22 1,24 1,18 1,23
1,21 1,18 1,16 1,17 1,20 1,15 1,18 1,22 1,21 1,23 1,26 1,24
Ta có: xmax = 1,26; xmin = 1,15
Chia các số liệu thành 6 lớp (k = 6), chọn độ rộng của lớp là 0,02, lớp đầu tiên là
(1,14; 1,16] đƣợc bảng phân lớp:
X (kg)
1,14 – 1,16 1,16 – 1,18 1,18 – 1,20 1,20 – 1,22 1,22 – 1,24 1,24 – 1,26
ni (số con)
3
7
8
11
6
5
Chú thích: Nếu không phân lớp thì có bảng tần số:
X(kg) 1,15 1,16 1,17 1,18 1,19 1,20 1,21 1,22 1,23 1,24 1,25 1,26
ni
2

1
2
5
3
5
6
5
3
3
3
2
4


Bài giảng Toán Thống kê

2.2. Biểu diễn hình học của mẫu
Có thể lập bảng tần suất cho mẫu có tần số:
X
x1
x2
fi
f1
f2
và cho mẫu phân lớp:
X
x0 – x1
x1 – x2
fi
f1

f2




xk
fk




xk – 1 – xk
fk

ni
n
Từ đó có dạng biểu diễn hình học cho mẫu có tần số hoặc mẫu phân lớp nhƣ sau: Chọn
trục hoành biểu diễn các giá trị thu thập đƣợc và trục tung biểu diễn tần suất hoặc tần số khi đó
ta có một hình vẽ gọi là biểu đồ tần suất hoặc biểu đồ tần số. Chẳng hạn biểu diễn hình học của
hai thí dụ trong mục 2.1 là:
Trong các bảng trên thì fi =

ni (fi)

ni (fi)
5
4
3
2
1


11 (11/40)

(0,25)
(0,2)
(0.15)
(0,1)
(0,05)

0

7 (7/40)
5 (5/40)
3 (3/40)

163 164 165 166 167 168

0

X

1,14 1,16 1,18 1,20 1,22 1,24 1,26

X

III. CÁC SỐ ĐẶC TRƢNG CỦA MẪU
Sau khi sắp xếp lại các số liệu, ta thƣờng phải tính các số đặc trƣng của mẫu. Sau đây là
một số số đặc trƣng chính của một mẫu thống kê.

3.1. Trung bình mẫu

Số trung bình của mẫu thống kê (x1, x2, …, xn) là số:
x

x1  x 2  ...  x n 1 n
  xi
n
n i 1

(4.1)

Nếu mẫu cho có tần số:
X
ni
thì:

x

x1
n1

x2
n2




xk
nk

n1x1  n 2 x 2  ...  n k x k 1 k

  ni xi
n1  n 2  ...  n k
n i 1

(4.1a)

Nếu mẫu là phân lớp thì tính nhƣ mẫu có tần số, nhƣng tính theo giá trị đại diện của lớp
(giá trị giữa lớp).
Trung bình mẫu đặc trƣng cho độ lớn của các số liệu quan sát đƣợc.

2.2. Phƣơng sai mẫu
Số phƣơng sai của mẫu thống kê (x1, x2, …, xn) là số:

s*2 =

1 n
(x i  x)2

n i 1

(4.2)

Biến đổi (4.2) đƣợc:
5


ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI
2

 n 

n
x

2
   xi  1 n 2 2
1 n 2 1 n 
2
 i 1  
s* =  x i    x i   i 1
 xi  x
2
n i 1
n
n i 1
 n i 1 
n

2
i

Nếu là mẫu có tần số thì:

s*2 =



(4.2a)

1 k
n i (x i  x )2


n i 1

(4.3)

Biến đổi (4.3) đƣợc:
2

 n

n n i x    n i x i 
2
k
k
k
1
1

 i 1
  1 n x2  x 2
s*2 =  n i x i2    n i x i   i 1
 i i
n i 1
n2
n i 1
 n i 1

trong đó n = n1 + n2 + … + nk.
n


2
i



(4.3a)

Với mẫu phân lớp thì dùng công thức mẫu có tần số để tính và tính theo giá trị giữa của
lớp (giá trị đại diện của lớp).
Căn bậc hai của phƣơng sai gọi là độ lệch chuẩn của mẫu và ký hiệu là s*: s*  s *2

2.3. Phƣơng sai hiệu chỉnh của mẫu
Số phƣơng sai hiệu chỉnh của mẫu thống kê (x1, x2, …, xn) là số: s2 =
1 n
(xi  x)2
s =

n  1 i 1
2

n

n

Biến đổi (4.4) đƣợc:

s2 =

Nếu là mẫu có tần số thì:


i 1

2

s2 =
k

n

Biến đổi (4.5) đƣợc:

s2 =

(4.4)

 n

   x i 
 i1  
n (n  1)

x i2

i 1

 x i2  nx 
n

2


i 1

(4.4a)

n 1

1 k
 n i (x i  x) 2
n  1 i1
2

 k

   n i x i 
 i 1
 
n (n  1)

n i x i2

n
s *2 , nghĩa là:
n 1

(4.5)

 ni xi2  n x 
k

i 1


2

n 1

(4.5a)

trong đó n = n1 + n2 + … + nk.
Với mẫu phân lớp thì dùng công thức mẫu có tần số để tính và tính theo giá trị giữa của
lớp (giá trị đại diện của lớp).
Căn bậc hai của phƣơng sai hiệu chỉnh gọi là độ lệch chuẩn hiệu chỉnh của mẫu và ký
hiệu là s: s  s 2
Nếu coi trung bình mẫu x là tâm của dãy số liệu thu thập đƣợc thì đại lƣợng ei = x i  x là
độ lệch giữa xi và x , nó cho biết xi gần hay xa tâm x . Bởi vậy phƣơng sai mẫu cũng nhƣ
phƣơng sai mẫu hiệu chỉnh và các độ lệch chuẩn là đặc trƣng cho độ phân tán các số liệu quan
sát đƣợc quanh giá trị trung bình mẫu x .
Chú ý rằng sau này chúng ta chỉ dùng phƣơng sai hiệu chỉnh của mẫu s2 mà không dùng
phƣơng sai mẫu s*2. Điều này sẽ đƣợc lý giải ở chƣơng sau.
6


Bài giảng Toán Thống kê

Phƣơng sai, độ lệch chuẩn cũng nhƣ phƣơng sai hiệu chỉnh, độ lệch chuẩn hiệu chỉnh đặc
trƣng cho độ phân tán của các số liệu quanh giá trị trung bình mẫu.
Thí dụ 1. Tính các số đặc trƣng của mẫu (số liệu của thí dụ 1 trong 2.1)
X (cm) 163
164
165
166

167
168
ni
2
3
5
5
4
1
Giải: Thƣờng dùng các công thức (4.1a), (4.2a) hoặc (4.3a), (4.4a) hoặc (4.5a) để tính các
số đặc trƣng của mẫu. Khi đó cần phải tính dung lƣợng mẫu n và các tổng: x, x2. Có hai cách
tính các tổng này:
- Cách 1: Lập bảng tính nhƣ sau:
x
163
164
165
166
167
168
Tổng

ni
2
3
5
5
4
1
20


nixi
326
492
825
830
668
168
3309

nixi2
53138
80688
136125
137780
111556
28224
547511

- Cách 2: Tính theo hàng:
Dung lƣợng mẫu: n = 2 + 3 + … + 1 = 20
nixi = 163.2 + 164.3 + … + 168 = 3309
nixi2 = 1632.2 + 1642.3 + … + 1682 = 547511
3309
 165,45
Từ đó có: Trung bình mẫu: x 
20
547511
 (165,45) 2 =1,84750  độ lệch chuẩn: s* = 1,3592
Phƣơng sai mẫu: s*2 =

20
Phƣơng sai mẫu hiệu chỉnh:

s2 =

547511 20(165,45) 2
= 1,94474  s = 1,3945
19

Thí dụ 2. Tính các số đặc trƣng của mẫu (số liệu của thí dụ 2 trong 2.1)
X (kg)
1,14 – 1,16 1,16 – 1,18 1,18 – 1,20 1,20 – 1,22 1,22 – 1,24 1,24 – 1,26
ni (số con)
3
7
7
12
6
5
Giải: Có thể lập bảng tính nhƣ sau:
Lớp
1,14-1,16
1,16-1,18
1,18-1,20
1,20-1,22
1,22-1,24
1,24-1,26
Trung bình mẫu:

xi

1,15
1,17
1,19
1,21
1,23
1,25

ni
3
7
7
12
6
5

nixi
3,45
8,19
8,33
14,52
7,38
6,25

nixi2
3,9675
9,5823
9,9127
17,5692
9,0774
7,8125


Tổng
48,12
x
= 1,203
40

40

48,12

57,9216

7


ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

Phƣơng sai mẫu:

s*2 =

57,9216
 (1,203) 2 = 0,00083
40

Phƣơng sai mẫu hiệu chỉnh:

s2 =


 độ lệch chuẩn: s* = 0,0288

57,9216  40(1,203) 2
= 0,00085  s = 0,0292
39

IV. MẪU NGẪU NHIÊN
4.1. Mẫu ngẫu nhiên
Xét mẫu lƣợng n của biến ngẫu nhiên X. Gọi Xi là biến ngẫu nhiên chỉ giá trị của X ở cá
thể thứ i của mẫu thì đƣợc bộ biến ngẫu nhiên (X1, X2, …, Xn).
Bộ các biến ngẫu nhiên (X1, X2, …, Xn) gọi là mẫu ngẫu nhiên của X.
Do việc khảo sát các cá thể trong mẫu là độc lập nên các biến ngẫu nhiên X i trong mẫu
ngẫu nhiên đƣợc coi là độc lập với nhau và cùng phân phối xác suất với X.
Ngƣời ta còn nói mẫu thống kê (x1, x2, …, xn) là một thể hiện hay là một mẫu cụ thể của
mẫu ngẫu nhiên (X1, X2, …, Xn).

4.2. Các đặc trƣng của mẫu ngẫu nhiên
Cũng nhƣ mẫu thống kê (x1, x2, …, xn) của biến ngẫu nhiên X, với mẫu ngẫu nhiên
(X1, X2, …, Xn) cũng có các đặc trƣng của nó. Đó là là:
n

Trung bình mẫu ngẫu nhiên: X 

 Xi
i 1

n

 Xi  X 
n


Phƣơng sai mẫu ngẫu nhiên: S *2 

;
2

i 1

n

;



 Xi  X 
n

Phƣơng sai hiệu chỉnh của mẫu ngẫu nhiên: S2 

2

i 1

;…
n 1
Các số dặc trƣng của mẫu thống kê (x1, x2, …, xn) gọi là các thể hiện tƣơng ứng của các
đặc trƣng của mẫu ngẫu nhiên.

4.3. Thống kê
Xét mẫu ngẫu nhiên (X1, X2, …, Xn). Một hàm của mẫu ngẫu nhiên:

G = G(X1, X2, …, Xn)
gọi là một thống kê.
Nhƣ vậy các đặc trƣng của mẫu ngẫu nhiên là các thống kê.
Vì các thống kê là các hàm của các biến ngẫu nhiên nên nó cũng là các biến ngẫu nhiên và
trong toán thống kê nó đƣợc khảo sát nhƣ mọi biến ngẫu nhiên khác, nghĩa là nó cũng có luật
phân phối xác suất cũng nhƣ các số đặc trƣng của nó.

V. MỘT SỐ PHÂN PHỐI XÁC SUẤT DÙNG TRONG TOÁN THỐNG KÊ
5.1. Các định lý về phân phối chuẩn
Phân phối chuẩn đã đƣợc trình bày trong chƣơng 2, ở đây chỉ nêu thêm một số vấn đề về
phân phối chuẩn.
Với phân phối chuẩn có một số kết luận sau:
8


Bài giảng Toán Thống kê

1) Nếu X ~ N(, 2) thì:
X
Z=
~ N(0, 1)


f(t)

2) Nếu các biến X1, X2, …, Xn độc lập và cùng
phân phối chuẩn N(, 2) , thì:
 2
1 n
X   X i ~ N  ,

 n
n i 1


/2

/2
-t(/2)

O 

t(/2)

t

Đồ thị hàm mật độ biến Chuẩn
tham số , 2







1
1
2 
1 n
 1 n
1 n

 1 n
 E X  E  Xi    EXi   n   ; D X  D  Xi   2  DXi   2 n2 

n
n
n
n
n
n
n
i 1
i 1
 i 1 
 i 1 







3) Nếu X~N(x, x2), Y~N(y, y2) thì X  Y ~ N(x  y, x2 + y2) (vì D(X  Y) =
D(X) + D(Y))
4) Trong toán thống kê thƣờng phải tìm số u(/2) (còn ký hiệu là u/2) sao cho:
| X   |

P
 u( / 2)   1   , với  đã cho với X ~ N(, 2).





Khi đó biểu thức đã cho là tƣơng đƣơng với: 2(u/2) – 1 = 1 –   (u/2) = 1– /2.
Từ đó số u(/2) đƣợc tìm bằng cách tra ngƣợc bảng phân phối chuẩn: Tìm số 1 – /2 ở giữa
bảng, dóng theo hàng và cột lên cột đầu tiên và hàng đầu tiên là số u(/2).
Thí dụ:

u(0,025) = 1,96; u(0,05) = 1,645

5.2. Phân phối khi-bình phƣơng (2)
Định nghĩa: Nếu X1, X2, …, Xn là n biến ngẫu nhiên độc lập, cùng phân phối chuẩn tắc thì
biến ngẫu nhiên  2  X12  X 22  ...  X 2n có phân phối khi-bình phƣơng với n bậc tự do. Ký hiệu
2 ~ 2(n).
Chú ý rằng biến 2 ~ 2(n) chỉ nhận các giá trị
không âm, đƣờng cong mật độ xác suất của nó còn phụ
thuộc vào số bậc tự do n
Trong toán thống kê thƣờng gặp biểu thức xác suất:
P(2 > 2(, n) ) = , với  đã cho
trong đó 2 ~ 2(n) và phải tìm 2(, n) (hay 2, n) .

f(q)
n1
n2

O

2(,n2)

q2


Đồ thị hàm mật độ biến 2
n bậc tự do (n1 < n2)

Khi đó số 2(,n) đƣợc tìm trong bảng phân phối khi-bình phƣơng ở giao của cột , dòng n.
Thí dụ: 2(0,05; 4) = 9,488;

2(0,95; 10) = 3,94

5.3. Phân phối Student
Định nghĩa: Nếu X, X1, X2, …, Xn là các biến ngẫu nhiên chuẩn tắc và độc lập với nhau
X
thì biến ngẫu nhiên T 
có phân phối Student với n bậc tự do. Ký hiệu T ~ t(n).
1 n 2
 Xi
n i 1
9


ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

Phân phối Student là phân phối đối xứng (đƣờng
cong mật độ xác suất là đối xứng qua trục tung). Đồ thị
của hàm mật độ xác suất của biến Student có dạng
giống nhƣ đồ thị hàm mật độ xác suất của biến chuẩn
tắc, nhƣng ít nhọn hơn (n càng lớn thì đƣờng cong mật
độ xác suất càng nhọn).

f(t)
n1

n2
/2

/2
-t(/2,n1)

O

t(/2,n1) tT

Đồ thị hàm mật độ biến Student

Trong toán thống kê thƣờng gặp biểu thức xác suất:
n bậc tự do (n1 > n2)
P(|T| > t(/2, n) ) = , với  đã cho
trong đó T ~ t(n) phải tìm t(/2, n) (hay t/2, n).
Khi đó số t(/2, n) đƣợc tìm trong bảng phân phối Student ở giao của cột , dòng n.
Thí dụ: t(0,025; 15) = 2,131;
t(0,05; 15) = 1,753
Ngƣời ta chứng minh đƣợc rằng khi n lớn thì phân phối Student n bậc tự do là xấp xỉ phân
phối chuẩn tắc. Trong thực tế, nếu n > 30 thì phân phối Student n bậc tự do đƣợc coi là phân
phối chuẩn tắc. Vi thế:
t(0,025; 31) = t(0,025;35) = t(0,025; n) = 1,96, n31 (tra ở dòng cuối của bảng Student)
t(0,05; 31) = t(0,05;35) = t(0,05; n) = 1,645, n31 (tra ở dòng cuối của bảng Student)

5.4. Phân phối Fisher-Snedecor
Định nghĩa: Nếu X1, X2, …, Xn và Y1, Y2, …, Ym là các biến ngẫu nhiên chuẩn tắc và độc
n

lập với nhau thì biến ngẫu nhiên F 


m Xi2
i 1
m

n
i 1

gọi là biến ngẫu nhiên Fisher với n, m bậc tự do

Yi2

(Quy luật phân phối xác suất của F gọi là quy luật Fisher với n, m bậc tự do, chú ý bậc tự do của
tử số đọc trƣớc) và ký hiệu F ~ F(n, m).
Trong toán thống kê thƣờng gặp biểu thức xác suất:
P(F > F(,n,m) ) = , với  đã cho
trong đó F ~ F(n,m) và phải tìm F(,n,m) (hay F, n, m).
Khi đó số F(,n,m) đƣợc tìm trong bảng phân phối
khi-bình phƣơng ở giao của cột n, dòng m, bảng 
Thí dụ: F(0,05; 9; 12) = 2,796
F(0,05; 12; 9) = 3,073

f(f)
n1,m1
n2,m2

O




F(,n1,m1)

fF

Đồ thị hàm mật độ biến Fisher
n,m bậc tự do

5.5. Phân vị mức 1 – 
Phân vị mức 1 –  của biến ngẫu nhiên X là số X thỏa mãn:
P( X < X)  1 –   P(X  X)
Nếu F(x) là hàm phân phối của X, thì từ tính chất của hàm phân phối, ta có:
F(X)  1 –   F(X0 )
Nếu X là biến ngẫu nhiên liên tục có hàm mật độ f(x) thì: F(X ) 

X

 f (x)dx  1  



Các số u() ;  (, n); t(, n); F(, n, m) trong các phân phối trên chính là các phân vị
mức 1 –  của các phân phối tƣơng ứng. Chú ý là các phân vị trên có thể ký hiệu tƣơng ứng:
u; 2, n ; t, n; F, n, m.
2

10


Bài giảng Toán Thống kê


BÀI TẬP CHƢƠNG 4
(Các số trong dấu ngoặc đơn là số của bài tập tƣơng ứng trong sách giáo khoa)

1. (1)Điều tra năng suất lúa (X tạ/ha) trên 10 thửa ruộng đƣợc bảng số liệu sau:
Thửa số
X

1
2
3
4
5
6
7
8
9
10
45,5 46,0 47,0 45,5 47,5 46,0 48,0 48,0 44,0 49,5

Tính các số đặc trƣng của mẫu.
Đs: x = 46,7; s*2 = 2,3100; s* = 1,5199; s2 = 2,5567, s = 1,6021

2. Trọng lƣợng X (kg/con) của 25 con lợn xuất chuồng cho bởi bảng sau:
X
95
96
97
98
99
100

Số con (ni)
2
5
7
6
4
1
a) Lập biểu đồ tần số và tần suất,
b) Lập hàm phân phối mẫu,
c) Tính các số đặc trƣng của mẫu.
Đs: c) x = 97,32; s*2 = 1,6576; s* = 1,2875; s2 = 1.7267, s = 1,340

3. (4)Đo chiều cao X (mét) của 100 sinh viên chọn ngẫu nhiên đƣợc bảng số liệu:
X
1,50-1,55 1,55-1,60 1,60-1,65 1,65-1,70 1,70-1,75
ni
5
18
42
27
8
a) Lập biểu đồ tần số cà đa giác tần số,
b) Tính các số đặc trƣng mẫu.
Đs: x = 1,6325; s*2 = 0,00237; s* = 0,0478; s2 = 0,0239, s = 0,0489

4. (5)Một mẫu là số tiền mua hàng X (đơn vị mƣời nghìn đồng) của 50 khách hàng tại một siêu
thị nhƣ sau:
1
5
22

21
39
32
29
47
14
37
21
14
10
28
26
16
20
35
41
30
36
6
27
18
17
31
25
23
54
10
49
29
24

8
28
12
24
25
3
49
20
23
10
13
45
16
22
58
43
32
a) Tính trực trung bình mẫu và phƣơng sai hiệu chỉnh của mẫu,
b) Xếp mẫu thành 6 lớp với độ rộng h = 10,
c) Tính trung bình mẫu và phƣơng sai hiệu chỉnh của mẫu theo phân lớp ở phần b).
b)

X
ni

Đs: a) x = 25,36;
0-10
10-20
20-30
8

10
17
c) x = 24,80;

5. (2) Trọng lƣợng của 12 con lợn xuất chuồng là (đơn vị kg)
108 112 108 120 112 114 115 112 115
Hãy tính các số đặc trƣng của mẫu.
Đs: a) x = 113,33;

s2 = 184.48, s = 13,5823
30-40
40-50
50-60
7
6
2
s2 = 185,6735, s = 13,6262

118

116

110

s*2= 12,7222; s* = 3,5668; s2 = 13,8788, s = 3,7254

11


ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI


Chương 5. ƯỚC LƯỢNG THAM SỐ
Khái niệm về bài toán ƣớc lƣợng tham số
Giả sử khi nghiên cứu biến ngẫu nhiên X tồn tại trong một tập hợp chính nào đó, chúng ta
đã biết quy luật phân phối xác suất của X, tuy nhiên còn tham số  nào đó của X chƣa xác định
đƣợc giá trị, ta phải tiến hành xác định giá trị của  bằng một mẫu thống kê (x1, x2,…,xn) của X.
Bài toán xác định giá trị (gần đúng) của tham số  nhƣ vậy gọi là bài toán ƣớc lƣợng
tham số .
Về mặt lý thuyết, bài toán đƣợc giải quyết trên cơ sở mẫu ngẫu nhiên (X 1, X2, …, Xn) của
X, và sau đó thay các biến ngẫu nhiên Xi bằng giá trị cụ thể xi của nó có trong mẫu cụ thể
(x1,x2,…,xn) ta đƣợc đáp số cụ thể.
Có hai phƣơng pháp ƣớc lƣợng:
1- Ƣớc lƣợng điểm của : chỉ ra  = 0 nào đó
2- Ƣớc lƣợng khoảng của : Chỉ ra khoảng [1, 2] sao cho P(1 ≤  ≤ 2) = P với P
đƣợc cho trƣớc thì khoảng [1, 2] gọi là khoảng ƣớc lƣợng (hay khoảng tin cậy) của  và P gọi
là độ tin cậy của khoảng ƣớc lƣợng [1, 2].

I. ƢỚC LƢỢNG ĐIỂM
1.1. Định nghĩa.
Giả sử cần ƣớc lƣợng tham số  của đại lƣợng ngẫu nhiên X.
Một thống kê (một hàm) của mẫu ngẫu nhiên G = G(X1, …, Xn) dùng thay thể cho  gọi là
một ƣớc lƣợng của tham số .
Khi thay (X1, …, Xn) bằng một mẫu cụ thể (x1, …, xn) vào thống kê G thì đƣợc một giá trị
cụ thể G0 = G(x1, …, xn). G0 gọi là ƣớc lƣợng điểm của .
Dễ thấy G là biến ngẫu nhiên (vì nó là hàm của các biến ngẫu nhiên).
Với định nghĩa nhƣ trên sẽ có rất nhiều ƣớc lƣợng cho tham số , bởi vậy phải có các tiêu
chuẩn để lựa chọn ƣớc lƣợng cho tham số .

1.2 Các loại ƣớc lƣợng
Ngƣời ta phân loại các ƣớc lƣợng điểm nhƣ sau:

1-/ Ƣớc lƣợng không chệch: Ƣớc lƣợng G của tham số  gọi là ƣớc lƣợng không chệch
nếu kỳ vọng của nó bằng chính , nghĩa là: E(G) = .
Ý nghĩa: Giả sử ˆ là ƣớc lƣợng không chệch của . Ta có:
E(G ) = E(G) – E() =    = 0
Vậy ƣớc lƣợng không chệch là ƣớc lƣợng có sai số trung bình bằng 0.
2-/ Ƣớc lƣợng hiệu quả: Ƣớc lƣợng Gcủa tham số  gọi là ƣớc lƣợng hiệu quả nếu nó là
ƣớc lƣợng không chệch có phƣơng sai nhỏ nhất:
D(G) đạt min trong mọi ƣớc lƣợng không chệch của .
3-/ Ƣớc lƣợng vững: Ƣớc lƣợng G của tham số  gọi là ƣớc lƣợng vững nếu khi tăng
dung lƣợng mẫu thì G sẽ dần (theo xác suất) đến :
lim P  G       1 , >0
n 

Một ƣớc lƣợng điểm là chấp nhận đƣợc nếu nó đồng thời là ƣớc lƣợng không chệch, ƣớc
lƣợng hiệu quả và ƣớc lƣợng vững.
12


Bài giảng Toán Thống kê

1.3. Các ƣớc lƣợng điểm thƣờng gặp.
Với mẫu ngẫu nhiên (X1, X2, …, Xn) của X, trong đó Xi là các biến ngẫu nhiên độc lập có
cùng phân phối xác suất với X và giả sử E(X) = , D(X) = 2. Ta có:
a-/ Trung bình mẫu ngẫu nhiên: X 

1 n
 Xi là ƣớc lƣợng không chệch đồng thời là ƣớc
n i 1

lƣợng vững và ƣớc lƣợng hiệu quả của kỳ vọng E(X) =  của tổng thể X.

Thật vậy:
Giả sử E(X) = , khi đó:
E(Xi) = ; D(Xi) = 2 , i
Ta có:
1 n
 1 n
1

E(X)  E  Xi    EXi   .n.  
n
 n i 1  n i 1

Vậy, trung bình mẫu X là ƣớc lƣợng không chệch của kỳ vọng E(X)
Chúng ta thừa nhận X là ƣớc lƣợng hiệu quả và là ƣớc lƣợng vững của .
b-/ Phƣơng sai mẫu ngẫu nhiên hiệu chỉnh:
S2 





2
n
1 n
S *2 
Xi  X

n 1
n  1 i 1


là ƣớc lƣợng không chệch, đồng thời là ƣớc lƣợng hiệu quả và ƣớc lƣợng vững của phƣơng sai
D(X) = 2 của tổng thể X.
Thật vậy: Trƣớc hết xét phƣơng sai mẫu: S*2 =
S*2 =







2
1 n
Xi  X . Ta có:

n i 1



2
1 n
1 n
2
(
X

X
)
( X i  )  ( X  ) =
=



i
n i 1
n i 1





1 n
=  (X i  ) 2  (X  )[2(X i  )  (X  )] =
n i 1

=





n
1 n
1
( X i  ) 2  ( X  )  2X i  X   =

n i 1
n
i 1

=




1 n
1
(Xi  ) 2  (X  ) 2 Xi  n X  n =

n i 1
n
 i


=

1 n
1
1 n
(Xi  ) 2  (X  )(2n X  n X  n) =  (Xi  ) 2  (X  ) 2 .

n i 1
n
n i 1

Từ đó:
1 n
 1 n
E(S*2) = E  (Xi  )2  (X  )2  =  E(Xi  ) 2  E(X  ) 2 =
 n i 1
 n i 1


=

1 n
1 n 2 2
2
n 1 2
2
D
(
X
)

D
(
X
)



=
=


=


i
n
n i 1
n i 1

n
n

Vậy Phƣơng sai mẫu S*2 là ƣớc lƣợng chệch của phƣơng sai D(X) = 2 của tổng thể X.
Từ đó:
13


ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

 

n
n n 1 2
 n

S *2  =
E(S2) = E
E S *2 =
.
 = 2
n 1
n 1 n
 n 1


Vậy phƣơng sai hiệu chỉnh S2 của mẫu là ƣớc lƣợng không chệch của phƣơng sai D(X) = 2
của tổng thể X.
Ta thừa nhận phƣơng sai hiệu chỉnh S2 của mẫu cũng là ƣớc lƣợng vững và ƣớc lƣợng hiệu
quả của D(X) = 2.

Chú ý: Vì phƣơng sai mẫu S*2 là ƣớc lƣợng chệch của D(X) = 2 nên không dùng để ƣớc
lƣợng 2. Phải ƣớc lƣợng D(X) bằng phƣơng sai hiệu chỉnh S2 của mẫu.
c-/ Tần suất là ƣớc lƣợng vững, đồng thời là ƣớc lƣợng hiệu quả và ƣớc lƣợng vững của
xác suất.
Giả sử mỗi cá thể trong tổng thể có tính chất A với xác suất p (tỷ lệ cá thể có tính chất A là
p) (p chƣa biết).
Để ƣớc lƣợng p, ta lấy mẫu kích thƣớc n và gọi X là số cá thể có tính chất A trong mẫu.
Gọi Xi là số cá thể có tính chất A trong cá thể thứ i. Ta có (X1, X2, …, Xn) là mẫu ngẫu
nhiên của X và phân phối xác suất của Xi là:
Xi
0
1
P 1–p
p
Ta có: E(Xi) = 0.(1 – p) + 1.p = p, i = 1, 2, …, n.
Mặt khác vì X là số cá thể có tính chất A trong mẫu nên X là biến ngẫu nhiên Nhị thức
n

tham số n, p (X ~ B(n, p)) và X   Xi
i 1

Tỷ số giữa số cá thể có tính chất A trong mẫu với tổng số cá thể quan sát gọi là tần suất cá
thể có tính chất A. Vậy F 

1 n
 Xi là tần suất cá thể có tính chất A trong mẫu ngẫu nhiên.
n i 1

1
1 n

 1 n
Từ đó: E(F) = E(F)  E   Xi    E  Xi   .np  p
n
 n i 1  n i 1
Vậy tần suất F các cá thể có tính chất A là ƣớc lƣợng không chệch của p. Ta thừa nhận tần
suất F cũng ƣớc lƣợng hiệu quả và ƣớc lƣợng vững của p.

II. ƢỚC LƢỢNG KHOẢNG
2.1. Khoảng tin cậy. Độ tin cậy
Giả sử đại lƣợng ngẫu nhiên X có tham số  chƣa biết. Tìm khoảng [1, 2] chứa  sao cho
P(1 ≤  ≤ 2) = P, với P là xác suất cho trƣớc.
Từ ƣớc lƣợng điểm G = G(X1, X2, ..., Xn) chấp nhận đƣợc của , ta tìm quy luật phân phối
xác suất của G, từ đó tìm đƣợc các thống kê G1 = G1(X1, X2, ..., Xn) và G2 = G2(X1, X2, ..., Xn)
sao cho:
P(G1    G2) = P
(5.1)
Vì P gần bằng 1, nên biến cố (G1    G2) hầu nhƣ xảy ra.
Với mẫu thống kê cụ thể (x1, x2, …, xn) của X, ta tính đƣợc:
1 = G1(x1, x2, …, xn), 2 = G2(x1, x2, …, xn)
Vậy, với P cho trƣớc, ta xác định đƣợc khoảng (1, 2) chứa  sao cho:
P(  [1, 2]) = P
14


Bài giảng Toán Thống kê

- Khoảng [1, 2] gọi là khoảng tin cậy hay khoảng ƣớc lƣợng của tham số .
- Số P gọi là độ tin cậy của khoảng tin cậy.
- Đại lƣợng 2d = |1  2| gọi là độ rộng của khoảng tin cậy.
Chú ý: Với cùng độ tin cậy P, khoảng ƣớc lƣợng (1, 2) có độ rộng càng nhỏ càng tốt.

Cùng độ tin cậy P có rất nhiều 1, 2 thỏa mãn (5.1), do đó có rất nhiều khoảng tin cậy khác
nhau nên cần phải chọn khoảng nào có độ rộng nhỏ nhất.

2.2. Ƣớc lƣợng kỳ vọng (giá trị trung bình) của phân phối chuẩn
Bài toán: Giả sử X là biến ngẫu nhiên chuẩn N(, 2), trong đó M(X) =  chƣa biết. Hãy
tìm khoảng tin cậy của  với độ tin cậy P cho trƣớc từ mẫu thống kê (x1, x2, …, xn) của X.
Giải: Nhƣ đã biết trong phần I, trung bình mẫu của mẫu ngẫu nhiên X 

1 n
 Xi là ƣớc
n i 1

lƣợng điểm chấp nhận đƣợc của .
Có hai trƣờng hợp xảy ra:
a) Trƣờng hợp biết phƣơng sai D(X) = 2.
Khi đó:

|X|
  
X ~ N  ,
~ N(0, 1)
 

n

n
Bởi vậy, với độ tin cậy P đã cho có thể tìm phân vị chuẩn u/2, trong đó  = 1 – P đƣợc:







|
X


|
 
 = P.
P
 u   = P  P| X   |  u  .

 

n
2


2

n




 
 P X  u .
   X  u.
 =P

n
n
2
2


Vậy khoảng tin cậy của kỳ vọng  là:



 
; X  u.
X  u  .

n
n
2
2


Với mẫu cụ thể (x1, x2, …, xn) thì tính trung bình mẫu x và đƣợc khoảng tin cậy cụ thể:



 
; x  u.
x  u  .

n
n

2
2

Ta thừa nhận việc chọn u/2 nhƣ vậy cho khoảng tin cậy của  có độ rộng nhỏ nhất.
Thí dụ 1: Biết chiều dài của một loại sản phẩm là lƣợng ngẫu nhiên chuẩn N(; 4). Đo
chiều dài của 25 sản phẩm tính đƣợc chiều dài trung bình x = 99,82mm. Hãy tìm khoảng tin
cậy  (độ dài trung bình của sản phẩm) với độ tin cậy 0,95.
Giải: Theo giả thiết có  = 2, tra bảng chuẩn đƣợc u0,025 = 1,96.
Từ đó có khoảng tin cậy cần tìm:
2
2
[99,82 – 1,96
; 99,82 + 1,96
]  [99,036; 100,604]
25
25
15


ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

b) Trƣờng hợp không biết phƣơng sai 2
Khi đó ƣớc lƣợng 2 bằng phƣơng sai mẫu hiệu chỉnh S2 





2
1 n

Xi  X và có:

n  1 i 1

|X|
~ t(n – 1)
S
n

Bởi vậy, với xác suất P đã cho có thể tìm phân vị Student t(/2; n –1) đƣợc:





|X|
S


P
 t( / 2; n  1)  = P  P | X   |  t ( / 2; n  1)  = P
n
 S




n





S2
S2 
 P  X  t   / 2,n  1
   X  t   / 2,n  1
 =P


n
n



S2
S2 
Vậy khoảng tin cậy của kỳ vọng  là:  X  t   / 2,n  1
; X  t   / 2,n  1

n
n 

Với mẫu cụ thể (x1, x2, …, xn) thì tính trung bình mẫu x , phƣơng sai hiệu chỉnh s2 của
mẫu và đƣợc khoảng tin cậy cụ thể:


s2
s2 
; x  t .
x  t  .


, n 1
, n 1
n
n


2
2
Thí dụ 2: Điều tra giá bán một loại sản phẩm tại một số cửa hàng ở địa phƣơng A đƣợc
kết quả:
Giá bán một sản phẩm (X đồng)
Số cửa hàng (ni)

9,5
2

9,7
5

9,8
6

9,9
4

10,1
2

10,2

1

Giả sử giá bán là biến ngẫu nhiên chuẩn. Hãy khoảng tin cậy giá bán trung bình của sản
phẩm đó tại địa phƣơng A với độ tin cậy 0,95
Giải: Trƣớc hết, tính các số đặc trƣng của mẫu
Dung lƣợng mẫu: n = 2 + 5 + 6 + 4 + 2 + 1 = 20
Tổng của X: x = 9,5.2 + 9,7.2 + … + 10,2.1 = 196,3
Tổng của X2: x2 = 9,52.2 + 9,72.2 + … + 10,22.2 = 1927,29
196,3
Từ đó có trung bình mẫu là: x 
= 9,815;
20
Phƣơng sai hiệu chỉnh của mẫu: s2 =

20.1927,29  (196,3) 2
= 0,0319
20.19

Tra bảng Student đƣợc t(0,025; 19) = 2,093
Vậy khoảng tin cậy cần tìm là:
[9,815 – 2,093

16

0,0319
0,0319
; 9,815 + 2,093
]  [9,731; 9,899] (đồng/sản phẩm)
20
20



Bài giảng Toán Thống kê

2.3. Ƣớc lƣợng phƣơng sai của phân phối chuẩn
Bài toán: Giả sử X là đại lƣợng ngẫu nhiên chuẩn N(, 2), trong đó D(X) = 2 chƣa biết.
Hãy tìm khoảng tin cậy của 2 với độ tin cậy P.
Chọn thống kê

n  1S2
2

với S2 





2
1 n
Xi  X thì

n  1 i 1

Với mức tin cậy 1 –  đã cho ta tìm các phân vị 2(

n  1S2 ~ 2(n –1).
2




; n 1) và 2(1 ; n 1) đƣợc:
2
2

 (n  1)S2


(n  1)S2 
(n  1)S2
2
2
=
P

P



P  2  


 2



,n 1
2
12/2,n1 
2

 1 2 ,n1

 /2,n1
 (n  1)S2 (n  1)S2 
Vậy khoảng tin cậy của D(X) = 2 là:  2
; 2


1/2,n 1 

/2,n

1

Với mẫu cụ thể (x1, x2, …, xn) thì tính phƣơng sai hiệu chỉnh s2 của mẫu và đƣợc khoảng
tin cậy cụ thể:
 (n  1)s2 (n  1)s2 
; 2
 2


1/2,n 1 

/2,n

1

Thí dụ 1: Tìm khoảng tin cậy của phƣơng sai của thí dụ 2 trong mục 2.2 với độ tin cậy 0,90.
Ở trên đã tính đƣợc: n = 20, s2 = 0,0319. Ta có  = 1 – 0,90 = 0,10
Tra bảng 2 đƣợc : 2(0,95; 19) = 10,117; 2(0,05; 19) = 30,144.

Vậy khoảng tin cậy của phƣơng sai là:
 19.0,0319 19.0,0319 
;


10,117 
 30,144



(0,0201; 0,0599)

Thí dụ 2: Kết quả đo đƣờng kính các viên bi kim loại (X mm) nhƣ sau:
X: 5,13 5,31 4,92 4,83 4,92 5,05 5,34 4,93
Giả sử các kết quả đo là lƣợng ngẫu nhiên chuẩn N(, 2), hãy tìm khoảng tin cậy 95%
Giải:
Từ số liệu đã cho tính đƣợc: xi = 40,93; xi2 = 204,5777 nên:

8.204,5777  40,832
s 
= 0,0364
8.7
Tra bảng 2 đƣợc: 2(0,025; 7) = 16,013; 2(0,975; 7) = 1,690;
2

Từ đó có khoảng tin cậy 95% của 2:

 7 . 0,0364 7 . 0,0364 
;



1,69 
 16,013



(0,0159; 0,1508)

2.4. Ƣớc lƣợng xác suất (tỷ lệ)
Bài toán: Giả sử mỗi cá thể trong tổng thể có đặc tính A với xác suất p (tỷ lệ cá thể có đặc
tính A là p) (p chƣa biết). Hãy tìm khoảng tin cậy của p với độ tin cậy P cho trƣớc.
Giải: Ở 1.3c đã chứng minh đƣợc tần suất F các cá thể có tính chất A trong mẫu ngẫu
nhiên là ƣớc lƣợng điểm của xác suất p.
Do X ~ B(n,p) ≈ N(np, npq)  F 

X
 pq 
~ N  p,  , trong đó q = 1 – p
n
 n 
17


ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

Fp
Fp
thì
~ N(0, 1).
pq

pq
n
n
Do đó với xác suất P đã cho có thể tìm đƣợc phân vị chuẩn u/2 với  = 1  P đƣợc:
Bởi vậy, chọn thống kê:






pq 
| Fp|

 =P
P
 u   = P  P| F  p |  u 

 pq

n
2


2


n



Lấy mẫu cụ thể với n cá thể, trong mẫu có k cá thể có tính chất A thì tính tần suất cá thể có
k
tính chất A là f  và khoảng tin cậy của p cần tìm thoả mãn:
n

| f  p |  u
2

pq
n

(5.2)

Từ (5.2), có thể:
 Hoặc giải bất phƣơng trình:
(5.2)  | f  p |2  u 2
2

 u2 

p(1  p)
u2 
 1   / 2  p2   2f   / 2  p  f 2  0  [p1, p2]
n
n 
n 



k

không quá nhỏ hoặc quá lớn (0,01  f 
n
0,99) có thể thay p và q ở vế phải của công thức trên bằng f và 1 – f và đƣợc khoảng tin
cậy gần đúng của xác suất p là:

 Hoặc khi n đủ lớn (n  100) và tần suất f 



 f  u  f (1  f ) ; f  u  f (1  f ) 

n
n 
2
2

Thí dụ 1: Kiểm tra 200 sản phẩm thấy có 25 sản phẩm có khuyết tật. Hãy tìm khoảng tin
cậy tỷ lệ sản phẩm có khuyết tật với độ tin cậy 0,95.
25
 0,125
Giải: Tần suất sản phẩm có khuyết tật là: f 
200
Ở đây  = 1 – 0,95 = 0,05. Tra bảng chuẩn đƣợc u0,025 = 1,96
Khoảng tin cậy cần tìm của tỷ lệ sản phẩm có khuyết tật là:


0,125.0,875
0,125.0,875 
; 0,125  1,96
0,125  1,96


200
200


Chú thích: Nếu lập bất phƣơng trình đƣợc:

 (0,079; 0,171)

 1,962  2 
1,962 
2
1 
 p   2.0,125 
 p  0,125  0
200 
200 


 1,0192p2 – 0,2692p + 0,0156 ≤ 0  [0,086; 0,178]
Thí dụ 2: Để biết tỷ lệ ngƣời tiêu dùng ƣa thích một loại sản phẩm mới, ngƣời ta hỏi ý kiến
400 ngƣời và có 252 ngƣời trả lời là thích. Hãy ƣớc lƣợng tỷ lệ ngƣời thích loại sản phẩm đó
với độ tin cậy 0,90.
252
 0,63
Giải: Tần suất số ngƣời thích loại sản phẩm mới là: f 
400
18



Bài giảng Toán Thống kê

Ở đây  = 1 – 0,90 = 0,10. Tra bảng chuẩn đƣợc u0,05 = 1,645
Khoảng tin cậy cần tìm của tỷ lệ ngƣời ƣa thích sản phẩm đó là:


0,63(1  0,63)
0,63(1  0,63) 
; 0,63  1,645
0,63  1,645
  [0,5903; 0,6697]
400
400


(Nếu giải bất phƣơng trình thì đƣợc đáp số: [0,5895; 0,6687]

2.5. Kích thƣớc mẫu cần thiết
Trong nhiều trƣờng hợp ta cần phải xác định dung lƣợng n của mẫu để với độ tin cậy P đã
cho sao cho độ rộng của khoảng tin cậy (kỳ vọng hoặc xác suất) không quá 2 với  cho trƣớc.
Khi ấy:

a) Trƣờng hợp ƣớc lƣợng kỳ vọng thì độ rộng của khoảng tin cậy là 2u 
nên có:
n
2

2u 
2



2
 2  n  u 2 2
n
2 

Chú ý: Nếu chƣa biết  thì từ mẫu đã cho ta tính phƣơng sai hiệu chỉnh s2 và thay 2 ở
công thức trên bằng s2
2

Thí dụ: Biết X~N(, 0,16) . Để độ chính xác của ƣớc lƣợng khoảng với độ tin cậy 0,95
của  không quá 0,5 thì cần lấy mẫu có bao nhiêu cá thể?
Giải:

Tra bảng chuẩn đƣợc: u0,025 = 1,96
2

Từ đó:

 1,96.0,4 
n≥ 
 = 9,83
 0,25 

Vậy phải lấy mẫu có ít nhất là 10 cá thể.
b) Trƣờng hợp ƣớc lƣợng xác suất thì độ rộng của khoảng tin cậy là 2u 
2

2u 
2


p(1  p)
nên có:
n

p(1  p)
u 2 / 2p(1  p)
 2  n 
n
2

u 2 / 2
1
Nếu chƣa biết p thì có thể ƣớc lƣợng: n  2 ; vì p(1  p) 
4
4
Thí dụ: Để đánh giá tỷ lệ đồng ý trong một cuộc thăm dò ý kiến về một vấn đề nào đó sao
cho độ rộng của khoảng tin cậy của tỷ lệ ủng hộ không vƣợt quá 0,06 thì cần hỏi ý kiến bao
nhiêu ngƣời?
Giải:
Từ đó:

1.962
n≥
= 1067,11
4.0,032
Vậy cần hỏi ít nhất 1068 ngƣời.

19



ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

BÀI TẬP CHƢƠNG 5
1. (12)Đo một đại lƣợng 15 lần bằng một dụng cụ đo không có sai số hệ thống, tính đƣợc x =
19,25. Biết sai số X ~ N(; 0,4). Hãy tìm khoảng tin cậy của kỳ vọng  với độ tin cậy 0,95.
Đs: [18,93; 19,57]

2. (9)Trọng lƣợng X của các gói mì ăn liền tuân theo phân phối chuẩn. Kiểm tra 20 gói mì tính
đƣợc x = 78,0g; s = 2,5 g. Với độ tin cậy 0.95 hãy tìm khoảng tin cậy của E(X).
Đs: [76,83; 79,17]

3. (4)Năng suất ngô X (tạ/ha) là đại lƣợng ngẫu nhiên có phân phối chuẩn N(, 2). Điều tra
năng suất ngô của 130 thửa ruộng ta có kết quả sau:
Năng suất xi
Số thửa ni

40
2

45
5

46
9

49
35

51

43

53
22

57
14

Hãy tìm khoảng tin cậy của năng suất ngô trung bình  với độ tin cậy 0,95.
Đs: x = 50,70; s2 = 10,5992; [50,140; 51,260]

4. (6)Biết khối lƣợng X(kg/con) của các con gà tại một trại gà có phân phối chuẩn N(, 2).
Bắt ngẫu nhiên 20 con gà đem cân ta có kết quả sau:
xi
2,1
2,3
2,4
2,6
2,7
ni
1
2
3
3
5
Với độ tin cậy 0,95, hãy:
a) Tìm khoảng tin cậy của trung bình .
b) Tìm khoảng tin cậy của phƣơng sai 2.

2,9

3

3,1
2

Đs: a) x = 2,67; s2 = 0,0927; [2,53; 2,81];

3,3
1

b) [0,0536; 0,1977]

5. (5)Biết trọng lƣợng X (g/quả) của trứng gà có phân phối chuẩn N(, 25) Cân một mẫu gồm
100 quả trứng ta có kết quả sau:
xi
ni

150
4

160
12

165
14

170
25

175

25

180
14

185
6

a) Với độ tin cậy 0,95 tìm khoảng tin cậy của trọng lƣợng trứng trung bình .
b) Trứng có khối lƣợng lớn hơn 170 g là trứng loại một. Với độ tin cậy 0,95 hãy tìm
khoảng tin cậy của tỷ lệ trứng loại một.
Đs: a) x = 170,85; s2 =65,1793; [169,27; 172,43];
b) f = 0,45; [0,3525; 0,5475] (hoặc [0,3561; 0,5476] nếu giải bất phương trình)

6. (11)Đo độ chịu lực X (kg/cm2) của 250 mẫu bê tông ta có kết quả sau:
X
180-190 190-200 200-210 210-220 220-230 230-240 240-250 250-260
Tần số ni
12
15
30
58
65
35
20
15
Biết độ chịu lực X là biến chuẩn. Hãy tìm khoảng tin cậy của E(X) với độ tin cậy 0,95.
Đs: x = 221,36; s2 = 289,9100; [219,25; 223,47]

7. (8)Theo d i doanh thu hàng tháng của 10 cửa hàng kinh doanh thóc giống tại một tỉnh ta có

kết quả sau:
Doanh thu X( triệu đồng)
ni
20

30
1

31
1

33
2

35
2

37
2

39
1

40
1


Bài giảng Toán Thống kê

Biết X có phân phối chuẩn N(, 2).

Hãy tìm khoảng tin cậy của  và khoảng tin cậy của 2 với độ tin cậy 0,98.
Đs: x = 35; s2 = 10,8889;  [32,06; 37,94]; 2 [4,5232; ;46,4349]

8. (10)Kiểm tra 1000 mẫu máu một loại gia cầm có 120 mẫu chứa vi rút gây bệnh A. Hãy tìm
khoảng tin cậy của tỉ lệ gia cầm chứa vi rút gây bệnh A với độ tin cậy 0,95.
Đs: f = 0,12; [0,0999; 0,1401] (hoặc [0,1013; 0,1416], nếu giải bất phương trình)

9. (19)Đại lƣợng ngẫu nhiên X có phân phối chuẩn với phƣơng sai 0,04. Tối thiểu phải điều
tra bao nhiêu mẫu để với độ tin cậy 0,95 độ rộng của khoảng tin cậy không quá 0,12.
Đs: Ít nhất 43

10. (20)Phải kiểm tra ít nhất bao nhiêu mẫu bệnh phẩm để với độ tin cậy 0,95 độ rộng của
khoảng tin cậy tỉ lệ ngƣời mắc bệnh  0,05.
Đs: 1537

11. (14)Để khảo sát mức tiêu thụ xăng trung bình của một loại ô tô ngƣời ta cho chạy thử 20 xe
loại này trên đoạn đƣờng 100km. Mức xăng tiêu thu tƣơng ứng cho bởi bảng sau:
Mức xăng X
Số xe ni

7,5
3

8,0
4

8,5
6

9,0

5

9,5
2

Hãy tìm khoảng tin cậy của mức xăng tiêu thụ trung bình với độ tin cậy 0,95, biết X là biến
chuẩn.
Đs: x = 8,475; s2 = 0,3809; [8,186; 8,764]

12. (13)Trọng lƣợng X của một giống lợn khi xuất chuồng là một biến ngẫu nhiên chuẩn. Một
mẫu ngẫu nhiên gồm 9 con lợn đến thời gian xuất chuồng có trọng lƣợng cho bởi bảng sau:
129,8; 121,2; 138,6; 125,4; 122,6; 139,8; 129,9; 130,3; 125,8
Hãy tìm khoảng tin cậy của trọng lƣợng trung bình E(X) và của phƣơng sai D(X) với độ tin
cậy 0,95.
Đs: x = 129,27; s2 = 42,0375; E(X) [124,29; 134,25]; D(X) [19,1784; 154,2631]

13. (22)Kiểm tra 200 con gà tại một trại thấy có 80 con mắc bệnh A. Hãy tìm khoảng tin cậy
của tỉ lệ gà mắc bệnh A ở trại gà nói trên với độ tin cậy 0,95.
Đs: f = 0,4; [0,3321; 0,4679] (hoặc [0,3346; 0,4692] nếu giả bất phương trình)

14. (22)Biết đặc trƣng X có phân phối chuẩn N(; 0,09). Hỏi dung lƣợng mẫu tối thiểu là bao
nhiêu để với độ tin cậy 0,95 có thể tin rằng độ rộng của khoảng tin cậy của  không vƣợt
quá 0,5.
Đs: 6

15. (24)Tỉ lệ ngƣời có nhóm máu O ở một tộc ngƣời là p. Phải kiểm tra ít nhất bao nhiêu ngƣời
để với độ tin cậy 0,95 độ rộng của khoảng tin cậy của p không vƣợt quá 0,02.
Đs: 9604

21



ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

Chương 6. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
I. GIẢ THUYẾT, ĐỐI THUYẾT
1.1. Giả thuyết, đối thuyết
Giả thuyết là một mệnh đề (một câu khẳng định) về một vấn đề chƣa biết nào đó.
Khi nghiên cứu một (hoặc nhiều) biến ngẫu nhiên ta có thể nêu lên một giả thuyết nào đó
liên quan đến biến ngẫu nhiên đó.
Khi đã nêu một giả thuyết thì cần phải xây dựng các tiêu chí để đánh giá giả thuyết đó có
đƣợc chấp nhận hay không. Trong toán thống kê phải dựa vào các mẫu thu đƣợc để đƣa ra kết
luận có chấp nhận hay bác bỏ giả thuyết đã nêu. Việc này gọi là kiểm định giả thuyết thống kê.
Giả thuyết nêu lên để kiểm định gọi là giả thuyết không hay giả thuyết gốc, ký hiệu H0.
Tuy nhiên, khi kết luận là bác bỏ giả thuyết H0 đã nêu thì cần phải chấp nhận một giả thuyết
khác. Bởi vậy trong bài toán kiểm định thống kê phải có thêm một giả thuyết khác giả thuyết
H0 gọi là đối thuyết H1.
Cặp giả thuyết H0, đối thuyết H1 đƣợc nêu ngay từ đầu bài toán kiểm định giả thuyết.
Kết luận của bài toán kiểm định giả thuyết thống kê có dạng:
- Hoặc chấp nhận H0.
- Hoặc bác bỏ H0, khi đó phải chấp nhận H1.
Nếu giả thuyết H0 là về tham số của luật phân phối xác suất của một hay nhiều biến ngẫu
nhiên thì bài toán gọi là kiểm định tham số, nếu giả thuyết H0 không phải là tham số thì bài
toán gọi là kiểm định phi tham số.

1.2. Quy tắc kiểm định giả thuyết
Giả sử phải kiểm định cặp giả thuyết H0, đối thuyết H1 liên quan đến biến ngẫu nhiên X.
Khi ấy, từ mẫu ngẫu nhiên (X1, X2, …, Xn) của X, ta chọn thống kê:
Z = Z(X1, X2, …, Xn)
(6.1)

có liên quan đến cặp giả thuyết H0, H1.
Đại lƣợng ngẫu nhiên Z gọi là tiêu chuẩn kiểm định cặp giả thuyết H0, đối thuyết H1.
Gọi  là tập xác định của biến ngẫu nhiên Z.
Sau đó tìm quy luật phân phối xác suất của Z và với số  > 0 đủ nhỏ cho trƣớc ta xác định
miền W   sao cho:
P(Z  W) = .
(6.2)
Vì  đủ nhỏ nên sự kiện (Z  W) là khó xảy ra trong thực tế (nguyên lý xác suất nhỏ).
Miền W xác định nhƣ vậy gọi là miền bác bỏ giả thuyết H0.
Số  gọi là mức ý nghĩa của kiểm định.
Đặt:

W\W.

Miền W gọi là miền chấp nhận giả thuyết H0.
Dễ thấy xác suất chấp nhận giả thuyết H0 là:

P(Z  W ) = 1 – 

Sau khi xây dựng đƣợc thống kê Z, cũng nhƣ miền chấp nhận giả thuyết W và miền bác bỏ
giả thuyết W thì đƣợc quy tắc kiểm đinh:
Từ mẫu cụ thể (x1, x2, …, xn) ta tính đƣợc giá trị thống kê thực nghiệm ZT của Z.
 Nếu ZTW thì kết luận bác bỏ H0 và chấp nhận H1;
 Nếu ZT  W  ZT W thì kết luận chấp nhận H0 (và đƣơng nhiên H1 bị bác bỏ).
22


Bài giảng Toán Thống kê

1.3. Các loại sai lầm

Khi tiến hành kiểm định cặp giả thuyết, đối thuyết H0, H1 có thể mắc hai loại sai lầm sau:
Sai lầm loại một: Bác bỏ giả thuyết H0 khi H0 đúng.
Ngƣời ta tính đƣợc xác suất của sai lầm loại một là  ( là mức ý nghĩa của kiểm định)
Sai lầm loại hai: Chấp nhận giả thuyết H0 khi H0 sai.
Gọi  là xác suất của sai lầm loại hai, thì 1 –  gọi là lực lƣợng của tiêu chuẩn kiểm định Z
Một quy tắc kiểm định là tốt nếu cả hai loại sai lầm đều có xác suất nhỏ. Tuy nhiên điều đó
là khó thực hiện, hơn nữa nếu giảm  thì có nguy cơ là tăng  và ngƣợc lại, mặt khác do sai lầm
loại một là dễ kiểm soát hơn do đó ngƣời ta thƣờng chọn trƣớc  nhƣ là một ngƣỡng hợp lý.
Từ đó thấy rằng chấp nhận một giả thuyết không có nghĩa là giả thuyết đó hoàn toàn đúng
hay bác bỏ một giả thuyết không có nghĩa đó là giả thuyết đó hoàn toàn sai. Nói cách khác, kết
luận của kiểm định giả thuyết chỉ là một quy tắc hành động chứ không phải là một chứng
minh tính đúng hay sai của một giả thuyết.
II. CÁC BÀI TOÁN KIỂM ĐỊNH THAM SỐ
Giả sử đã biết luật phân phối của biến ngẫu nhiên X, nhƣng chƣa biết giá trị của tham số 
trong luật phân phối đó. Khi đó có thể nêu giả thuyết H0:  = 0, trong đó 0 là một số đã cho.
Với giả thuyết H0:  = 0 có thể chọn một trong 3 đối thuyết H1 sau:
- H1:   0 và gọi là đối thuyết hai phía
- H1:  > 0 và gọi là đối thuyết phải
- H1:  < 0 và gọi là đối thuyết trái
Hai đối thuyết sau ( > 0 và  > 0) gọi chung là đối thuyết một phía.
Bài toán kiểm định với đối thuyết hai phía gọi bài toán kiểm định hai phía.
Bài toán kiểm định với đối thuyết một phía gọi bài toán kiểm định một phía.
Chú thích:
Khái niệm kiểm định hai phía hay kiểm định một phía là do:
 Nếu miền bác bỏ giả thuyết H0 nằm ở hai bên miền chấp nhận thì gọi là kiểm
định hai phía.
 Nếu miền bác bỏ giả thuyết H0 nằm ở một bên miền chấp nhận thì gọi là kiểm
định một phía.

2.1. Kiểm định kỳ vọng của biến chuẩn

Bài toán: Giả sử biến ngẫu nhiên X~N(, 2), trong đó chƣa biết giá trị của M(X) = .
Từ mẫu ngẫu nhiên (X1, X2, …, Xn) ta xây dựng quy tắc kiểm định giả thuyết H0:  = 0 với các
đối thuyết khác nhau ở mức ý nghĩa .
a) Trƣờng hợp biết phƣơng sai 2.
Khi đó nếu H0 đúng thì X 

1 n
 

Xi ~ N   0 ,


n i 1
n


X  0
n
  X  0  2 ~ N(0, 1)


n
Chọn thống kê Z thì với  đã cho, nếu đối thuyết là:
a1) H1:   0 thì tìm số u/2 từ bảng chuẩn sao cho:
P(| Z | > u/2) = 
Vậy có miền bác bỏ giả thuyết H0 là: W = {|Z| > u/2}  (–,–u/2)  (u/2, )

 Thống kê Z =

23



ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

a2) H1:  > 0 thì tìm số u từ bảng chuẩn sao cho:
Vậy có miền bác bỏ giả thuyết H0 là: W = (u, )
a3) H1:  < 0 thì tìm số u từ bảng chuẩn sao cho:
Vậy có miền bác bỏ giả thuyết H0 là: W = (–,–u)

P(Z > u) = 
P( Z < – u) = 

Vậy có quy tắc kiểm định:
Quy tắc 1: Từ mẫu cụ thể (x1, x2, ..., xn) thực hiện các bƣớc sau để kiểm định giả thuyết H0:
 = 0 với các đối thuyết H1 khác nhau khi đã biết 2 ở mức :
- Bƣớc 1: Tính trung bình mẫux,
- Bƣớc 2: Tính thống kê thực nghiệm: ZT = ( x  0 )

n
,


(6.3)

- Bƣớc 3: Tra bảng và kết luận
Đối thuyết H1:

  0

Tra bảng chuẩn


u/2

Kết luận

 > 0

 < 0
u

Chấp nhận H0

| ZT |  u/2

ZT  u

ZT  – u

Bác bỏ H0

| ZT | > u/2

Z T > u

ZT < – u

(Các bài toán kiểm định giả thuyết H0:  = 0 với đối thuyết H1:  > 0 (hoặc  < 0) đƣợc
gọi là các bài toán kiểm định một phía).
Thí dụ: Kiểm tra đƣờng kính X (mm) của 25 viên bi đƣợc chọn ngẫu nhiên từ một dây
chuyền sản xuất bi tự động tính đƣợcx = 9,98 (mm). Biết X ~ N(; 0,0004). Với mức ý nghĩa

0,05 hãy cho biết bi sản xuất ra có đạt tiêu chuẩn quy định về đƣờng kính là 10 mm.
(Tiến hành kiểm định cả hai phía và một phía).
Giải:
1-/ Kiểm định hai phía: Ta có H0:  = 10 và H1:   10
Ta phải kiểm định giả thuyết H0: E(X) = 10 với đối thuyết H1: E(X)  10, mức ý nghĩa
0,05.
Tính thống kê thực nghiệm:

ZT = (9,98  10)

25
= – 5,00.
0,0004

Tra bảng chuẩn đƣợc: u0,025 = 1,96.
Vậy, H0 bị bác bỏ, chấp nhận H1: Đƣờng kính các viên bi là không đạt tiêu chuẩn.
2-/ Kiểm định một phía: Ta có H0:  = 10 và H1:   10
Vẫn tính lƣợng thống kê thực nghiệm nhƣ trên (ZT = –5,00)
Tra bảng chuẩn đƣợc: u0,05 = 1,645
Vậy H0 bị bác bỏ, chấp nhận H1: Đƣờng kính các viên bi là nhỏ hơn tiêu chuẩn.
b) Trƣờng hợp chƣa biết phƣơng sai 2
Khi đó lấy phƣơng sai hiệu chỉnh của mẫu ngẫu nhiên: S2 =





2
1 n
Xi  X thay cho


n  1 i 1

phƣơng sai D(X) (ƣớc lƣợng D(X) bằng S2) và:



X  0
 X  0
S
n
với  đã cho, nếu đối thuyết H1 là:
24

Nếu H0 đúng, thống kê Z =



n
S2

là biến Student n – 1 bậc tự do, do đó


Bài giảng Toán Thống kê

b1) H1:   0 thì tìm số t/2, n –1 từ bảng Student sao cho: P(| Z | > t/2, n –1) = 
Vậy có miền bác bỏ giả thuyết là: W ={|ZT| > t/2, n – 1 }  (–,–t/2, n –1)  (t/2, n –1, )
b2) H1:  > 0 thì tìm số t, n –1 từ bảng Student sao cho:
P( Z > t, n –1) = 

Vậy có miền bác bỏ giả thuyết là: W = (t/2, n –1, )
b3) H1:  < 0 thì tìm số t, n –1 từ bảng Student sao cho:
P( Z < – t, n –1) = 
Vậy có miền bác bỏ giả thuyết là: W = (–,–t, n –1)
Vậy có quy tắc kiểm định:
Quy tắc 2: Từ mẫu cụ thể (x1, x2, ..., xn) thực hiện các bƣớc sau để kiểm định giả thuyết H0:
 = 0 với các đối thuyết H1 khác nhau khi chƣa biết  ở mức .
- Bƣớc 1: Tính trung bình mẫux và phƣơng sai hiệu chỉnh s2 của mẫu,



- Bƣớc 2: Tính thống kê thực nghiệm: ZT = x  0

 sn



hay ZT = x  0



n
,
s2

(6.4)

- Bƣớc 3: Tra bảng và kết luận:
  0


Đối thuyết H1:
Tra bảng Student

tb = t/2; n – 1

 > 0

 < 0
tb = t, n – 1

| Z T |  tb
Z T  tb
Z T  – tb
Bác bỏ H0
| Z T | > tb
Z T > tb
Z T < – tb
Các bài toán kiểm định giả thuyết H0:  = 0 với đối thuyết H1:  > 0 (hoặc  < 0) đƣợc
gọi là các bài toán kiểm định một phía.
Kết luận

Chấp nhận H0

c) Chú thích: Việc tiến hành kiểm định hai phía hay một phía là tuỳ thuộc vào giá trị
trung bình mẫux tính đƣợc và số 0 đã cho:
 Nếux  0 thì tiến hành kiểm định hai phía
 Nếux << 0 thì tiến hành kiểm định một phía với H1:  < 0
 Nếux >> 0 thì tiến hành kiểm định một phía với H1:  > 0.
Thí dụ 1: Kết quả điều tra giá bán mặt hàng A tại 10 cửa hàng nhƣ sau (đơn vị nghìn đồng
một sản phẩm):

15,0; 14,7; 14,8; 15,1; 14,8; 15,2; 15,0; 14,7; 15,1; 15,2
Biết giá bán trung bình của mặt hàng này năm trƣớc là 14,8 nghìn đồng/ sản phẩm.
Giả sử giá bán là lƣợng ngẫu nhiên chuẩn. Với mức 0,05 có thể coi mặt hàng A là tăng giá?
Giải: Gọi X là giá bán mặt hàng A, ta phải kiểm định giả thuyết H0: E(X) = 14,8 với đối
thuyết H1: E(X) > 14,8.
Ta có: Dung lƣợng mẫu: n = 10,
Tổng của X: x = 15 + 14,7 + 14,8 + … + 15,2 = 149,6
Tổng của X2: x2 = 152 + 14,72 + 14,82 + … + 15,22 = 2238,36
Từ đó: x =

149,6
= 14,96;
10

s2 =

10.2238,36  149,62
= 0,0382
10.9

Lƣợng thống kê: ZT = (14,96 – 14,8)

10
= 2,588
0,0382

Tra bảng Student đƣợc: t(0,05; 9) = 1,833
Vậy, Bác bỏ H0, chấp nhận H1: Có thể coi mặt hàng A là tăng giá.
25



×