Tải bản đầy đủ (.doc) (44 trang)

Hoan thien va bo sung phan thong ke toan nam 2013

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (335.55 KB, 44 trang )

LỜI NÓI ĐẦU
Môn Xác suất và Thống kê ngày càng được ứng dụng rộng rãi trong các lĩnh vực
nghiên cứu cũng như trong thực tế. Vì vậy, nó được đưa vào giảng dạy ở nhiều
trường đại học, nhiều cơ sở đào tạo với những trình độ khác nhau. Trong những
năm gần đây, với sự đổi mới giáo dục, đòi hỏi người học phải chủ động tự học, tự
nghiên cứu. Để giúp người học có cơ sở lý luận, kết nối với những môn học khác
áp dụng được vào thực tế, chúng tôi đưa ra nghiên cứu đề tài “Hoàn thiện và bổ
sung phần Thống kê Toán cho phù hợp với hình thức giảng dạy theo tín chỉ ở Học
viện Tài chính”. Với những nghiên cứu này, chúng tôi hy vọng giúp cho việc giảng
dạy, học tập và nghiên cứu phần Thống kê Toán của môn học này ở Học viện Tài
chính thuận lợi hơn, đồng thời tạo điều kiện cho người học tiếp cận được với một
số bài toán trong thực tế. Đề tài đề cập tới 2 chương Thống kê Toán của môn học.
- Chương 1: Lý thuyết mẫu.
Trong chương này, chúng tôi nhắc lại và bổ sung quy luật phân phối xác suất của
một số thống kê đặc trưng mẫu. Trên cơ sở đó, mở rộng phương pháp suy diễn
thống kê và phương pháp ước lượng.
- Chương 2: Kiểm định giả thuyết thống kê.
Trong chương này, chúng tôi bổ sung thêm một số bài toán kiểm định tham số và
kiểm định phi tham số.
Đề tài được thực hiện bởi các thành viên sau đây:
- Gvc.ThS. Nguyễn Văn Tiện: Chủ nhiệm đề tài;
- ThS. Phan Thị Phương Thanh, ThS. Đỗ Thị Lan Hương,
ThS. Nguyễn Thu Thuỷ: Chương 1;
- ThS. Đàm Thanh Tú, ThS. Khuất Quang Thành: Chương 2.
Chúng tôi xin cảm ơn Ban Giám đốc, Ban Khoa học - Học viện Tài chính đã tạo
điều kiện thuận lợi cho chúng tôi thực hiện đề tài này. Trong quá trình nghiên cứu,
chúng tôi rất cố gắng để hoàn thành đề tài. Nhưng do tính ứng dụng đa dạng và
phong phú của phần Thống kê Toán, nên không tránh khỏi những hạn chế. Vì vậy
chúng tôi mong muốn các đồng nghiệp, những ai quan tâm hãy đóng góp ý kiến để
đề tài nghiên cứu của chúng tôi có chất lượng tốt hơn.
Hà Nội, tháng 10 năm 2013


Các tác giả
1


Chương 1
LÝ THUYẾT MẪU
Phần 1: Quy luật phân phối xác suất của một số thống kê đặc trưng mẫu
Trong thực tế cuộc sống ta cần phải nghiên cứu nhiều xu hướng, đặc tính, đặc
trưng của đám đông, chẳng hạn: chiều cao của dân cư ở một vùng, tuổi thọ của một
loại thiết bị điện tử, tỷ lệ phế phẩm trong một lô hàng,…
Tuy nhiên, việc nghiên cứu chỉ được thực hiện trong toàn bộ với những đám
đông có kích thước nhỏ và dễ nắm bắt được tất cả các phần tử trong đám đông đó.
Với những đám đông có kích thước lớn thì việc nghiên cứu mất rất nhiều thời gian,
chi phí tốn kém, đôi khi không nắm được toàn bộ các phần tử trong đám đông,…
có thể dẫn tới kết quả thu được bị sai lệch. Do đó người ta dựa vào việc chọn mẫu
và sử dụng các phương pháp xác suất để nghiên cứu các đặc trưng của mẫu, trên cơ
sở đó đưa ra kết luận cho đám đông.
Để nghiên cứu mẫu, sau đây chúng tôi đề cập tới quy luật phân phối xác suất của
một số thống kê đặc trưng mẫu.
I. Trường hợp một biến ngẫu nhiên gốc có phân phối chuẩn
Giả sử dấu hiệu nghiên cứu của đám đông là biến ngẫu nhiên X ~ N(a; 2 ) .
Từ đám đông lấy ngẫu nhiên mẫu lặp kích thước n: (X1 ,X 2 ,...,X n ) thì
X1 , X 2 ,..., X n là các biến ngẫu nhiên độc lập, có cùng phân phối với X. Ta có:
� 2 �
1 n
a; �;
1. X  �X i ~ N �
n i1
� n �
2. G 


 X  a   X  a

 X

n

~ N(0;1) ;
2

n
1 n
�X  a � 2
3.   2 �(Xi  a) 2 �� i
�~  (n) ;
 i 1
i 1 � 

2
1

2

(n  1)S
nS2
4.  

~ 2 (n  1) ;
2
2



2
2

5.

T

G

n 1
2
2

 X  a



n



2
Xa
S
:

2
S




2

n



 X  a
S

n 1

~ T(n  1)

.


II. Trường hợp hai biến ngẫu nhiên gốc có phân phối chuẩn
Ta xét hai đám đông với hai dấu hiệu cần nghiên cứu lần lượt là hai đại lượng
ngẫu nhiên X1 và X 2 . Giả sử X1 ~ N(a1 ; 12 ) ; X 2 ~ N(a 2 ; 22 ) .
Từ hai đám đông lấy hai mẫu lặp, độc lập có kích thước tương ứng là n1 và n 2 :
(X11 ,X12 ,...,X1n1 ) ; (X 21 ,X 22 ,...,X 2n 2 ) .
Ta có:
1.

G

X


1



 X 2  (a1  a 2 )
12 22

n1 n 2

~ N(0;1)

;

2

2

(n  1)S1
(n  1)S2
2. Do   1 2
~ 2 (n1  1) và 22  2 2
~  2 (n 2  1) nên
1
2
2
1

n1S12 n 2S22
      2  2 ~  2 (n1  n 2  2) ;

1
2
2

2
1

2
2

3. Trong trường hợp 12  22  2 thì:
G

T

4.

T

X

1



2
n1  n 2  2

 X 2  (a1  a 2 )
2

1

2
2

S S

n1 n 2



X

1



 X 2  (a1  a 2 )

n1S12  n 2S22
n1  n 2  2

~ T(k)

1 1

n1 n 2

~ T(n1  n 2  2)


;

;
2

(n1  1)(n 2  1)
S1 n1
; C 2
trong đó k 
;
2
2
2
(n 2  1)C  (n1  1)(1  C)
S1 n1  S2 n 2
2

2

(n  1)S1
(n  1)S2
~ 2 (n1  1) và 22  2 2
~  2 (n 2  1) nên
5. Do   1 2
1
2
2
1

2


12 (n1  1) S1  22
F 2

~ F(n1  1;n 2  1) .
 2 (n 2  1) S2212
Chú ý:
Với các thống kê T có phân phối Student với n – 1 bậc tự do, khi n  30 thì T có
phân phối xấp xỉ phân phối chuẩn tắc.
3


III. Trường hợp một biến ngẫu nhiên gốc có phân phối không – một
Giả sử dấu hiệu nghiên cứu của đám đông là biến ngẫu nhiên X  A(p). Từ đám
đông lấy ngẫu nhiên mẫu lặp kích thước n: (X1 ,X 2 ,...,X n ) ta được tần xuất mẫu f.
Với nf (1  f ) �20 thì:
Q

f  p (f  p) n

~ N(0;1) .
(f )
p(1  p)

IV. Trường hợp hai biến ngẫu nhiên gốc có phân phối không – một
Ta xét hai đám đông với hai dấu hiệu cần nghiên cứu lần lượt là hai đại lượng
ngẫu nhiên X1 và X 2 , giả sử X1 ~ A(p1 ) ; X 2 ~ A(p2 ) . Từ hai đám đông lấy hai
mẫu lặp, độc lập có kích thước tương ứng là n1 và n 2 :
(X11 ,X12 ,...,X1n1 ) ; (X 21 ,X 22 ,...,X 2n 2 ) .
Từ hai mẫu này ta có tần xuất mẫu tương ứng là f1, f2. Với n1  30 và n2  30 thì:

(f1  f 2 )  (p1  p 2 )
Q
~ N(0;1)
p1 (1  p1 ) p2 (1  p 2 )
.

n1
n2
Phần 2: Suy diễn thống kê
I. Suy đoán về hai biến ngẫu nhiên có phân phối chuẩn
1. Suy đoán về hiệu của hai trung bình mẫu
Giả sử có hai đám đông, trong đó các dấu hiệu nghiên cứu là các biến ngẫu nhiên
X1 , X 2 cùng phân phối chuẩn với các vọng toán tương ứng là a1 , a 2 và các phương
sai tương ứng là 12 ,  22 đã biết. Nếu từ hai đám đông trên rút ra hai mẫu lặp, độc lập
kích thước tương ứng là n1 , n 2 thì có thể tiến hành các suy đoán sau đây về hiệu hai
trung bình mẫu của hai biến ngẫu nhiên đó.
Chúng ta chỉ xét trường hợp các mẫu lấy ra có kích thước đủ lớn (n 1 � 30 và
n2 �30). Khi đó đại lượng thống kê:

 X X   a
U
1

2

1

 a2 

Sa


12  22


: N  0,1 , trong đó Sa 
n1 n 2

Sử dụng công thức P  1  U   2      2     1  , ta thu được các công thức
sau về khoảng giá trị của X1  X 2 :





P  a1  a 2   1Sa  X1  X 2   a1  a 2    2Sa     2     1 

4


� �
�Sa �

� �
�Sa �

hoặc P   a1  a 2   1  X1  X 2   a1  a 2    2    � 2 �  � 1 �.
a. Khoảng hai phía đối xứng:






P  a1  a 2   Sa  X1  X 2   a1  a 2   Sa  2   
� �
�Sa �

hoặc P   a1  a 2     X1  X 2   a1  a 2      2 � �.
b. Khoảng một phía bên phải:





P  a1  a 2   Sa  X1  X 2  0,5     

� �
�Sa �

hoặc P   a1  a 2     X1  X 2   0,5   � �.
c. Khoảng một phía bên trái:





P X1  X 2   a1  a 2   Sa       0,5
� �
�Sa �

hoặc P  X1  X 2   a1  a 2       � � 0,5 .

Ví dụ: Hai công ty A và B cùng sản xuất một loại bóng đèn có tuổi thọ là các
biến ngẫu nhiên có phân phối chuẩn với tuổi thọ trung bình tương ứng là 12000 giờ
và 11000 giờ và độ lệch tiêu chuẩn tương ứng là 200 giờ và 150 giờ. Nếu kiểm tra
ngẫu nhiên 50 bóng đèn của công ty A và 75 bóng đèn của công ty B thì xác suất để
tuổi thọ trung bình của các bóng đèn được kiểm tra của A lớn hơn tuổi thọ trung
bình của các bóng đèn được kiểm tra của B ít nhất 950 giờ là bao nhiêu?
Giải: Gọi X1 , X 2 lần lượt là tuổi thọ của bóng đèn của công ty A và B.
2
2
Ta có X1 : N  12000;200  , X 2 : N  11000;150  .

Với mẫu lấy ra đủ lớn ( n1  50  30;n 2  75  30 ), xem như mẫu lặp thì

 X X  a
U
1

2

Sa

Ta có Sa 

1

 a2 

12  22



: N  0,1 , trong đó Sa 
n1 n 2

2002 1502

�33,1662 .
50
75

� 50 �
P 950 �X1  X 2  P  12000  11000   50 �X1  X 2 �0,5   �

�33,1662 �









 0,5    1,51  0,5    1,51 �0,5  0, 43348  0,93348 .

5


Như vậy, trong 93,348% trường hợp kiểm tra tương tự thì tuổi thọ trung bình của
bóng đèn do công ty A sản xuất sẽ lớn hơn tuổi thọ trung bình của bóng đèn do
công ty B sản xuất ít nhất 950 giờ.

2. Suy đoán về tỷ số giữa hai phương sai mẫu điều chỉnh
Giả sử các phương sai mẫu điều chỉnh của X1 , X2 lần lượt là S12 và S22 .
S12 22
Ta có đại lượng thống kê: F  2 � 2 : F  n1  1, n 2  1 .
S2 1

Do đó với xác suất 1  , tìm được cặp giá trị 1 ,  2 dương sao cho 1   2  
 n 1;n
và các giá trị tới hạn Fisher-Snedecor tương ứng f1
1



n 1;n
P f1
1



2 1

1

 F  f  n 1;n
1



2 1


2



2 1

1

,f  n 1;n
1

2



2 1

thỏa mãn

  1  .

Từ đó thay biểu thức của F vào và chuyển vế ta thu được công thức:
� 2 n 1;n
P � 12 f1
� 2
1



2 1


1



S12 12  n 1;n
 f
S22  22
1



2 1

2


� 1   .

S12
Tiến hành các suy đoán về tỷ số 2 :
S2
�12  n 1;n
a. Khoảng hai phía: P � 2 f1
� 2
1



2 1


1

S12 12  n 1;n
 2  2 f
S2  2
1

2



2 1


� 1   .

b. Khoảng một phía bên phải:
� 2 n 1;n
P � 12 f1
� 2
1



2 1



S12 �

� 1   .
S22

c. Khoảng một phía bên trái:
�S12 12  n 1;n
P � 2  2 f
�S2  2
1



2 1


� 1   .

Ví dụ: Trở lại ví dụ ở mục 1. Tính xác suất để phương sai mẫu điều chỉnh của
tuổi thọ các bóng đèn được kiểm tra của công ty A lớn hơn phương sai mẫu điều
chỉnh của tuổi thọ các bóng đèn được kiểm tra của công ty B ít nhất 2 lần.
S12 22
Giải: Ta có F  2 . 2 : F  n1  1, n 2  1 .
S2 1

Theo công thức về khoảng một phía bên phải:
�S 2  2 n 1;n
P �12 � 12 f1
�S2  2
1




2 1


2002  49;74 
49;74 

1



f
 2 � f1
 1,125 � 1   �0,313 .

2 1
150

Vậy xác suất cần tìm là 0,313.
6


II. Suy đoán về hai biến ngẫu nhiên có phân phối không – một (hiệu của hai
tần xuất)
Giả sử có hai đám đông, trong đó các biến ngẫu nhiên X1 , X 2 đều có phân phối
không - một với các tham số lần lượt là p1 , p 2 , 0  p1  1, 0  p 2  1 . Từ hai đám đông
lần lượt rút ra hai mẫu lặp, độc lập kích thước tương ứng là n1 , n 2 . Từ hai mẫu này
ta có tần xuất mẫu tương ứng là f 1, f2. Chúng ta chỉ xét trường hợp các mẫu lấy ra
có kích thước đủ lớn (n1 �30, n 2 �30) .
Khi đó đại lượng thống kê:

U

 f1  f 2    p1  p2 
Sf

: N  0,1 , trong đó Sf 

p1  1  p1  p 2  1  p 2 


n1
n2

Sử dụng công thức P  1  U   2      2     1  , ta thu được công thức sau về
khoảng giá trị của f1  f 2 :
P   p1  p 2   1Sf  f1  f 2   p1  p 2    2Sf      2     1 
� �
�Sf �

� �
�Sf �

hoặc P   p1  p 2   1  f1  f 2   p1  p2    2    � 2 �  � 1 �.
1. Khoảng hai phía đối xứng:

P   p1  p 2   Sf  f1  f 2   p1  p 2   Sf   2   
� �
�Sf �

hoặc P   p1  p 2     f1  f 2   p1  p 2      2 � �.

2. Khoảng một phía bên phải:

P   p1  p 2   Sf  f1  f 2   0,5     
� �
�Sf �

hoặc P   p1  p 2     f1  f 2   0,5   � �.
3. Khoảng một phía bên trái:

P  f1  f 2   p1  p 2   Sf        0,5
� �
�Sf �

hoặc P  f1  f 2   p1  p 2       � � 0,5 .
Ví dụ: Tỷ lệ khách hàng ưa thích dầu gội mác X ở hai tỉnh A và B tương ứng là
50% và 40%. Trong lần đầu phỏng vấn ngẫu nhiên 100 khách hàng ở mỗi tỉnh thì ở
tỉnh A có 52 người và ở tỉnh B có 38 người ưa thích dùng sản phẩm đó. Tìm xác
suất để trong lần phỏng vấn thứ hai, tỷ lệ khách hàng ưa thích sản phẩm mác X
được điều tra tại tỉnh A cao hơn tỷ lệ khách hàng ưa thích sản phẩm mác X được
7


điều tra tại tỉnh B một lượng lớn hơn mức chênh lệch giữa tỷ lệ khách hàng ưa
thích sản phẩm mác X được điều tra tại tỉnh A và tỷ lệ khách hàng ưa thích sản
phẩm mác X được điều tra tại tỉnh B trong cuộc phỏng vấn thứ nhất.
Giải: Gọi p1 , p 2 lần lượt là tỷ lệ ưa thích sản phẩm mác X ở hai tỉnh A và B. Gọi
f1 ,f 2 là tỷ lệ khách hàng ưa thích sản phẩm mác X của hai mẫu khách hàng. Ta có

p1 = 0,5; p2 = 0,4.
Với hai mẫu thỏa mãn n1  n 2  100  30 nên ta có:

U

 f1  f 2    p1  p 2 
Sf

: N  0,1 , trong đó Sf 

p1  1  p1  p 2  1  p 2 


n1
n2

Ta phải đi tìm xác suất để f1  f 2  0,52  0,38  0,14 .
Sf 

p1  1  p1  p 2  1  p 2 
0,5  1  0,5  0, 4  1  0, 4 



 0,07 .
n1
n2
100
100

Theo công thức về khoảng một phía bên phải, ta có:
P  0,14  f1  f 2   P �
0,14   0,5  0, 4   f1  f 2   0,5  0, 4  �



�0,04 �
 P  0,04  f1  f 2  0,1  0,5   �
� 0,5    0,57  �0,5  0, 21566  0, 28434.
�0,07 �

Vậy xác suất cần tìm là 0,28434.
III. Bài tập
1. Điều tra hai mẫu ngẫu nhiên độc lập có cùng kích thước là 100 được rút ra từ hai
đám đông trong đó hai dấu hiệu nghiên cứu là hai đại lượng ngẫu nhiên độc lập và
có phân phối chuẩn có cùng trung bình, còn phương sai tương ứng là 50 và 40. Tìm
xác suất để:
a. Hai trung bình mẫu của hai đại lượng ngẫu nhiên được điều tra sai lệch nhau ít
nhất là 2.
b. Phương sai mẫu của đại lượng ngẫu nhiên được điều tra ở mẫu thứ nhất lớn
hơn phương sai mẫu của đại lượng ngẫu nhiên được điều tra ở mẫu thứ hai ít nhất 2
lần.
Đ/S: a. 0,03486
b. 0,01
2. Hai mẫu ngẫu nhiên độc lập có kích thước lần lượt là 40 và 50 được rút ra từ hai
đám đông trong đó các dấu hiệu nghiên cứu có phân phối chuẩn với trung bình lần
lượt là 70 và 68; các phương sai lần lượt là 120 và 150.
Tìm xác suất để:

8


a. Trung bình mẫu của đại lượng ngẫu nhiên được nghiên cứu ở mẫu thứ nhất lớn
hơn trung bình mẫu của đại lượng ngẫu nhiên được nghiên cứu ở của mẫu thứ hai ít

nhất là 5.
b. Phương sai mẫu của đại lượng ngẫu nhiên ở mẫu thứ hai lớn hơn phương sai
mẫu của đại lượng ngẫu nhiên ở của mẫu thứ nhất không quá 1,5 lần.
Đ/S: a. 0,11123
b. 0,72
3. Tỷ lệ đàn ông và phụ nữ ủng hộ quan điểm bình đẳng giới là 0,52 và 0,65. Vậy
nếu phỏng vấn ngẫu nhiên một cách độc lập 400 đàn ông và 400 phụ nữ về vấn đề
trên thì xác suất để tỷ lệ đàn ông ủng hộ quan điểm bình đẳng giới trong mẫu điều
tra lớn hơn tỷ lệ phụ nữ ủng hộ quan điểm bình đẳng giới trong mẫu điều tra một
lượng vượt quá 16% là bao nhiêu?
Đ/S: 0,19215
4. Một nhà máy sản xuất hai loại gioăng cao su A và B. Giả sử độ dày của hai loại
gioăng này là hai đại lượng ngẫu nhiên độc lập và có phân phối chuẩn với độ dày
trung bình lần lượt là 0,118cm và 0,122cm; độ lệch tiêu chuẩn lần lượt là 0,01cm
và 0,015cm. Kiểm tra 800 gioăng cao su A và 900 gioăng cao su B một cách độc
lập. Tính xác suất để:
a. Chiều dày trung bình của các gioăng cao su B được kiểm tra lớn hơn chiều dày
trung bình của các gioăng cao su A được kiểm tra một lượng nằm giữa 0,001cm và
0,002cm.
b. Phương sai mẫu của độ dày của gioăng cao su B không vượt quá 2,5 lần
phương sai mẫu của độ dày của gioăng cao su A.
Đ/S: a. 0,00048
b. 0,063185
5. Hai lô hàng A và B của nhà máy C có tỷ lệ chính phẩm lần lượt là 90% và 80%.
Kiểm tra mỗi lô hàng 80 sản phẩm. Tính xác suất:
a. Tỷ lệ chính phẩm trong hai mẫu được điều tra sai lệch nhau không quá 10%.
b. Tỷ lệ chính phẩm của các sản phẩm của lô A được kiểm tra lớn hơn tỷ lệ chính
phẩm các sản phẩm của lô B được kiểm tra ít nhất 20%.
Đ/S: a. 0,49984
b. 0,06372

6. Điều tra ý kiến của người dân cả nước đối với hai nghị quyết A và B của Chính
phủ thì thấy tỷ lệ người dân cả nước ủng hộ hai nghị quyết trên lần lượt là 70% và
80%. Nếu bây giờ lấy ý kiến của 1000 người dân huyện Từ Liêm đối với hai nghị
quyết A và B, hãy tính khả năng để tỷ lệ người dân huyện Từ Liêm ủng hộ nghị
quyết A thấp hơn tỷ lệ người dân huyện Từ Liêm ủng hộ nghị quyết B tối thiểu 5%.
Đ/S: 0,99534
9


7. Tỷ lệ bảo hành của hai loại máy A và B lần lượt là 3% và 2%. Nếu cửa hàng bán
ra thị trường mỗi loại 500 máy. Tính xác suất:
a. Sai lệch giữa tỷ lệ động cơ phải bảo hành của hai loại máy đã được bán ra ít
nhất là 1%.
b. Tỷ lệ động cơ A đã được bán ra phải bảo hành thấp hơn tỷ lệ động cơ B đã
được bán ra phải bảo hành.
Đ/S: a. 0,52118
b. 0,15625
8. Việc tiêu dùng điện hàng tháng của các hộ gia đình ở Hà Nội và Hải Phòng là
các đại lượng ngẫu nhiên độc lập và có phân phối chuẩn với trung bình lần lượt là
200KWh và 180KWh; độ lệch tiêu chuẩn lần lượt là 40KWh và 35KWh. Tính xác
suất để khi điều tra 100 hộ gia đình ở Hà Nội và 80 hộ gia đình ở Hải Phòng thì:
a. Mức tiêu dùng điện trung bình các hộ gia đình được điều tra ở Hà Nội lớn hơn
ít nhất 10KWh so với mức tiêu dùng điện trung bình các hộ gia đình được điều tra
ở Hải Phòng.
b. Mức tiêu dùng điện trung bình các hộ gia đình được điều tra ở Hà Nội lớn từ
5KWh đến 15KWh mức tiêu dùng điện trung bình các hộ gia đình được điều tra ở
Hải Phòng.
c. Phương sai mẫu của mức tiêu dùng điện hàng tháng của các hộ gia đình được
điều tra tại Hà Nội lớn hơn phương sai mẫu của mức tiêu dùng điện hàng tháng của
các hộ gia đình được điều tra tại Hải Phòng từ 1,2 đến 1,5 lần.

Đ/S: a. 0,96328
b. 0,18305
c. 0,395
9. Tỷ lệ thất nghiệp của người lao động là nam tại tỉnh A là 5% và của người lao
động là nữ tại tỉnh A là 3%. Vậy nếu điều tra ngẫu nhiên một cách độc lập 500 đàn
ông và 400 phụ nữ tại tỉnh A thì xác suất để tỷ lệ thất nghiệp của đàn ông được điều
tra lớn hơn tỷ lệ thất nghiệp của phụ nữ được điều tra không quá 1% là bao nhiêu?
Đ/S: 0,22065
Phần 3: Phương pháp ước lượng
I. Ước lượng điểm
1. Khái niệm về tham số lý thuyết và tham số mẫu
- Giả sử nghiên cứu đại lượng ngẫu nhiên X của đám đông có E  X   a ;
D  X    2 . Các đại lượng a và 2 được gọi là các tham số lý thuyết, chúng là các
hằng số.

Giả sử a và 2 chưa biết, từ đám đông lấy ra mẫu kích thước n :  X1 ,X 2 ,...,X n  .
10


Ta có X 





2
1 n
1 n
2
X

S
X

  �X i  X .

i ;
n i 1
n i 1

2
Các đại lượng X , S  X  gọi là các tham số mẫu, chúng là các đại lượng ngẫu
2
nhiên. Trong thống kê người ta thường lấy X và S  X  lần lượt là giá trị gần đúng
cho a và 2 .

- Giả sử đám đông gồm N phần tử, trong đó có M phần tử mang đặc tính A thì
tỷ lệ phần tử mang đặc tính A của đám đông là p  M N . Khi đó p được gọi là
tham số lý thuyết và là một hằng số.
Giả sử p chưa biết, từ đám đông lấy ra ngẫu nhiên mẫu có kích thước n. Gọi X
là số phần tử mang đặc tính A trong mẫu thì f  X n là tỷ lệ phần tử mang đặc tính
A trong mẫu. Khi đó f gọi là tần xuất mẫu và là đại lượng ngẫu nhiên. Trong thống
kê người ta thường lấy tần xuất f làm giá trị gần đúng cho p.
2
Các tham số lý thuyết E  X   a ; D  X    , p,... được ký hiệu là  và chúng là
các hằng số.
Các tham số mẫu X , S  X  , f,... được ký hiệu là * và chúng là các đại lượng
ngẫu nhiên.
2. Một số loại ước lượng
Việc dùng tham số mẫu * làm giá trị gần đúng cho tham số lý thuyết  được
gọi là ước lượng điểm hay ước lượng thống kê.

a. Ước lượng không chệch:
2

*
* được gọi là ước lượng không chệch của  nếu E      .

2
Ví dụ 1: Giả sử đại lượng ngẫu nhiên X của đám đông có E  X   a ; D  X   

(a chưa biết). Chọn ngẫu nhiên mẫu lặp kích thước n:  X1 ,X 2 ,...,X n  .
Ta có X 

1 n
�Xi . Ta dùng X để ước lượng cho a.
n i 1

Do mẫu lấy ra là lặp nên X1 ,X 2 ,...,X n là các đại lượng ngẫu nhiên độc lập có





2
cùng phân phối với X. Do đó E  Xi   E  X   a; D  Xi   D  X    i  1,n .

 

1
�1 n
� 1 �n

� 1 n
� E X  E � �X i � E �
Xi � �E  Xi   ��
n a a.

n
�n i 1 � n �i1 � n i1
Vậy X ước lượng không chệch của a.
11


Ví dụ 2: Cho đám đông gồm N phần tử, trong đó có M phần tử mang đặc tính A.
Khi đó p  M N là xác suất để lấy được 1 phần tử mang đặc tính A từ đám đông.
Giả sử xác suất p chưa biết, từ đám đông lấy ra ngẫu nhiên mẫu lặp kích thước n.
Gọi X là số phần tử mang đặc tính A trong mẫu thì f  X n là tần xuất của phần tử
mang đặc tính A trong mẫu. Ta lấy f để ước lượng cho p.
Mỗi lần lấy một phần tử từ đám đông coi như tiến hành một phép thử. Vì mẫu
lặp có kích thước n, nên ta có n phép thử độc lập. Xác suất xuất hiện phần tử mang
đặc tính A trong mỗi phép thử đều bằng p � X : B  n;p  .
1
�X � 1
np  p .
Do đó E  X   np ; D  X   np(1  p) � E  f   E � � E  X   �
n
�n � n
Vậy f là ước lượng không chệch của p.
b. Ước lượng chệch:

*
* được gọi là ước lượng chệch của  nếu E    � .


Ví dụ 3:
2
Giả sử đại lượng ngẫu nhiên X của đám đông có E  X   a ; D  X    ( 2

chưa biết). Từ đám đông lấy ra ngẫu nhiên mẫu lặp kích thước n:  X1 ,X 2 ,...,X n  .



1 n
Ta có S  X   �X i  X
n i 1
2



2 kh

 S2 . Ta dùng S2 để ước lượng cho 2 .

Do mẫu lấy ra là lặp nên X1 ,X 2 ,...,X n là các đại lượng ngẫu nhiên độc lập có





2
cùng phân phối với X. Do đó E  X i   E  X   a; D  X i   D  X    i  1,n .
2


2
2
Ta có S  X   S  X  a    X  a    X  a  
2





1 n
2
 Xi  a   X  a

n i1





2�
�1 n
�1 n
2
2�
� E  S   E � � X i  a   X  a � E � � X i  a  � E X  a
n i1
n i1
��
2


 



1 �n
1 n
�1 n

2�
2
 E�
 Xi  a  � D X  �E  X i  a   D � �X i �

n ���
n i1
n i1
i 1
1 n
1 �n
1 n
�d l 1 n
 �D  X i   2 D �
D  X i   2 �D  X i 
�Xi � n �
n i1
n �i1 �
n i1
i 1
1 n 2 1 n 2
2 n  1 2

2
 �  2 �   

 � 2 .
n i1
n i 1
n
n
12

2



2


Vậy S2 là ước lượng chệch của 2 .
c. Ước lượng vững:
*
P
�  , tức là   0 cho trước
* được gọi là ước lượng vững của  nếu  ���
n��





P *      1.

ta có nlim
��
Ví dụ 4: Trở lại ví dụ 1.
2
Do X1 ,X 2 ,...,X n độc lập; D  X i     �.
Áp dụng định lý Trê bư sép:   0 cho trước ta có:





�1 n

1 n
lim P � �X i  �E  X i    � 1 hay lim P X  a    1 .
n ��
n ��
n i 1
�n i1
Vậy X là ước lượng vững của a.
Ví dụ 5: Trở lại ví dụ 2.
Do X : B  n;p  . Áp dụng định lý Becnuli   0 cho trước, ta có:
�X

P  f  p    1 .
lim P �  p   � 1 hay nlim
��
n ��
n


Vậy f là ước lượng vững của p.
d. Ước lượng hiệu quả:
Định nghĩa: * được gọi là ước lượng hiệu quả của tham số  , nếu nó là ước
lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng không chệch
khác được xây dựng trên cùng mẫu đó.
Nếu * là ước lượng không chệch của  , thì giá trị nhỏ nhất của phương sai
D  *  có thể tìm được dựa vào bất đẳng thức Cramer-Rao.

Bất đẳng thức Cramer-Rao:
Cho đại lượng ngẫu nhiên X của đám đông có hàm mật độ xác suất (hay biểu
thức xác suất) f  x,  . Từ đám đông lấy ra một mẫu ngẫu nhiên có kích thước n:

 X1,X 2 ,...,X n  . Khi đó với $

là một ước lượng không chệch bất kỳ của  thì:

 

1

D $ �

2

��ln f  x,   ��.
nE �

��





��



13


2
Ví dụ 6: Giả sử X : N  a;  . Từ đám đông lấy ra một mẫu lặp có kích thước n:

1 n
 X1,X 2 ,...,X n  . Ta có X  �Xi là ước lượng không chệch của a (ví dụ 1).
n i 1
 

2
1
2
Ta có D X 
và f  x,a  
e 2
n
 2
x a

 

 x  a

2 

� ln f  x,a    ln 

2

2

2



2

�ln f  x,a  x  a
 2 �

a


Vậy
2
2


��ln f  x,a  ��
n
n 2 n
2
�x  a �� n �


nE �
 x  a  � 4 D  X   4  2 .

�� nE �
� 2 �� 4 E �

a
 �� 











Giả sử $ là một ước lượng không chệch bất kỳ của a. Theo bất đẳng thức

Cramer - Rao thì D($) �D(X) .
Vậy X là ước lượng hiệu quả của a.
II. Ước lượng khoảng
1. Bài toán tổng quát
Để ước lượng tham số  của biến ngẫu nhiên X, ta sử dụng thống kê G nào đó
được xây dựng từ mẫu và phụ thuộc vào  . Từ đó xác định khoảng  G1;G 2  sao
cho với   1   cho trước ( 0    1 ) thì khoảng  G1;G 2  chứa  với xác suất
bằng  , tức là

P  G1    G 2     1   .

Xác suất   1   được gọi là độ tin cậy của ước lượng.
Khoảng  G1;G 2  được gọi là khoảng tin cậy của ước lượng.
Để giải quyết bài toán này, người ta tiến hành như sau:

Từ đám đông lấy ra một mẫu lặp có kích thước n:  X1 ,X 2 ,...,X n  và sử dụng

thống kê G  f  X1 ,X 2 ,...,X n ,   có quy luật phân phối xác suất xác định. Khi đó
với độ tin cậy   1   cho trước, tìm được cặp giá trị 1 và  2 dương sao cho
1   2   và các cặp giá trị tương ứng g 1 và g 2 thỏa mãn









P G  g 1  1 , P G  g 2   2 .

14






Từ đó suy ra P g 1  G  g 2  1   1   2   1     .


 *

Bằng phép biến đổi tương đương bao giờ ta cũng đưa được  * về dạng:
P  G1    G 2    .
Vậy  G1;G 2  chính là khoảng tin cậy cần tìm.
2. Một số bài toán ước lượng khoảng
a. Ước lượng vọng toán của biến ngẫu nhiên có phân phối chuẩn:

2
Giả sử X : N  a;  nhưng a chưa biết. Để ước lượng cho a, ta lấy ngẫu nhiên

mẫu lặp kích thước n:  X1 ,X 2 ,...,X n  . Xét hai trường hợp sau:
 ) Trường hợp n �30 hoặc  2 đã biết:
Ta chọn đại lượng thống kê G 

 X  a

n

thì G : N  0;1 .


Với độ tin cậy   1   cho trước, tìm được các giá trị 1 và  2 dương sao cho

1   2   và các giá trị tới hạn chuẩn tương ứng là u11 và u 2 thỏa mãn










P G  u11  1 , P G  u 2   2 .


P  u


   (vì u

P u11  G  u 2  1   1   2   1     .

Do đó
Suy ra





1

 G  u 2

11

  u 1 )




Xa n




� P�
u 1 
 u 2 �  � P �
X

u 2  a  X 

u 1 �  .



n
n




Vậy với độ tin cậy   1   thì khoảng tin cậy của a là




X



u
;X


u
.



2
1 �
n
n



- Nếu lấy 1   2  thì khoảng tin cậy đối xứng của a là:
2




X

u  ;X 

u �
.


n
n

2
2 �
- Nếu lấy 1  0 ;  2   thì g 1  g 0  �, ta có khoảng tin cậy bên phải của a là:



X

u  ; ��.

n


15


- Nếu lấy 1   ;  2  0 thì g 2  g 0  �, ta có khoảng tin cậy bên trái của a là:





;X


u



�.
n


Chú ý:
Nếu bài toán không cho biết  , ta lấy  �S hoặc  �S .
 ) Trường hợp n  30 và  2 không biết:
Ta chọn đại lượng thống kê T 

 X  a

n 1



 X  a

n

thì T : T  n  1 .

S
S
Với độ tin cậy   1   cho trước, tìm được các giá trị 1 và  2 dương sao cho

n 1
 n 1
1   2   và các giá trị tới hạn Student tương ứng t1 

và t 2 thỏa mãn:
1







  .
P  t   T  t    1        1     .
P   t    T  t      (vì t     t   )

P T  t1 1  1 , P T  t 2
Do đó
Suy ra

n 1

n 1

n 1
11

n 1
2

n 1
1


1

n 1
2



2

2

n 1
1

n 1
11




X  a n  1  n 1 �
 n 1

� P  t 1 
 t 2 � 
S





S
S

n 1
n 1 �
� P�
X

t 2   a  X 

t 1  � 
n 1
n 1



S  n 1
S  n 1 �
X

t 2  a  X 

t  �  .
hoặc P �
n
n 1 �

Vậy với độ tin cậy   1   , khoảng tin cậy của a là:

S

S
S  n 1
S  n 1 �

n 1
n 1 �
X

t 2 ;X 

t 1 �hay �
X

t 2  ;X 

t 1  �
.

n
n
n 1
n 1





- Nếu lấy 1   2  thì khoảng tin cậy đối xứng của a là:
2


S  n 1
S  n 1 �
X

t  ;X 

t  �hay

n
n
2
2




S
S
n 1
n 1 �
X

t   ;X 

t   �
.

n 1 2
n 1 2 �



- Nếu lấy 1  0 ;  2   thì khoảng tin cậy bên phải của a là:
16




S  n 1
S


n 1
X

t  ; ��hay �
X

t   ; ��.

n
n 1




- Nếu lấy 1   ;  2  0 thì khoảng tin cậy bên trái của a là:

S  n 1 �
S


n 1 �
�;X 

t  �hay �
�;X 

t   �.

n
n 1




b. Ước lượng phương sai của biến ngẫu nhiên có phân phối chuẩn:
Giả sử đại lượng ngẫu nhiên X của đám đông tuân theo quy luật phân phối chuẩn
N  a; 2  với 2 chưa biết. Để ước lượng phương sai 2 , ta lấy mẫu lặp kích thước

n:  X1 ,X 2 ,...,X n  và sử dụng phân phối khi bình phương.
 ) Trường hợp vọng toán a đã biết:
n

Người ta đã chứng minh được đại lượng ngẫu nhiên

2 

� X
i 1

i


 a

2

: 2  n 

.


Với độ tin cậy   1   cho trước, tìm được các giá trị 1 và  2 dương sao cho
2

2 n 
2 n 
1   2   và các giá trị tới hạn Khi bình phương tương ứng là 1


thỏa

1
2










 
 
2
2
mãn P   11  1, P    2   2 .
2 n



2n



Do đó

 
 
2
P 1




 1   1   2   1     .

1
2

Suy ra


n


2
X

a



i
�2 n

2 n 
 
i 1
P�
1




2 �
1
2








2 n

2 n

n
�n
2
2 �
X

a
X

a






i
i


�  .
� P �i1 2 n 
  2  i 1 2 n 

11
� 2





Như vậy với độ tin cậy   1   thì khoảng tin cậy của 2 là
n
�n
2
2 �
�� X i  a  � X i  a  �
�i 1 2 n 

; i 1 2 n 
.
11
� 2






17



, ta có khoảng tin cậy của 2 là:

2
n
�n
2
2 �
X

a


 Xi  a  �

�� i
�i 1 2 n 

; i 1 2 n 
.
 
� 

1


2
2


- Nếu 1  0 ;  2   , ta có khoảng tin cậy bên phải của 2 là:
- Nếu 1   2 


�n

2
�� X i  a 

�i 1 2 n 
; ��.
� 





- Nếu 1   ;  2  0 , ta có khoảng tin cậy bên trái của 2 là:
� n
2 �
� � Xi  a  �

�.
0; i1 2 n 
1






 ) Trường hợp vọng toán a chưa biết:
Người ta đã chứng minh được đại lượng ngẫu nhiên
nS2 (n  1)S 2


:  2  n  1 .
2
2


Với độ tin cậy   1   cho trước, tìm được các giá trị 1 và  2 dương sao cho
2 

2 n 1
 n 1
1   2   và các giá trị tới hạn Khi bình phương tương ứng là 12
và 2
1


P  

   , P         .

        1       1    .


2
thỏa mãn P   11

Do đó

2 n 1
11


2 n 1

2

1

2 n 1
2

2 n 1
2

1

2

2

2

�nS2
� 2 n 1 nS2
nS2
2 n 1 �
2
11  2  2 �  � P � 2 n 1    2 n 1
Suy ra P �
�


11


� 2
Như vậy với độ tin cậy   1   thì khoảng tin cậy của 2 là
�nS2 nS2
� 2 n 1 ; 2 n 1
�
11
� 2


�hay



�(n  1)S 2 (n  1)S 2 �
� 2 n 1 ; 2 n 1 �
.
� 


1

� 2
1


18



�  .




- Nếu 1   2 


, ta có khoảng tin cậy của 2 là:
2




�nS2 nS2 �
�(n  1)S 2 (n  1)S 2 �
.
� 2 n 1 ; 2 n 1 �hay � 2 n 1 ; 2 n 1 �













1
1
�2
2

� 2
2


- Nếu 1  0 ;  2   , ta có khoảng tin cậy bên phải của 2 là:
�nS2

;
�


� 2 n 1
�hay
�


�(n  1)S 2

;
�


�  2 n 1
�.

� 


- Nếu 1   ;  2  0 , ta có khoảng tin cậy bên trái của 2 là:
� nS2
0; 2 n 1


� 1



�hay


� (n  1)S 2 �
0; 2 n 1 �
.



� 1

c. Ước lượng tham số của biến ngẫu nhiên X : A  p  :
Ta chỉ xét trường hợp nf  1  f  �20 thì đại lượng thống kê Q 

 f  p n
p 1  p




phân phối xấp xỉ phân phối chuẩn tắc N  0;1 . Trong trường hợp này thì đại lượng
thống kê Q 

 f  p n
f 1 f 

cũng có phân phối xấp xỉ phân phối chuẩn tắc N  0;1 .

Với độ tin cậy   1   cho trước, tìm được các giá trị 1 ,  2 dương sao cho
1   2   và các giá trị tới hạn chuẩn tương ứng u11 và u 2 thỏa mãn









P Q  u11  1 , P Q  u  2   2 .





Do đó P u11  Q  u 2  1   1   2   1     .


 f  p n  u �

 f  p n  u �



u11 



P

u

Suy ra P �
2
2  


� 1

f
1

f
f
1

f











f 1 f 
f 1 f 

�P f

u 2  p  f 

u 1 �  .


n
n


Vậy với độ tin cậy   1   thì khoảng tin cậy của p là:
19




f 1 f 
f 1 f 


f

u 2 ;f 

u 1 �
.


n
n



thì khoảng tin cậy đối xứng của p là:
2


f 1 f 
f 1 f 

f

u  ;f 

u  �.


n
n
2

2 �

- Nếu lấy 1  0 ;  2   thì q 1  q 0  �, ta có khoảng tin cậy bên phải của p là:
- Nếu lấy 1   2 



f 1 f 

f

u  ;1�.


n


- Nếu lấy 1   ;  2  0 thì q 2  q 0  �, ta có khoảng tin cậy bên trái của p là:


f 1 f 

0;f 

u  �.


n



d. Ước lượng hiệu hai vọng toán của hai biến ngẫu nhiên có phân phối chuẩn:
Giả sử có hai đám đông với hai dấu hiệu cần nghiên cứu lần lượt là hai đại lượng
ngẫu nhiên X1 và X 2 , X1 ~ N(a1 ; 12 ) ; X 2 ~ N(a 2 ; 22 ) , trong đó a1 và a 2 chưa
biết. Để ước lượng hiệu a1  a 2 , từ hai đám đông đó lấy hai mẫu lặp, độc lập có
kích thước tương ứng là n1 và n 2 :
(X11 ,X12 ,...,X1n1 ) ; (X 21 ,X 22 ,...,X 2n 2 ) .
Với mẫu lấy ra ta tìm được X1 , X 2 và S12 ,S22 . Xét các trường hợp:

 ) Trường hợp đã biết  12 và  22 :

X
Khi đó G 

1



 X 2  (a1  a 2 )

12  22

.
~ N(0;1) , trong đó A 
n1 n 2

A
Với độ tin cậy   1   cho trước, tìm được các giá trị 1 , 2 dương sao cho

1   2   và các giá trị tới hạn chuẩn tương ứng u11 , u 2 thỏa mãn
P(G  u11 )  1 ; P(G  u 2 )  2 .

Do đó P(u11  G  u 2 )  1  (1   2 )  1     .











Suy ra P X1  X 2  Au 2  a1  a 2  X1  X 2  Au 1   .
20


- Khoảng tin cậy đối xứng (cho 1  2   / 2 ):

  X  X   Au ;  X  X   Au  .
1

2

1

/2

2

/2


- Khoảng tin cậy bên phải (cho 1  0;  2   ):

  X  X   Au ; � .
1

2



- Khoảng tin cậy bên trái (cho 1   ;  2  0 ):

 �;  X  X   Au  .
1

2



 ) Trường hợp chưa biết  12 và  22 nhưng giả thiết rằng  12   22 :
Khi đó T 

X

1



 X 2  (a1  a 2 )
B


~ T(n1  n 2  2) ,

(n1  n 2 )(n1S12  n 2S22 )

trong đó B 
n1n 2 (n1  n 2  2)
Với độ tin cậy   1   cho trước, tìm được các giá trị 1 , 2 dương sao cho
1   2   .
Tiến hành tương tự như trên ta được:











1  n 2  2)
1  n 2  2)
P X1  X 2  Bt (n
 a1  a 2  X1  X 2  Bt (n
.
2
1

- Khoảng tin cậy đối xứng (cho 1  2   / 2 ):


  X  X   Bt
1

2

(n1  n 2  2)
/2



- Khoảng tin cậy bên phải (cho 1  0;  2   ):

  X  X   Bt
1

2

(n1  n 2  2)


 �;  X  X   Bt
2



; � .

- Khoảng tin cậy bên trái (cho 1  ;  2  0 ):
1






1  n 2  2)
; X1  X 2  Bt (n
.
/2

(n1  n 2  2)


.

 ) Trường hợp chưa biết  12 ,  22 và chưa có cơ sở để cho rằng chúng bằng nhau:
Khi đó

T

X

1



 X 2  (a1  a 2 )
2
1


2
2

~ T(k)

S S

n1 n 2

21


2

(n1  1)(n 2  1)
S1 n1
k
;
C


2
2
(n 2  1)C 2  (n1  1)(1  C) 2
với
S1 S2

n1 n 2
Với độ tin cậy   1   cho trước, tìm được các giá trị 1 , 2 dương sao cho
1   2   .

Tiến hành tương tự như trên ta được:
2
2
2
2


S
S
S
S
1
2 (k)
1
2 (k)

P X1  X 2 
 t 2  a 1  a 2  X1  X 2 
 t 1 �  .
n1 n 2
n1 n 2




- Khoảng tin cậy đối xứng (cho 1  2   / 2 ):










2
2
2
2


S
S
S
S
1
2
1
2
(k)
(k)
�X1  X 2 
 �
t /2 ; X1  X 2 
 �
t /2 �
.
n1 n 2
n1 n 2














2
2


S
S
1
2
(k )

�.


0;



X


X



t
;


1
2
- Khoảng tin cậy bên phải (cho 1
):
2

n1 n 2









2
2


S

S
1
2
(k )
�; X1  X 2 
 �
t �
- Khoảng tin cậy bên trái (cho 1  ;  2  0 ): �
.
n1 n 2




e. Ước lượng tỷ số hai phương sai của hai biến ngẫu nhiên có phân phối chuẩn:
Giả sử có hai đám đông với hai dấu hiệu cần nghiên cứu lần lượt là X1 và X 2 ,





X1 ~ N(a1 ; 12 ) ; X 2 ~ N(a 2 ; 22 ) , trong đó 12 và 22 chưa biết. Từ hai đám đông đó
lấy hai mẫu lặp, độc lập có kích thước tương ứng là n1 và n 2 . Từ đó có các phương
sai mẫu điều chỉnh của X1 , X2 lần lượt là S12 và S22 .
2

Khi đó F 

S1 22
2


S212

~ F(n1  1;n 2  1) .

Với độ tin cậy   1   cho trước, tìm được các giá trị 1 , 2 dương sao cho
1   2   và các giá trị tới hạn Fisher-Snedecor tương ứng f1(n111;n2 1) , f (n2 1 1;n2 1)
(n 1;n 1)
(n 1;n 1)
thỏa mãn P(F  f111 2 )  1 ; P(F  f 2 1 2 )  2 .
(n 1;n 1)
(n 1;n 1)
Do đó P(f111 2  F  f 2 1 2 )  1  (1   2 )  1     . Do đó

22


�S22 (n 1;n 1) 2 S22 (n 1;n 1) �
�S12 (n 1;n 1) 2 S12 (n 1;n 1) �
P � 2 f111 2  22  2 f 2 1 2 �  � P � 2 f122 1  12  2 f1 2 1 � .
�S1

�S2

1 S1
 2 S2





�S12 (n 1;n 1) S12 (n 1;n 1) �
.
- Khoảng tin cậy (cho 1  2   / 2 ): � 2 f12 /2 1 ; 2 f /22 1 �
�S2

S2


�S12 (n 1;n 1)

.
- Khoảng tin cậy bên phải (cho 1  0; 2   ): � 2 f12 /2 1 ; ��
�S2



� S12 (n 1;n 1) �
0; 2 f  / 22 1 �
.
- Khoảng tin cậy bên trái (cho 1  ; 2  0 ): �
� S2



f. Ước lượng hiệu hai tham số của hai biến ngẫu nhiên có phân phối không - một:
Ta xét hai đám đông với hai dấu hiệu cần nghiên cứu lần lượt là X1 và X 2 ,
X1 ~ A(p1 ) ; X 2 ~ A(p2 ) . Từ hai đám đông đó lấy hai mẫu lặp, độc lập có kích
thước tương ứng là n1 và n 2 ( n1 �30;n 2 �30 ). Từ hai mẫu ta tìm được tần xuất
mẫu tương ứng f1 ,f 2 .
Khi đó Q 


p (1  p1 ) p 2 (1  p 2 )
(f1  f 2 )  (p1  p 2 )


~ N(0;1) , trong đó D  1
n1
n2
D

Với độ tin cậy   1   cho trước, tìm được các giá trị 1 , 2 dương sao cho
1   2   . Tiến hành tương tự như trên ta được:





P (f1  f 2 )  Du 2  p1  p 2  (f1  f 2 )  Du 1   .

Do p1 , p 2 chưa biết nên ta lấy D �

f1 (1  f1 ) f 2 (1  f 2 )


n1
n2

- Khoảng tin cậy đối xứng (cho 1  2   / 2 ):

 (f1  f 2 )  Du  / 2 ;(f1  f 2 )  Du  / 2  .

- Khoảng tin cậy bên phải (cho 1  0; 2   ):  (f1  f 2 )  Du  ;1 .
- Khoảng tin cậy bên trái (cho 1  ; 2  0 ):  1;(f1  f 2 )  Du   .
Ví dụ 1:
Khối lượng của một loại sản phẩm trong kho hàng là biến ngẫu nhiên có phân
phối chuẩn với độ lệch tiêu chuẩn là 0,4. Lấy 36 sản phẩm từ kho hàng đó để cân
thử người ta thu được bảng số liệu sau:
23


Khối lượng (kg) 1,33 1,55 1,71 1,88 1,95
Số sản phẩm
4
7
13
6
6
Với độ tin cậy 0,95 hãy:
a. Tìm khoảng tin cậy đối xứng của khối lượng trung bình của loại sản phẩm trên.
b. Ước lượng khối lượng trung bình tối thiểu, khối lượng trung bình tối đa của
sản phẩm trong kho hàng đó.
Giải: Gọi X là khối lượng của sản phẩm trong kho hàng đó thì X ~ N(a;0,16) .
Ta có X  (4.1,33  7.1,55  13.1,71  6.1,88  6.1,95) / 36  1,705 .
Đây là bài toán ước lượng a trong trường hợp n  36  30 ;   0,4 đã biết.
Khi đó X có phân phối xấp xỉ phân phối chuẩn và coi là mẫu lặp. Với   0,95
�   1    0,05 .
a. Tra bảng giá trị tới hạn chuẩn ta được u 0,025  1,96 .
Do đó khoảng tin cậy đối xứng của a là:


0,4

0,4


��
X
u 0,025 ;X 
u 0,025 � �
1,705 

1,96;1,705 

1,96 �

n
n
36
36

��

 (1,5743;1,8357) .
b. Tra bảng giá trị tới hạn chuẩn ta được u 0,05  1,645 . Do đó:
Khoảng tin cậy bên phải của a là:

0, 4


��
X


u
;



1,705


1,645; �� (1,5953; �) .
0,05

��
n
36

��

Khoảng tin cậy bên trái của a là:

0,4


��
�;X 
u 0,05 � �
�;1,705 

1,645 � ( �;1,81467) .

n

36

��

Vậy với mẫu lấy ra và độ tin cậy 0,95 thì khoảng tin cậy đối xứng của khối
lượng trung bình của sản phẩm trong kho là: (1,5743; 1,8357); khối lượng trung
bình tối thiểu là 1,5953 kg; khối lượng trung bình tối đa là 1,81467 kg.
Ví dụ 2: Một máy tự động đóng gói mì chính, khối lượng gói mì chính được giả
thiết là biến ngẫu nhiên có phân phối chuẩn. Lấy 100 gói mì chính đã được đóng
gói để cân thấy khối lượng trung bình là 460 gam, độ lệch tiêu chuẩn mẫu là 25
gam. Với độ tin cậy 0,95 hãy ước lượng bằng khoảng tin cậy đối xứng khối lượng
trung bình của các gói mì chính của máy đó.
Giải:
Gọi X là khối lượng của gói mì chính do máy đóng gói thì X ~ N(a; 2 ) .
24


Đây là bài toán ước lượng a bằng khoảng tin cậy đối xứng trong trường hợp
n  100  30 ;  chưa biết.
Khi đó X có phân phối xấp xỉ phân phối chuẩn và coi là mẫu lặp. Với   0,95
�   1    0,05 . Tra bảng giá trị tới hạn chuẩn ta được u 0,025  1,96 .
Lấy  �S ta được khoảng tin cậy đối xứng của a là: :


S
S

��

X

u 0,025 ;X 
u 0,025 ���
X
u 0,025 ;X 
u 0,025 �

n
n
n
n

��

25
25


�
460 

1,96;460 

1,96 � (455,1;464,9) .
100
100


Vậy với mẫu lấy ra và độ tin cậy 0,95 thì khoảng tin cậy đối xứng của khối
lượng các gói mì chính là (455,1; 464,9).
III. Bài tập

1. Chọn ngẫu nhiên 25 chi tiết máy do một máy sản xuất để đo chiều dài được
chiều dài trung bình là 13,4 cm; độ lệch tiêu chuẩn mẫu điều chỉnh là 4 cm. Hãy
xác định khoảng tin cậy đối xứng của chiều dài trung bình của các chi tiết máy với
độ tin cậy 0,95. Giả thiết chiều dài chi tiết máy được sản xuất có phân phối chuẩn.
2. Thu nhập/tháng năm 2012 của công nhân công ty A là biến ngẫu nhiên có phân
phối chuẩn. Lấy số liệu về thu nhập/tháng (đơn vị: triệu đồng) năm 2012 của 10
công nhân được kết quả: 2,5; 2,8; 2,9; 3,1; 3,2; 3,4; 3,6; 3,7; 4,0; 4,1. Với độ tin cậy
0,98 hãy ước lượng mức thu nhập/tháng trung bình tối thiểu năm 2012 của công
nhân công ty A.
3. Thời gian sản xuất một sản phẩm của công nhân nhà máy Z là biến ngẫu nhiên
có phân phối chuẩn với kỳ vọng là 35 phút. Chọn ngẫu nhiên 26 công nhân, cho
mỗi người sản xuất một sản phẩm người ta thu được kết quả:
Thời gian (phút) 32
33
34
35
37
Số công nhân
3
4
6
7
6
Với độ tin cậy 0,9 hãy ước lượng phương sai của thời gian sản xuất một sản
phẩm của công nhân nhà máy Z.
4. Lãi suất khi đầu tư vào cổ phiếu A trong năm 2013 được coi là biến ngẫu nhiên
có phân phối chuẩn. Biết rằng khi lấy số liệu của 100 nhà đầu tư vào cổ phiếu đó
thì thấy lãi suất trung bình là 22%; độ lệch tiêu chuẩn mẫu là 8%. Với độ tin cậy
0,95 hãy:
a) Ước lượng mức độ phân tán của lãi suất khi đầu tư vào cổ phiếu A trong năm

2013 bằng khoảng tin cậy.
25


×