Tải bản đầy đủ (.pdf) (295 trang)

Kinh tế lượng ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (29.3 MB, 295 trang )

T H ư v ìỆ N
« I
: ĩiUÕMC BAế HOC HAlỈÀii;
'J} ( ^
NGUYỄN THỐNG
)
KINH TẾ LƯỢNG
ỨNG DỤNG
NHÀ X U Â T BẢN ĐẠI HỌC Quốc GIA
TP. HỒ CHÍ MINH - 2000
M ỤC LỤC
IM mở đầu
C hư ơng 1:K h o ả n g tin c ậ y
1.1 Giới thiệu 10
ỉ'.2 ước lượng và sự lấy mẫu 10
1.3 Phân phối giá trị trung bình của mẫu

12
1.4 Khoảng tin cậy của giá trị ưung bình trong ưường hợp
phân bố chuẩn 14
1.5 Kích thước mẫu để ước tính giá trị trung bình của tập hợp
mẹ 16
1.6 Phân phối Student và khoảng tin cậy của giá trị trung bình

17
1.7 Bất đẳng thức Bienaymé-Tchebycheí. Khoảng tin cậy của
giá trị trung bình 18
1.8 Khoảng tin cậy của độ sai biệt 2 giá trị trung bình dựa vào
phân phối chuẩn 19
1.9 Khoảng tin cậy của độ sai biệt 2 giá trị trung bình dựa vào


phân phối Student 21
1.10 Khoảng tin cậy của một tỷ lệ dựa vào phân phối chuẩn

22
1.11 Xác định kích thước mẫu cần thiết để ước lượng tỷ lệ

23
1.12 Khoảng tin cậy cho sự sai biệt giữa 2 tỷ lệ

24
BÀI TẬP 25
C hư ơng 2:K iể m đ ịn h g iả th iế t
2.1 Giới thiệu 47
2.2 Các bước kiểm định một giả thiết 47
2.3 Kiểm định giả thiết về giá trị trung bình của một phân
phối chuẩn

48
2.4 Kiểm định giả thiết về giá ưị trung binh của một phân
phối Student

51
2.5 Kiểm định giả thiết về sự sai biệt của 2 giá trị trung bình
dựa vào phân phối chuẩn 52
2.6 Kiểm định giả thiết về sự sai biệt của 2 giá trị trung bình
dựa vào phân phối Student

55
2.7 Kiểm định giả thiết cho tần số dựa vào phân phối chuẩn


5"
2.8 Kiểm định giả thiết về sự sai biệt của hai tần sô" nhờ vào
phân phối chuẩn 58
2.9 Kiểm định giả thiết liên quan đến phân phôi X2 60
2.9.1 Kiểm định sự phù hợp 60
2.9.2 Kiểm định giả thiết sự độc lập giữa hai biến số

63
2.10 Kiểm định giả thiết cho tỷ lệ

65
2. 10. 1 Kiểm định cho tỷ lệ 65
2.10.2 Kiểm định về sự khác nhau của hai tỷ lệ


2.10.3 Kiểm định sự bằng nhau của hai tỷ lệ

66
BÀI TẬP
.
69
C h ư ơng 3 : Mô h ìn h h ồ i q u y tu y ế n tín h đ ơ n
3.1 Giới thiệu 90
3.2 Giới thiệu mô hình 90
3.2.1 Ví dụ giới thiệu 90
3.2.2 Vai trồ của số hạng ngẫu nhiên

91
3.2.3Ảnh hưởng của hệ số ngẫu nhiên 93
3.3 Ước lượng các thông số của mô hình 94

3.3.1 MÔ hình và các giả thiết 94
3.3.2Công thức xác định các hệ số ước lượng

95
3.3.3 Các dạng khác nhau của mô hình: sai sô" và sô" dư



98
3.3.4Các tính chất của hệ số hồi quy âo, ầ |

99
3.4 Hệ quả của các giả thiết: thiết lập các kiểm định

101
3.4.1 Giẳ thiết sai số tuân theo phân phôi chuẩn

.
101
3.4.2Hệ quâ của giả thiết

101
3.5 Phương trình và bảng tính phân tích phương sai

106
3.5.1 Phương trình phần tích phương sai 106
3.5.2 Bảng phân tích phương sai

107
3.6 Vấn đề dự báo trong một mô hình hồi quy đơn


111
BÀI TẬP

114
C h ư ơng 4: M ô h ìn h h ồ i q u y tu y ế n tín h b ộ i
4.1 Giới thiệu

* 118
4.2 Mô hình dưới dạng ma trận

.

.
118
4.3 Sự ước lượng và các tính chất của sự ưổlc lượng

119
4.3.1 Ưđc lượng các hệ sô trong phương trình hồi quy

119
4.3.2 Các giả thiết và tính chất của ước lượng

120
4.3.3 Các tính chât của các ước lượng.
.

121
4.4 Phương trình phân tích phương sai và clhất lượng của sự ăn
khớp



.

.

122
4.5 Các kiểm định thống kê trong mô hình kinh tế lượng 127
4.5.1 Vai trò của các giả thiết 127
4.5.2 Thiết lập các kiểm định

127
4.6 Phân tích phương sai 131
4.6.1 Bảng phân tích và kiểm định tổng quát cho hồi quy

131
4.6.2 Các kiểm định khác 132
4.7 Biến chỉ báo 136
4.8 Biến định tính trong mô hình kinh tế lượng

.
141
4.8.1 Giới thiệu vấn đề
.
141
4.8.2 Chuẩn bị số liệu cho biến định tíaih 141
4.8.3 Vấn đề điều kiện ràng buộc ưong trường hợp biến
định tính 142
4.9 Dự báo của mô hình tuyến tính tổng qjuát —
Dự báo có điều kiện 144

4.10 Vấn đề phụ thuộc tuyến tính và sự lựa chọn các biến
giải thích 145
4.10.1 Giới thiệu

145
4.10.2 Tương quan riêng phần

145
4.10.3 Tổng quát hóa khái niệm tương quan riêng phần

146
4.10.4 Phụ thuộc tuyến tính giữa các bnến giải thích: hệ quả
và phương phấp nhận biết

150
4.10.5 Sự lựa chọn các biến giải thích

155
4.11 Vấn đề tự tương quan của chuỗi sai số 158
4.11.1 Đặt vấn đề

158
4.11.2Toán tở ước lượng của phương pháp bình phương tối
thiểu tổng quát hóa

.•

159
4.11.3Nguyên do và cách nhận biết vấn đề tự tương quan
• giữa các sai số ! 160

4.11.4Các quy trình ựớc lượng trong tirường hợp có tính tự
tương quan của sai số
166
4.12 Hiện tượng “hétérocédasticité”

168
4.12.1Giới thiệu vấn đề

168
4.12.2Hiệu chỉnh 169
BÀI't ậ p 173
Chư ơng 5 : Mô h ìn h p h i tu y ế n v à m ô h ìn h c ó h ệ p h ư ơ n g

trình đ ồ n g th ờ i
5.1 Giới thiệu 186
5.2 Mô hình LnY = aX + b 187
5.3 MÔ hình Y= aLnX + b

191
5.4 Mô hình LnY = aLnX + b 192
5.5 Mô hình có dạng đa thức 195
5.6 Mô hình khuyếch tán

197
5.6.1 Các dạng mô hình chu kỳ phát triển của sản phẩm

198
5.6.2 Mô hình Logistique (đường cong Verhulst hay đường
cong Pearl) 198
5.6.3 Mô hình Gompertz


199
5.6.4 Phương pháp ước lượng

200
5.7 Mô hình tuyến tính tự hồi quy

206
5.7.1 Công thức tổng quát 206
5.7.2 Kiểm tra trình tự tương quan và các phương pháp
ước lượng !

207
5.7.3 Ước lượng trong trường hợp có hiện tượng tự tương
quan giữa các sai sô"

208
5.7.4 Dự báo trong một mô hình tự tương quan

210
5.8 Mô hình với các biến ưễ 214
5.8.1 Công thức tổng quát 214
5.8.2 Độ trễ trung bình 215
5.8.3Xác định mức độ trễ h

215
5.9 Mô hình động 216
5.9.1 Mô hình tương thích từng phần 216
5.9.2 Mô hình dự đoán thích nghi


218
5.10 Mô hình với các phương trình đồng thời

219
5.10.1 Phương trình câu trúc và phương trình thu gọn

219
5.10.1.1 Ví dụ giới thiệu 220'
5. 10. 1.2Mô hình tổng quát

221
5.10.1.3 Trường hợp đặc biệt: mô h'inh đệ qui

222
5.10.2 Vân đồ đồng nhât trong hệ phương trình

223
5.10.2.1 Ràng buộc cho các hệ số 223
5.10.2.2 Các điều kiện đồng nhất

223
5.10.3 Các phương pháp ước lượng

224
5.10.3.1 Phương pháp bình phương tối thiểu gián tiêp

225
5.10.3.2 Mô hình bình phương tối thiểu hai lần

.


225
BÀI TẬP 232
C h ư ơ n g 6: P h â n tíc h c h u ồ i thời g ia n
6.1 Giới thiệu 239
6.2 Các phương pháp làm trơn

239
6.2.1 Phương pháp làm trơn với trung bình động

240
6.2.2 Phương pháp làm trơn với 1 đa thức

243
6.2.3 Phương pháp làm trơn với hàm m ũ

.
244
6.2.4 Phương pháp làm trơn với hàm mũ có hiệu chỉnh 248
6.3 Phương pháp phân rã

249
6.3.1 Phân tích xu tlìế

249
6.3.2 Đánh giá sự biến đổi theo mùa

251
6.3.3 Dự báo dựa trên xu thế và thành phần theo mùa


252
6.3.4 Phân tích sự biến đổi theo chu kỳ và sự biến đổi
ngẫu nhiên 253
6.3.5 Ví dụ áp dụng

.

253
6.4 Phương pháp Box-Jenkins

255
6.4.1 Tính ổn định của 1 chuỗi 255
6.4.2 Hàm số tự tương quan và tự tương quan riêng phần

256
6.4.3 Kiểm định “nhiễu trắng" 258
6.4.3.1 Phân tích hàm tự tương quan

.
258
6.4.3.2 Tham số thông kê của Box-Pierce và Ljung-Box

259
6.4.4 Mô hình AR (p) (Auto Régressif)

261
6.4.5 Mô hình MA (q) (Moving Average)

263
6.4.6 Mô hình ARMA (p,q)


265
6.4.7 Mô hình ARMA mở rộng : ARIMA, SARIMA

266
6.4.8 Phương pháp Box-Jenkins 268
BÀI TẬP 279
PHỤ LỤC 285
Khoảng tin cậy
9
Chương 1
KHOẢNG TIN CẬY
10
Kinh tê lượng ứng dụng
Giới thiệu
Trong khuôn khổ nghiên cứu các biến ngẫu nhiên liên tục
tuân theo một phân phối thống kê nào đó, một số bài toán, ta
thường khảo sát giá trị các biến dao động trong một khoảng cho
trước. Nói một cách khác, biến liên tục ngẫu nhiên X sẽ dao động
trong một khoảng giá trị cho trước tương ứng với một xác suâ't định
trước nào đó. Để so sánh giá trị của một biến ngẫu nhiên với một
giá trị cho trước, người ta sẽ đưa ra khái niệm một khoảng giá trị
và sẽ so sánh giá trị cần khảo sát với khoảng giá trị này.
v ề quan điểm thống kê, người ta không bao giờ đặt vấn đề
biến
X
nghiên cứu sẽ bằng vđi một giá trị « chính xác » đã định với
một xác suất cho trước trong trường hợp này. Ví dụ tuổi trung bình
của các mẫu lấy ra từ tập hợp sinh viên trường Đại học Kỹ thuật
Tp. Hồ chí Minh tuân theo phân phôi chuẩn. Tiến hành chọn một

mẫu ngẫu nhiên của sinh viên, và từ đó ta chỉ có thể tính giá trị tuổi
trung bình của mẫu này sẽ nằm trong một khoảng tính được với một
xác suất tương ứng. Ta không đặt vấn đề khảo sát giá trị này bằng
với một giá trị cho trước. Một ví dụ khác ta xét tỷ lệ trẻ sơ sinh là
nam (nữ) tại Tp. Hồ chí Minh. Ta có thể xem tỷ lệ này sẽ tuân theo
phân phối chuẩn. Tiến hành khảo sát trên một mẫu điển hình và
tính được tỷ lệ nam trên tổng số. v ề nguyên tắc ta chỉ có thể tiến
hành khảo sát tỷ lệ này dao động trong một khoảng cho trước nào
đó vđi xác suất tương ứng. Ta không thể khảo sát giá trị này bằng
với một giá trị định trước nào đó. Đó là lý do tại sao khi nghiên cứu
đến sự thay đổi của các biến ngẫu nhiên liên tục người ta nói đến
vấn đề khoảng tin cậy.
1.2 Ước lượng và sự lấy mổu
Trong thực tế nghiên cứu các thông số thống kê của một tập
hợp mẹ bất kỳ, người ta thường tính toán trên mẫu được chọn từ tập
hợp mẹ một cách cồ lý luận được gọi là thống kê mẫu. Ví dụ p và CT
biểu thị giá trị trung bình và độ lệch chuẩn của tập hợp mẹ (thông
thường là các đại lượng không biết vl kích thước mẫu lđn, tiến hành
Khoảng tin cậy
lỉ
xác định thường tốn kém); trong khi đó , và s là giá trị trung bình
và độ lệch chuẩn của một mẫu lấy từ tập hợp mẹ (tính được tương
đối dễ dàng). Một cách tổng quát ta có: // * và ơ * s . Tuy vậy,
các nghiên cứu lý thuyết sẽ dược tiến hành nhằm cho phép nghiên
cứu giá trị của ụ,ơ từ kết quả có được 5 cho từ mẫu.
Các nhà thống kê học đưa ra các tiêu chuẩn để chọn lựa các
đại lượng đánh giá dùng để nghiên cứu các thông số của tập hựp
mẹ. Tiêu chuẩn đầu tiên đặt ra là đại lượng đánh giá này không bị
lệch. Theo định nghĩa một đại lượng đánh giá được xem là không bị
lệch khi kỳ vọng toán của nó bằng đúng với giá trị của nó mà

chúng ta đang tìm cách ước lượng.
Thứ hai là tiêu chuẩn hội tụ. Một đại lượng đánh giá được
xem là hội tụ khi giá trị của đại lượng đánh giá này tiến về giá trị
tương ứng của tập hợp mẹ trong trường hợp kích thước mẫu xét n
tiến về kích thước tập hợp mẹ đang xét N. Một đại lượng đánh giá
chỉ được xem là hoàn toàn đúng khi nó thỏa mãn cả 2 tính chất:
không lệch và hội tụ.
Trong bảng sau giới thiệu cho chúng ta một vài đại lượng đánh giá
hay gặp:
Thông sô" (tập hỢp mẹ)
Đại lượng đắnh giá
Trung bình, |1
X
Sai biệt giá trị trung bình của
2 tập hợp mẹ, ( ụì- )
(X, - x 2)
Tỷ lệ ,n
p
Sai biệt giá trị giữa hai tỉ lệ
của hai tập hợp mẹ, (Jt| -
n 2)
(Ã -Pĩ)
Độ lệch chuẩn, ơ
s
Bảng 1.1
12
Kỉnh tế lượng ứng dụng
1.3 Phân phối giá trị trung bình của mẫu
Xét tập hợp các mẫu có kích thước n lấy ra từ tập hợp mẹ.
Từ các mẫu, chúng ta có thể tính đưực các thông số thống kê như

giá trị trung bình, độ lệch chuẩn. Các thông số sẽ thay đổi từ mẫu
này sang mẫu khác. Ví dụ, các'giá trị trung bình tính từ các mẫu
nghiên cứu sẽ tạo nên một phân phối được gọi là phân phối giá trị
trung bình của mẫu. Gọi Xlà giá trị trung bình của mẫu và nó tạo
thành một phân phối, <Xjlà độ lệch chuẩn của phân phối. Nếu tập
hợp mẹ là vô hạn và sự lấy mẫu sẽ được hoàn trả lại cho tập hợp
mẹ sau mỗi lần lấy. Chúng ta có:
E( X ) = Ji
.và:
ơ~x =
■Tn
Nhận xét: Nếu n=l ta có ƠỊ = ơ
Ví dụ: Giả sử giá trị trung bình của một tập hợp mẹ có kích
thước rất lđn là p = 50 và độ lệch chuẩn là ơ = 12. Chúng ta có thể
ưđc lượng sự phân phối của giá trị trung bình tính từ các mẫu có
kích thước n = 36 nhờ vào giá trị trung bình và độ lệch chuẩn của
tập hỢp mẹ như sau:
E( X ) = p = 50
ơ 12
4ñ ~V36
Trong trường hợp kích thước tập hợp mẹ là hữu hạn và sự
lấy mẫu từ tập hợp này là không hoàn lại, giá trị của <Tj, trong
trường hợp này, phải thêm vào giá trị hiệu chỉnh để kể đến sự thay
đổi kích thước của tập hợp mẹ. Trong thực tế ứng dụng, nếu n <
5%N (với N là kích thước tập hợp mẹ) sự hiệu chỉnh này có thể bỏ
qua. Trong trường hợp ngược lại, nến n > 5%N, giá trị ơ~x có kể đến
hiệu chỉnh được tính như sau:
Khoảng tin cậy
13
ơ [Ñ-n

ơ ỉ ' 7 ^ vã^ t
Nhận xét: ơ ị = ơkhin=ì
Trong trường hợp nếu độ lệch chuẩn ơ của tập hợp mẹ
không biết, chúng ta có thể ước lượng độ lệch chuẩn của mẫu. Để
phân biệt, chúng ta sẽ ký hiệu 5j cho trường hợp này :
5
Tương tự như trên, nếu tập hợp mẹ là hữu hạn và sự lấy mẫu
là không hoàn lại, ta phải thêm vào giá trị hiệu chỉnh:
í In - n
Ví dụ 1: Một kiểm định viên chọn một mẫu ngẫu nhiên có
kích thước n=16 trong tập hợp mẹ có kích thước N = 100. Kết quả
tính toán độ lệch chuẩn cho thấy s = 57. Xác định độ lệch chuẩn
của phân phối các giá trị trung bình
s [Ñ-n _ 57 /100 -16
Sĩ~^ÌN-iVÏ6 V 100-1 - u ,u
Ghi chú: Chúng ta phải kể đến giá trị hiệu chỉnh khi tính Sị n
>5%N. Trong thực tế tính toán,người tù thừa nhận khi kích thước mẫu
thỏa mãn điều kiện n >30, thì sự phân của giá trung bình theo gần
như phân phối chuẩn.
Ví dụ 2: Một kiểm định viên lấy một mẫu có kích thước n =
36 từ một tập hợp mẹ có kích thước N = 100. Giả sử độ lệch chuẩn
của tập hỢp mẹ chưa biết và độ lệch chuẩn của mẫu là s = 43. Nêu
giá trị trung binh của tập hợp mẹ là p = 260. Xác định xác suât để
giá trị trung bình của mẫu xét nhỏ hơn hoặc bằng 250. Giả sử giá trị
trung binh tuân theo phân phối chuẩn.
14 Kinh tế lượng ứng dụng
Ta có:
E (x)= ụ = 260
_£_ = 4 L = 7 1 7
V36

«ĩ =
Ở đây ta không cần hiệu chỉnh giá trị bởi vì < 5%N.
Và:
z , £ z £ = 250 - 260 =-1,39
Ȓ 7,17
Từ đó ta có:
P{x <250) = P ( - ~ 26- < — ~ 26Q) = < -1,39)
ss
0,0823
1.4 Khoảng tin cộy của giá trị trung bình trong trường
hợp phân bố chuẩn
Trong mục này chúng ta giả thiết phân phối của giá trị trung
bình từ các mẫu tuân theo phân phối chuẩn.
Đỉnh nghĩa:
Khoảng tin cậy của giá trị trung bình là một khoảng được
ước lượng từ giá trị trung bình của tập hợp mẹ, được thiết lập đối
xứng quanh giá trị trung bình của mẫu sao cho khoảng tin cậy này
chứa giá trị trung bình của tập hợp mẹ với một xác suất định trước.
Ta cố thể giới thiệu định nghĩa trên nhờ vào sơ đồ sau đây:
- 00
X, -
e ,xx,+ e +0 0
Khoảng tin cậy
với e được gọi là biên độ.
Hình 1.1
* «
Các khoảng tin cậy của giá trị trung bình thừa nhận giá trị
X
Khoảng tin cậy
15

ở trung điểm. Khi sự sử dụng phân phối chuẩn là hợp lý, khoảng tin
cậy của’ giá trị trung bình được xác định bởi:
Hay
X ± Z.ƠJ
X
±
z
Những khoảng tin cậy sử dụng phổ biến trong thực tê áp
dụng là các khoảng tin cậy 90%, 95% và 99%.
Ví dụ: Một cuộc thăm dò được thực hiện trong vòng một
tuần lễ về lương tháng nhận được của các công nhân trong một xí
nghiệp có sô' công nhân viên làm việc được xem là lđn (tập hợp
mẹ). Có n = 30 công nhân được chọn phỏng vân một cách
ngẫu nhiên và người ta nhận thây là lương trung bình của họ là
X
= 180ƯSD. Độ lệch chuẩn của phân phối lương của 30 công
nhân này là s = 14USD. Chúng ta sẽ ước tính lương trung bình của
tất cả công nhân của xí nghiệp nhờ vào khoảng tin cậy. Giả sử
chúng ta mong muôn có một hệ số tin cậy là 95% để khoảng tin cậy
chứa giá trị lương trung bình của công nhân xí nghiệp.
ìiai:
Từ bảng tra phân phối chuẩn, giá trị của biến z để diện tích
đối xứng xung quanh trục đối xứng có giá trị 0,95 sẽ là z = 1,96.
Do đó khoảng tin cậy là:
Vđi:
X ±
x = 180 và = — = -41= = 2.56
in V l30
Từ đó:
X

± ZsJ = 180 ± 1,96 X 2,56 = [174,98;185,02]
Từ đây chúng ta có thể kết luận là với một độ tin cậy là
95%, giá trị lương trung bình của công nhân xí nghiệp biến đổi dao
động trong khoảng [174,98USD ; 185.02USD].
16
Kỉnh tế lượng ứng dụn>
1.5 Kích thước mẫu để ước tính giá trị trung bình của tộp
hựp mẹ
Giả sử chúng ta đã xác định trước biên độ khoảng tin cậy yêu
cầu và độ tin cậy tương ứng. Giả thiết chúng ta biết độ lệch chuẩn
ơ của tập hợp mẹ hoặc có thể ứớc lượng nó. vấn đề đặt ra là ta
phải xác định kích thước mẫu n cần thiết để đạt đến yêu cầu đặt ra.
Gọi z là giá trị trong hàm phân phối chuẩn tương ứng vđi độ
tin cậy, ơ là độ lệch chuẩn của tập hợp mẹ và E là một nửa chiều
dài của khoảng tin cậy. Ta có:
hay:
Zơ - = e => = e
n =
'ZơỸ
< e y
Ví dụ: Giám đốc nhân sự của một công ty X muốn ưđc tính số giờ
đào tạo bổ sung cho công nhân công ty với độ tin cậy là 90% và có
sự sai biệt so vđi giá trị trung bình là 3 giờ. Nhờ vào số liệu trong
dịch vụ khác của công ty, ông ta ưđc tính là độ lệch chuẩn của số
giờ đào tạo bổ sung là ơ = 20 giờ.
Để đạt được độ tin cậy đặt ra, giám đốc nhân sự phải điều
tra trên mẫu có kích thưổc tối thiểu là:
n =

Y _ f 1,65x20^1

« J
k 3 J
= 121 công nhân.
Vđi 1,65 là giá trị của z có từ bảng tra phân phối chuẩn tương
ứng vđi trường hợp có diện tích đối xứng xung quanh trục tung là
0,9.
Khoang tin cậy
17
1.6 Phân phối student và khoảng tin cộy của giá trị trung
Chúng ta đã biết khi kích thước mẫu xét n > 30, phân phối
chuẩn có thể được sử dụng để ước lượng giá trị trung bình của tập
hợp mẹ. Nếu n < 30 ta phải đảm bảo trước tiên là tập hợp mẹ phải
thỏa mãn phân phối chuẩn và độ lệch chuẩn ơ đã biết nếu muốn áp
dụng phân phôi chuẩn trong tính toán. Trong mục này, chúng ta sẽ
giải quyết trường hợp kích thước mẫu n là nhỏ và ơ là không biết
và tập hỢp mẹ là phân phối chuẩn.
Như ta đã thấy, các giá trị trung bình của mẫu phải được
trung tâm hóa và chuẩn hóa: (x - ụNếu ơ là không biết, giá
trị s} sẽ thay thê cho ơ ở mẫu số. Điều này làm cho phân phối của
biến chuẩn hóa này không còn hình dạng của phân phối chuẩn.
Trong trường hợp như vậy các giá trị Sj trong thực tế, sẽ
phân phối theo luật Student. Mỗi phân phối này sẽ phụ thuộc vào
một thông số ta gọi là bậc tự do (dl) có giá trị bằng (n-1) với n là
kích thước của mẫu ngẫu nhiên.
Tóm lại, phân phối Student thích hợp để xác định khoảng tin
cậy của giá trị trung bình cho bất kỳ kích thước mẫu đang xét trong
trường hợp ơ không biết. Lưu ý rằng ngay trường hợp này tập hợp
mẹ phải có phân phối chuẩn, về lý thuyết, dạng đường cong biểu
thị phân phối Student sẽ tiệm cận về dạng phân phối chuẩn khi kích
thưđc mẫu n tăng.

Ví dụ: Tuổi thọ trung bình của một mẫu gồm n = 10 bóng
dèn điện là X = 4000 giờ. Độ lệch chuẩn của mẫu là s =200 giờ.
Giả thiết phân bố tuổi thọ bóng đèn gần như là phân phối chuẩn.
Chúng ta muốn ưđc tính tuổi thọ trung bình của toàn bộ bóng đèn
với một khoảng tin cậy là 95%.
Với khoảng tin cậy là 95%, từ bảng tra phân bố Student (vì n
< 30) với độ tự do dl = n-1 = 9, ta có:
bình
tr n p m
ì xrzz>
18
Kinh tế lượng ứng dụng
_ 0 OAO ' 5 200 1
tdi = 2,262 và = —Ị= = —p= = 63.3
v ũ Vĩo
Do đó, khoảng tin cậy sẽ là:
3c +tut. 5j = [3857giờ ; 4143giờ]
Kết luận:Vđi một độ tin cậy là 95% chúng ta có thể bảo đảm
giá trị trung bình của tuổi thọ các bóng đèn nằm trong khoảng
[3857giờ; 4143giờ].
1.7 Bất đẳng thức Bienaymé-Tchebychet: Khoảng tin cậy
của giá trị trung bình
Khi kích thước mẫu xét có n < 30 và chúng ta không thể giả
định phân phối của tập hợp mẹ là chuẩn, trong trường hợp này
chúng ta không thể thành lập khoảng tin cậy, ngay cả khi châp
nhận phân phối Stuđent.
Định lý Bienaymé - Tchebycheí
Định lý được thể hiện bởi bất đẳng thức sau:
Chú ý trong bất đẳng thức Bienaymé-Tchebychef giá trị
hiện hữu. Do đó, chúng ta phải biết ơ hoặc ưđc lượng bởi .Vj.

Bất đẳng thức Bienaymé-Tchebychef không được áp dụng rộng rãi
trong việc xác định khoảng tin cậy của giá trị trung bình, tuy vậy
đây là phương pháp duy nhất sẽ được sử dụng khi phân phối của
tập hợp mẹ không phù hợp với phân phối chuẩn và trường hợp kích
thước mẫu xét là nhỏ (n<30).
Để áp dụng bất đẳng thức Bienaymé-Tchebychef nhằm
thiết lập khoảng tin cậy của giá trị trung bình, ta đặt (1-1/k2) bằng
độ tin cậy mong muốn. Tìm giá trị k và thiết lập khoảng tin cậy từ
các công thức thích hợp sau:
với k > 1
Khoảng tin cậy
19
- nếu ơ biết ta xác định khoảng tin cậy từ ±
- nếu ơ không biết ta xác định khoảng tin cậy từ
Ví dụ: Trong một tuần thăm dò, 10 công nhân được chọn ngẫu
nhiên trong một xí nghiệp lớn (tập hợp mẹ có kích thước lớn) và
người ta tính được lương trung binh từ mẫu 10 người này là =
180USD và độ lệch chuẩn là s = 14USD. Xác định khoảng tin cậy
tương ứng với độ tin cậy 95% chứa giá trị lương trung bình của toàn
thể công nhân Xí nghiệp. Giả thiết trong trường hợp này ta không
thể chấp nhận phân phối lương công nhân là phân phối chuẩn.
Giải:
Sử dụng bất đẳng thức cho trường hợp này:
1 - -i- = 0,95 =>k = 4,47
k2
VI ơ không biết nên ta ước lưựng như sau:
4.43
Do đó khoảng tin cậy của giá trị trung bình là:
X±ksx = 180 ± 4,47(4,43) = [ 160.2USD ; 199,8 USD]
1.3 Khoảng tin cộy cho độ sai biệt hai giá trị trung bình

dựa vào phân phối chuẩn
Trong thực tế, chúng ta có thể gặp trường hợp ưđc tính sự sai
biệt giá trị trung bình của hai tập hợp mẹ khác nhau. Ví dụ, đánh
giá lương trung bình của công nhân hai xí nghiệp có lchác nhau
nhiều không? Tuổi trung bình của hai dân tộc có khác nhau hay
không? Đại lượng đánh giá không bị lệch được sử dụng để ước
lưẹng sự sai biệt (|i| - p2) là (3c, - x 2). Khoảng tin cậy cần thiết lập
cho sự sai biệt về nguyên tắc cũng tương tự như chúng ta đã trình
20
Kinh tế lượng ứng dụng
bày ở trước. Phân phối chuẩn ở đây sẽ giữ vai trò tương tự như
trong trường hợp nghiên cứu cho giá trị trung bình.
Ta có:
(*. - ĩ j ) ± z ơ j rỉi .
hay trong trường hợp ơ không biết:
trong trường hợp nếu chúng ta biết độ lệch chuẩn của hai tập hợp
mẹ, độ lệch chuẩn của phân bố biểu thị sự sai biệt hai giá trị trung
bình xác định như sau:
và nẹu chúng ta không biết độ lệch chuẩn ở tập hợp mẹ, sự ưđc
lượng giá trị độ lệch chuẩn của phân bố hiệu hai giá trị trung bình
Như vậy chúng ta sẽ tiến hành tính toán độ lệch chuẩn cho
từng tập hợp mẹ riêng lẻ và hiệu chỉnh nó khi cần thiết (khi tập hợp
mẹ hữu hạn) như đã trình bày ở trước.
Ví dụ: Lương hàng tuần trung bình của công nhân Xí nghiệp
A tính từ một mẫu khảo sát ni=30 cho biết 3ẽị = 180 nghìn đồng. Độ
lệch chuẩn là S| = 14 nghìn đồng. Đối với Xí nghiệp B nghiên cứu
cho một mẫu khảo sát ĨÌ2 = 40 cho biết x2 = 170 nghìn đồng và độ
lệch chuẩn S2 = 10 nghìn đồng. Xác lập khoảng tin cậy với độ tin
cậy 99%. cho sự sai biệt hai giá trị lương trung bình.
(xí- x 2)±zsĩi_h

Với độ tin cậy là 99% , từ bảng tra phân phối chuẩn ta có:
z = 2,58
(x, -X2)±zs
là:
Giải:
Ta có:
Khoảng tin cậy 21
và:
S —
*1
5, _ 14
■Ịnx~ J30
2,56
Do đó:
s- - = J s j + $1 «3,01
X ị- X i
V
*1

-x2

5
Từ đó khoảng tin cậy sẽ là:
(180-170) ± 2,58 (3,01) = ị 2,23 ; 17,77 ]
Với độ tin cậy là 99%, chúng ta có thể kết luận là lương
trung bình hàng tuần của công nhân Xí nghiệp A cao hơn ở Xí
nghiệp B và sự khác biệt đó nằm trong khoảng [2,23 nghìn đồng ;
17,77 nghìn đồng]
1.9 Khoảng tin cộy cho độ sai biệt hai gỉá trị trung bình
dựa vào phân phối student

Giống như phần trước, phân phối Student sẽ được sử dụng
thay cho phân phối chuẩn khi kích thươc mẫu của ta bé (n<30) và
độ lệch chuẩn ơ là không biết, mặc dù phân phối của tập hợp mẹ là
phân phối chuẩn. Trong trường hợp này, bậc tự do sẽ là (ni +Ũ2 -2)
với ni , n2 lần lượt là kích thước của mẫu 1 và mẫu 2. Khoảng tin
cậy sẽ được xác định bởi:
te. - * 2 )± 'c//V ĩ2
Bậc tự do:
ni + n2 -2 = 16
Với độ tin cậy là 90% và bậc tự do là 16, từ bảng tra của
phân phối Student, ta có:
22
Kinh tê lượng ứng dụng
0 ,= /,, =1.746
và:
Do đó:
5 j _j
=
Ịsĩ + s ĩ =108,65
Xì - X
2
\ x \ x ĩ 7
Từ đó khoảng tin cậy sẽ là:
(4000 - 4600) ± 1,746*108,65 = [ - 789,7 giờ; - 410,3giờ )
Kết luận:Với độ tin cậy là 90%, chúng ta có thể nói tuổi thọ
trung bình của bóng đèn hiệu B lớn hơn bóng đèn hiệu A và sự sai
biệt đó nằm trong khoảng [410,3giờ ;789,7giờ].
1.10 Khoảng tin cộy của một tỷ lệ dựa vào phân phối
Ta biết rằng phân phối nhị thức có tỷ lệ p, sẽ được tính xấp
xỉ và sẽ thay thế bởi phân phối chuẩn khi n > 30 và np > 5 (xem lại

lý thuyết về các luật phân phối). Gọi p là tỷ lệ mẫu quan sát được,
ta có thể ước tính độ lệch chuẩn liên quan đến sự phân phối của các
tỷ lệ như sau:
Trong trường hợp n > 5%N, với N là kích thước tập hợp mẹ,
và ta phải hiệu chỉnh giá trị của s^nhưsau:
chuấn
Khoảng tin cậy
23
Và khoảng tin cậy cho tỷ lệ đưực xác điịnh như sau:
p ±
Ví dụ: Một nhân viên thương mại muốn nghiên cứu thị
trường dao cạo râu. Chọn ngẫu nhiên 100 người dàn ông trong một
thành phố lđn và nhận thây là 40% người được phỏng vấn sử dụng
dao cạo râu hiệu A. Xác định khoảng tin cậy cho tỷ lệ đàn ông sử
dụng dao cạo râu hiệu A với độ tin cậy là 95%.
Ta có:
Độ lệch chuẩn của các phân phối tỷ lệ là:
Vđi độ tin cậy là 95%, từ bảng phân phối chuẩn ta có
z = 1,96.
Kết luận: Với độ tin cậy là 95%, ta có thể ước lượng là tỷ lệ đàn
ông sử dụng dao cạo râu hiệu A trong thànhi phố biến động trong
khoảng [0,3;0,5J.
1.11 Xác định kích thước mẫu cần thiết để ước lượng tỷ
Do đó khoảng tin cậy sẽ là:
p±Zs-p= 0.4 ±1.96 *0.05 =[0,3;0,5]
lệ
Gọi 71 là ước lượng sơ bộ của tỷ lệ đang xét, tai có:
24 Kỉnh tế lượng ứng dụng
z
2

n ị\ -
7
ĩ)
n = s ~
với:
Z: giá trị tra từ phân bố chuẩn tương ứng vđi độ tin cậy yêu
£
cẵu.
e: biên độ của khoảng tin cậy.
n: kích thước mẫu.
Trong trường hợp không thể đưa ra được ưđc lượng giá trị n,
ta có thể giả thiết là ( = 0,5. Với giả thiết này sẽ đưa đến việc xác
định n lđn nhất so với bất kỳ giá trị nào của 71 (thiên về an toàn). Ta
có trong trường hợp này:
1.12 Khoảng tin cộy cho $ự sai biệt giữa hai tỷ lệ
Cũng dựa trên lý luận tương tự cho tỷ lệ, ở đây chúng ta
cũng nhờ vào phân phôi chuẩn. Khoảng tin cậy cho sự sai biệt của
hai tỷ lệ tương ứng trong hai tập hợp mẹ là:
(ã - p ĩ)±Zsỹì_h
Và độ lệch chuẩn cho phân phối sẽ là:
5= s =Jsị + s|
Pi~Pĩ V P\ p 2
Với
52 ^ Ã O -Ã ) à 2
Ỹ' H, * n2
Ghi chú: Giá trị z = 2,58 được tra từ bảng phân phôi chuẩn với độ
tin cậy là 99%.
Khoáng tin cậy
25
BÀI TẬP

Bài 1. Chuyên viên kiểm tra chất lượng đèn hình của hãng
Sony biết rằng tuổi thọ trung bình của nó là P = 9000 giờ và độ lệch
chuẩn ơ = 5000 giờ. Xác định giá trị trung bình và độ lệch chuẩn
của phân phối giá trị trung bình từ các mẫu lấy có kích thước n =
100 .
Giải:
e {x j = M = 9000 giờ
ơ
5000
Vĩõõ
= 50 giờ
Bài 2. Một chuyên viên phân tích tài chính chọn ngẫu nhiên
10% trong tổng số 300 hóa đơn bán hàng của công ty. Giá trị trung
bình tính từ mẫu là
X
= 148,5ƯSD và độ lệch chuẩn là s =
35,7USD. ước lượng độ lệch chuẩn của giá trị trung bình của phân
phối mẫu có kích thước như trên.
Giải:
Do n > 5%N, độ lệch chuẩn của giá trị trung bình phải được hiệu
chỉnh:
Í Ặ E iu “ ¿5 lm _ -30 USD
s’ ■ -f> V N - 1 M V 300 - I '
Bài 3. Giả sử giá trị trung bình của tập hợp mẹ gồm 300 hóa
đơn trong bài tập trên là |i= 138USD. Xác định xác suất để lấy ra
một mẫu có giá trị trung bình ít nhât là 148.5USD.
Giải:
Giả thiết xem đây là một phân phối chuẩn. Ta có:
P ( X > 148,5) = P(^—^ > 148>^ 138) = P(Z > 1,69)
h

6,2
26
Kinh tếlưựng dụng
Từ bảng tra của phân phối chuẩn ta có:
P( X > 148,5) = P(Z > 1,69) = 0,0455
Bài 4. Giả sử độ lệch chuẩn của tuổi thọ bóng đèn Điện Quang là cr
= 500 giờ. Giả thiết tuổi thọ của bóng đèn tuân theo phân phối
chuẩn và ta không biết giá trị trung bình của nó. Trong một mẫu
chọn ngẫu nhiên có kích thước n=15, người ta tính được tuổi thọ
trung bình của nó là x=8900 giờ. Xác định (a) khoảng tin cậy với
độ tin cậy là 95% và (b) với độ tin cậy là 90% của tuổi thọ trung
bình của bóng đèn do Điện Quang sản xuất.
Giải:
Chúng ta có thể áp dụng phân phối chuẩn và thêm vào đó với điều
kiện ơ đã biết.
(a) Với độ tin cậy là 95%, tra bảng phân phối chuẩn ta có z = 1,96
và:
ơ 500
(Ty “ /— ~ /— 129,20
Ux Vn V15
Ghi chú: Vì n nhỏ so với kích thước tập hợp ta không cần hiệu
chỉnh giá trị (J- .
Từ đó khoảng tin cậy của giá trị trung bình tương ứng là:
8900 ± z ơ - = 8900 ±1,96x129,2 = [ 8647giờ ; 9 153giờ)
Kết luận:Từ kết quả tính từ mẫu trên, ta có thể nói với độ tin cậy
95%>, giá trị tuổi thọ trung bình của bóng đèn Điện Quang sẽ nằm
trong khoảng [ 8647giờ ; 9153giờ ]
(b) Tương tự cách tính cho độ tin cậy 90%:
8900 ± 1,65.129,2 = [ 8687giờ ; 9113giờ]
Nhận xét:Cùng xuất phát từ một mẫu khảo sát, xác suất đê giá

trung bình của tuổi thọ rơi vào khoảng cậy bé ( trường hợp b) sẽ
nhỏ hơn là rơi vào khoảng tin cậy lớn (trường hợp

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×