Tải bản đầy đủ (.pdf) (12 trang)

Giáo trình kinh tế chất lượng - ôn lại thống kê - 3 ppt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (174.18 KB, 12 trang )

Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 2: Ôn lại xác suất và thống kê

Ramu Ramanathan 25 Thục Đoan/Hào Thi
Trong phần này chúng ta trình bày hai thủ tục có thể thay thế nhau để ước lượng
các thông số chưa biết của phân phối xác suất mà các quan sát x
1
, x
2
, . . . , x
n
được rút ra
từ đó. trong Phụ lục, Phần 2.A.3, ta mô tả thêm một phương pháp nâng cao. trong phần
thảo luận tiếp theo, chúng ta sẽ giả sử rằng nhà khảo sát biết được bản chất của phân
phối xác suất nhưng chưa biết các giá trò của các thông số.

Phương pháp Momen
Phương pháp lâu đời nhất để ước lượng các thông số là phương pháp momen. Nếu một
phân phối có
k thông số chưa biết, thủ tục nhằm tính toán hệ số các momen mẫu k bậc
nhất của phân phối và sử dụng chúng như là các ước lượng của
các momen tổng thể
tương ứng. Trong Phần 2.2, chúng tôi đã có lưu ý rằng
trung bình tổng thể của phân
phối (


µ) cũng được đề cập đến như là momen bậc nhất của phân phối xung quanh giá trò
gốc. Đó là giá trò trung bình có trọng số của tất cả các x có thể có, các trọng số là các xác
suất tương ứng. Trung bình mẫu (x
_
) là trò trung bình số học của các quan sát mẫu x
1
, x
2
, .
. . , x
n
. Bằng phương pháp các momen, x
_
được tính như là một ước lượng của µ. Phương
sai của một biến ngẫu nhiên là
σ
2
= E [(X – µ)
2
] và được biết như là momen bậc hai xung
quanh giá trò trung bình. Phương sai mẫu (s
2
), được đònh nghóa trong Phương trình (2.9),
được sử dụng như là một ước lượng của
phương sai tổng thể của phân phối. Trong nhiều
trường hợp (ví dụ như, phân phối chuẩn), trung bình và phương sai đặc trưng hoàn toàn
cho một phân phối, và do đó không có nhu cầu phải sử dụng các momen bậc cao hơn như
là giá trò kỳ vọng của (X –
µ)
3

. Chúng ta sẽ thấy trong Phần 2.6 rằng trung bình mẫu có
một số tính chất mong muốn.
Cùng với nguyên lý này có thể được áp dụng để ước lượng hệ số của sự tương quan
giữa hai biến ngẫu nhiên X và Y (xem Đònh nghóa 2.5). Gọi x
1
, x
2
, . . . , x
n
và y
1
, y
2
, . . . ,
y
n
là các mẫu quan sát ngẫu nhiên độc lập (với cỡ mẫu n) tương ứng với X và Y. Phương
sai tổng thể giữa chúng được cho trong Đònh nghóa 2.4 là
E [(X – µ
x
) (Y – µ
y
)], trong đó
µ
x
và µ
y
là các trung bình tổng thể tương ứng của X và Y. Một trò ước lượng của thông số
này được cho bởi
phương sai mẫu


S
xy
= Cov(X, Y) =
1
n – 1
∑ (x
i
– x
_
) (y
i
– y
_
) (2.10)

Nếu các cặp giá trò của x
i
và y
i
được vẽ ra đồ thò, chúng ta có được một đồ thò như
Hình 2.7, trong đó X và Y có tương quan thuận với nhau (nghóa là, X và Y nói chung là
cùng dòch chuyển theo cùng một hướng). Chúng ta đã có đề cập rằng một đồ thò điểm
như vậy được gọi là
biểu đồ phân tán. Hình 2.6 cũng tương tự như vậy ngoại trừ việc
trung bình vẽ những điểm đề cập đến
tổng thể, trong khi ở đây nó lại đề cập đến mẫu.
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004


Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 2: Ôn lại xác suất và thống kê

Ramu Ramanathan 26 Thục Đoan/Hào Thi
Bằng cách chuyển đổi các trục thành các đường nét đứt xuất phát từ điểm (x
_
,y
_
), chúng ta
có thể thấy rằng (x
i
– x
_
) và (y
i
– y
_
) là những khoảng cách từ điểm trung bình (x
_
,y
_
).
} Hình 2.7 Một Biểu đồ Phân tán đối với Tương quan Thuận



















} Hình 2.8 Một Biểu đồ Phân tán đối với Mối quan hệ xấp xỉ bậc hai


















0
y
_

x
_
Y
X
3
2
1
4
0
y
_

x
_
Y
X
3
2
1
4
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích

Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 2: Ôn lại xác suất và thống kê

Ramu Ramanathan 27 Thục Đoan/Hào Thi


Nếu mối quan hệ là dương, chúng ta sẽ kỳ vọng hầu hết các điểm đều nằm trong
các phần tư thứ nhất và thứ ba mà trong đó tích số (x
i
– x
_
) (y
i
– y
_
) sẽ dương. Do các tích
số âm của các điểm trong phần tư thứ hai và thứ tư hầu như bò lấn át bởi các tích số
dương, chúng ta sẽ kỳ vọng đồng phương sai là dương. Bằng lý luận tương tự, chúng ta
có thể thấy rằng nếu mối quan hệ là âm, hầu hết các điểm sẽ nằm trong phần tư thứ hai
và thứ tư, tạo ra một đồng phương sai âm. Điều này cho thấy rằng nếu X và Y có tương
quan thuận, thì đồng phương sai và do đó tương quan giữa chúng cũng sẽ thuận. Một mối
quan hệ âm sẽ cho một hệ số tương quan âm.
Hệ số tương quan mẫu được cho bởi

r
xy
=
s

xy
s
x
s
y
=
∑ (x
i
– x
_
) (y
i
– y
_
)
[
∑ (x
i
– x
_
)
2
]
1/2
[∑ (y
i
– y
_
)
2

]
1/2
(2.11)
trong đó s
x
và s
y
là các độ lệch chuẩn mẫu (căn bậc hai của các phương sai) tương ứng
của X và Y.
Trong Phần 2.3 chúng ta đã có đề cập đến vấn đề hệ số tương quan là một đại
lượng đo lường mối quan hệ tuyến tính giữa X và Y. Hình 2.8 là một biểu đồ phân tán
cho ta thấy trường hợp khi Y là một hàm xấp xỉ bậc hai của X. chúng tôi lưu ý rằng các
điểm được phân tán trong cả bốn phần tư của biểu đồ, và do đó tổng
∑ (x
i
– x
_
) (y
i
– y
_
)
hầu như rất nhỏ, cho một giá trò r
xy
nhỏ. Vì vậy, một r
xy
nhỏ không có nghóa là X và Y
không có quan hệ chặt chẽ với nhau, mà có nghóa là chúng không có quan hệ
tuyến tính
chặt chẽ.

Bài tập 2.24 minh họa khái niệm sự tương quan được áp dụng cho
đường cong
Phillips.
Đối với những người sử dụng GRETL, Phần Thực hành trên Máy tính 2.3 (xem Phụ
lục D, Bảng D.1) chứng tỏ rằng việc tính toán các đồng phương sai và tương quan giữa
điểm trung bình ở đại học và điểm trung bình ở trung học theo dữ liệu trong DATA 2-2,
được mô tả trong Phụ lục D. Hãy sử dụng chương trình riêng của bạn với DATA 2-2 để
xác minh lại các kết quả được trình bày ở đây.

} Bảng 2.8 Số liệu Kết quả từ Máy tính được giải thích từng phần minh họa cho các trò thống
kê tóm tắt khác nhau.
Các chú giải được qui đònh ở dạng riêng khác với dạng được sử dụng cho các kết quả
máy tính.
x = colgpa = Grade point average in College
y = hsgpa = Grade point average in High School
Correlation between x and y = 0.406662
Summary Statistics, using the observations 1 – 427

Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 2: Ôn lại xác suất và thống kê

Ramu Ramanathan 28 Thục Đoan/Hào Thi
Variable MEAN MEDIAN MIN MAX
x 2.7855 2.79 0.85 3.97

y 3.55785 3.59 2.29 4.5

Variable S.D. C.V. SKEW EXCSKURT
x 0.54082 0.194155 -0.203647 -0.0517458
y 0.419577 0.11793 -0.401241 -0.220107

Min và Max là những giá trò nhỏ nhất và lớn nhất trong mẫu. Median là giá trò của
x hoặc y tính theo mỗi bên của giá trò này sẽ có 50% các quan sát. C.V. là hệ số biến
thiên (MEAN/S.D.) đã được thảo luận trong Phần 2.2. SKEW là một đại lượng đo lường
sự phân phối của biến sai lệch bao xa so với điểm đối xứng (trong bài này gọi là độ lệch
skewness). Một giá trò bằng không cho biết điểm đối xứng xung quanh giá trò không.
Một giá trò dương cho biết độ lệch về bên phải với một nhánh dài theo hướng này. Một
giá trò âm cho biết độ lệch đối xứng skewness sang bên trái với một nhánh dài theo
hướng này. EXCKURT là độ lệch kurtosis, nghóa là, độ kurtosis –3. Kurtosis là một đại
lượng đo lường độ rộng hình chóp của một phân phối. Phân phối chuẩn có kurtosis là 3.
Một phân phối dàn trải rộng sẽ có một giá trò kurtosis âm, và một phân phối hẹp sẽ có
một giá trò kurtosis dương. Độ lệch skewness và kurtosis không được thảo luận trong bài
vì chúng không được sử dụng nhiều trong kinh tế lượng. Nếu muốn biết thêm chi tiết về
các đại lượng này, hãy xem sách của Ramanathan (1993, Phần 3.5).
Một phiên bản giải thích kết quả được trình bày ở Bảng 2.8. Bảng cũng cung cấp
thêm các đại lượng thống kê tóm tắt chưa được thảo luận ở phần trên.

Phương Pháp Bình Phương Tối Thiểu (hay Bình Phương Tối Thiểu Thông Thường)
Trong kinh tế lượng, phương pháp được sử dụng phổ biến nhất để ước lượng các thông số
là phương pháp bình phương tối thiểu (cũng còn được biết đến dưới tên
bình phương tối
thiểu thông thường
hay OLS). Mặc dù nó được sử dụng chủ yếu để ước lượng các thông
số của một mô hình hồi qui dạng PRICE =
α

+
β
SQFT + u đã gặp phải trong Chương 1,
phương pháp này còn rất hữu ích trong trường hợp ước lượng giá trò trung bình của một
biến đơn ngẫu nhiên
X.
Từng quan sát
x
i
có thể được xem như một giá trò ước lượng của mẫu trung bình
µ

E(x
i
) =
µ
. Sai số trong giá trò ước lượng này là e
i
= x
i

µ
(tức là, x
i
=
µ
+ e
i
). Xem xét
tổng bình phương của sai số này trong tổng thể mẫu. Tức là, đặt ESS (

µ
) = ∑
2
i
e = ∑ (x
i

µ
)
2
. Phương pháp bình phương tối thiểu chọn giá trò ước lượng
µ
mà tổng bình phương sai
số mẫu là nhỏ nhất. Việc bình phương các sai số giải quyết được hai vấn đề. Đầu tiên, nó
loại bỏ dấu của sai số. Vì vậy, những sai số có giá trò dương và âm được xem xét như
nhau. Thứ hai, việc bình phương sẽ loại bỏ những sai số lớn bởi vì những sai số như thế
bò phóng đại lên nhiều khi lấy bình phương.

Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 2: Ôn lại xác suất và thống kê

Ramu Ramanathan 29 Thục Đoan/Hào Thi

Để có được

µ
ˆ
, ước lượng
µ
bằng cách tối thiểu ESS, viết ESS như sau:

ESS (
µ
ˆ
) = ∑ (x
i

µ
ˆ
)
2
= ∑ (x
i

x
+
x

µ
ˆ
)
2

=
∑ (x

i

x
)
2
+ ∑ (
x

µ
ˆ
)
2
+ 2∑ (
x

µ
ˆ
)(x
i

x
)
=
∑ (x
i

x
)
2
+ ∑ (

x

µ
ˆ
)
2


Bởi vì
x

µ
ˆ
trong số hạng thứ ba là một hằng số, nên nó có thể được loại ra (xem Phụ
Lục 2.A.1) và, theo Tính Chất 2.A.4, số hạng thứ ba bằng không. Do trong số hạng đầu
không có
µ
ˆ
, nên chúng ta thấy rằng ESS được tối thiểu đối với việc lựa chọn
µ
ˆ
nếu và
chỉ nếu chúng ta cho
µ
ˆ
=
x
, điều này nó có thể làm cho số hạng thứ hai bằng không. Do
đó, giá trò ước lượng bình phương tối thiểu của
µ

là giá trò trung bình mẫu
x
.
Trong phần phụ lục của chương, chúng ta sẽ thảo luận một thủ tục khác, hiện đại
hơn: giá trò ước lượng thích hợp cực đại (MLE). Những người đọc có quan tâm nên đọc
phần này.
(Để thấy được việc sử dụng những phương pháp diễn tả trong phần này trong ước
lượng các hồi qui như thế nào, xem tiếp Phần 3.1 và 3.2.)

} 2.6 Các Tính Chất Của Ước Lượng

Trong phần trước chúng ta đã thảo luận hai thủ tục ước lượng mà nó chọn trung bình mẫu
là ước lượng của
µ
. Trong ví dụ chiều cao của người trong Phần 2.5, một ước lượng thay
thế đó là lấy các chiều cao của những người cao nhất và những người thấp nhất và lấy
trung bình. Ước lượng nào tốt hơn? Để có thể trả lời được những câu hỏi loại như thế
này, chúng ta cần một vài tiêu chí trong việc chọn lựa giữa những ước lượng khác nhau.
Một vài tiêu chuẩn đã được thiết lập để đánh giá “sự thích hợp” của một ước lượng,
nhưng trong những phần sau chúng ta chỉ thảo luận các khái niệm được sử dụng thường
xuyên nhất trong kinh tế lượng. Một vài khái niệm trong đó áp dụng được cho những cỡ
mẫu nhỏ và những khái niệm khác chỉ thích hợp đối với những cỡ mẫu lớn.

Những Tính Chất Của Ước Lượng Cỡ Mẫu Nhỏ
Ký hiệu chuẩn cho thông số chưa biết là
θ
và ký hiệu một giá trò ước lượng là
θ
ˆ
. Nên

nhấn mạnh rằng
θ
ˆ
là một hàm số của những quan sát x
1
, x
2
, … , x
n
và nó không phụ thuộc
vào bất kỳ thông số chưa biết nào. Do đó một giá trò ước lượng như vậy là một trò thống
kê mẫu. Tuy nhiên, bởi vì
x là những biến ngẫu nhiên, nên
θ
ˆ
cũng ngẫu nhiên.

K
HÔNG THIÊN LỆCH Bởi vì
θ
ˆ
là một biến ngẫu nhiên, nên nó có một phân phối xác
suất với giá trò trung bình nào đó, gọi là
E(
θ
ˆ
). Nếu giá trò trung bình này tương đương
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004


Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 2: Ôn lại xác suất và thống kê

Ramu Ramanathan 30 Thục Đoan/Hào Thi
với thông số chưa biết
θ
, chúng ta nói rằng giá trò ước lượng là không thiên lệch. Do
vậy, chúng ta có đònh nghóa sau.

ĐỊNH NGHĨA 2.7 (Không Thiên Lệch)
Một ước lượng
θ
ˆ
được gọi là giá trò ước lượng không thiên lệch của
θ
nếu E(
θ
ˆ
) =
θ
.
Nếu sự cân bằng này không được duy trì, thì ước lượng được gọi là bò thiên lệch và độ
thiên lệch là
E(
θ
ˆ
) -

θ
.
Mặc dù với một cuộc thử nghiệm cho trước
θ
ˆ
có thể không bằng
θ
, nếu chúng ta
lặp lại một lượng lớn số lần thử và tính toán
θ
ˆ
từng lần một, thì trò trung bình của những
giá trò này sẽ là
θ
nếu giá trò ước lượng là không thiên lệch. Như đã mô tả trong Phần
2.4, nếu chúng ta giữ cố đònh cỡ mẫu ở
n, thực hiện nhiều lần thí nghiệm này, tính toán
θ
ˆ
cho từng lần, và hình thành một phân phối tần suất, thì chúng ta thu được phân phối
mẫu của
θ
ˆ
. Tính không thiên lệch đòi hỏi trò trung bình của phân phối này là giá trò
θ

thực.

H
IỆU QUẢ Trong khi tính thiên lệch rõ ràng là một đặc tính mong muốn của bất kỳ ước

lượng nào, chúng ta cũng cần thêm tiêu chuẩn bởi vì có thể xây dựng một số lïng
không giới hạn những ước lượng không thiên lệch. Trong ví dụ đo lường chiều cao,
chúng ta biết rằng giá trò trung bình mẫu
x
không thiên lệch bởi vì E(
x
) =
µ
. Nhưng giá
trò ước lượng khác, vừa được đưa ra trước đây, tính độ cao trung bình của những người
cao nhất (gọi là
x
max
) và của những người thấp nhất (gọi là x
min
) cũng không thiên lệch.
Đặt
θ
ˆ
=
2
1
(x
max
+ x
min
). Tiếp theo E(
θ
ˆ
) =

2
1
[E(x
max
) + E(x
min
)] =
µ
, và do vậy
θ
ˆ
cũng
không thiên lệch. Thật dễ dàng chứng minh rằng bất kỳ giá trò trung bình trọng số nào
của
x là một ước lượng không thiên lệch của
µ
, miễn là các trọng số không ngẫu nhiên
và có tổng bằng 1. Do đó chúng ta cần thêm tiêu chí để phân biệt giữa hai ước lượng
không thiên lệch.
Chúng ta đã biết rằng phương sai của một biến ngẫu nhiên là một đại lượng đo
lường sự phân tán của nó xung quanh giá trò trung bình. Về mặt trung bình, một phương
sai nhỏ hơn có nghóa là các giá trò của biến ngẫu nhiên sẽ gần với giá trò trung bình hơn
những giá trò của biến ngẫu nhiên khác với cùng giá trò trung bình nhưng có phương sai
cao hơn. Điều này gợi ý rằng chúng ta có thể sử dụng phương sai của hai ước lượng
không thiên lệch như là giá trò trung bình của việc chọn lựa giữa hai giá trò. Xét về trung
bình, giá trò ước lượng với phương sai nhỏ hơn rõ ràng được mong muốn hơn vì nó gần
với giá trò trung bình thực
θ
. Đó chính là khái niệm hiệu quả.


ĐỊNH NGHĨA 2.8 (Hiệu Quả)
a. Đặt
1
ˆ
θ

2
ˆ
θ
là hai ước lượng không thiên lệch của thông số
θ
. Nếu Var (
1
ˆ
θ
) < Var
(
2
ˆ
θ
), thì chúng ta nói rằng
1
ˆ
θ
hiệu quả hơn
2
ˆ
θ
.
Chương trình Giảng dạy Kinh tế Fulbright

Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 2: Ôn lại xác suất và thống kê

Ramu Ramanathan 31 Thục Đoan/Hào Thi
b. Tỉ số [Var (
1
ˆ
θ
)]/[Var (
2
ˆ
θ
)] được gọi là hiệu quả tương đối.
c.
Giữa tất cả những giá trò ước lượng không thiên lệch của
θ
, giá trò với phương sai nhỏ
nhất được gọi là
ước lượng không thiên lệch có phương sai tối thiểu.

Chúng ta hãy ứng dụng đònh nghóa này vào ví dụ chiều cao. Đặt
1
ˆ
θ
là trung bình

mẫu và
2
ˆ
θ
là trung bình độ cao của những người cao nhất và những người thấp nhất. Từ
Tính chất 2.10a, Var (
1
ˆ
θ
) =
σ
2
/n và Var (
2
ˆ
θ
) =
σ
2
/2. Nếu cỡ mẫu lớn hơn hai,
1
ˆ
θ

phương sai nhỏ nhất và dó đó rõ ràng sẽ được ưa thích hơn. Do vậy,
1
ˆ
θ
hiệu quả hơn
2

ˆ
θ
.

S
AI SỐ BÌNH PHƯƠNG TRUNG BÌNH Xem xét hai ước lượng: Một không thiên lệch và
giá trò kia mặc dù thiên lệch nhưng lại có phương sai nhỏ hơn nhiều, hàm ý nói rằng, về
mặt trung bình, nó có thể gần với giá trò trung bình thực hơn là giá trò ước lượng không
thiên lệch. Trong trường hợp này, chúng ta có thể sẵn sàng cho phép một vài sai lệch để
có thể có được lợi về phương diện phương sai. Một phương pháp cho phép việc đánh đổi
này giữa sự không thiên lệch và phương sai là
sai số bình phương trung bình.

ĐỊNH NGHĨA 2.9 (Sai Số Bình Phương Trung Bình)
a. Sai số bình phương trung bình của một ước lượng
θ
ˆ
được đònh nghóa là MSE (
θ
) =
E[(
θ
ˆ
-
θ
)
2
], đó là giá trò kỳ vọng của bình phương độ lệch của
θ
ˆ

từ
θ
.
b.
Nếu
1
ˆ
θ

2
ˆ
θ
là hai ước lượng thay thế của
θ
và MSE (
1
ˆ
θ
) < MSE (
2
ˆ
θ
), thì
1
ˆ
θ
được
gọi là
hiệu quả bình phương trung bình so với
2

ˆ
θ
. Nếu cả hai giá trò đều không thiên
lệch, thì
1
ˆ
θ
sẽ hiệu quả hơn, như trong Đònh Nghóa 2.8a.
c.
Giữa tất cả các ước lượng có thể có của
θ
, giá trò với sai số bình phương trung bình
nhỏ nhất được gọi là
giá trò ước lượng sai số bình phương trung bình tối thiểu.

Dễ dàng chỉ ra được sai số bình phương trung bình tương đương với tổng phương sai
và bình phương của những độ thiên lệch. Do vậy, nếu
b(
θ
) = E(
θ
ˆ
) -
θ
là độ thiên lệch
trong ước lượng
θ
ˆ
, thì MSE = Var(
θ

ˆ
) + [b(
θ
)]
2
. Lưu ý rằng b(
θ
) độc lập với các giá trò x
và do đó nó cố đònh và không ngẫu nhiên.

MSE =
E[(
θ
ˆ
-
θ
)
2
] = E[
θ
ˆ
- E(
θ
ˆ
) + E(
θ
ˆ
) –
θ
]

2

=
E[
θ
ˆ
- E(
θ
ˆ
) + b(
θ
)]
2
= E[
θ
ˆ
- E(
θ
ˆ
)]
2
+ [b(
θ
)]
2
+ 2b(
θ
) E[
θ
ˆ

- E(
θ
ˆ
)]

Số hạng đầu tiên là phương sai của
θ
ˆ
và số hạng thứ ba bằng không bởi vì E(
θ
ˆ
)
không ngẫu nhiên và do đó
E[
θ
ˆ
- E(
θ
ˆ
)] = E(
θ
ˆ
) - E(
θ
ˆ
) = 0. Kết quả mong muốn xuất
hiện ngay theo sau.
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004


Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 2: Ôn lại xác suất và thống kê

Ramu Ramanathan 32 Thục Đoan/Hào Thi
Khái niệm sai số bình phương trung bình được sử dụng thường xuyên hơn trong
việc lựa chọn giữa những dự báo khác nhau của một biến ngẫu nhiên (xem Chương 11).
Các dự báo thường bò thiên lệch – tức là, chúng ước lượng quá mức hoặc là ước lượng
dưới mức một cách có hệ thống biến quan tâm – nhưng một vài giá trò dự báo có thể có
phương sai nhỏ hơn. Do đó sai số bình phương trung bình là một đại lượng hữu ích vì nó
có xét đến cả sự thiên lệch và phương sai của giá trò dự báo đó.

Những Tính Chất Của Ước Lượng Cỡ Mẫu Lớn
Tất cả những tính chất thảo luận trong phần trước thích hợp đối với những cỡ mẫu hữu
hạn. Đôi khi một ước lượng có thể không mang một hay nhiều hơn những tính chất mong
muốn trong một cỡ mẫu nhỏ, nhưng khi cỡ mẫu trở nên lớn, nhiều tính chất mong muốn
có thể được duy trì. Do đó, nên quan tâm nghiên cứu đến những tính chất của các cỡ mẫu
lớn này, hoặc
tiệm cận. Trong những thảo luận sau đây, chúng ta cho cỡ mẫu n tăng lên
không giới hạn. Bởi vì một ước lượng sẽ phụ thuộc vào
n, nên chúng ta ký hiệu nó là
n
θ
ˆ
.

N
HẤT QUÁN Tính chất cỡ mẫu lớn thường được sử dụng nhất là tính nhất

quán.Theo thuật ngữ trực giác, nhất quán có nghóa là khi n tăng lên, giá trò ước lượng
n
θ
ˆ

sẽ tiến đến giá trò
θ
thực. Hay nói cách khác, chúng ta biểu diễn một mẫu ngẫu nhiên
của bất kỳ cỡ mẫu nào từ tổng thể lớn và tính
θ
ˆ
. Tiếp theo chúng ta vẽ thêm một quan
sát và tính toán lại
θ
ˆ
với quan sát thêm này. Chúng ta lặp lại quá trình này nhiều lần, và
nhận được một chuỗi các ước lượng cho
θ
. Nếu chuỗi này hội tụ về
θ
khi n tăng lên vô
tận, thì
θ
ˆ
là một giá trò ước lượng nhất quán của
θ
. Đònh nghóa chính thức của sự nhất
quán được cho trong Đònh Nghóa 2.10.

ĐỊNH NGHĨA 2.10 (Sự Nhất Quán)

Một ước lượng
n
θ
ˆ
được gọi là một giá trò ước lượng nhất quán của
θ
nếu
∞→n
lim
P(
θ

ε

n
θ
ˆ

θ
+
ε
) = 1, cho tất cả các
ε
> 0 . Tính chất này được biểu diễn như plim(
n
θ
ˆ
) =
θ
.

Chúng ta hãy nghiên cứu đònh nghóa này kỹ lưỡng hơn. Xem xét khoảng cố đònh
(tức là, không ngẫu nhiên) (
θ

ε
,
θ
+
ε
), với
ε
là một số dương bất kỳ. Bởi vì
n
θ
ˆ
là một
ước lượng phụ thuộc vào một mẫu các quan sát, nên nó là một biến ngẫu nhiên. Do đó
chúng ta có thể tính xác suất mà
n
θ
ˆ
nằm trong khoảng xác đònh đó. Nếu xác suất này
tăng lên 1 khi
n tăng lên vô tận đối với bất kỳ giá trò
ε
> 0 nào, thì chúng ta nói rằng
n
θ
ˆ


là một
ước lượng nhất quán của
θ
.
Điểm này được minh họa trong Hình 2.9, nó biểu diễn phân phối mẫu của
n
θ
ˆ
=
x

cho nhiều giá trò khác nhau của cỡ mẫu
n. Chúng ta lưu ý rằng phân phối này trở nên
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 2: Ôn lại xác suất và thống kê

Ramu Ramanathan 33 Thục Đoan/Hào Thi
ngày càng “bò nén chặt” khi cỡ mẫu tăng lên. Nói một cách khác, phương sai của
n
θ
ˆ
tiến
đến 0 khi cỡ mẫu tăng lên. Trong giới hạn, phân phối của
n

θ
ˆ
sẽ trở thành điểm đơn
θ
.

} Hình 2.9 Phân Phối Mẫu Của
x
Khi Cỡ Mẫu Tăng Lên,
n
3
> n
2
> n
1




} Hình 2.10 Phân Phối Mẫu Của Một Ước Lượng Thiên Lệch,
Nhưng Nhất Quán, n
3
> n
2
> n
1





Cần nhấn mạnh rằng, các khái niệm không thiên lệch và nhất quán tương đối khác
nhau về quan điểm. Không thiên lệch có thể được duy trì cho bất kỳ cỡ mẫu nào, nhưng
sự nhất quán thì hoàn toàn chỉ áp dụng được đối với khái niệm cỡ mẫu lớn. Hình 2.10
minh họa giá trò ước lượng thiên lệch nhưng nhất quán.
Sự thiên lệch có bao hàm luôn sự nhất quán hay không? Hoàn toàn không, như sẽ
chỉ ra trong ví dụ phản bác ngay sau đây. Quan sát đầu tiên,
x
1
, là một giá trò ước lượng
không thiên lệch của trò trung bình
θ
bởi vì E(x
1
) =
θ
. Nhưng khi cho n →∞ thì sẽ không
làm cho
x
1
tiến đến
θ
với bất kỳ giá trò trung bình nào.
f(
x
)
x
θ

n
3

n
2
n
1
f(
θ
ˆ
)
θ
ˆ

n
3
n
2
n
1
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 2: Ôn lại xác suất và thống kê

Ramu Ramanathan 34 Thục Đoan/Hào Thi
(Tiếp tục xem trong Phần 3.3 để thấy được những khái niệm này được ứng dụng
trong kinh tế lượng như thế nào)


K
HÔNG THIÊN LỆCH TIỆM CẬN* Sự thiên lệch trong một ước lượng sẽ khác nhau giữa giá
trò kỳ vọng của nó và thông số thực
θ
. Sự thiên lệch này có thể phụ thuộc vào cỡ mẫu, n.
Nếu sự thiên lệch đi đến không khi
n tăng lên vô cực, chúng ta nói rằng giá trò ước lượng

không thiên lệch tiệm cận.

ĐỊNH NGHĨA 2.11 (Không Thiên Lệch Tiệm Cận)*
Một ước lượng
n
θ
ˆ
được gọi là không thiên lệch tiệm cận nếu như )
ˆ
(
n
n
E
θ
∞→
lim =
θ
, hay nói
cách khác, nếu
)(
θ
n

n
b
∞→
lim = 0, với b
n
(
θ
) = E(
n
θ
ˆ
) -
θ
.

H
IỆU QUẢ TIỆM CẬN* Không có một ước lượng đơn nào có thể hiệu quả nhất (tức là,
có phương sai nhỏ nhất) cho tất cả các giá trò
θ
. Một vài giá trò khá tốt cho một số giá trò
θ
nào đó và những giá trò khác thì hiệu quả hơn trong những khoảng giá trò khác của
θ
.
Ví dụ, đặt
θ
ˆ
= 1,25, không cần biết giá trò của các quan sát là bao nhiêu. Nếu giá trò
θ
thực đúng bằng hay gần bằng 1,25, thì đây là ước lượng tương đối tốt; nhưng khi giá trò

thực nằm ngoài 1,25, thì ước lượng này kém. Tuy nhiên, khi gặp phải những giá trò ước
lượng nhất quán, thì khoảng giá trò của
θ
mà có một giá trò ước lượng hiệu quả hơn một
giá trò ước lượng khác thu hẹp lại khi cỡ mẫu tăng lên. Trong giới hạn khi
n → ∞, phân
phối của tất cả các giá trò ước lượng nhất quán trở về giá trò thực
θ
(lưu ý là phương sai
bằng không). Do đó ưu tiên thuộc về những giá trò ước lượng mà tiến đến giá trò thực
θ
theo cách nhanh nhất có thể (tức là, những giá trò mà phương sai của chúng hội tụ về
không nhanh nhất). Đó chính là khái niệm
hiệu quả tiệm cận được đònh nghóa một cách
chính thức trong Đònh Nghóa 2.12. Theo thuật ngữ trực giác, ước lượng nhất quán, áp
dụng cho cỡ mẫu lớn, sẽ hiệu quả tiệm cận khi phương sai của nó nhỏ hơn phương sai
của bất kỳ ước lượng nhất quán nào khác.

ĐỊNH NGHĨA 2.12 (Hiệu Quả Tiệm Cận)*
Một ước lượng nhất quán
1
ˆ
θ
được gọi là hiệu quả tiệm cận nếu đối với tất cả các ước
lượng nhất quán khác
2
ˆ
θ









∞→
)
ˆ
)
ˆ
(
lim
1
2
Var(
Var
θ
θ
n
< 1 cho tất cả các giá trò
θ


} 2.7 Phân Phối Chi-Bình Phương, Phân Phối-t và Phân Phối-F
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc


Nhập môn kinh tế lượng với các ứng dụng
Chương 2: Ôn lại xác suất và thống kê

Ramu Ramanathan 35 Thục Đoan/Hào Thi
Trong việc kiểm đònh các giả thuyết của những mô hình kinh tế lượng, có bốn phân phối
được sử dụng chủ yếu. Đó là
phân phối chuẩn, phân phối chi-bình phương, phân phối-t
của Student, và phân phối-F của Fisher.
Chúng ta đã xem xét phân phối chuẩn và những
tính chất của nó. Trong phần này, chúng ta sẽ thảo luận ba phân phối còn lại.

Phân Phối Chi-Bình Phương
Phân phối của tổng bình phương của n biến ngẫu nhiên chuẩn chuẩn hóa độc lập được
gọi là
phân phối chi-bình phương (χ
2
) với n bậc tự do và được viết là
2
n
χ
. Chính thức
hơn, xem xét
n biến ngẫu nhiên Z
1
, Z
2
,…, Z
n
, tất cả đều tuân theo phân phối độc lập và

giống nhau (idd) như phân phối chuẩn
N(0,1). Đònh nghóa một biến U mới bằng tổng
bình phương của tất cả các giá trò
Z. Do vậy,

U
=

=+++
222
2
2
1

in
ZZZZ
Phân phối của biến ngẫu nhiên
U là
2
n
χ
. Bởi vì U không âm, nên phân phối chi-
bình phương chỉ được xác đònh trong khoảng 0 ≤
u ≤ ∞. Hàm mật độ của
2
n
χ
chỉ phụ
thuộc vào một thông số, gọi là
bậc tự do (thường viết tắt là d.f.). Trò trung bình của

2
n
χ

có thể được xem là
n. Hình 2.11 biểu diễn đồ thò các mật độ chi-bình phương cho một số
các giá trò chọn lọc của bậc tự do. Chúng ta lưu ý rằng khi
n = 1, hàm mật độ giảm hoàn
toàn. Đối với những bậc tự do cao hơn, nó sẽ tăng nhanh đến điểm cực đại nhưng hẹp
dần sang bên phải với một “đuôi” dài. Một số tính chất của
χ
2
được tóm tắt trong Tính
Chất 2.12.



} Hình 2.11 Phân Phối Chi-Bình Phương Với Các Bậc Tự Do d.f. (n) 1, 5, và 10




f(
χ
2
)
χ
2

n

=
1
n
=
5
n
=
10
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 2: Ôn lại xác suất và thống kê

Ramu Ramanathan 36 Thục Đoan/Hào Thi
Tính chất 2.12
a. E(
2
n
χ
) = n, tức là, giá trò kỳ vọng của một biến ngẫu nhiên chi-bình phương chính là
bậc tự do d.f của nó
b.
Phân phối chi-bình phương có tính chất cộng thêm; gọi là, nếu U ∼
2
m
χ

và V ∼
2
n
χ
với
U và V độc lập, thì tổng của chúng U + V ∼
2
nm+
χ
. Do đó tổng của nhiều biến ngẫu
nhiên chi-bình phương độc lập thì cũng là chi-bình phương với bậc tự do d.f. tương
đương với tổng của d.f.
c.
Nếu x
1
, x
2
, …, x
n
là các biến độc lập và ngẫu nhiên tuân theo phân phối chuẩn với
trung bình
µ
i
và phương sai
2
i
σ
, thì tổng bình phương U = ∑(x
i
-

µ
i
)
2
/
2
i
σ
có phân phối
chi-bình phương với
n bậc tự do d.f. Kết quả này có từ dữ kiện cho rằng Z
i
= (x
i
-
µ
i
)/
σ
i
có phân phối chuẩn chuẩn hóa và Z là các biến độc lập, do đó làm cho tổng
bình phương của chúng bằng
2
n
χ
. Như trong một trường hợp đặc biệt, nếu
µ
i
=
µ


2
i
σ
=
σ
2
– tức là, nếu các giá trò Z là iid – thì ∑(x
i
-
µ
i
)
2
/
σ
2

2
n
χ
.

Bảng in trong bìa trước của quyển sách và Bảng A.3 của Phụ Lục A biểu diễn các
giá trò của
χ
2
mà diện tích phía bên phải tương ứng với những xác suất được xác đònh. Do
đó, ví dụ, đối với bậc tự do d.f là 15 diện tích phía bên phải của 24,9958 là 0,05. Phần
2.8 về kiểm đònh các giả thuyết minh họa việc sử dụng phân phối chi-bình phương này.


Phân Phối-t Student
Phân phối của tỉ lệ giữa một biến chuẩn với căn bậc hai của
2
n
χ
độc lập được gọi là
phân phối t Student với n bậc tự do (và được viết là t
n
). Giả sử Z ∼ N(0,1) và U ∼
2
n
χ
,
với
Z và U độc lập. Đònh nghóa biến ngẫu nhiên t = Z/ nU / =(Z n )/ U . Phân phối
của
t là phân phối-t với n bậc tự do.
Bảng nằm ở bìa sau của cuốn sách và Bảng A.2 biểu diễn các giá trò của
t mà phần
diện tích trong các nhánh tương ứng với những xác suất xác đònh. Một vài tính chất của
phân phối-
t được đưa ra trong Tính Chất 2.13.

Tính Chất 2.13 Phân phối-t với n bậc tự do d.f. có những tính chất sau

a.
Phân phối-t là đối xứng qua gốc tọa độ và có hình dạng tương tự như trong phân phối
chuẩn
b.

Đối với n
i
lớn, phân phối-t tuân theo một cách gần đúng với phân phối N(0,1). Sự gần
đúng là tương đối tốt ngay cả với
n = 30.

Như trong một ví dụ, với bậc tự do d.f. là 15, diện tích ở nhánh bên phải tại điểm
1,753 là 0,05, tức là
P(t > 1,753) = 0,05. Bởi vì tính chất đối xứng này, P(t < 1,753 hoặc t

×