Vấn đề 2. Thống kê cơ bản
Phân phối xác suất
Dữ liệu liên tục
Phân phối chuẩn (X, Z)
Phân phối hàm mũ
-Chú ý: Phân phối của mẫu
Z, t, F và Phân phối Khi bình phương (Tests)
Dữ liệu rời rạc*
Phân phối nhị thức
Phân phối Poisson
Phân phối Hình họcvà Nhị thức
Công cụ thống kê
Thông tin đầy đủ về Phân phối của một bộ dữ
liệu có thể thành lập và tham khảo hình dạng
của Phân phối. Thường người ta sử dụng
Phân phối chuẩn là phân phối phổ biến,
thường gặp nhất.
Phân phối chuẩn, có thể giúp ta trả lời nhiều
câu hỏi.
This image cannot currently be displayed.
Sử dụng hai tham số (trung bình & độ
lệch chuẩn)
Chú ý:
Giả sử ta biết giá trị của 2 tham số trung bình và
độ lệch chuẩn. Như thế ta sẽ biết về tổng thể
(Không phải của mẫu).
Phân phối chuẩn
Hình 1. Đường cong chuẩn
f(x) = chiều cao đường cong
x = biến
trung bình của x = a
m
Một phân phối chuẩn có thể được mô tả một
cách đầy đủ bởi hai giá trị: trung bình m và độ
lệch chuẩn sigma (hoặc phương sai của nó là
sigma
2
.)
Biến phân phối chuẩn có nhiều đặc điểm làm
cơ sở cho các tính toán và suy diễn
.
A. Đặc điểm
1. đối xứng quanh đường thẳng có x = m
2. diện tích nằm bên phải của trung bình bằng
khoảng 1/2 diện tích chung, diện tích nằm bên trái
của trung bình bằng khoảng 1/2 diện tích chung
(nhìn slide tiếp)
3. giá trị khác µ (mean) & sigma
2
(variance) xác
định đường cong khác; µ trung tâm của đường
cung & sigma
2
xác định độ phân tán
f(x)
x
đối xưng qua đường thẳng đứng với x = m
a
f(x)
x
diện tích bên phải là bằng 1/2 của tổng diện tích;
diện tích bên phải là bằng 1/2 của tổng diện tích
µ
1/2 của tổng diện tích
1/2 của tổng diện tích
4. khoảng 68% trường hợp sẽ nằm trong vùng
phân bố chuẩn có khoảng trung bình và một độ
lệch chuẩn
5. khoảng 95% trường hợp sẽ nằm trong vùng
phân bố chuẩn có khoảng trung bình và hai độ lệch
chuẩn
6. khoảng 99.7% trường hợp sẽ nằm trong vùng
phân bố chuẩn có khoảng trung bình và ba độ lệch
chuẩn
CHÚ Ý: độ lệch chuẩn ký hiệu bởi “s” hoặc s
68% của phân phối’ nằm trong vùng trung bình cộng với 1 độ
lệch chuẩn
68%
µ µ - s µ + s
f(x)
x
Diện tích nằm giữa đường cong và trục hoành
95% của phân phối’ nằm trong vùng trung bình cộng với 2 độ
lệch chuẩn
68%
95%
µ µ - s µ + sµ - 2s µ + 2s
f(x)
x
Diện tích nằm giữa đường cong và trục hoành
99.7% của phân phối’ nằm trong vùng trung bình cộng với 3
độ lệch chuẩn
68%
95%
99.7%
µ µ - s µ + sµ - 2s µ + 2sµ - 3s µ + 3s
f(x)
x
Diện tích nằm giữa đường cong và trục hoành
Example
(see note page)
Cho X là đại lượng ngẫu nhiên biểu thị kết quả
đạt được qua kỳ thi quốc gia MBA. Giả sử X
tuân theo quy luật phân bố chuẩn với trung bình
là 600 và độ lệch chuẩn (sigma) là 65. Vậy xác
xuất để X nằm trong khoảng 2 sigma = 2(65) =
130 points của 600 is 95%. Nói một cách khác,
95% của kết quả sẽ nằm trong khoảng 470 và
730. Tương tự,
99.7% của kết quả sẽ nằm trong khoảng 405 và
795.
95%
99.7%
600600
-2(65)
600
+ 2(65)
600
-3(65)
600
+ 3(65)
f(x)
x
730470 795405
Diện tích nằm giữa đường cong và trục hoành
95%
99.7%
600600
-2(65)
600
+ 2(65)
600
-3(65)
600
+ 3(65)
f(x)
x
730470 795405
% nhỏ hơn 600
Diện tích nằm giữa đường cong và trục hoành
95%
99.7%
600600
-2(65)
600
+ 2(65)
600
-3(65)
600
+ 3(65)
f(x)
x
730470 795405
% nhoí hån 730
Diện tích nằm giữa đường cong và trục hoành
Think for a moment!!
Heaven or on the Earth?
How about skewness và kurtosis?
The analysis using the Phân phối chuẩn is based on the
assumptions of
(i) No skewness (skewness = 0)
(ii) No kurtosis (kurtosis = 3, excess kurtosis = 0)
Note: But, using the Phân phối chuẩn is still valid in
the sampling Phân phối.
From Lectures 3 và onward
“Regardless of the Phân phối in the population, the sampling
Phân phối of the sample thống kê is NORMAL” (Central
Limit Theorem)
Phân phối chuẩn tắc
1. biến ngẫu nhiên có phân phối chuẩn tắc là một
biến chuẩn với:
trung bình = 0 và
độ lệch chuẩn (sigma) = 1.
xem Hình trên slide tiếp.
biến này thường được ký hiệu là Z. Thường một
biến chuẩn được ký hiệu là X. Việc biến đổi thành
Z có thể trả lời được nhiều câu hỏi trong kinh tế và
quản trị.
f(z)
z
0-1 +1-3 -2 +2 +3
Hình 2. Đường cong chuẩn tắc: trung bình = 0 và đ
ộ lệch chuẩn (sigma) = 1
Chú ý “Z” khác “X”.
f(z)
z
0-1 +1-3 -2 +2 +3
Hình 2. Đường cong chuẩn tắc: trung bình = 0 và đ
ộ lệch chuẩn (sigma) = 1
Phần trăm của tỷ số nằm ngoài khoảng -2 & +2?
Chú ý “Z” khác “X”.
diện tích nằm dưới đường cong chuẩn tắc giữa z =
0 & z = z
0
ở đây z
0
=> 0.
Also see the table in a few slides.
Example
See the next slide.
At the intersection of the row for 2.5 và the column
under 0.04, meaning Z = 2.54, you find a value of
0.4945.
This means that the area under the standard normal
curve between z = 0 & z = 2.54 is 0.4945 (49.45%
of total area under curve).
Table (in text)
z
.00 .01 .02 .03
.04
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
.4772
.4821
.4861
.4893
.4918
.4938
.4953
.4965
.4974
.4981
.4778 .4783 .4788 .4793
.4826 .4830 .4834 .4838
.4864 .4868 .4871 .4875
.4896 .4898 .4901 .4904
.4920 .4922 .4925 .4927
.4940 .4941 .4943 .
4945
.4955 .4956 .4957 .4959
.4966 .4967 .4968 .4969
.4975 .4976 .4977 .4977
.4982 .4982 .4983 .4984
for row value of 2.5 & column under 0.04, meaning Z = 2.54,
value = 0.4945
Table (in text)
z
.00 .01 .02 .03
.04
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
.4772
.4821
.4861
.4893
.4918
.4938
.4953
.4965
.4974
.4981
.4778 .4783 .4788 .4793
.4826 .4830 .4834 .4838
.4864 .4868 .4871 .4875
.4896 .4898 .4901 .4904
.4920 .4922 .4925 .4927
.4940 .4941 .4943 .
4945
.4955 .4956 .4957 .4959
.4966 .4967 .4968 .4969
.4975 .4976 .4977 .4977
.4982 .4982 .4983 .4984
giá trị hàng của 2.5 & và cột 0.04, có nghĩa là Z = 2.54,
giá trị = 0.4945
49.45 là diện tích nằm giữa
z=0 và z=2.54 và trục hoành