Tóm tắt XSTK - 1 - 2013
KHÁI NIỆM CƠ BẢN XÁC SUẤT
Công thức Siêu bội P(X=k) =
−
−−
−
−
−−
−
k n k
M N M
n
N
C .C
C
Công thức Nhị thức P(X=k) =
k
n
C
.p
k
(1 – p)
n–k
Công thức cộng
P(A+B) = P(A) + P(B) – P(A.B)
▪ P(A) = 1 − P(
A
)
▪ P(A
1
+A
2
+…+A
n
) = P(A
1
)+P(A
2
)+…+P(A
n
)
(A
i
) xung khắc từng đôi.
▪ P(A+B+C) = P(A) + P(B) + P(C)
– P(AB) – P(BC) – P(AC)
+ P(ABC)
Ghi nhớ
A B A.B
+ + =
A.B A+B+
=
Công thức nhân
P(A.B) = P(A).P(B/A) = P(B).P(A/B)
▪ P(A/B) =
P(A.B)
P(B)
=
P(A).P(B / A)
P(B)
▪ P(A/B) =
P(A)
P(B)
(B = A + … )
▪
P(A/B) P(B/A)
P(A) P(B)
=
▪ P(A
1
.A
2
) = P(A
1
).P(A
2
) (A
i
) đ.lập t.phần.
▪ P(A.B.C) = P(A).P(B/A).P(C/A.B)
Công thức Xác suất đầy đủ
(A
i
) đầy đủ và xung khắc từng đôi.
P(B) =
/
∑
∑∑
∑
n
i i
i =1
P(B A ).P(A )
P(B.C) =
/ /
∑
∑∑
∑
n
i i
i =1
P(B A .C).P(A C)
Công thức Bayes
(A
i
) đầy đủ và xung khắc từng đôi.
P(A
i
/B) =
i i
P(A ).P(B / A )
P(B)
ĐẠI LƯỢNG NGẪU NHIÊN HAI CHIỀU
▪ Bảng phân phối theo thành
ph
ần X (p
i
bằng tổng p
ij
theo
dòng) ⇒ E(X), Var(X), σ
X
X x
1
x
m
p p
1
p
m
▪ Bảng phân phối theo thành
ph
ần Y (q
j
bằng tổng p
ij
theo
cột) ⇒ E(Y), Var(Y), σ
Y
Y y
1
y
n
q q
1
q
n
Bảng phân phối đồng thời
Y
X
y
1
y
n
x
1
p
11
p
1n
Σ= p
1
x
m
p
m1
p
mn
Σ= p
m
Σ= q
1
Σ= q
n
p
ij
≥ 0, ΣΣp
ij
= 1
p
i
> 0, Σp
i
= 1 q
j
> 0, Σq
j
= 1
▪ Bảng phân phối theo X có
điều kiện Y=y
j
(cột j chia cho
tổng cột j)
⇒ E(X /y
j
), Var(X /y
j
)
X /y
j
x
1
x
m
p /y
j
p
1j
/q
j
p
mj
/q
j
▪ Bảng phân phối theo Y có
điều kiện X=x
i
(dòng i chia
cho tổng dòng i)
⇒ E(Y /x
i
), Var(Y /x
i
)
Y /x
i
y
1
y
n
q /x
i
q
i1
/p
i
q
in
/p
i
Hiệp phương sai: đo độ phụ thuộc giữa X, Y
Cov(X, Y) =
m n
i j ij
i 1 j 1
x y p
= =
= == =
= =
∑∑
∑∑∑∑
∑∑
– E(X).E(Y)
▪ X, Y độc lập ⇔ p
ij
= p
i
.q
j
∀(i, j)
⇒ Cov(X, Y) = 0
▪ Var(aX ± bY) = a
2
Var(X) + b
2
Var(Y)
± 2abCov(X, Y)
Hệ số tương quan: đo mức độ phụ thuộc
tuyến tính giữa X và Y.
XY
ρ
ρρ
ρ
=
X Y
Cov(X,Y)
.σ σ
σ σσ σ
σ σ
▪
XY
ρ
≤ 1,
XY
ρ
> 0 ⇒ X, Y đồng biến
▪
XY
ρ
= 1 ⇔ P(Y = aX+b) = 1 (hầu hết)
Tóm tắt XSTK - 2 - 2013
ĐẠI LƯỢNG NGẪU NHIÊN
p
i
> 0
p
1
+ p
2
+ + p
n
= 1
X x
1
x
2
x
n
p p
1
p
2
p
n
Mod(X) = x
o
⇔ P(X = x
o
) =
x
max
P(X = x)
⇔ f(x
o
) =
x
max
f(x)
E(X) =
∑
n
i i
i=1
x p
E(c) = c E(cX) = cE(X)
E(X + Y) = E(X) + E(Y)
E(X.Y) = E(X).E(Y) X, Y độc lập
Var(X) = E(X
2
) −
−−
− [E(X)]
2
σ(X)=
Var(X)
=
−
−−
−
∑ ∑
∑ ∑∑ ∑
∑ ∑
2
n n
2
i i i i
i=1 i=1
x p x p
Var(c) = 0 Var(cX) = c
2
Var(X)
Var(X ± Y) = Var(X) + Var(Y) X, Y độc lập
Phân phối Chuẩn X ~ N(µ, σ
σσ
σ
2
)
Hàm mật độ: f(x) =
2
x
/2
1
e
2
µ
σ
σ π
−
−−
−
−
−−
−
E(X) = µ Var(X) = σ
σσ
σ
2
Mod(X) = µ
Hàm Laplace: Φ(x)=
2
x
z /2
0
1
e dz
2
−
π
∫
▪ Φ(–x) = –Φ(x) =NORMSDIST(x)–0,5
▪ x ≥ 4 ⇒ Φ(x) ≈ 0,5
▪ Φ(a) > Φ(b) ⇔ a > b
▪ z
α
= a ⇔ α = 0,5 – Φ(a)
X Chuẩn ⇔
X
− µ
σ
~ N(0; 1)
▪ P(X < x) = 0,5 + Φ(
X
− µ
σ
)
▪ P(X > x) = 0,5 – Φ(
X
− µ
σ
)
▪ P(a < X < b) = Φ(
b
− µ
σ
) – Φ(
a
− µ
σ
)
▪ P(X – µ< a) = 2Φ(a / σ)
a
1
N(µ
1
, σ
1
2
) + a
2
N(µ
2
, σ
2
2
) =
N(a
1
µ
1
+ a
1
µ
1
, a
1
2
σ
1
2
+ a
2
2
σ
2
2
)
Phân phối Nhị thức X ~ B(n, p)
P(X=k) =
k k n-k
n
C .p q
=BINOMDIST(k; n; p; 0)
P(X ≤ k) =BINOMDIST(k; n; p; 1)
E(X) = np Var(X) = npq
Mod(X) ∈
∈∈
∈ [(n+1)p–1, (n+1)p]
▪ n đủ lớn, p không quá gần 0 hay 1:
B(n, p) ≈ N(np, npq)
▪ n đủ lớn, p gần 0:
B(n, p) ≈ P(np)
Tổng các phân phối Nhị thức độc lập:
B(n
1
, p) + B(n
2
, p) = B(n
1
+ n
2
, p)
Phân phối Poisson X ~ P(λ
λλ
λ)
P(X=k) =
−
k
e
k!
λ
λλ
λ
λ
λλ
λ
=POISSON(k; λ; 0)
P(X ≤ k) =POISSON(k; λ; 1)
E(X) = λ
λλ
λ Var(X) = λ
λλ
λ Mod(X) ∈
∈∈
∈ [λ
λλ
λ–1, λ
λλ
λ]
▪ λ ≥ 10: P(λ
λλ
λ) ≈ N(λ
λλ
λ; λ
λλ
λ)
Tổng các phân phối Poisson độc lập:
P(λ
1
) + P(λ
2
) = P(λ
1
+ λ
2
)
Phân phối Siêu bội X ~ H(N, M, n)
P
k
=
−
−
k n k
M N M
n
N
C .C
C
=HYPGEOMDIST(k; n; M; N)
E(X) = np Var(X) = npq
−
−
N n
N 1
Mod(X) =
+ +
+ ++ +
+ +
+
++
+
(n 1)(M 1)
N 2
▪ n đủ nhỏ so với N: H(N, M, n) ≈ B(n, M/N)
Phân phối Chi bình k bậc tự do
χ
χχ
χ
2
~
χ
χχ
χ
2
(k)
E(
χ
χχ
χ
2
(k)) = k Var(
χ
χχ
χ
2
(k)) = 2k
χ
2
(k)
α
=CHIINV(α; k)
Phân phối Student k bậc tự do T ~ T(k)
E(T) = 0 Var(T(k) ) =
k
k 2
−
−−
−
t(k)
α
=TINV(2*α; k)
▪ k ≥ 30:
χ
χχ
χ
2
(k) ≈ N(0; 1) T(k) ≈ N(0; 1)
Tóm tắt XSTK - 3 - 2013
THỐNG KÊ TOÁN
µ trung bình tổng thể. σ
2
phương sai tổng thể. p tỷ lệ tổng thể.
X
trung bình mẫu ngẫu nhiên. S
2
phương sai mẫu ngẫu nhiên. F tỷ lệ mẫu ngẫu nhiên.
x
trung bình mẫu. s
2
phương sai mẫu. f tỷ lệ mẫu. n kích thước mẫu. ε
εε
ε độ chính xác.
z
α
αα
α
phân vị mức α của phân phối Chuẩn chuẩn tắc. P(Z > z
α
αα
α
) = α
αα
α
=NORMSINV(1–α) z
α
αα
α
= Φ
–1
(0,5 – α
αα
α) P(
Z
> Z
α
αα
α
) = α
αα
α ⇒
⇒⇒
⇒ Z
α
αα
α
= z
α
αα
α/2
t
α
αα
α
(n) phân vị mức α của phân phối Student với n bậc tự do. P(T > t
α
αα
α
) = α
αα
α
=TINV(2*α; n) P(
T
> T
α
αα
α
) = α
αα
α ⇒
⇒⇒
⇒ T
α
αα
α
= t
α
αα
α/2
χ
χχ
χ
2
α
αα
α
(n) phân vị mức α của phân phối Chi bình với n bậc tự do. P(
χ
χχ
χ
2
>
χ
χχ
χ
2
α
αα
α
) = α
αα
α
=CHIINV(α; n)
Số liệu dạng điểm không có tần số
x
=
n
i
i 1
1
x
n
=
==
=
∑
∑∑
∑
s
2
=
2
n n
2
i i
i 1 i 1
1 1
x x
n 1 n
= =
= == =
= =
−
−−
−
−
−−
−
∑ ∑
∑ ∑∑ ∑
∑ ∑
Số liệu dạng khoảng có tần số
x
i
= (a
i
+ b
i
)/2 ⇒ s
ố liệu dạng điểm có tần số.
Số liệu dạng điểm có tần số
n =
k
i
i 1
n
=
==
=
∑
∑∑
∑
x
=
k
i i
i 1
1
n x
n
=
==
=
∑
∑∑
∑
s
2
=
2
k k
2
i i i i
i 1 i 1
1 1
n x n x
n 1 n
= =
= == =
= =
−
−−
−
−
−−
−
∑ ∑
∑ ∑∑ ∑
∑ ∑
Bảng số liệu hai chiều
Số liệu X theo điểm:
Cộng tần số theo
dòng.
Số liệu Y theo điểm:
Cộng tần số theo cột.
Số liệu X biết Y=y
j
: Lấy cột j.
Số liệu Y biết X=x
i
: Lấy dòng i.
Y
X
y
1
y
h
x
1
n
11
n
1h
x
k
n
k1
n
kh
Đổi biến
x
o
: bằng x
i
có tần số lớn nhất h: tuỳ ý
n =
k
i
i 1
n
=
==
=
∑
∑∑
∑
u
=
k
i i
i 1
1
n u
n
=
==
=
∑
∑∑
∑
x
= x
o
+ h
u
s
2
=
2
k
2 2
i i
i 1
h
n u nu
n 1
=
==
=
−
−−
−
−
−−
−
∑
∑∑
∑
Khoảng tin cậy của trung bình tổng thể µ
µ∈(
x
− ε,
x
+ ε) với độ tin cậy 1–α.
n ≥
≥≥
≥ 30 hoặc n < 30, biết σ
2
, tổng thể Chuẩn
ε
εε
ε =
/2
z
n
α
αα
α
σ
σσ
σ
(σ ≈ s)
n < 30, chưa biết σ
2
, tổng thể Chuẩn
ε
εε
ε =
/2
s
t(n 1)
n
α
αα
α
−
−−
−
Khoảng tin cậy của tỷ lệ tổng thể p
p∈(f – ε, f + ε) với độ tin cậy 1–α.
ε
εε
ε =
/2
f(1 f )
z
n
α
αα
α
−
−−
−
Khoảng tin cậy của phương sai tổng thể
σ
2
∈(a, b) với độ tin cậy 1–α.
Chưa biết µ
a =
2
2
/2
(n 1)s
(n 1)
α
αα
α
−
−−
−
χ −
χ −χ −
χ −
b =
2
2
1 /2
(n 1)s
(n 1)
−α
−α−α
−α
−
−−
−
χ −
χ −χ −
χ −
Biết µ
a =
(
((
( )
))
)
2
1
2
2
n
i
i
/
x
(n)
=
==
=
α
αα
α
− µ
− µ− µ
− µ
χ
χχ
χ
∑
∑∑
∑
b =
(
((
( )
))
)
2
1
2
2
n
i
i
1 /
x
(n)
=
==
=
−α
−α−α
−α
− µ
− µ− µ
− µ
χ
χχ
χ
∑
∑∑
∑
Tóm tắt XSTK - 4 - 2013
Độ tin cậy 1–α ⇔ mức ý nghĩa α
Giá trị kiểm định: z, t, χ
2
Loại kiểm định
Giá trị kiểm định
(KD)
Giá trị tới hạn (TH)
Bác bỏ
H
o
H
o
: µ = µ
o
H
1
: µ ≠ µ
o
n ≥ 30 hay n < 30, biết σ
2
, Chuẩn: z
α
αα
α/2
n < 30, chưa biết σ
2
, Chuẩn: t(n–1)
α
αα
α/2
|KĐ| > TH
H
o
: µ = µ
o
H
1
: µ > µ
o
n ≥ 30 hay n < 30, biết σ
2
, Chuẩn: z
α
αα
α
n < 30, chưa biết σ
2
, Chuẩn: t(n–1)
α
αα
α
KĐ > TH
H
o
: µ = µ
o
H
1
: µ < µ
o
o
x
/ n
− µ
− µ− µ
− µ
σ
σσ
σ
(σ ≈ s)
n ≥ 30 hay n < 30, biết σ
2
, Chuẩn: –z
α
αα
α
n < 30, chưa biết σ
2
, Chuẩn: –t(n–1)
α
αα
α
KĐ < TH
H
o
: p = p
o
H
1
: p ≠ p
o
z
α
αα
α/2
|KĐ| > TH
H
o
: p = p
o
H
1
: p > p
o
z
α
αα
α
KĐ > TH
H
o
: p = p
o
H
1
: p < p
o
−
−−
−
−
−−
−
o
o o
f p
p (1 p ) / n
–z
α
αα
α
KĐ < TH
H
o
: σ
2
= σ
o
2
H
1
: σ
2
≠ σ
o
2
χ
χχ
χ
2
(n–1)
1–α
αα
α/2
và
χ
χχ
χ
2
(n–1)
α
αα
α/2
KĐ > TH
L
hoặc
KĐ < TH
N
H
o
: σ
2
= σ
o
2
H
1
: σ
2
> σ
o
2
χ
χχ
χ
2
(n–1)
α
αα
α
KĐ > TH
H
o
: σ
2
= σ
o
2
H
1
: σ
2
< σ
o
2
2
2
o
(n 1)s
−
−−
−
σ
σσ
σ
χ
χχ
χ
2
(n–1)
1–α
αα
α
KĐ < TH
BẢNG KÊ SỐ
z 0 1 2 3 4 5 6 7 8 9
1.9
0.4713
0.4719
0.4726
0.4732
0.4738
0.4744
0.4750
0.4756
0.4761
0.4767
2.0
0.4772
0.4778
0.4783
0.4788
0.4793
0.4798
0.4803
0.4808
0.4812
0.4817
2
z
t /2
0
1
(z) e dt
2
−
Φ =
π
∫
•
Φ(2,03) =
0,4788 •
α
= 0,025 ?z
α
0,5 – 0,025 = 0,4750
⇒
z
α
= 1,96
z
α
0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.0
0.0228
0.0222
0.0217
0.0212
0.0207
0.0202
0.0197
0.0192
0.0188
0.0183
1.9
0.0287
0.0281
0.0274
0.0268
0.0262
0.0256
0.0250
0.0244
0.0239
0.0233
P(Z > z
α
) =
α
•
α
= 0,025 ?z
α
z
α
= 1,96
a 0,005
0,01 0,015
0,02 0,025
0,03 0,04 0,05
z
a
2,576
2,326
2,17 2,054
1,96 1,881
1,751
1,645