Tải bản đầy đủ (.pdf) (4 trang)

công thức xác suất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (177.45 KB, 4 trang )


Tóm tắt XSTK - 1 - 2013
KHÁI NIỆM CƠ BẢN XÁC SUẤT
Công thức Siêu bội P(X=k) =

−−


−−

k n k
M N M
n
N
C .C
C

Công thức Nhị thức P(X=k) =
k
n
C
.p
k
(1 – p)
n–k

Công thức cộng
P(A+B) = P(A) + P(B) – P(A.B)
▪ P(A) = 1 − P(
A
)


▪ P(A
1
+A
2
+…+A
n
) = P(A
1
)+P(A
2
)+…+P(A
n
)
(A
i
) xung khắc từng đôi.

▪ P(A+B+C) = P(A) + P(B) + P(C)
– P(AB) – P(BC) – P(AC)
+ P(ABC)
Ghi nhớ

A B A.B
+ + =

A.B A+B+
=

Công thức nhân
P(A.B) = P(A).P(B/A) = P(B).P(A/B)

▪ P(A/B) =
P(A.B)
P(B)
=
P(A).P(B / A)
P(B)

▪ P(A/B) =
P(A)
P(B)
(B = A + … )

P(A/B) P(B/A)
P(A) P(B)
=

▪ P(A
1
.A
2
) = P(A
1
).P(A
2
) (A
i
) đ.lập t.phần.

▪ P(A.B.C) = P(A).P(B/A).P(C/A.B)
Công thức Xác suất đầy đủ

(A
i
) đầy đủ và xung khắc từng đôi.
P(B) =
/

∑∑

n
i i
i =1
P(B A ).P(A )

P(B.C) =
/ /

∑∑

n
i i
i =1
P(B A .C).P(A C)

Công thức Bayes
(A
i
) đầy đủ và xung khắc từng đôi.
P(A
i
/B) =

i i
P(A ).P(B / A )
P(B)


ĐẠI LƯỢNG NGẪU NHIÊN HAI CHIỀU
▪ Bảng phân phối theo thành
ph
ần X (p
i
bằng tổng p
ij
theo
dòng) ⇒ E(X), Var(X), σ
X

X x
1
x
m

p p
1
p
m


▪ Bảng phân phối theo thành
ph
ần Y (q

j
bằng tổng p
ij
theo
cột) ⇒ E(Y), Var(Y), σ
Y

Y y
1
y
n

q q
1
q
n


Bảng phân phối đồng thời
Y

X
y
1


y
n



x
1
p
11


p
1n

Σ= p
1




x
m
p
m1


p
mn

Σ= p
m


Σ= q
1




Σ= q
n


p
ij
≥ 0, ΣΣp
ij
= 1
p
i
> 0, Σp
i
= 1 q
j
> 0, Σq
j
= 1

▪ Bảng phân phối theo X có
điều kiện Y=y
j
(cột j chia cho
tổng cột j)
⇒ E(X /y
j
), Var(X /y

j
)
X /y
j
x
1
x
m

p /y
j
p
1j
/q
j

p
mj
/q
j


▪ Bảng phân phối theo Y có
điều kiện X=x
i
(dòng i chia
cho tổng dòng i)
⇒ E(Y /x
i
), Var(Y /x

i
)
Y /x
i
y
1
y
n

q /x
i
q
i1
/p
i

q
in
/p
i


Hiệp phương sai: đo độ phụ thuộc giữa X, Y
Cov(X, Y) =
m n
i j ij
i 1 j 1
x y p
= =
= == =

= =
∑∑
∑∑∑∑
∑∑
– E(X).E(Y)
▪ X, Y độc lập ⇔ p
ij
= p
i
.q
j
∀(i, j)
⇒ Cov(X, Y) = 0
▪ Var(aX ± bY) = a
2
Var(X) + b
2
Var(Y)
± 2abCov(X, Y)
Hệ số tương quan: đo mức độ phụ thuộc
tuyến tính giữa X và Y.
XY
ρ
ρρ
ρ
=
X Y
Cov(X,Y)
.σ σ
σ σσ σ

σ σ

▪ 
XY
ρ
 ≤ 1,
XY
ρ
> 0 ⇒ X, Y đồng biến
▪ 
XY
ρ
 = 1 ⇔ P(Y = aX+b) = 1 (hầu hết)



Tóm tắt XSTK - 2 - 2013
ĐẠI LƯỢNG NGẪU NHIÊN
p
i
> 0
p
1
+ p
2
+ + p
n
= 1
X x
1

x
2
x
n

p p
1
p
2
p
n

Mod(X) = x
o
⇔ P(X = x
o
) =
x
max
P(X = x)
⇔ f(x
o
) =
x
max
f(x)
E(X) =

n
i i

i=1
x p

E(c) = c E(cX) = cE(X)
E(X + Y) = E(X) + E(Y)
E(X.Y) = E(X).E(Y) X, Y độc lập
Var(X) = E(X
2
) −
−−
− [E(X)]
2
σ(X)=
Var(X)

=
 
  
 

−−

 
  
 
 
  
 
∑ ∑
∑ ∑∑ ∑

∑ ∑
2
n n
2
i i i i
i=1 i=1
x p x p

Var(c) = 0 Var(cX) = c
2
Var(X)
Var(X ± Y) = Var(X) + Var(Y) X, Y độc lập

Phân phối Chuẩn X ~ N(µ, σ
σσ
σ
2
)
Hàm mật độ: f(x) =
2
x
/2
1
e
2
µ
σ
σ π

−−


 
  
 

−−

 
  
 
 
  
 

E(X) = µ Var(X) = σ
σσ
σ
2
Mod(X) = µ
Hàm Laplace: Φ(x)=


2
x
z /2
0
1
e dz
2


π


▪ Φ(–x) = –Φ(x) =NORMSDIST(x)–0,5

▪ x ≥ 4 ⇒ Φ(x) ≈ 0,5
▪ Φ(a) > Φ(b) ⇔ a > b
▪ z
α
= a ⇔ α = 0,5 – Φ(a)

X Chuẩn ⇔
X
− µ
σ
~ N(0; 1)
▪ P(X < x) = 0,5 + Φ(
X
− µ
σ
)

▪ P(X > x) = 0,5 – Φ(
X
− µ
σ
)

▪ P(a < X < b) = Φ(
b

− µ
σ
) – Φ(
a
− µ
σ
)
▪ P(X – µ< a) = 2Φ(a / σ)
a
1
N(µ
1
, σ
1
2
) + a
2
N(µ
2
, σ
2
2
) =
N(a
1
µ
1
+ a
1
µ

1
, a
1
2
σ
1
2
+ a
2
2
σ
2
2
)
Phân phối Nhị thức X ~ B(n, p)
P(X=k) =
k k n-k
n
C .p q
=BINOMDIST(k; n; p; 0)

P(X ≤ k) =BINOMDIST(k; n; p; 1)

E(X) = np Var(X) = npq
Mod(X) ∈
∈∈
∈ [(n+1)p–1, (n+1)p]
▪ n đủ lớn, p không quá gần 0 hay 1:
B(n, p) ≈ N(np, npq)
▪ n đủ lớn, p gần 0:

B(n, p) ≈ P(np)
Tổng các phân phối Nhị thức độc lập:
B(n
1
, p) + B(n
2
, p) = B(n
1
+ n
2
, p)
Phân phối Poisson X ~ P(λ
λλ
λ)
P(X=k) =

k
e
k!
λ
λλ
λ
λ
λλ
λ
=POISSON(k; λ; 0)

P(X ≤ k) =POISSON(k; λ; 1)

E(X) = λ

λλ
λ Var(X) = λ
λλ
λ Mod(X) ∈
∈∈
∈ [λ
λλ
λ–1, λ
λλ
λ]

▪ λ ≥ 10: P(λ
λλ
λ) ≈ N(λ
λλ
λ; λ
λλ
λ)
Tổng các phân phối Poisson độc lập:
P(λ
1
) + P(λ
2
) = P(λ
1
+ λ
2
)
Phân phối Siêu bội X ~ H(N, M, n)
P

k
=


k n k
M N M
n
N
C .C
C
=HYPGEOMDIST(k; n; M; N)

E(X) = np Var(X) = npq


N n
N 1

Mod(X) =
+ +
+ ++ +
+ +
 
  
 
 
  
 
+
++

+
 
  
 
(n 1)(M 1)
N 2

▪ n đủ nhỏ so với N: H(N, M, n) ≈ B(n, M/N)
Phân phối Chi bình k bậc tự do
χ
χχ
χ
2
~
χ
χχ
χ
2
(k)
E(
χ
χχ
χ
2
(k)) = k Var(
χ
χχ
χ
2
(k)) = 2k

χ
2
(k)
α
=CHIINV(α; k)
Phân phối Student k bậc tự do T ~ T(k)
E(T) = 0 Var(T(k) ) =
k
k 2

−−


t(k)
α
=TINV(2*α; k)
▪ k ≥ 30:
χ
χχ
χ
2
(k) ≈ N(0; 1) T(k) ≈ N(0; 1)

Tóm tắt XSTK - 3 - 2013
THỐNG KÊ TOÁN
µ trung bình tổng thể. σ
2
phương sai tổng thể. p tỷ lệ tổng thể.
X
trung bình mẫu ngẫu nhiên. S

2
phương sai mẫu ngẫu nhiên. F tỷ lệ mẫu ngẫu nhiên.
x
trung bình mẫu. s
2
phương sai mẫu. f tỷ lệ mẫu. n kích thước mẫu. ε
εε
ε độ chính xác.
z
α
αα
α
phân vị mức α của phân phối Chuẩn chuẩn tắc. P(Z > z
α
αα
α
) = α
αα
α
=NORMSINV(1–α) z
α
αα
α
= Φ
–1
(0,5 – α
αα
α) P(

Z


 > Z
α
αα
α
) = α
αα
α ⇒
⇒⇒
⇒ Z
α
αα
α
= z
α
αα
α/2

t
α
αα
α
(n) phân vị mức α của phân phối Student với n bậc tự do. P(T > t
α
αα
α
) = α
αα
α
=TINV(2*α; n) P(


T

 > T
α
αα
α
) = α
αα
α ⇒
⇒⇒
⇒ T
α
αα
α
= t
α
αα
α/2

χ
χχ
χ
2
α
αα
α
(n) phân vị mức α của phân phối Chi bình với n bậc tự do. P(
χ
χχ

χ
2
>
χ
χχ
χ
2
α
αα
α
) = α
αα
α
=CHIINV(α; n)
Số liệu dạng điểm không có tần số
x
=
n
i
i 1
1
x
n
=
==
=

∑∑

s

2
=

2
n n
2
i i
i 1 i 1
1 1
x x
n 1 n
= =
= == =
= =
 
  
 
 
  
 

−−

 
  
 
 
  
 


−−

 
  
 
 
  
 
 
  
 
∑ ∑
∑ ∑∑ ∑
∑ ∑


Số liệu dạng khoảng có tần số
x
i
= (a
i
+ b
i
)/2 ⇒ s
ố liệu dạng điểm có tần số.
Số liệu dạng điểm có tần số
n =
k
i
i 1

n
=
==
=

∑∑


x
=
k
i i
i 1
1
n x
n
=
==
=

∑∑


s
2
=

2
k k
2

i i i i
i 1 i 1
1 1
n x n x
n 1 n
= =
= == =
= =
 
  
 
 
  
 

−−

 
  
 
 
  
 

−−

 
  
 
 

  
 
 
  
 
∑ ∑
∑ ∑∑ ∑
∑ ∑


Bảng số liệu hai chiều
Số liệu X theo điểm:
Cộng tần số theo
dòng.
Số liệu Y theo điểm:
Cộng tần số theo cột.

Số liệu X biết Y=y
j
: Lấy cột j.
Số liệu Y biết X=x
i
: Lấy dòng i.
Y
X
y
1
y
h


x
1

n
11
n
1h


x
k

n
k1
n
kh

Đổi biến
x
o
: bằng x
i
có tần số lớn nhất h: tuỳ ý
n =
k
i
i 1
n
=
==

=

∑∑


u
=
k
i i
i 1
1
n u
n
=
==
=

∑∑


x
= x
o
+ h
u

s
2
=


2
k
2 2
i i
i 1
h
n u nu
n 1
=
==
=
 
  
 

−−

 
  
 

−−

 
  
 

∑∑



Khoảng tin cậy của trung bình tổng thể µ
µ∈(
x
− ε,
x
+ ε) với độ tin cậy 1–α.
n ≥
≥≥
≥ 30 hoặc n < 30, biết σ
2
, tổng thể Chuẩn
ε
εε
ε =
/2
z
n
α
αα
α
σ
σσ
σ
(σ ≈ s)
n < 30, chưa biết σ
2
, tổng thể Chuẩn
ε
εε
ε =

/2
s
t(n 1)
n
α
αα
α

−−


Khoảng tin cậy của tỷ lệ tổng thể p
p∈(f – ε, f + ε) với độ tin cậy 1–α.
ε
εε
ε =
/2
f(1 f )
z
n
α
αα
α

−−


Khoảng tin cậy của phương sai tổng thể
σ
2

∈(a, b) với độ tin cậy 1–α.
Chưa biết µ
a =
2
2
/2
(n 1)s
(n 1)
α
αα
α

−−

χ −
χ −χ −
χ −
b =
2
2
1 /2
(n 1)s
(n 1)
−α
−α−α
−α

−−

χ −

χ −χ −
χ −

Biết µ
a =
(
((
( )
))
)
2
1
2
2
n
i
i
/
x
(n)
=
==
=
α
αα
α
− µ
− µ− µ
− µ
χ

χχ
χ

∑∑

b =
(
((
( )
))
)
2
1
2
2
n
i
i
1 /
x
(n)
=
==
=
−α
−α−α
−α
− µ
− µ− µ
− µ

χ
χχ
χ

∑∑




Tóm tắt XSTK - 4 - 2013
Độ tin cậy 1–α ⇔ mức ý nghĩa α
Giá trị kiểm định: z, t, χ
2


Loại kiểm định
Giá trị kiểm định

(KD)
Giá trị tới hạn (TH)
Bác bỏ
H
o

H
o
: µ = µ
o

H

1
: µ ≠ µ
o

n ≥ 30 hay n < 30, biết σ
2
, Chuẩn: z
α
αα
α/2
n < 30, chưa biết σ
2
, Chuẩn: t(n–1)
α
αα
α/2

|KĐ| > TH
H
o
: µ = µ
o

H
1
: µ > µ
o

n ≥ 30 hay n < 30, biết σ
2

, Chuẩn: z
α
αα
α
n < 30, chưa biết σ
2
, Chuẩn: t(n–1)
α
αα
α

KĐ > TH
H
o
: µ = µ
o

H
1
: µ < µ
o

o
x
/ n
− µ
− µ− µ
− µ
σ
σσ

σ
(σ ≈ s)
n ≥ 30 hay n < 30, biết σ
2
, Chuẩn: –z
α
αα
α
n < 30, chưa biết σ
2
, Chuẩn: –t(n–1)
α
αα
α

KĐ < TH
H
o
: p = p
o

H
1
: p ≠ p
o

z
α
αα
α/2


|KĐ| > TH
H
o
: p = p
o

H
1
: p > p
o

z
α
αα
α

KĐ > TH
H
o
: p = p
o

H
1
: p < p
o


−−



−−

o
o o
f p
p (1 p ) / n

–z
α
αα
α

KĐ < TH
H
o
: σ
2
= σ
o
2

H
1
: σ
2
≠ σ
o
2


χ
χχ
χ
2
(n–1)
1–α
αα
α/2

χ
χχ
χ
2
(n–1)
α
αα
α/2

KĐ > TH
L

hoặc
KĐ < TH
N

H
o
: σ
2

= σ
o
2

H
1
: σ
2
> σ
o
2

χ
χχ
χ
2
(n–1)
α
αα
α

KĐ > TH
H
o
: σ
2
= σ
o
2


H
1
: σ
2
< σ
o
2


2
2
o
(n 1)s

−−

σ
σσ
σ

χ
χχ
χ
2
(n–1)
1–α
αα
α

KĐ < TH


BẢNG KÊ SỐ
z 0 1 2 3 4 5 6 7 8 9
1.9

0.4713

0.4719

0.4726

0.4732

0.4738

0.4744

0.4750

0.4756

0.4761

0.4767

2.0

0.4772

0.4778


0.4783

0.4788

0.4793

0.4798

0.4803

0.4808

0.4812

0.4817

2
z
t /2
0
1
(z) e dt
2

Φ =
π




Φ(2,03) =
0,4788 •

α
= 0,025 ?z
α

0,5 – 0,025 = 0,4750

z
α
= 1,96



z
α

0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.0

0.0228

0.0222

0.0217

0.0212

0.0207


0.0202

0.0197

0.0192

0.0188

0.0183

1.9

0.0287

0.0281

0.0274

0.0268

0.0262

0.0256

0.0250

0.0244

0.0239


0.0233


P(Z > z
α
) =
α



α
= 0,025 ?z
α
z
α
= 1,96

a 0,005

0,01 0,015

0,02 0,025

0,03 0,04 0,05
z
a
2,576

2,326


2,17 2,054

1,96 1,881

1,751

1,645



×