Tải bản đầy đủ (.pdf) (2 trang)

Ôn tập xác suất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (908.28 KB, 2 trang )

1/ Ước lượng 𝝁:
Trên 1 mẫu

Trên 2 mẫu phụ thuộc

*Chương 1,2: Xác suất*
1/ Công thức cộng: P(A+B) = P(A) + P(B) – P(AB)
2/ X/s có điều kiện (CT Nhân): P(A∩B) = P(A|B).P(B) = P(B|A).P(A)
3/ A, B độc lập: P(A|B) = P(A) ; P(B|A) = P(B) ; P(AB) = P(A).P(B)
4/ Bayes Rule: P(A|X) =

P(AX)
P(X)

=

P(X|A).P(A)
P(X)

5/ + Công thức đầy đủ: P(A) = P(A|B1).P(B1) + P(A|B2).P(B2) + …
̅).P(B
̅)
+ Total Probability: P(A) = P(A|B).P(B) + P(A|B
6/ Bayes Rule for 2 events: Ghép Bayes Rule và Total Probability
*Chương 3: Biến ngẫu nhiên rời rạc & phân phối*
1/ Yêu cầu phân phối x/s: 0 ≤ p(x) ≤ 1 AND ∑ p(x) = 1
2/ Hàm phân phối tích lũy: F(x) = P(X ≤ x)
3/ Giá trị kì vọng: E(X) = ∑∞
i=1 xi pi

Trên 2 mẫu độc lập



2
2
4/ Phương sai: σ2 = ∑∞
i=1 xi p(xi ) − μ

5/ Độ lệch chuẩn: 𝜎 = √𝜎 2
6/ Phân phối Bernoulli: 𝑓𝑝 (𝑘) = 𝑝𝑘 (1 − 𝑝)1−𝑘
E(X) = p ; V(X) = p(1 – p)
7/ Phân phối x/s nhị thức (Binomial Probability Distribution):

P(X = k) = Cnk pk (1 − p)(n−k) ; X~B(n,p)
8/ Trung bình và độ lệch chuẩn cho Biến nhị thức ngẫu nhiên:
µ = np ; σ = √np(1 − p)
9/ Geometic (Hình học): P(k) = (p1 − p)(k−1) ; p ∈ (0,1)
Kì vọng: 1/p ; Phương sai: (1-p)/p2
10/ Negative Binomial (Nhị thức phủ định):

2/ Ước lượng p:
Trên 1 mẫu

k−1 k
P(X = m) = Cm−1
p (1 − p)(m−k)

Trên 2 mẫu

Kì vọng: k/p ; Phương sai: k(1-p)/p2
*Chương 4: Phân phối liên tục*
E(X) = ∫ xf(x)dx ; V(X) = ∫(x − μ)2 f(x)dx = E(X2) – [E(X)]2

>>Phân phối xác suất đều (Uniform)<<
f(x): Hàm mật độ (Probability density function).
b

1/ P(a ≤ X ≤ b) = ∫a f(x)dx
2/ E(X) = (a+b)/2
3/ V(X) = (b-a)2/12

3/ Điều kiện bác bỏ H0:
Kiểm định phía trái
𝑍 < −𝑍𝛼
𝑇<

−𝑇𝛼𝑛−1

(1 mẫu)

𝑇 < −𝑇𝛼𝑛1+𝑛2−2 (2 mẫu, 𝜎12 = 𝜎22 )
𝑑𝑓

𝑇 < −𝑇𝛼 (2 mẫu, 𝜎12 ≠ 𝜎22 )

Kiểm định phía phải
𝑍 > 𝑍𝛼
𝑇>

𝑇𝛼𝑛−1

(1 mẫu)


𝑇 > 𝑇𝛼𝑛1+𝑛2−2 (2 mẫu, 𝜎12 = 𝜎22 )
𝑑𝑓

𝑇 > 𝑇𝛼 (2 mẫu, 𝜎12 ≠ 𝜎22 )

Kiểm định 2 phía
|𝑍| > 𝑍𝛼
2

|𝑇| > 𝑇𝛼𝑛−1 (1 mẫu)
2

|𝑇| > 𝑇𝛼𝑛1+𝑛2−2 (2 mẫu, 𝜎12 = 𝜎22 )
2

|𝑇| > 𝑇𝛼𝑑𝑓 (2 mẫu, 𝜎12 ≠ 𝜎22 )
2

4/ 𝜎 = √𝑉(𝑋)
>>Phân phối xác suất thường (Normal)<<
1/ Hàm mật độ xác suất: f(x) =

2
2
1
e−(x−µ) /(2σ)
σ√2π
2

X ~ N(μ, 𝜎 2 ) ; E(X) = μ ; V(X) = 𝜎

2/ Phân phối chuẩn: Z ~ N(0,1) ; Dị bảng Chuẩn Hóa.
3/ Tính x/s bằng cdf: P(X>a)=1–F(a) ; P(a ≤ X ≤ b)=F(b)–F(a) ; (b>a)
𝑥

𝐹𝑋 (𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡
−∞

CuuDuongThanCong.com

; -∞ < x < ∞

/>

4/ Kiểm định 𝝁:
Trên 1 mẫu

Trên 2 mẫu phụ thuộc

4/ Phân phối thường không chuẩn (Nonstandard normal distribution):
a− μ
b− μ
𝑏− μ
𝑎− μ
P(a ≤ X ≤ b) = P (
≤Z ≤
) = ɸ(
)−ɸ(
)

σ

σ
𝜎
5/ Xấp xỉ phân phối nhị thức bằng phân phối chuẩn:
µ = np ; σ = √np(1 − p) ; P(X ≤ x) ≈ ɸ(

𝑥−𝑛𝑝

𝜎

) (x = 0,1,...,n)

√np(1−p)

(Điều kiện: µ và 𝛔 ≥ 10)
Bino(n,p) => N(μ, 𝜎 2 ):
P(X = a) => P(a - 0,5 ≤ X ≤ a + 0,5)
P(X ≥ a) => P(X > a - 0,5)
P(X ≤ a) => P(X < a + 0,5)
P(X > a) => P(X > a + 0,5)
P(X < a) => P(X < a - 0,5)
6/ Phân vị: P(X ≤ n(p)) = p = F(n(p)) => n(p) = ? //Kết hợp với cdf
*Chương 5: Phân phối x/s đồng thời*

1/ Phân phối đồng thời: ∬−∞ f(x, y)dxdy = 1

Trên 2 mẫu độc lập

2/ Mật độ lề/Phân phối lề (Marginal Density):
+∞


5/ Kiểm định p:
Trên 1 mẫu:
6/ Thống kê mơ tả:
+ Mean: Trung bình (cộng)
+ Median: Trung vị //Vị trí ở giữa các số
+ Mode: Yếu vị //Số có số lần x/hiện nhiều nhất
+ Tứ phân vị thứ nhất, hai, ba: Q1 = n.25%/100 = * (Tương
tự Q2 là 50%, Q3 là 75%)
(Nếu * lẻ thì làm trịn, lấy số ở vị trí làm trịnq. Nếu * chẵn
thì lấy số ở vị trí chẵn đó + số ở vị trí kế tiếp rồi chia 2).
+ IQR = Q3 – Q1

Trên 2 mẫu:

∑ ni (xi −x̅)

+ s = √s 2 = √
7/ Lưu ý về kiểm định:
+ Cái gì có dấu = đẩy vào Ho. (=; ≥, ≤)
+ H1 thì ngược lại. (≠, >, <)
+ p̂: Tương đương f
+x
̅ ≈ N(μ;

σ2
)
n

;


𝑥̅ −𝜇
√𝑛

n−1

(ni : Số lần xuất hiện của 1 giá trị)

+ Vẽ Histogram và Stem-Leaf
+ Lower Fence = Q1 – 1,5(IQR) //Kiếm outliners
+ Upper Fence = Q3 + 1,5(IQR) //Kiếm outliners
+ BoxPlot:

+∞

𝑓𝑋 (𝑥) = ∫−∞ 𝑓(𝑥, 𝑦)𝑑𝑦 ; 𝑓𝑦 (𝑦) = ∫−∞ 𝑓(𝑥, 𝑦)𝑑𝑥
(Với rời rạc: Thể hiện phân phối dưới dạng bảng. Liên tục: Hàm mật
độ).
2/ Độc lập: p(x,y) = p(x)p(y) => f(x,y)=f(x).f(y).
3/ Covenient: Cov(X,Y) = E[XY] - µx µy (µ: Kì vọng)
Cov(X,Y) = 0 khi X,Y độc lập.
4/ E[XY] = ∬ xyf(x, y)dxdy
5/ V(X+Y) = V(X) + V(Y) + 2Cov(X,Y)
6/ Correlations (Sự tương quan): Corr(X,Y) or px,y or p =
*Lưu ý & Chú thích*

𝑛

REJECTION HO
CuuDuongThanCong.com


σX σY

5/ Hợp Lý Cực Đại (max):
+ Kỹ thuật 1: Đạo hàm [g(x)]’ = 0
2/ ∝: Độ khác biệt/Độ sai lệch/ + Kỹ thuật 2: Cần phải thuộc công
thức đạo hàm ln và log. Gán
Mức ý nghĩa.
ln/log/… 2 bên rồi đạo hàm 2 bên
3/ 1-∝: Độ tin cậy.
theo biên * (* Là yêu cầu đề).
𝑝̂(1−𝑝̂)
+ Kỹ thuật 3: Nhìn & xử lý (Khó).
4/ Z∝/2 √
: Lỗi biên
1/ t n−1
∝/2 : Giá trị tới hạn.

𝑍 = 𝜎/

+ Pvalue = P(Z>Ztest) = *
Nếu * ≥ ∝ => Don’t reject Ho.
Nếu P < ∝ => Reject Ho.
Nếu đề là kiểm định 2 phía (Two tails) thì
Pvalue = 2P(Z>Ztest).
//Có thể đổi Ztest thành Ttest tương ứng đề.

Cov(X,Y)

/>



×