1/ Ước lượng 𝝁:
Trên 1 mẫu
Trên 2 mẫu phụ thuộc
*Chương 1,2: Xác suất*
1/ Công thức cộng: P(A+B) = P(A) + P(B) – P(AB)
2/ X/s có điều kiện (CT Nhân): P(A∩B) = P(A|B).P(B) = P(B|A).P(A)
3/ A, B độc lập: P(A|B) = P(A) ; P(B|A) = P(B) ; P(AB) = P(A).P(B)
4/ Bayes Rule: P(A|X) =
P(AX)
P(X)
=
P(X|A).P(A)
P(X)
5/ + Công thức đầy đủ: P(A) = P(A|B1).P(B1) + P(A|B2).P(B2) + …
̅).P(B
̅)
+ Total Probability: P(A) = P(A|B).P(B) + P(A|B
6/ Bayes Rule for 2 events: Ghép Bayes Rule và Total Probability
*Chương 3: Biến ngẫu nhiên rời rạc & phân phối*
1/ Yêu cầu phân phối x/s: 0 ≤ p(x) ≤ 1 AND ∑ p(x) = 1
2/ Hàm phân phối tích lũy: F(x) = P(X ≤ x)
3/ Giá trị kì vọng: E(X) = ∑∞
i=1 xi pi
Trên 2 mẫu độc lập
2
2
4/ Phương sai: σ2 = ∑∞
i=1 xi p(xi ) − μ
5/ Độ lệch chuẩn: 𝜎 = √𝜎 2
6/ Phân phối Bernoulli: 𝑓𝑝 (𝑘) = 𝑝𝑘 (1 − 𝑝)1−𝑘
E(X) = p ; V(X) = p(1 – p)
7/ Phân phối x/s nhị thức (Binomial Probability Distribution):
P(X = k) = Cnk pk (1 − p)(n−k) ; X~B(n,p)
8/ Trung bình và độ lệch chuẩn cho Biến nhị thức ngẫu nhiên:
µ = np ; σ = √np(1 − p)
9/ Geometic (Hình học): P(k) = (p1 − p)(k−1) ; p ∈ (0,1)
Kì vọng: 1/p ; Phương sai: (1-p)/p2
10/ Negative Binomial (Nhị thức phủ định):
2/ Ước lượng p:
Trên 1 mẫu
k−1 k
P(X = m) = Cm−1
p (1 − p)(m−k)
Trên 2 mẫu
Kì vọng: k/p ; Phương sai: k(1-p)/p2
*Chương 4: Phân phối liên tục*
E(X) = ∫ xf(x)dx ; V(X) = ∫(x − μ)2 f(x)dx = E(X2) – [E(X)]2
>>Phân phối xác suất đều (Uniform)<<
f(x): Hàm mật độ (Probability density function).
b
1/ P(a ≤ X ≤ b) = ∫a f(x)dx
2/ E(X) = (a+b)/2
3/ V(X) = (b-a)2/12
3/ Điều kiện bác bỏ H0:
Kiểm định phía trái
𝑍 < −𝑍𝛼
𝑇<
−𝑇𝛼𝑛−1
(1 mẫu)
𝑇 < −𝑇𝛼𝑛1+𝑛2−2 (2 mẫu, 𝜎12 = 𝜎22 )
𝑑𝑓
𝑇 < −𝑇𝛼 (2 mẫu, 𝜎12 ≠ 𝜎22 )
Kiểm định phía phải
𝑍 > 𝑍𝛼
𝑇>
𝑇𝛼𝑛−1
(1 mẫu)
𝑇 > 𝑇𝛼𝑛1+𝑛2−2 (2 mẫu, 𝜎12 = 𝜎22 )
𝑑𝑓
𝑇 > 𝑇𝛼 (2 mẫu, 𝜎12 ≠ 𝜎22 )
Kiểm định 2 phía
|𝑍| > 𝑍𝛼
2
|𝑇| > 𝑇𝛼𝑛−1 (1 mẫu)
2
|𝑇| > 𝑇𝛼𝑛1+𝑛2−2 (2 mẫu, 𝜎12 = 𝜎22 )
2
|𝑇| > 𝑇𝛼𝑑𝑓 (2 mẫu, 𝜎12 ≠ 𝜎22 )
2
4/ 𝜎 = √𝑉(𝑋)
>>Phân phối xác suất thường (Normal)<<
1/ Hàm mật độ xác suất: f(x) =
2
2
1
e−(x−µ) /(2σ)
σ√2π
2
X ~ N(μ, 𝜎 2 ) ; E(X) = μ ; V(X) = 𝜎
2/ Phân phối chuẩn: Z ~ N(0,1) ; Dị bảng Chuẩn Hóa.
3/ Tính x/s bằng cdf: P(X>a)=1–F(a) ; P(a ≤ X ≤ b)=F(b)–F(a) ; (b>a)
𝑥
𝐹𝑋 (𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡
−∞
CuuDuongThanCong.com
; -∞ < x < ∞
/>
4/ Kiểm định 𝝁:
Trên 1 mẫu
Trên 2 mẫu phụ thuộc
4/ Phân phối thường không chuẩn (Nonstandard normal distribution):
a− μ
b− μ
𝑏− μ
𝑎− μ
P(a ≤ X ≤ b) = P (
≤Z ≤
) = ɸ(
)−ɸ(
)
σ
σ
𝜎
5/ Xấp xỉ phân phối nhị thức bằng phân phối chuẩn:
µ = np ; σ = √np(1 − p) ; P(X ≤ x) ≈ ɸ(
𝑥−𝑛𝑝
𝜎
) (x = 0,1,...,n)
√np(1−p)
(Điều kiện: µ và 𝛔 ≥ 10)
Bino(n,p) => N(μ, 𝜎 2 ):
P(X = a) => P(a - 0,5 ≤ X ≤ a + 0,5)
P(X ≥ a) => P(X > a - 0,5)
P(X ≤ a) => P(X < a + 0,5)
P(X > a) => P(X > a + 0,5)
P(X < a) => P(X < a - 0,5)
6/ Phân vị: P(X ≤ n(p)) = p = F(n(p)) => n(p) = ? //Kết hợp với cdf
*Chương 5: Phân phối x/s đồng thời*
∞
1/ Phân phối đồng thời: ∬−∞ f(x, y)dxdy = 1
Trên 2 mẫu độc lập
2/ Mật độ lề/Phân phối lề (Marginal Density):
+∞
5/ Kiểm định p:
Trên 1 mẫu:
6/ Thống kê mơ tả:
+ Mean: Trung bình (cộng)
+ Median: Trung vị //Vị trí ở giữa các số
+ Mode: Yếu vị //Số có số lần x/hiện nhiều nhất
+ Tứ phân vị thứ nhất, hai, ba: Q1 = n.25%/100 = * (Tương
tự Q2 là 50%, Q3 là 75%)
(Nếu * lẻ thì làm trịn, lấy số ở vị trí làm trịnq. Nếu * chẵn
thì lấy số ở vị trí chẵn đó + số ở vị trí kế tiếp rồi chia 2).
+ IQR = Q3 – Q1
Trên 2 mẫu:
∑ ni (xi −x̅)
+ s = √s 2 = √
7/ Lưu ý về kiểm định:
+ Cái gì có dấu = đẩy vào Ho. (=; ≥, ≤)
+ H1 thì ngược lại. (≠, >, <)
+ p̂: Tương đương f
+x
̅ ≈ N(μ;
σ2
)
n
;
𝑥̅ −𝜇
√𝑛
n−1
(ni : Số lần xuất hiện của 1 giá trị)
+ Vẽ Histogram và Stem-Leaf
+ Lower Fence = Q1 – 1,5(IQR) //Kiếm outliners
+ Upper Fence = Q3 + 1,5(IQR) //Kiếm outliners
+ BoxPlot:
+∞
𝑓𝑋 (𝑥) = ∫−∞ 𝑓(𝑥, 𝑦)𝑑𝑦 ; 𝑓𝑦 (𝑦) = ∫−∞ 𝑓(𝑥, 𝑦)𝑑𝑥
(Với rời rạc: Thể hiện phân phối dưới dạng bảng. Liên tục: Hàm mật
độ).
2/ Độc lập: p(x,y) = p(x)p(y) => f(x,y)=f(x).f(y).
3/ Covenient: Cov(X,Y) = E[XY] - µx µy (µ: Kì vọng)
Cov(X,Y) = 0 khi X,Y độc lập.
4/ E[XY] = ∬ xyf(x, y)dxdy
5/ V(X+Y) = V(X) + V(Y) + 2Cov(X,Y)
6/ Correlations (Sự tương quan): Corr(X,Y) or px,y or p =
*Lưu ý & Chú thích*
𝑛
REJECTION HO
CuuDuongThanCong.com
σX σY
5/ Hợp Lý Cực Đại (max):
+ Kỹ thuật 1: Đạo hàm [g(x)]’ = 0
2/ ∝: Độ khác biệt/Độ sai lệch/ + Kỹ thuật 2: Cần phải thuộc công
thức đạo hàm ln và log. Gán
Mức ý nghĩa.
ln/log/… 2 bên rồi đạo hàm 2 bên
3/ 1-∝: Độ tin cậy.
theo biên * (* Là yêu cầu đề).
𝑝̂(1−𝑝̂)
+ Kỹ thuật 3: Nhìn & xử lý (Khó).
4/ Z∝/2 √
: Lỗi biên
1/ t n−1
∝/2 : Giá trị tới hạn.
𝑍 = 𝜎/
+ Pvalue = P(Z>Ztest) = *
Nếu * ≥ ∝ => Don’t reject Ho.
Nếu P < ∝ => Reject Ho.
Nếu đề là kiểm định 2 phía (Two tails) thì
Pvalue = 2P(Z>Ztest).
//Có thể đổi Ztest thành Ttest tương ứng đề.
Cov(X,Y)
/>