Thống kế sinh học
Cao Hào Thi 1
Chương 1
XÁC SUẤT
(Probability)
1.1. THÍ NGHIỆM NGẪU NHIÊN, KHÔNG GIAN MẪU, BIẾN CỐ:
1.1.1. Thí nghiệm ngẫu nhiên (Random Experiment)
Thí nghiệm ngẫu nhiên là một thí nghiệm có hai đặc tính :
- Không biết chắc hậu quả nào sẽ xảy ra.
- Nhưng biết được các hậu quả có thể xảy ra
Ví dụ:
Tung một con xúc sắc là một thí nghiệm ngẫu nhiên vì :
- Ta không biết chắc mặt nào sẽ xuất hiện
- Nhưng biết được có 6 trường hợp xảy ra (xúc sắc có 6 mặt 1, 2, 3, 4, 5, 6)
Ràng buộc:
- Con xúc sắc đồng chất để 6 mặt đều có thể xuất hiện như nhau.
- Cách tung xúc sắc không cố ý thiên vị cho mặt nào hiện ra.
1.1.2. Không gian mẫu (Sample Space)
Tập hợp các hậu quả có thể xảy ra trong thí nghiệm ngẫu nhiên gọi là không gian mẫu của
thí nghiệm đó.
Ví dụ:
Không gian mẫu của thí nghiệm thảy một con xúc xắc là: E = {1, 2, 3, 4, 5, 6}
Không gian mẫu của thí nghiệm thảy cùng một lúc hai đồng xu là:
E = {SS, SN, NS, NN} với S: Sấp, N: Ngửa
1.1.3. Biến cố (Event)
a) Biến cố
- Mỗi tập hợp con của không gian mẫu là một biến cố
- Biến cố chứa một phần tử gọi là biến cố sơ đẳng
Ví dụ:
Trong thí nghiệm thảy 1 con xúc sắc :
- Biến cố các mặt chẵn là : {2, 4, 6}. Biến cố các mặt lẻ: {1, 3, 5}
- Các biến cố sơ đẳng là : {1}, {2}, {3}, {4}, {5}, {6}
Cao Hào Thi 2
b) Biến cố xảy ra (hay thực hiện)
Gọi r là một hậu quả xảy ra và A là một biến cố
- nếu r ∈ A ta nói biến cố A xảy ra
- nếu r ∉ A ta nói biến cố A không xảy ra
Ví dụ:
Trong thí nghiệm thảy một con xúc sắc nếu mặt 4 xuất hiện thì:
- Biến cố {2,4,6} xảy ra vì 4 ∈ {2, 4, 6}
- Biến cố {1,3,5} không xảy ra vì 4 ∉ {1, 3, 5}
Ghi chú:
- φ ⊂ E => φ là một biến cố
∀ r, r ∉ φ => φ là một biến cố vô phương (biến cố không)
- E ⊂ E => E là một biến cố
∀ r, r ∈ E => E là một biến cố chắc chắn
1.1.4. Các phép tính về biến cố
Cho 2 biến cố A, B với A ⊂ E và B ⊂ E
a) Biến cố hội A
∪
B (Union)
Biến cố hội của 2 biến cố A và B được ký hiệu là A ∪ B:
A ∪ B xảy ra Ù (A xảy ra HAY B xảy ra)
b) Biến cố giao A
∩
B (Intersection)
A ∩ B xảy ra Ù (A xảy ra VÀ B xảy ra)
A
B
A∪B
E
A
B
A∩B
E
Cao Hào Thi 3
c) Biến cố phụ A (Biến cố đối lập, Component of A)
A xảy ra Ù A không xảy ra
d) Biến cố cách biệt ( biến cố xung khắc, mutually exclusive event)
A cách biệt với B Ù A ∩ B = φ
A cách biệt với B Ù A với B không cùng xảy ra
Ví dụ:
Trong thí nghiệm thảy một con xúc sắc, ta có không gian mẫu: E = {1, 2, 3, 4, 5, 6}
- Gọi A là biến cố mặt lẻ xuất hiện => A = {1, 3, 5}
- Gọi B là biến cố khi bội số của 3 xuất hiện => B = {3, 6}
- Gọi C là biến cố khi mặt 4 xuất hiện => C = {4}, biến cố sơ đẳng.
Ta có:
A ∪ B = {1, 3, 5, 6}
A ∩ B = {3}
A = {2,4,6} : biến cố khi mặt chẵn xuất hiện.
A ∩ C = φ => A và C là 2 biến cố cách biệt.
e) Hệ đầy đủ (Collectively Exhaustive)
Gọi A
1
, A
2
…, A
k
là k biến cố trong không gian mẫu E
Nếu A
1
∪ A
2
∪… ∪A
k
= E thì K biến cố trên được gọi là một hệ đầy đủ.
A
E
A
B
A
E
A
∩
B=
φ
Cao Hào Thi 4
1.2. XÁC SUẤT (Probability).
1.2.1. Định nghĩa:
Nếu thơng gian mẫu E có N biến cố sơ đẳng và biến cố A có n biến cố sơ đẳng thì xác
suất của biến cố A là :
P(A) =
N
n(A)
Một cách khác ta có thể viết :
P(A) =
raxảy thể có hợptrường Số
raxảyAhợptrườngSo
á
Ví dụ:
Trong thí nghiệm thảy một con xúc sắc, xác suất biến cố các mặt chẵn xuất hiện là :
P(A) =
N
n(A)
=
2
1
6
3
=
1.2.2. Tính chất:
a. Gọi A là một biến cố bất kỳ trong khơng gian mẫu E
0 ≤ P(A) ≤ 1
b. P (φ) = 0 => φ là Biến cố vơ phương
P (E) = 1 => E là Biến cố chắc chắn
1.2.3. Cơng thức về xác suất :
a) Xác suất của biến cố hội:
P (A
∪ B) = P (A) + P(B) - P( A ∩ B)
Chứng minh:
Gọi N : là số phần tử của khơng gian mẫu E
n
1
: là số phần tử của (A - B)
n
2
: là số phần tử của (A∩B)
n
3
: là số phần tử của (B - A)
A
B
n
1
n
2
n
3
E
Cao Hào Thi 5
n(A ∪ B) = n
1
+ n
2
+ n
3
= n
1
+ n
2
+ n
2
+ n
3
- n
2
= n(A) + n(B) - n(A ∩ B)
Do đó : n( A ∪ B)/N = n(A)/N + n(B)/N - n(A ∩ B )/N
P(A
∪ B) = P(A) + P(B) - P(A ∩ B)
Ghi chú :
Nếu A và B là 2 biến cố cách biệt, ta có:
A ∩ B = φ => P(A ∩ B) = P(φ) = 0
==> P (A
∪ B) = P(A) + P(B)
b) Xác suất của biến cố phụ (biến cố đối lập)
Biến cố phụ của biến cố A trong không gian mẫu E là
A : P(A) + P ( A ) = 1
Chứng minh:
A∪ A = E
P (A∪ A ) = P(E)
P(A) + P( A ) - P(A ∩ A ) = 1 vì P(A∩ A ) = P(φ) = 0
1.2.4. Công thức nhân về xác suất :
a) Xác xuất có điều kiện :
Gọi P (B / A) là xác suất có điều kiện của biến cố B sau khi biến cố A đã thực hiện.
P(B/A) = P(A
∩ B)/ P(A) Với P(A) > 0 ; P(B) > 0
hay
P(A/B) = P(A ∩ B)/ P(B)
Chứng minh
:
• Gọi E là không gian mẫu chứa hai biến cố A,B
• Giả sử A thực hiện rồi thì A là biến cố chắc chắn, ta có thể chọn A làm không gian
mẫu thu gọn.
• Biến cố B thực hiện sau khi biến cố A xảy ra trở thành biến cố B/A.
• Trong không gian mẫu biến cố B/A thực hiện nếu và chỉ nếu A ∩ B thực hiện.
r
∈ B/A Ù r ∈ A ∩ B
A
B
A∩B
E
Cao Hào Thi 6
Theo định nghĩa, ta có:
)A(P
)BA(P
N
)A(n
N
)BA(n
)A(n
)BA(n
)A/B(P
∩
=
∩
=
∩
=
b) Công thức nhân về xác suất:
Cho hai biến cố A và B trong không gian mẫu E, xác suất của biến cố giao được tính:
P(A∩B) = P(B/A) * P(A) hay P(A∩B) = P(A/B) * P(B)
c) Biến cố độc lập :
Biến cố gọi là độc lập với biến cố A về phương diện xác suất nếu xác suất của biến cố B
không thay đổi cho dù biến cố A đã xảy ra, nghĩa là:
P(B/A) = P(B) ngược lại: P(A/B) = P(A)
Trong trường hợp hai biến cố độc lập, công thức nhân trở thành:
P(A∩B) = P(A) * P(B)
1.2.5. Công thức xác suất đầy đủ - Công thức Bayes
a) Công thức xác suất đầy đủ :
Giả sử biến cố B xảy ra khi và chỉ khi một trong các biến cố của hệ đầy đủ cách biệt nhau
từng đôi một A
1
, A
2
…, A
k
xảy ra.
Biết xác suất P(A
i
) và P(B/A
i
) hãy tìm P(B)
E A
k
A
2
A
1
B
B∩A
1
B∩A
2
B
∩
A
k
Cao Hào Thi 7
Theo giả thiết bài toán thì
B = (B ∩ A
1
) ∪ (B ∩ A
2
) ∪ … ∪ (B∩A
k
)
P(B)= P[(B∩A
1
) ∪ (B∩A
2
) ∪…∪ (B∩A
k
)] = P(B∩A
1
) + P(B∩A
2
) + … + P(B∩A
k
)
Vì: P(B∩A
i
) = P(B/A
i
) * P(A
i
)
P(B) =
∑
=
k
i
ii
)A(P*)A/B(P
1
Công thức này được gọi là công thức xác xuất đầy đủ.
Ví dụ:
Trong nhà máy có 4 phân xưởng. Phân xưởng I sản xuất chiếm 1/3 tổng sản lượng của
nhà máy; Phân xưởng II chiếm 1/4; Phân xưởng III chiếm 1/4; Phân xưởng IV chiếm 1/6.
Tỷ lệ phế phẩm tương ứng với các phân xưởng là 0,15; 0,08; 0,05; 0,01.
Tìm xác suất để lấy ngẫu nhiên một sản phẩm trong kho sản phẩm của nhà máy thì sản
phẩm đó là phế phẩm
Giải :
Gọi A
1
, A
2
, A
3
, A
4
là biến cố lấy đúng một sản phẩm của phân xưởng I,II,III,IV.
Gọi B là biến cố lấy được một phế phẩm
B = (B∩A
1
) ∪ (B∩A
2
) ∪ (B∩A
3
) ∪ (B∩A
4
)
==> P(B) =
∑
=
4
1i
ii
)A(P*)A/B(P
Theo đề bài:
P(A
1
) = 1/3, P(A
2
) = 1/4, P(A
3
)= 1/4, P(A
4
) = 1/6,
∑
=1)Ai(P
P(B/A
1
) = 0,15, P(B/A
2
) = 0,08, P(B/A
3
) = 0,05, P(B/A
4
) = 0,01
Vậy P(B) =1/3 * 0,15 + 1/4 * 0,08 + 1/4 * 0,05 + 1/6 * 0,01 = 0,0816
b) Công thức Bayes:
Giải bài toán ngược của bài toán trên, tức là biết các P(A
i
), P(B/A
i
) và biến cố B đã xảy
ra, tìm P(A
i
/B)
Ta có : B = (B
∩A
1
) ∪ (B∩A
2
) ∪ (B∩A
3
) ∪ (B∩A
4
)
và P(A
i
∩B) = P(A
i
/B) * P(B) = P(B/A
i
) * P(A
i
)
P(A
i
/B) =
P(B)
)P(A*)P(B/A
ii
P(A
i
/B) =
∑
=
k
i
ii
ii
)P(A * )P(B/A
)P(A*)P(B/A
1
Cao Hào Thi 8
Công thức này được gọi là công thức Bayes, hay công thức xác suất các giả thiết về các
biến cố A
i
có thể xem như giả thiết theo đó biến cố B xuất hiện. Ta phải tính xác suất của
các giả thiết với điều kiện biến cố B xuất hiện.
Ví dụ:
Xét lại thí dụ 2.2, cũng với giả thiết đó bây giờ ta yêu cầu xác suất để lấy một sản phẩm
của phân xưởng thứ nhất biết nó là một phế phẩm.
Ta phải tìm P(A
1
/B)
P(A
1
/B) = [P(B/A
1
) * P(A)]/P(B) = [0,15 * 1/3]/0,0816 = 0,61
1.2.6. Công thức Bernoulli :
a) Công thức Bernoulli :
Nếu tiến hành những phép thử độc lập, trong mỗi phép thử xác suất hiện của biến cố A
như nhau và bằng p thì xác suất để biến cố A xuất hiện k lần trong n phép thử đó được
biểu diễn bằng công thức Bernoulli
P
n
(k) = C
n
k
p
k
q
n-k
Với q = 1-p
Ghi chú :
a. Trong trường hợp biến cố A xuất hiện từ k
1
đến k
2
lần trong n phép thử thì ta ký hiệu
xác xuất đó là P
n
(k
1
,k
2
)
Gọi A
ki
là biến cố A xuất hiện k
i
lần
A = A
ki
∪ A
k1+1
∪…∪ A
k2
P
n
(k
1
,k
2
) = P(A) =
∑
=
−
2
1
k
ki
inii
n
qpC
b. Khi n và k khá lớn việc tính toán P
n
(k) và P
n
(k
1
, k
2
) sẽ phức tạp. Để khắc phục điều đó
người ta phải tìm cách tính gần đúng các xác suất đó bằng cách áp dụng các định lý
giới hạn.
Ví dụ:
Trong thùng có 30 bi: 20 trắng và 10 đen. Lấy liên tiếp 4 bi, trong đó mỗi bi lấy ra đều
hoàn lại thùng trước khi lấy bi tiếp theo và các bi đều được trộn lại. Hỏi xác suất để trong
4 bi lấy ra có 2 bi trắng.
Giải:
Xác suất lấy được bi trắng p = 20/30 =2/3 có thể xem như nhau trong 4 phép thử:
q = 1 - p = 1/3
áp dụng công thức Bernoulli
P
4
(2) = C
4
2
p²q
(4-2)
=
27
8
3
1
30
2
21
34
22
=
⎟
⎠
⎞
⎜
⎝
⎛
⎟
⎠
⎞
⎜
⎝
⎛
*
*
≈ 0,3
Ví dụ:
Cao Hào Thi 9
Xác suất xuất hiện biến cố A bằng 0,4. Hỏi xác suất để trong 10 phép thử biến cố A xuất
hiện không quá 3 lần.
Giải:
p = 0.4, q = 0.6
Xác suất để biến cố A xuất hiện 0 lần : P
10
(0) = q
10
Xác suất để biến cố A xuất hiện 1 lần : P
10
(1) = 10pq
9
Xác suất để biến cố A xuất hiện 2 lần : P
10
(2) = 45p
2
q
8
Xác suất để biến cố A xuất hiện 3 lần : P
10
(3) = 120p
3
q
7
Xác suất để biến cố A xuất hiện không quá 3 lần
P
10
(0,3) = P
10
(0) + P
10
(1) + P
10
(2) + P
10
(3) ≈ 0.38
Ghi chú:
• Chỉnh hợp A
p
n
=
p)!-(n
n!
•
Tổ hợp C
p
n
=
p)!-(np!
n!
•
Hoán hợp p
n
= C
n
n
= n! = n* (n - 1) * ( n - 2) * …. 3 * 2 * 1
b) Số lần xuất hiện chắc chắn nhất:
Trị số của P
n
(k) nói chung phụ thuộc vào k. Ta tìm một số k
0
sao cho P
n
(k
0
) đạt giá trị lớn
nhất. Số k
0
gọi là số lần xuất hiện chắc chắn nhất của biến cố A trong n phép thử. Ta có:
np-q ≤ k
0
≤ np + p p ≠ 0 và p ≠ 1
Ví dụ:
Xác suất bắn trúng đích của một người bằng 0,7. Nếu người đó bắn 25 phát. Xác định số
lần có khả năng trúng đích nhất.
Giải :
n = 25, p = 0,7, q = 0,3
np - q ≤ k
0
≤ np + p
25 * 0,7 – 0,3 ≤ k
0
≤ 25 * 0,7 + 0,7
17,2 ≤ k
0
≤ 18,2
Vì k là số nguyên, nên chọn k = 18
c) Các công thức gần đúng để tính P
n
(k) và P
n
(k
1
,k
2
)
Các công thức được rút ra từ các định lý giới hạn.
Công thức Moixre - Laplace :
P
n
(k) ≈ ϕ(x
k
)/
npq
•
Công thức Moixre - Laplace được sử dụng khi n khá lớn
Cao Hào Thi 10
• p là xác suất của biến cố A trong phép thử Bernoulli, p không quá gần 0 và 1
x
k
= (k-np)/
npq
ϕ(x) = 1 /
2
π
* e
-x²/2
: hàm số Gauss
x
y
f(x)/
2
π
Ví dụ:
Xác suất để sản xuất ra một chi tiết loại tốt là 0.4. Tìm xác suất để trong 26 chi tiết sản
xuất ra thì có 13 chi tiết loại tốt.
Vấn đề là tìm P
26
(13)
n = 26
p = 0.4
q = 0.6
x
k
= (k - np)/ npq = 1,04
ϕ(x
k
) = ϕ(1,04) = 0,2323
P
26
(13) = ϕ(x
k
) /
npq
= 0,2323/2,5 = 0,093
P
n
(k
1
, k
2
) ≈ ∅ (β) - ∅ (α)
∅(x)
1/2
0
-1/2
α = (k
1
- np)/ npq
Cao Hào Thi 11
β = (k
2
- np)/ npq
∅(x) = 1/
2
0
π
x
∫
e
-x²/2
dx : hàm Laplace chuẩn
Ví dụ:
Một phân xưởng sản xuất bóng đèn đạt trung bình là 70% sản phẩm loại tốt. Tìm xác suất
để trong 1000 bóng đèn có từ 652 đèn 760 bóng đèn loại tốt.
Xác suất phải tìm là P
1000
(652, 760)
n = 1000, p = 0,7 q = 0,3 k
1
= 652 k
2
= 700
α = (k
1
- np)/ npq = - 3,31 => ∅ (α) = ∅(-3,31) = - 0,499520
β = (k
2
- np)/ npq = 4,14 => ∅ (β) = ∅(4,14) = 0,499968
P
1000
(652, 760) = ∅ (β) - ∅ (α) = 0,999488
Công thức Poisson
• Nếu n →
∞
và p → 0 sao cho np = λ (const) thì
P
n
(k) ≈ (e
-λ
λ
k
) / k!
•
Định lý Poisson cũng có thể dùng để tính gần đúng P
n
(k
1
,k
2
)
P
n
(k
1
, k
2
) =
∑∑
==
−
≈
2
1
2
1
!
n
(k)P
k
kk
k
e
k
kk
k
λ
λ
Ví dụ:
Tổng sản phẩm của xí nghiệp A trong 1 quí là 800. Xác xuất để sản xuất ra một phế phẩm
là 0.005. Tìm xác suất để cho :
1. Có 3 sản phẩm là phế phẩm
2. Có không quá 10 sản phẩm bị hỏng
Giải:
n =800, p = 0,005 => λ = np = 4
1.
P
800
(3) = e
-4
4³/3! = 0,1954
2.
P
800
(0,10) =
k =
∑
0
10
e
-4
4
k
/k! = 0, 997
Cao Hào Thi 13
Chương 2
THỐNG KÊ
Thống kê là một khoa học có mục đích thu thập, xếp đặt và phân tích các dữ liệu về một
tập hợp gồm các phân tử cùng loại
2.1 TẬP HỢP CHÍNH VÀ MẪU (Population and Sample)
2.1.1 Tập hợp chính (tập hợp tổng quát, tổng thể)
Tập hợp chính là tập hợp tất cả các đối tượng mà ta quan tâm nghiên cứu trong một vấn
đề nào đó. Số phần tử của tập hợp chính được ký hiệu là N.
2.1.2 Mẫu
Mẫu là tập hợp con của tập hợp chính. Mẫu gồm một số hữu hạn n phần tử. Số n được gọi
là cỡ mẫu:
Tập hợp chính = {x
1
,x
2
…x
N
}
Mẫu = {x
1
,x
2
…x
n
}
2.1.3 Cách chọn mẫu
Có nhiều cách chọn mẫu khác nhau, nhưng nguyên tắc quan trọng nhất là làm sao mẫu
phải phản ảnh trung thực tập hợp chính.
Các cách chọn mẫu thường dùng:
• Chọn mẫu ngẫu nhiên : đó là cách chọn n phần tử từ tập hợp chính N phần tử sao cho
mỗi tổ hợp trong
n
N
C tổ hợp đều có cùng khả năng được chọn như nhau.
• Cách chọn máy móc.
• Cách chọn phân lớp
• Cách chọn hàng loạt
• Cách chọn kết hợp (nhiều bậc)
2.2 BẢNG KÊ VÀ BIỂU ĐỒ
Để mô tả các dữ liệu một cách cụ thể ta dùng bảng kê và các biểu đồ.
2.2.1 Bảng kê (Table)
• Xếp đặt các dữ liệu vào một bảng theo một qui tắc nào đó ta được một bảng kê.
• Bảng kê thường bắt đầu bằng tiêu đề và chấm dứt bằng một xuất xứ.
+ Tiêu đề : Mô tả đơn giản nội dung của bảng kê
+ Xuất xứ : Ghi nguồn gốc các dữ liệu trong bảng kê.
Cao Hào Thi 14
Thí dụ:
Bảng 2.1: Diện tích các đại dương trên thế giới
Đại dương Diện tích (triệu km²)
Thái Bình Dương
Đại Tây Dương
Ấn Độ Dương
Nam Băng Dương
Bắc Băng Dương
183
106,7
73,8
19,7
12,4
nguồn : Liên Hiệp Quốc
2.2.2 Biểu đồ
Để có ấn tượng rõ và mạnh hơn về dữ liệu người ta trình bày dữ liệu bằng các biểu đồ:
a) Biểu đồ hình thanh (Bar chart)
Biểu đồ hình thanh dọc Biểu đồ hình thanh ngang
b) Biểu đồ hình gẫy khúc (Line Chart)
Biểu đồ này thích hợp với việc biểu diễn một sự liên hệ giữa hai đại lượng với nhau:
Dieän tích (trieäu km²)
183
106.7
73.8
19.7
12.4
0 50 100 150 200
TBD
DTD
ADD
NBD
BBD
Dieän tích (trieäu km²)
183
106.7
73.8
19.7
12.4
0
50
100
150
200
TBD DTD ADD NBD BBD
Cao Hào Thi 15
18.5
19
19.5
20
20.5
21
21.5
22
22.5
23
23.5
123456789101112
Nhiệt độ trung bình tại Đà Lạt năm 1969
c) 2.2.2.3 Biểu đồ hình tròn (Pie Chart)
Dieän tích (%)
TBD
DTD
ADD
NBD
BBD
Biểu đồ hình tròn là một vòng tròn chia thành nhiều hình quạt. Cả hình tròn tượng trưng
toàn thể đại lượng, mỗi hình quạt tương trưng một thành phần mà góc ở tâm tỷ lệ với số
dữ kiện thuộc thành phần đó.
2.3 TẦN SỐ
• Nếu mỗi biến cố sơ đẳng A thuộc tập hợp biến cố ω nào đấy có thể đặt tương ứng với
một đại lượng xác định X = X(A), thì X được gọi là một biến ngẫu nhiên. Biến ngẫu
nhiên X có thể xem như hàm của biến cố A với miền xác định là ω.
• Các biến ngẫu nhiên được ký hiệu bằng các chữ lớn X,Y,Z … còn các giá trị c
ủa
chúng được ký hiệu bằng các chữ nhỏ x,y,z…
• Biến ngẫu nhiên được chia ra là biến ngẫu nhiên rời rạc và biến ngẫu nhiên liên tục.*
*
- Nếu các giá trị mà biến ngẫu nhiên X cho trước có thể lập thành dãy số rời rạc các số x
1
,x
2
…,x
n
(dãy
hữu hạn hay vô hạn) thì chính biến ngẫu nhiên X được gọi là biến ngẫu nhiên rời rạc.
- Nếu các giá trị mà biến ngẫu nhiên X cho trước có thể lấp đầy toàn bộ khoảng hữu hạn hay vô hạn
[a,b] của trục số thì biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục.
Cao Hào Thi 16
2.3.1 Tần số (Frequency)
• Gọi x
i
là các giá trị quan sát được của biến ngẫu nhiên X (i = 1,2,…l)
• Số lần xuất hiện của giá trị x
i
trong khối dữ liệu được gọi là tần số của x
i
và được ký
hiệu là f
i
.
nf
l
i
i
=
∑
=1
với n là cỡ mẫu
2.3.2 Tần số tương đối (Relative frequency, tần suất)
Tỉ số giữa tần số f
i
và cỡ mẫu n gọi là tần số tương đối
n
f
i
n
f
W
i
i
=
1
1
=
∑
=
l
i
Wi
2.3.3 Tần số tích lũy (Cumulative Frequency)
Tần số tích lũy của một giá trị x
i
là tổng số tần số của giá trị này với tần số của các giá trị
nhỏ hơn x
i
.
2.3.4 Bảng phân phối tần số
Bảng phân phối tần số là bảng thiết lập sự tương quan giữa các giá trị x
i
của biến ngẫu
nhiên X và các tần số của x
i
. Tùy thuộc vào loại tần số ta có:
• Bảng phân phối tần số
• Bảng phân phối tần số tương đối (Bảng phân phối thống kê)
• Bảng phân phối tần số tích lũy.
Thí dụ:
• Bảng phân phối tần số tương đối của biến ngẫu nhiên rời rạc.
X x
1
x
2
x
3
… x
l
W
i
w
1
w
2
w
3
… w
l
• Bảng phân phối tần số của biến ngẫu nhiên liên tục.
X
[ξ
o
, ξ
1
) [ξ
1
, ξ
2
) [ξ
2
, ξ
3
)
…
[ξ
l-1
, ξ
l
)
f
i
f
1
f
2
f
3
f
l
2.3.5 Đa giác phân phối và biểu đồ tổ chức
a) Đa giác phân phối
Đối với biến ngẫu nhiên rời rạc, để dễ nhận biết người ta trình bày phân phối thống kê của
biến ngẫu nhiên rời rạc dưới dạng đa giác phân phối. Muốn vậy, ta biểu diễn các điểm
liên tiếp (x
1
,w
1
),(x
2
,w
2
)…(x
l
,w
l
) trên mặt phẳng tọa độ và nối chúng bằng các đoạn thẳng.
Cao Hào Thi 17
x1 x2 xi xl
b) Biểu đồ tổ chức
Là biểu đồ thiết lập sự liên hệ giữa tần số (hay tần số tương đối) và các khoảng chia mà
các giá trị của biến ngẫu nhiên rơi vào đó.
X
[ξ
o
, ξ
1
) [ξ
1
, ξ
2
)
…
[ξ
i-1
, ξ
i
) [ξ
l-1
, ξ
l
)
f
i
f
1
f
2
… f
i
f
l
y
i
= f
i
/h
h =
ξ
i
- ξ
i-1
= Const
S
i
= y
i
* h = f
i
S
i
= f
i
Ghi chú :
Đối với tần số tương đối y
i
= w
i
/h
i
và S
i
= W
i
y y
i
f
i
/h
0
ξ ξ
i-1
ξ
i
ξ
l-1
ξ
l
X
W
i
X
Cao Hào Thi 18
Thí dụ:
Trong kết quả của phép thử biến ngẫu nhiên X lấy các giá trị sau đây:
ξ
1
= 2 ξ
2
= 5 ξ
3
= 7 ξ
4
=1 ξ
5
=10
ξ
6
= 5 ξ
7
= 9 ξ
8
= 6 ξ
9
= 8 ξ
10
= 6
ξ
11
= 2 ξ
12
= 3 ξ
13
= 7 ξ
14
= 6 ξ
15
= 8
ξ
16
= 3 ξ
17
= 8 ξ
10
= 10 ξ
19
= 6 ξ
20
= 7
ξ
21
= 3 ξ
22
= 9 ξ
23
= 4 ξ
24
= 5 ξ
25
= 6
1. Lập bảng phân phối tần số:
2. Xây dựng bảng phân phối thống kê
3. Vẽ đa giác phân phối
Giải :
1. Cỡ mẫu n = 2, tần số f
i
và tần số tích lũyΣf
X 1 2 3 4 5 6 7 8 9 10
f
i
F
i
1 2 3 1 3 5 3 3 2 2
1 3 6 7 10 15 18 21 23 25
2.
X 1 2 3 4 5 6 7 8 9 10
W
i
=
n
f
i
0.04 0.08 0.12 0.04 0.12 0.2 0.12 0.12 0.08 0.08
Σ w
i
= 1
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
12345678910
w
X
Cao Hào Thi 19
2.4 SỐ ĐỊNH TÂM (Measure of Central Tendency)
Số định tâm của nhóm dữ liệu là số đại diện cho tất cả các dữ liệu đó, nó thể hiện vai trò
trung tâm của nhóm dữ liệu. Có các loại số định tâm sau: số trung bình (Mean), trung
bình trọng số (Weighted mean), số trung vị (Median) và số yếu vị (Mode).
2.4.1 Số trung bình (Mean, kỳ vọng)
a) Số trung bình của tập hợp chính (Population Mean)
N
x
N
i
i
∑
=
=
1
µ
b) Số trung bình của mẫu (Sample Mean)
n
x
x
n
i
i
∑
=
=
1
2.4.2 Số trung bình trọng số (Weighted Mean)
∑
∑
=
=
=
N
i
i
N
i
ii
w
xw
1
1
.
µ
w
i
: trọng số
2.4.3 Số trung vị (Median)
• Số trung vị của khối Dữ liệu là số mà phân nửa giá trị quan sát được của khối Dữ liệu
nhỏ hơn nó và phân nữa giá trị quan sát lớn hơn nó.
• Gọi n là số giá trị quan sát được (đối với biến ngẫu nhiên rời rạc)
9 Nếu n là số lẻ thì số trung vị là số có thứ tự (n+1)/2. Nó chính là số có vị trí ở giữa
khối Dữ liệu.
9 Nếu n là số chẵn thì số trung vị là trung bình cộng của hai số có thứ tự
2
n
và
2
n
+1
2.4.4 Số yếu vị (Mode)
Số yếu vị của khối Dữ liệu là số có tần số lớn nhất
Thí dụ:
Cho khối dữ kiện
0 1 0 2 5 2 5 2 3 3 5 6 4
Tìm số trung bình, số trung vị và số yếu vị của khối Dữ liệu.
Giải :
Cao Hào Thi 20
Ta có bảng phân phối tần số :
X 0 1 2 3 4 5 6
Tần số f
i
2 1 3 2 1 3 1
Số trung bình (Mean)
X =
∑
∑
=
=
7
1
7
1
i
i
i
ii
f
xf
=
923,2
13
61534132231102
=
++++++ xxxxxxx
Số trung vị (Median): Cỡ mẫu n = 13 lẻ => (n+1)/2 = 7
0 0 1 2 2 2 3 3 4 5 5 5 6
⇒ Số trung vị là số có thứ tự 7, nghĩa là số trung vị là 3
Số yếu vị là 2 và 5 có tần số lớn nhất là 3
Số trung vị, số yếu vị không bị lệ thuộc vào các Dữ liệu có trị số thái quá.
2.5 SỐ PHÂN TÁN (Measure of Dispersion)
Số phân tán dùng để thể hiện sự khác biệt giữa các số trong dữ liệu đối với số định tâm.
2.5.1 Phương sai (Variance)
a) Phương sai của tập hợp chính (Population Variance)
2
1
2
1
2
2
)(
µ
µ
σ
−=
−
=
∑∑
==
N
x
N
x
N
i
i
N
i
i
b) Phương sai của mẫu (Sample Variance)
1
)(
1
2
2
−
−
=
∑
=
n
xx
S
n
i
i
2.5.2 Độ lệch chuẩn (Standard Deviation)
a) Độ lệch chuẩn của tập hợp chính (Population Standard Deviation)
()
∑
µ−=σ=σ
2
2
1
i
x
N
b) Độ lệch chuẩn của mẫu (Sample Standard Deiation)
Cao Hào Thi 21
∑
−
−
==
22
)(
1
1
xx
n
ss
i
c) Ý nghĩa của độ lệch chuẩn s
Qui tắc kinh nghiệm (Empirical Rule for Standard Desiation)
Đối với một khối dữ liệu, sẽ có hơn 90% các giá trị của Dữ liệu ở trong khoảng µ±3 s
Qui tắc Tchebycher (Tchebycher’s Rule)
Đối với khối Dữ liệu của tập hợp chính có số trung bình là µ và độ lệch chuẩn s, sẽ có
ít nhất 100(1 - 1/m²)% giá trị của dữ liệu nằm trong khoảng µ ± ms
m 1,5 2 2,5 3
100(1-1/m²)% 55,6% 75% 84% 88,9%
Qui tắc đối với khối dữ liệu có phân bố hình chuông (Rule for Bell Shaped Data)
Đối với khối dữ liệu có dạng phân bố hình chuông thì :
9 Khoảng 68% các giá trị của dữ liệu nằm ở khoảng µ ± s
9 Khoảng 95% các giá trị của dữ liệu nằm ở khoảng µ ± 2 s
9 Khoảng 100% các giá trị của dữ liệu nằm ở khoảng µ ± 3s
68%
95%
µ+σµ−σ
µ
µ+2σ
µ−2σ
2.5.3 Hàng số (khoảng, Range)
Trong một khối dữ liệu, hàng số là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất.
Thí dụ :
Hàng số của khối dữ liệu 6, 7, 9, 3, 5, 2 là 9 – 2 = 7
2.5.4 Hàng số tứ phân (Interquartile Range)
a) Số tứ phân
Trong 1 khối dữ liệu xếp thứ tự lớn dần, các số tứ phân là các số Q
1
, Q
2
, Q
3
chia khối
dữ liệu lần lượt thành 4 phần có tần số bằng nhau.
Cao Hào Thi 22
Q
1
Q
2
Q
3
N/4 N/2 3N/4 N
Nhận xét: Q
2
là số trung vị (median)
b) Hàng số tứ phân
Là hiệu số Q
3
- Q
1
c) Độ lệch tứ phân
Là phân nửa của hàng số tứ phân: Q = (Q
3
-Q
1
)/2
Thí dụ :
Cho khối dữ liệu xếp theo thứ tự lớn dần
1 1 2
3
3 3 5
5
6 6 7
9
10 11 11
Số tứ phân thứ 1 là Q
1
= 3
Số tứ phân thứ 2 là Q
2
= 5
Số tứ phân thứ 3 là Q
3
= 9
Hàng số tứ phân là Q
3
- Q
1
= 9 - 3 = 6
Độ lệch tứ phân Q = (Q
3
- Q
1
)/2 = (9-3)/2 = 3
Cao Hào Thi 22
Chương 3
RA QUYẾT ĐỊNH TRONG QUẢN LÝ
3
3.1 GIỚI THIỆU VỀ RA QUYẾT ĐỊNH TRONG QUẢN LÝ:
3.1.1 Tổng Quát
Trong cuộc sống hằng ngày, mỗi người trong chúng ta đều phải ra không biết bao nhiêu
quyết định liên quan đến các sinh hoạt cá nhân từ ăn gì, uống gì, mặc gì, làm gì, khi nào,
ở đâu, với ai đó là các quyết định rất bình thường. Nội dung chương này muốn đề cập đến
các quyết định trong quản lý.
Vai trò đặc trưng chung của nhà quản lý là trách nhiệm ra quyết định , từ các quyết định
quan trọng như phát triển một loại sản phẩm mới, giải thể công ty đến các quyết định
thông thường như tuyển nhân viên, xác định kế hoạch sản xuất hàng tháng, hàng quí. Ra
quyết định thâm nhập vào cả bốn chức năng của nhà quản lý gồm hoạch định, tổ chức, chỉ
đạo và kiểm tra, vì vậy nhà quản lý đôi khi còn được gọi là người ra quyết định
Các quyết định liên quan đến bốn chức năng quản lý thường có thể thấy qua các ví dụ
sau:
Hoạch định:
- Mục tiêu dài hạn của công ty là gì ?
- Nên theo chiến lược nào để đạt đến mục tiêu ?
Tổ chức :
- Nên chọn cấu trúc tổ chức nào ?
- Nên tập trung thẩm quyền đến mức nào ?
- Ai làm việc gì, Ai báo cáo cho ai ?
Chỉ đạo:
- Nên theo kiểu lãnh đạo nào?
- Làm thế nào để động viên nhân viên hiệu quả?
Kiểm tra:
- Cần kiểm tra ở những khâu nào, khi nào, bằng cách nào?
- Ai chịu trách nhiệm kiểm tra?
3.1.2 Định nghĩa
Ra quyết định ở một quá trình lựa chọn có ý thức giữa hai hoặc nhiều phương án để chọn
ra một phương án và phương án này sẽ tạo ra được một kết quả mong muốn trong các
điều kiện ràng buộc đã biết.
Cao Hào Thi 23
Lưu ý rằng, nếu chỉ có một giải pháp để giải quyết vấn đề thì không phải là bài toán ra
quyết định. Và cũng cần lưu ý rằng, phương án “Không làm gì cả” (do nothing) cũng là
một phương án, đôi khi đó lại là phương án được chọn.
3.1.3 Giả thuyết về sự hợp lý
Trước khi nghiên cứu quá trình ra quyết định của các nhà quản lý, cần phải thông hiểu
một giả thuyết quan trọng ẩn chứa trong quá trình. Đó là giả thiết về "sự hợp lý".
Giả thiết về sự hợp lý cho rằng các quyết định được đưa ra là kết quả của một sự lựa chọn
có lập trường và với mục tiêu là tối ưu (cực đại hay cực tiểu) một giá trị nào đó trong
những điều kiện ràng buộc cụ thể.
Theo giả thuyết này, Người ra quyết định hoàn toàn khách quan, có logic, có mục tiêu rõ
ràng và tất cả hành vi trong quá trình ra quyết định dựa trên một lập trường duy nhất
nhằm được mục tiêu cực trị một giá trị nào đó đồng thời thỏa mãn các điều kiện ràng
buộc.
Cụ thể hơn, quá trình ra quyết định hợp lý được dựa trên các giả thuyết sau:
- Người ra quyết định có mục tiêu cụ thể.
- Tất cả các phương án có thể có đều được xác định đầy đủ.
- Sự ưa thích của người ra quyết định cần phải rõ ràng, cần lượng hóa các tiêu chuẩn
của các phương án và xếp hạng các tiêu chuẩn theo thứ tự ưa thích của người ra
quyết định.
- Sự ưa thích của người ra quyết định là không thay đổi trong quá trình ra quyết định,
nghĩa là các tiêu chuẩn và trọng số của các tiêu chuẩn là không đổi.
- Không có sự hạn chế về thời gian và chi phí, nghĩa là có đủ điều kiện để thu nhập
đầy đủ thông tin trước khi ra quyết định.
- Sự lựa chọn cuối cùng sẽ là tối ưu mục tiêu mong muốn
3.2 CÁC LOẠI RA QUYẾT ĐỊNH TRONG QUẢN LÝ
Loại vấn đề mà người ra quyết định gặp phải là một yếu tố quan trọng trong quá trình ra
quyết định. Ra quyết định trong quản lý được phân loại dựa trên hai cơ sở : Cấu trúc của
vấn đề và tính chất của vấn đề.
3.2.1 Ra quyết định theo cấu trúc của vấn đề
Theo cấu trúc của vấn đề người ta chia vấn đề làm hai loại:
- Vấn đề có cấu trúc tốt : Khi mục tiêu được xác định rõ ràng thông tin đầy đủ, bài
toán có dạng quen thuộc
Ví dụ: Bài toán quyết định thưởng/phạt nhân viên
- Vấn đề có cấu trúc kém: Dạng bài toán mới mẽ, thông tin không đầy đủ, không rõ
ràng
Ví dụ: Bài toán quyết định chiến lược phát triển của công ty
Cao Hào Thi 24
Thông thường, các vấn đề có cấu trúc tốt có thể được phân quyền cho các nhà quản lý cấp
dưới ra quyết định theo những tiêu chuẩn và các hướng dẫn đã được lập sẵn. Còn các nhà
quản lý cấp cao trong tổ chức sẽ dành nhiều thời gian cho các vấn đề có cấu trúc kém. Do
vậy tương ứng với hai loại vấn đề sẽ có hai loại ra quyết định: Ra quyết định theo chương
trình và ra quyết định không theo chương trình.
- Ra quyết định theo chương trình :
Nhằm giải quyết các bài toán cấu trúc tốt, lặp đi lặp lại, các phương án hầu như có
sẵn, lời giải thường dựa trên các kinh nghiệm. Thường để giải quyết bài toán dạng
này, các nhà quản lý lập ra các quy trình, luật hay chính sách :
o Quy trình (procedure): Bao gồm một chuỗi các bước có liên quan nhau mà
người ra quyết định có thể sử dụng để xử lý các bài toán cấu trúc tốt .
o Luật (Rule): Là phát biểu cụ thể hướng dẫn người ra quyết định nên làm điều gì
và không nên làm điều gì.
o Chính sách (Policy): Là các hướng dẫn để định hướng cho người ra quyết định
trong việc giải quyết vấn đề. Khác với luật, chính sách thường là những khái
niệm chung chung để cho người ra quyết định tham khảo hơn là những điều
buộc người ra quyết định phải làm.
- Ra quyết định không theo chương trình:
Nhằm giải quyết các bài toán cấu trúc kém, các vấn đề mới, đơn chiếc không lặp đi
lặp lại, thông tin không rõ ràng.
Trong thực tế có nhiều bài toán ở dạng trung gian giữa hai loại vấn đề trên.
3.2.2 Ra quyết định theo tính chất của vấn đề
Theo tính chất của vấn đề, có thể chia quyết định làm ba loại :
- Ra quyết định trong điều kiện chắc chắn (cetainty): Khi ra quyết định, đã biết chắc
chắn trạng thái nào sẽ xảy ra , do đó sẽ dễ dàng và nhanh chóng ra quyết định.
- Ra quyết định trong điều kiện rủi ro (risk): Khi ra quyết định đã biết được xác suất
xảy ra của mỗi trạng thái.
- Ra quyết định trong điều kiện không chắc chắn (uncertainty): Khi ra quyết định,
không biết được xác suất xảy ra của mỗi trạng thái hoặc không biết được các dữ liệu
liên quan đến các vấn đề cần giải quyết.
3.3 QUÁ TRÌNH RA QUYẾT ĐỊNH TRONG QUẢN LÝ
3.3.1 Các bước của quá trình ra quyết định
Quá trình ra quyết định thường được tiến hành theo sáu bước:
Bước 1: Xác định rõ vấn đề cần giải quyết.
Bước 2: Liệt kê tất cả các phương án có thể có.
Bước 3: Nhận ra các tình huống hay các trạng thái.
Bước 4: Ước lượng tất cả lợi ích và chi phí cho mỗi phương án ứng với mỗi trạng thái.
Bước 5: Lựa chọn một mô hình toán học trong PP định lượng để tìm lời giải tối ưu.
Bước 6: Áp dụng mô hình để tìm lời giải và dựa vào đó để ra quyết định.