TÀI LIỆU HỌC TẬP
ÔN CAO HỌC
ĐẠI HỌC NGOẠI THƯƠNG
GIÁO TRÌNH
- PGS.TS Nguyễn Cao Văn (Cb), Giáo trình Lý thuyết
xác suất và Thống kê Toán, NXB Thống kê.
- PGS.TS Nguyễn Cao Văn (Cb), Bài tập Xác suất và
thống kê Toán, NXB Thống kê.
GIẢNG VIÊN: TS. Vương Thị Thảo Bình
Mobile: 0983466899
p. 2
Phần 1. Ôn tập về xác suất
Bổ trợ về đại số tổ hợp
-Quy tắc nhân: n = n1n2…nk
A
-Chỉnh hợp:
B
Ank =
n!
(n − k )!
P(n) = n!
- Hoán vị
- Tổ hợp Cnk =
C
Chương 1. Biến cố và xác suất của biến cố
Phép thử và biến cố
VD: Tung một con xúc xắc xuống đất là một phép thử.
Việc lật lên một mặt nào đó gọi là biến cố.
Biến cố chắc chắn
phép thử: tung một con xúc xắc cđ
Biến cố không thể có 6 bc sơ cấp: "xuất hiện 1 chấm",
"xh 2 chấm", ..., "xh 6 chấm"
Biến cố ngẫu nhiên BC "xuất hiện mặt có số chấm ≤ 6"
là biến cố ...........
BC "xuất hiện mặt có số chấm = 7"
là biến cố ..................
BC "xuất hiện mặt 1 chấm "
là biến cố ...................
n!
n( n − 1)...(n − k + 1)
=
k! (n − k )!
k!
- Chỉnh hợp lặp
Bnk = n k
p. 3
Mối quan hệ giữa các biến cố
a) Quan hệ kéo theo: kí hiệu A ⊂ B hoặc A⇒B
VD
Ω
A = “xuất hiện mặt 1 chấm ”
A
B
B = “xuất hiện mặt có số chấm lẻ”
b) Quan hệ tương đương: kí hiệu A = B
VD: A="xuất hiện mặt có số chấm là chẵn"
B= "xuất hiện mặt có số chấm chia hết cho 2"
Ω=U
c) Biến cố xung khắc
A
B
Ai= “xuất hiện mặt i chấm”
A1, A2 xung khắc
p. 5
p. 4
d) phép cộng (hợp): A+B hoặc A∪B
ĐN: C = A+B nếu C xảy ra khi
Ω
A
B
có ít nhất một trong hai bc A hoặc B xảy ra
C= A1+A2+…+An
VD1: Hai thợ săn cùng bắn vào một con thú.
A = "Người thứ nhất bắn trúng"
B = "Người thứ hai bắn trúng“ C = A + B =…….
VD2: Tung một con xúc xắc cđ, đchất. Gọi Ai là biến cố
xuất hiện mặt có i chấm, gọi A là biến cố xuất hiện mặt
có số chấm chẵn. Khi đó:
A = A2 + A4 + A6
? A, B có thể cùng xảy ra trong 1 phép thử không?
p. 6
1
e) Phép toán nhân (Giao): A.B hoặc A∩B
C = A.B nếu C xảy ra khi và chỉ khi
cả hai biến cố A và B cùng đồng thời xảy ra.
h) Biến cố đối: Hiệu U\A là bc đối của bc A, kí hiệu
Ω
A
B
VD1: Hai thợ săn cùng bắn vào một con thú.
A = "Người thứ nhất bắn trượt"
B = "Người thứ hai bắn trượt“
C = AB = ?
TQ: A1.A2…An
g) Hiệu của hai bc A và B: Kí hiệu A\B
VD: Gieo xx cđ, đch. B = "Xuất hiện mặt 3 chấm"
A = "Xuất hiện mặt có số chấm là bội của 3"
A\B = "Xuất hiện mặt 6 chấm"
p. 7
p. 8
Xác suất biến cố
• Một số tính chất
A+U=U
; A.U = A
A+V=A
; A.V = V
A+A=A
; A.A = A
A + B = B + A ; AB = BA
A+(B+C) = (A+B)+C
A.(BC) = (AB).C
A
i) Nhóm đầy đủ các bc xung khắc từng đôi:
Nhóm A1,...,An gọi là xktđ nếu 2 bc bất kỳ trong họ xk VD
Nhóm A1,...,An gọi là đầy đủ nếu A1+...+An = U VD tung xx
Nhóm A1,...,An gọi là nhóm bc đầy đủ và xktđ nếu
A1,...,An là nhóm đầy đủ và là nhóm xktđ
VD1: nhóm A và A
VD2: Tung xx....
; A + B = A. B
; A.B = A + B
; A(B+C) = AB + AC
;
Nếu A ⊂ B thì A.B = A, A+B = B.
A, B xung khắc ⇔ AB = φ
p. 9
Định nghĩa xác suất theo lối cổ điển
m Sè tr−êng hîp thuËn lîi cho A
=
n
Sè tr−êng hîp cã thÓ x¶ y ra
VD1: Gieo một con xúc xắc cân đối đồng chất. Tính
xác suất xuất hiện mặt chẵn.
VD2: Một lô hàng có 200 sản phẩm trong đó có 5 sản
phẩm xấu. Kiểm tra ngẫu nhiên 1 sản phẩm. Tính xác
suất để sản phẩm kiểm tra là tốt.
P ( A) =
Hạn chế:- đòi hỏi số kết cục đồng khả năng hữu hạn
- thực tế, nhiều khi không thể biểu diễn kết
quả của phép thử thành t/h bc duy nhất đồng kn
p. 10
Định nghĩa xác suất theo thống kê
ĐN tần suất: Thực hiện phép thử n lần.
Biến cố A xuất hiện m lần.
m gọi là tần số của biến cố A
f(A)=m/n được gọi là tần suất xuất hiện biến cố A
VD: Một xạ thủ bắn 1000 viên đạn vào bia. Có xấp xỉ
50 viên trúng bia. Khi đó XS để xạ thủ bắn trúng bia là:
ĐN: Cho số phép thử tăng lên vô hạn, tần suất xuất
hiện A dần về một số xác định gọi là xs của biến cố A.
VD: Tiến hành tung đồng tiền nhiều lần để khả năng
xuất hiện mặt sấp và thu được kết quả
m
P(A) = lim
n →∞ n
Về mặt thực tế, với n đủ lớn, ta có thể lấy P(A) ≈ f(A)
p. 11
50
= 5%
1000
Tên Số lần tung (n) Số lần xh sấp
(m)
A
4040
2048
B
12000
6019
C
24000
12012
Tần suất
f(A) = m/n
0,5069
0,5016
0,5005
p. 12
2
• Các tính chất của xác suất
a) A là bcnn thì 0 < P(A) < 1
b) U là bc chắc chắn thì P(U) = 1
c) V là bc không thể có thì P(V) = 0
Chú ý: MĐ đảo của b) và c) chưa chắc đã đúng:
- Một bc có XS bằng 1 chưa chắc là bc chắc chắn
- Một bc có XS bằng 0 chưa chắc là bc không thể có
Các định lý cộng, nhân xác suất
I) CT xs có điều kiện:
ĐN: XS của bc A được tính với đk bc B đã xảy ra gọi là
xs có đk của A, ký hiệu p(A/B)
VD: Trong bình có 5 T và 3 Đ. Lấy nn lần lượt ra hai
viên bi (không hoàn lại). Tìm XS để lần 2 lấy được viên
T biết lần 1 đã lấy được viên T.
.
p. 13
p. 14
CT xs có điều kiện:
P ( A | B) =
p ( AB)
,
p( B)
p( B) ≠ 0
VD: Một cỗ bài tây gồm 52 quân bài. Rút ngẫu nhiên ra
1 con. Tính xác suất để con bài rút ra là con 2 cơ trong
các trường hợp:
- Biết con bài rút ra là con màu đỏ
- Biết con bài rút ra là con 2
II) XS của tích các bc
ĐL: Xs của tích hai bc A và B bằng tích xs của một
trong hai bc đó với xs có điều kiện của hai bc còn lại
P(A.B) = P(A).P(B/A) = P(B).P(A/B)
Mở rộng:
P(A1A2...An) = p(A1).p(A2/A1). p(A3/A2A1)...p(An/A1...An-1)
VD: Một sinh viên đi thi chỉ thuộc 20 trong số 25 câu
hỏi đã quy định. Cứ 2 câu hỏi thành lập được 1 đề thi.
Tính xs để sv này trả lời được cả 3 câu hỏi trong đề.
p. 15
p. 16
III) XS của tích các bc độc lập
ĐN1 về bc đl:
ĐN2: Các bc A1, A2, ..., An được gọi là đl trong toàn bộ
nếu mỗi biến cố bất kì của hệ bc đã cho đều đl với giao
mọi tổ hợp có thể có của các bc còn lại trong hệ.
VD1: Trong bình có 3 T, 2 Đ. Lấy nn theo phương thức
có hoàn lại lần lượt ra hai quả.
A= “lần 1 lấy được cầu T”, B= “lần 2 lấy đc T”
Công thức XS:
A, B độc lập ⇔ P(AB) = P(A) . P(B)
VD2: Trong VD1, lấy nn không hoàn lại như trên
thì A, B phụ thuộc. Ta có: P(A) = 3/5,
P(B) = 1/2 nếu lần 1 lấy được cầu trắng
P(B) = 3/4 nếu lần 1 lấy được cầu đen
p. 17
A1, A2,...,An đl nhau ⇔ P(A1A2...An)=P(A1) P(A2)... P(An)
VD1:......
VD2:.....
p. 18
3
IV) XS của tổng các bc
P(A+B) = P(A) + P(B) – P(AB) với ∀ A, B
Hq:
A, B xk thì P(A+B) = P(A) + P(B)
VD1: Ba xạ thủ cùng bắn vào một mục tiêu một cách
độc lập với nhau. Xác suất bắn trúng đích của xạ thủ
thứ nhất, thứ hai và thứ ba tương ứng 0,6; 0,7; 0,8.
a) Tính xác suất để có đúng một xạ thủ bắn trúng.
b) Tính xác suất để có ít nhất một xạ thủ bắn trúng.
MR: p(A+B+C) = p(A)+p(B)+p(C)-p(AB)-p(AC)-p(BC)+
+ p(ABC)
Chú ý: Tính xs của tổng nhiều bc bất kỳ
n
⎛ n
⎞
p(∑ Ai ) = 1 − p ⎜ ∑ Ai ⎟ = 1 − p ( A1 A2 ... An )
⎜ i =1 ⎟
i =1
⎝
⎠
p. 19
Giải
Gọi Ai là biến cố "Xạ thủ thứ i bắn trúng"; i =1; 2; 3.
Ta có A1, A2, A3- là các biến cố độc lập.
a) Gọi A là biến cố "có đúng một xạ thủ bắn trúng".
A = A1.Ā2. Ā3 + Ā1.A2. Ā3 + Ā1. Ā 2.A3
P(A) = P(A1). P(Ā2). P(Ā3) + P(Ā1). P(A2) . P(Ā3) +
+ P(Ā1) . P(Ā2) . P(A3)
= 0,6 . 0,3 . 0,2 + 0,4 . 0,7 . 0,2 + 0,4 . 0,3 . 0,8 =
= 0,188.
p. 20
b) Gọi B là biến cố "có ít nhất một xạ thủ bắn trúng".
Ta có: B = A1 + A2 + A3 ⇒ B = Ā1. Ā2. Ā3
P( B ) = P(Ā1).P(Ā2).P(Ā3) = 0,4 . 0,3 . 0,2 = 0,024.
Vậy: P(B) = 1 - P( B ) = 1 - 0,024 = 0,976.
VD2: Một người làm thí nghiệm với các thí nghiệm
được tiến hành độc lập và xác suất mỗi thí nghiệm
thành công đều là 0,6. Hỏi người đó phải tiến hành bao
nhiêu thí nghiệm để với xác suất không bé hơn 0,9973
có thể kết luận rằng có ít nhất một thí nghiệm thành
công?
p. 21
Giải
Gọi A là biến cố " có ít nhất một thí nghiệm thành công".
Giả sử phải tiến hành n thí nghiệm.
Bk là biến cố "thí nghiệm thứ k thành công", k =1,2,..,n
A = B1 . B2 ....
Suy ra
. Bn
P( A )= (0,4)n.
Từ đó:
P(A) = 1 - (0,4)n. Do P(A) ≥ 0,9973
nên 1 - (0,4)n ≥ 0,9973 Giải ra ta được n ≥ 6,5
Vậy phải tiến hành 7 thí nghiệm.
p. 22
Công thức Bernoulli
•Phép thử độc lập
•Dãy phép thử Bernoulli:
n phép thử độc lập
XS để A xảy ra trong mỗi phép thử bằng p
•Công thức Bernoulli: XS để biến cố A xuất
hiện k lần trong dãy n phép thử Bernoulli:
•Pn(k) =
p. 23
Cnk p k (1 − p ) n − k
(k = 0, 1, ..., n)
p. 24
4
VD1: Một bác sĩ có xác suất chữa khỏi bệnh là 0,8. Có
người nói rằng cứ 10 người đến chữa thì chắc chắn có
8 người khỏi bệnh. Điều khẳng định đó có đúng không?
VD2: Bắn 5 viên đạn độc lập với nhau vào cùng một
bia, xác suất trúng đích các lần bắn như nhau và bằng
0,2. Muốn bắn hỏng bia phải có ít nhất 3 viên đạn bắn
trúng đích. Tìm xác suất để bia bị hỏng.
VD3: Trong phân xưởng có 5 máy hoạt động, XS để
trong ca mỗi máy bị hỏng đều bằng 0,1. Tìm XS để
trong ca đó có đúng 2 máy hỏng.
VD1: A = “Chữa khỏi bệnh cho 1 người” ⇒ P(A) = 0,8
⎧n = 10
B⎨
⎩ k =8
P10(8) = C108 0,8k 0,22 = 0,3108
Khẳng định trên sai
VD2: Gọi k là số đạn bắn trúng bia thì xS để bia bị
hỏng là:
P(k≥3) = P5(3) + P5(4) + P5(5)
VD3= P5(2) = C52 (0,1)2 (0,9)3
p. 25
p. 26
Công thức xác suất đầy đủ
•ĐN nhóm các biến cố đđủ xung khắc từng đôi
•ĐL: Giả sử H1, H2, ..., Hn là nhóm các biến cố
đầy đủ xung khắc từng đôi và A là biến cố bất kỳ
có thể xảy ra trong phép thử. Khi đó ta có
n
P ( A) = ∑ P ( H i ) . P ( A | H i )
i =1
p. 27
•ĐL: Giả sử H1, H2, ..., Hn là nhóm các biến cố đầy đủ
xung khắc từng đôi và A là biến cố bất kỳ có thể xảy ra
trong phép thử. Khi đó ta có
P ( H k ).P ( A / H k )
P ( H k ).P ( A / H k )
A) =
= n
P ( A)
∑ P ( H i ).P ( A H i )
i =1
•VD1: Một hộp có 4 sản phẩm tốt trộn lẫn với 2 sản
phẩm xấu. Lấy ngẫu nhiên lần lượt từ hộp ra hai sản
phẩm. Biết sản phẩm lấy ra ở lần hai là sản phẩm tốt.
Tìm xác suất để sản phẩm lấy ra ở lần thứ nhất cũng là
sản phẩm tốt.
p. 29
•VD2: Xn bút bi Thiên long có 3 phân xưởng sx. Px 1
sản xuất 50% sf của toàn XN, px 2 sx 30% sf của toàn
XN, px 2 sx 20% sf của toàn XN. Tỷ lệ PP tính trên px
1, 2, 3 tương ứng là 1%, 2%, 3%. Một sv mua 1 cây
bút bi TL
a) Tính XS mua phải cây viết xấu?
b) Biết rằng mua phải cây viết xấu, tính XS cây viết này
do phân xưởng 1 sản xuất?
p. 28
Công thức Bayes
P(H k
•VD1: Xét một lô sp trong đó số sp do nhà máy I sx
chiếm 20%, nhà máy II sx chiếm 30%, nhà máy 3 sx
chiếm 50%. Xác suất phế phẩm của nhà máy I là 0,001;
nhà máy II là 0,005; nhà máy III là 0,006. Tìm xác suất
để lấy ngẫu nhiên được đúng 1 phế phẩm.
Chương 2: Biến ngẫu nhiên
2.1. K/n biến ngẫu nhiên (BNN), phân loại BNN
2.2. Quy luật phân phối của BNN
2.2.1. Bảng phân phối xác suất
2.2.2. Hàm phân bố xác suất
2.2.3. Hàm mật độ xác suất
p. 30
5
2.1. K/n BNN, phân loại BNN
• BNN: Một biến số đuợc gọi là ngẫu nhiên nếu trong
kết qủa của phép thử nó sẽ nhận một và chỉ một trong
các giá trị có thể có của nó tuỳ thuộc vào sự tác động
của các nhân tố ngẫu nhiên.
Kí hiệu: X,Y,Z,U,V,T…
VD1: Tung một con xúc sắc.
Gọi X là số chấm xuất hiện.
X = 1, 2, 3, 4, 5, 6 với xác suất tương ứng là 1/6
⇒ X là BNN
•Phân loại BNN:
BNN rời rạc: là BNN mà các giá trị có thể có của nó
lập nên một tập hợp hữu hạn hoặc vô hạn đếm được.
VD: X là số chấm x/h khi tung xx: X=1,2,3,4,5,6
Y là số khách vào một cửa hàng trong 1 ngày
Y = 0,1,2,3, ... +∞
BNN liên tục: là BNN mà các giá trị có thể có của nó
lấp đầy một khoảng xác định trên trục số thực.
Đối với BNN liên tục, ta không thể liệt kê được hết
các giá trị có thể có của nó.
VD: X= ‘Tổng cầu của thị trường về xi măng’
Y ∈ (25 triệu tấn; 40 triệu tấn)
Y = ‘Lãi suất cổ phiếu của một công ty’
Y ∈ (5%; 20%)
p. 31
VD1: Tung 1 đồng xu sấp ngửa
Gọi X là số lần được mặt sấp. X là bnn?
VD2: Khảo sát số người vào siêu thị 1 ngày
Gọi X là số ng đến siêu thị trong ngày.
X là bnn?
p. 32
2.2. Quy luật phân phối của BNN
ĐN: Bất kỳ quy luật thiết lập sự tương ứng của BNN
và các xs tương ứng đều gọi là qlppxs của bnn ấy
2.2.1. Bảng phân phối xác suất
ĐN:
X x1 x2 … xi ... xn
Px p1 p2 … pi ... pn
VD3: Đo chiều cao của một người.
Gọi X là chiều cao của ng đó. X là bnn?
VD4: Hộp có 6 bi T, 2 bi Đ. Lấy nn ra 2 bi
Gọi X là số bi trắng lấy được. X là bnn?
b) T/c:
p. 33
Để lập được bảng ppxs ta phải làm gì?
VD1: Hai người cùng bắn vào một bia độc lập nhau.
XS bắn trúng tương ứng là 0,7 và 0,8.
Cho mỗi người bắn một viên đạn.
Lập bảng PPXS của số viên đạn bắn trúng.
G: X = “số viên bắn trúng”
X là BNN rời rạc với các giá trị có thể có 0,1,2
VD2: hộp có 6 SF trong đó có 4 CP, 2PP. Lấy NN 2 SF.
Tìm QLPP XS của số CP được lấy ra
G: Y=" số chính phẩm được lấy ra trong 2 sản phẩm"
Y là BNN rời rạc với các giá trị có thể có Y = 0,1,2
p. 35
⎧0 ≤ pi ≤ 1,
⎪ n
⎨
⎪∑ pi = 1
⎩ i =1
(i = 1, n)
p. 34
Chú ý:
-Kiểm tra lại tổng xs có bằng 1 hay không
-Không nên làm:
P(X=2) = 1 – P(X=0) - p(X=1)
-Không được tính xs ra số thập phân nếu phép
chia không hết.
-Nếu để xs dạng phân số thì nên để cùng mẫu số
p. 36
6
2.2.2. Hàm phân bố xác suất
Cho X là BNN (rời rạc hoặc liên tục), x là số thực bất kì
• ĐN: F(x) = p(X
• T/c:
⎧0 ≤ F ( x ) ≤ 1
⎨
⎩ x1 < x2 thì F ( x1 ) ≤ F ( x2 )
VD1: BNN rời rạc X có bảng PPXS như sau:
X 1
P 0,1
3
0,5
2.2.2. Hàm phân bố xác suất
Hq 1: P(a≤X< b) = F(b) - F(a)
Hq 2: X là bnn liên tục: P(X=x0) = 0
Hq3 : X là bnn liên tục:
P(a ≤X ≤b) = P(a ≤ X
Hq 4: F(-∞) = 0, F(+∞) = 1
Ý nghĩa: Hàm phân bố xác suất F(x) phản ánh mức độ
tập trung xác suất về bên trái của điểm x
4
0,4
Hạn chế: F(x) không đặc trưng được XS để BNN liên
tục X nhận 1 giá trị xác định
Hãy tìm hàm phân bố XS của X và vẽ đồ thị.
TQ: X là bnn rr thì F ( x) = ∑ pi
xi < x
p. 37
p. 38
2.2.3. Hàm mật độ xác suất của bnn liên tục
a)ĐN: f(x) = F’(x)
f(x)
b)T/c:
- T/c1: f(x) ≥ 0, ∀ x
- T/c 2:
f(x)
f(x) là hàm mật độ xs của X ⇔
T/c1: f(x) ≥ 0, ∀ x
+∞
T/c4: −∞∫ f ( x) dx = 1
b
p(a < X < b) = ∫ f ( x) dx
a
O
a
f(x)
- T/c3:
Ý nghĩa: Hàm mật độ xs của bnn X tại mỗi điểm
x cho biết mức độ tập trung xs tại điểm đó.
b
x
F ( x) =
∫
f ( x) dx
f(x)
−∞
- T/c4:
∫
a
O
+∞
x
f ( x) dx = 1
−∞
p. 39
VD1: Cho hàm số f(x) = x3. Hàm f(x) có thể là hàm mật
độ xác suất được không?
f(x) có thể là hàm mật độ XS của BNN liên tục ⇔ ?
VD2: Cho hàm số:
⎧⎪0
f ( x) = ⎨
⎪⎩kx
x ∉ ( 0,1)
p. 40
2.3. Các tham số đặc trưng của BNN
a.Kì vọng toán:
• X là BNN rời rạc nhận x1, x2, … , xn
với các XS tương ứng p1, p2, … , pn.
n
E ( X ) = ∑ xi pi
i =1
• X là BNN liên tục có hàm mật độ XS là f(x):
+∞
x ∈ ( 0,1)
a) Tìm k để f(x) là hàm mật độ xác suất
b) Tìm P(0,5
c) Khi thực hiện 2 phép thử độc lập thì xác suất để cả
hai lần ta đều có 0,5
p. 41
E( X ) =
∫ xf ( x)dx
−∞
VD1: Tìm kì vọng của BNN có thống kê số lần /2000:
X
5
n
100 500 700
6
7
8
300
9
10
150 250
p. 42
7
VD2(NT2010): Tỷ lệ khách hàng phản ứng tích
cực đối với một chiến dịch quảng cáo là bnn có
bảng ppxs:
X 0
10 20
P 0,05 0,15 0,2
30 40 50
0,3 0,25 k
a) Tìm k?
b)Tỷ lệ khách hàng bình quân phản ứng tích cực
đối với chiến dịch quảng cáo đó?
c) XS để có trên 20% KH phản ứng tích cực?
p. 43
•Hai BNN độc lập:
-Nhắc lại hai bc độc lập
A, B độc lập ⇔ P(AB) = P(A).p(B)
-Xéy hai bnn có bảng ppxs
X 2
5
Y 1
3
4
px 0,3 0,7
pY 0,1
0,5
0,4
-Bc (X=xi) và (Y=yj) dl ⇔
⇔ P[(X=xi),(Y=yj)]=P[X=xi,Y=yj]=P(X=xi).P(Y=yj), ∀i,j
• Thực hành: khi thực hiện phép thử mà việc X nhận
các giá trị xi không ảnh hưởng đến việc Y nhận các giá
trị yj, và ngược lại thì ta nói X, Y độc lập.
VD: Tung xx, X=‘số chấm xh lần1’, Y=‘số chấm xh lần2’
p. 45
b. Phương sai:
ĐN: V(X) là kỳ vọng toán của
bình phương sai lệch của BNN với kỳ vọng toán của nó
V(X) = E[X-E(X)]2
X là BNN rr
n
2
V ( X ) = ∑ ⎡⎣ xi − E ( X )⎤⎦ . pi
i =1
X là BNN liên tục
V (X )=
+∞
∫ ⎡⎣ x − E ( X )⎤⎦
−∞
C/m: V(X) = E(X2) – [E(X)]2
p. 47
2
f ( x)dx
Tính chất i) C là hằng số: E(C) = C
ii) C là hằng số: E(CX) = C.E(X)
iii) E(X+Y) = E(X) + E(Y); ∀X, Y
n
⎛ n
⎞
Hq: E ⎜ ∑ X i ⎟ = ∑ E ( X i )
⎝
i =1
⎠
i =1
iv) Nếu X và Y là hai bnn đl thì: E(X.Y) = E(X).E(Y)
n
⎛ n
⎞
Hq: Nếu n bnn X1, X2, …, Xn đl:E ⎜⎜ ∏ X i ⎟⎟ = ∏ E ( X i )
⎝
i =1
⎠
i =1
Ý nghĩa: kỳ vọng của bnn gần bằng giá trị trung bình
số học của các giá trị quan sát của bnn đó. Nó phản
ánh giá trị trung tâm của phân phối xác suất.
Ý nghĩa trong kinh tế:
- Nếu số lớn phép thử thì kv p/a gttb.
- Nếu xét trong 1 phép thử thì kv p/a giá trị mong đợi.
p. 44
VD1: C/m E(X-Y) = E(X) – E(Y)
E(aX+b) = aE(X) + b
VD2: Cho 2 bnn đl có bảng ppxs như sau
X 2
5
Y 1
3
4
pY 0,1
0,5
0,4
px 0,3 0,7
Tìm E(X+Y), E(XY)?
Giải
X+Y 3
5
6
6
8
9
p
0,03 0,15 0,12 0,07 0,35 0,28
X+Y 3
5
6
8
9
p
0,03 0,15 0,19 0,35 0,28
XY 2
6
8
5
15
20
P
0,03
0,15
0,12
0,07
0,35
0,28
p. 46
Tc: i) C là hằng số: V(C) = 0
ii) V(C.X) = C2.V(X)
iii) Nếu X, Y là hai bnn đl thì V(X±Y) = V(X) + V(Y)
(mở rộng cho tổng n bnn đl)
VD: Cho 2 bnn đl có bảng ppxs như sau
X 2
5
Y 1
3
4
px 0,3 0,7
pY 0,1
0,5
0,4
Tìm V(X+Y), V(XY)?
Giải
V(X+Y)
C1: Dùng đ/n
C2: áp dụng t/c3
V(XY) = E[(XY)2] – [E(XY)]2
p. 48
8
- Bản chất phương sai: PS chính là TB số học của bình
phương các sai lệch các giá trị quan sát bnn với gttb
chúng.
- Ý nghĩa: PS phản ánh mức độ phân tán của các giá trị
bnn xung quanh giá trị trung tâm là kỳ vọng toán.
e. Điểm tới hạn đối với bnn
• ĐN: Giá trị tới hạn mức α của BNNlt X, kí hiệu
xα, là giá trị của X thỏa mãn điều kiện:
P(X > xα) = α
(0 ≤ α ≤ 1)
f(x)
c. Độ lệch chuẩn σ X = V ( X )
α
xα
d. Hệ số biên thiên:
CV =
σX
E( X )
Ý nghĩa: Giá trị tới hạn xα là giá trị sao cho diện
×100(%) khi E ( X ) ≠ 0
p. 49
tích giới hạn bởi trục hoành, đường cong hàm
mật độ xs và đường thẳng x= xα bằng α.
p. 50
Chương 3: Một số quy luật phân
phối xác suất thông dụng
Biến ngẫu nhiên rời rạc:
Luật “không – một” A(p);
Luật Nhị thức B(n,p);
Biến ngẫu nhiên liên tục:
phân phối chuẩn N(0,σ2)
3.1. Luật “không – một” A(p)
VD1: Tung xx 1 lần
Gọi A là bc xuất hiện mặt 6 chấm
Gọi X là số lần xuất hiện mặt 6 chấm
(số lần xuất hiện bc A)
Lập bảng ppxs cho X? Tính E(X), V(X)
phân phối chuẩn hóa N(0,1)
Student, χ2, Fisher
p. 51
p. 52
3.1. Luật “không – một” A(p)
X là “số lần xảy ra bc A trong 1 phép thử” với p(A)=p
ĐN: X ~ A(p) với tham số p nếu bảng ppxs của X có
dạng:
X
P
0
1-p=q
1
p
với 0≤ p ≤ 1
• Các tham số đặc trưng: E(X) = p
V(X) = p (1-p) = pq
σ X = V ( X ) = p.q
p. 53
Chú ý: Trong thực tế, quy luật 0-1 thường được dùng để đặc
trưng cho các dấu hiệu nghiên cứu định tính có hai phạm trù
luân phiên.
VD: Nghiên cứu giới tính của khách hàng
Giới tính của khách hàng có thể nam hoặc nữ
Ta có thể đặc trưng cho giới tính bằng bnn X nhận hai giá
trị như sau:
⎧1 khi nam
X =⎨
⎩0 khi nu
E(X) = p đặc trưng cho
tỷ lệ khách hàng nam trong tập hợp khách hàng.
Quy luật 0-1 phản ánh tỷ lệ cấu thành trong tổng thể theo dấu
hiệu nào đó cần nghiên cứu.
p. 54
9
3.2. Luật Nhị thức B(n,p)
VD1: Tung xx 3 lần
Gọi A là bc xuất hiện mặt 6 chấm
Gọi X là số lần xuất hiện mặt 6 chấm
(số lần xuất hiện bc A)
Lập bảng ppxs cho X?
Giải
…………..
Tổng quát:
- Một dãy phép thử được gọi là độc lập nếu kết quả xảy
ra ở các phép thử không ảnh hưởng lẫn nhau
-Thực hiện phép thử n lần. Mỗi lần thực hiện phép thử
ta quan tâm bc A xuất hiện hay không
- Xác suất p(A) cố định qua các phép thử
Gọi X là số lần bc A xảy ra trong dãy n phép thử thì X
có phân phối nhị thức, kí hiệu: X ∼ B(n,p)
XS “X=x” (bc A xảy ra x lần trong n phép thử) là:
Nhận xét: - Tính độc lập giữa các lần tung
- bc A quan tâm?
- XS bc A qua các lần tung
px = P( X = x ) = Cnx p x q n − x
p. 55
p. 56
Mối liên hệ giữa quy luật A(p) và B(n,p)
X = “số lần xảy ra bc A trong lược đồ Becnully
với 2 tham số n và p”
ĐN: X ~ B(n,p) với tham số n và p nếu
X
P
0
p0
1 …
p1 …
x …
px …
n
pn
Trong đó
px = P( X = x ) = Cnx p x q n − x
x = 0, n , q=1-p, 0 ≤ p ≤ 1.
Có n phép thử
XS xảy ra bc A trong phép thử thứ i là p(A)= p, ∀ i
Xi = “số lần xảy ra bc A trong phép thử thứ i”, ta có:
X1 ~ A(p)
X2 ~ A(p)
…
Xn ~ A(p)
n
X = ∑ X i ∼ B ( n, p )
i =1
KL: Tổng của n biến NN độc lập cùng tuân theo ql A(p)
sẽ là BNN tuân theo quy luật B(n,p)
p. 57
• Các tham số đặc trưng: E(X) = np
V(X) = npq
σ X = V ( X ) = npq
m0 là số nguyên t/m bđt kép: np – q ≤ m0 ≤ np + p
• Bảng ở Phụ lục 1 X ~ B(n,p) với tham số n và p
px = P( X = x ) = Cnx p x q n − x
Px được tính sẵn thành bảng ở Phụ lục 1
• P(x≤ X ≤ x+h): X ~ B(n,p), với h ≤ n-x:
P(x≤ X ≤ x+h) = Px + Px+1 + … + Px+h
p. 59
p. 58
VD1: Lô hàng có 800 SF loại 1 và 200 SF loại 2.
Lấy nn ra 5SF theo phương thức có hoàn lại.
Gọi X là số SF loại 1 lấy được.
VD2: Tung 1 đồng xu cân đối và đồng chất. Hãy xđ số
lần được mặt sấp có KN nhiều nhất nếu số lần tung
là:
a) N = 10,
b) N = 5
VD3(BT3.7): XS để SF sản xuất ra bị hỏng bằng 0,1.
Tìm XS để trong 5SF sản xuất ra có:
a. Có 2 SF bị hỏng?
b. có không quá 2 SF bị hỏng?
c. Tìm số SF hỏng có KN xảy ra nhiều nhất?
p. 60
10
VD4: Một người đi chào hàng, mỗi ngày ở 10 nơi
XS bán được hàng ở mỗi nơi là 0,2
Nếu một năm người đó chào hàng 300ng thì TB
sẽ có khoảng bao nhiêu ngày bán được hàng?
(Xem NT-2000-4)
• Tính khép kín của quy luật nhị thức
thì X = X1+X2 ~ B(n1+n2,p)
Nếu X1 ~ B(n1,p)
X2 ~ B(n2,p)
X1, X2 độc lập
VD5: Gọi X là số lần được mặt sấp trong cả 2 đợt tung
ở ví dụ 2 thì X = X1+X2 ~ B(15; 0,5)
• Quy luật ppxs của tần suất
X = “số lần x/h bc A trong lược đồ Becnully
với 2 tham số n và p”
Tần suất x/h bc A trong n phép thử độc lập là: f = X
n
+Vì X ~ B(n,p) nên f ~ B(n,p). Bảng ppxs của f có dạng
f
P
với
0/n
p0
1/n … x/n
p1 … px
… n/n
… pn
px = P( X = x ) = Cnx p x q n − x
+ Các tham số đặc trưng của f:
E(f) = p; V(f)=pq/n
p. 61
p. 62
3.3. Quy luật phân phối chuẩn – N(μ,σ2)
Tỷ lệ f và X :
Xi tuân theo quy luật A(p) thì tần suất f có dạng
f =
1 n
∑ Xi = X
n i =1
Như vậy, bản thân tỷ lệ f cũng có thể coi là một bnn trung bình
X đặc biệt có các bnn thành phần Xi tạo nên bnn tb này phải là
những bnn đl và cùng tuân theo quy luật A(p).
•ĐN: BNNlt X nhận giá trị trong khoảng (-∞,+∞) gọi là
pp theo quy luật chuẩn với các tham số μ và σ2, nếu
hàm mật độ xs có dạng:
f ( x) =
−
1
e
σ 2π
( x − μ )2
2σ 2
Kí hiệu: N(μ,σ2)
Nhận xét:
a) Miền xđ? Đồ thị so với trục hoành?
b) Lim f(x) khi x → ± ∞? ⇒ tiệm cận
c) Cực trị? x=μ là trục đối xứng? Điểm uốn
p. 63
p. 64
f(x)
•Đồ thị
1
σ 2π
1
σ 2π e
0
μ−σ
μ
μ +σ
p. 65
p. 66
11
•Hàm phân bố:
F ( x) =
1
σ 2π
x
∫e
−
Phân phối chuẩn hóa:
ĐN: BNN U nhận các giá trị trong khoảng (-∞,+∞) gọi là
tuân theo quy luật pp chuẩn hóa nếu hàm mật độ xs
của nó có dạng:
1 − −2u
ϕ (u ) =
e
2π
Phụ lục 4
( x − μ )2
2σ 2
dx
−∞
2
•Các tham số đặc trưng:
E(X) = μ
V(X) = σ2
ϕ(u)
•Phân phối chuẩn hóa: Cho X ~ N(μ,σ2)
U=
X −μ
∼ N (0,1)
σ
−1
p. 67
• Phân phối chuẩn hóa: U =
• Hàm phân bố XS:
1
Φ(u ) =
2π
u
∫e
−
−u 2
2
p. 68
X −μ
σ
du
∼ N (0,1)
• Giá trị tới hạn: Giá trị tới hạn mức α của BNNlt X, kí
hiệu xα, là giá trị của X thỏa mãn điều kiện:
P(X > xα) = α
Phụ lục 5
f(x)
−∞
α
• Các tham số đặc trưng: E(U) = 0, V(U) = 1
•Phân phối chuẩn hóa kí hiệu là N(0,1)
xα
Giá trị tới hạn xα là giá trị sao cho diện tích giới hạn bởi
trục hoành, đường cong hàm mật độ xs và đường
thẳng x= xα bằng α.
•Giá trị tới hạn chuẩn:
p. 69
p. 70
• Giá trị tới hạn chuẩn: Giá trị tới hạn chuẩn mức α
(bậc α) của U pp chuẩn hóa , kí hiệu uα, là giá trị của U
có pp chuẩn hóa thỏa mãn điều kiện:
P(U > uα) = α
Ta có:
Phụ lục 6
+∞
u
−
1
2
p(U > uα ) =
e
du
=
α
∫
2π uα
2
ϕ(u)
u1-α= -uα
α
u 1−α
0
uα
• Giá trị tới hạn chuẩn:
0,06
1,645 = u0,05
1,96 = u0,025
1,90
0,0250
VD1(NT2009): Cho biết bậc tới hạn của điểm 1, biết
rằng
p(U<1) = 0,8413
Cho trước α, từ đó tính được uα, và ngược lại
p. 71
1
0
u
VD2(NT08): Tính p(0 < U < 3,464)=0,4997
u0,0003?
p. 72
12
•Công thức tính xác suất P(a
Cách 1: P(a
⎛b−μ ⎞
⎛a−μ ⎞
p ( a < X < b) = Φ 0 ⎜
⎟ − Φ0 ⎜
⎟
⎝ σ ⎠
⎝ σ ⎠
VD3 (NT2007): p(U < 1,645) = 0,95
p(U < 1,96) = 0,975
Điểm phân vị chuẩn của
2
u
•Trong đó
Điểm tới hạn chuẩn?
VD4 (NT2004):
z
−
1
2
Φ0 ( u) =
e
dz
2π ∫0
p(U > 1,645) = 0,05
p(χ2(99) > 73,4) = 0,975
p(χ2(99) >128,4) = 0,025
+ Φ0(u) ------ Bảng Ph. lục 5
+ Φ0(-u) = -Φ0(u)
+ ∀u>5, Φ0(u)≈ Φ0(5)=0,5
Điểm tới hạn chuẩn của
p. 73
p. 74
VD1: Φ0(1,645) = 0,45
0,5-0,05=0,45
0,05
VD1: Cho biết p(U < 2) = 0,9772
a) Hãy xác định bậc tới hạn của điểm 2 và điểm (-2)
b) Hãy xác định các giá trị Φ0 tại điểm 2 và điểm (-2)
1,645
0,0228
Φ0(1,96) = 0,475
0,5-0,025=0,45
0,025
-2
Cách 2: P(a
⎛a−μ
P (a < X < b) = P ⎜
<
1,96
Do tính chất đối xứng của hàm Φ(u) nên các bảng cho
điểm tới hạn chuẩn Uα cũng như các giá trị của hàm Φ0
người ta chỉ thiết lập đối với những điểm u>0. Với u<0,
ta xét các điểm đối xứng để từ đó suy ra.
•VD1: Cần mua gioăng cao su có độ dày 0,118 cm đến
0,122 cm. Có hai cửa hàng cùng bán loại gioăng này
với độ dày là các BNN phân phối chuẩn với các đặc
trưng:
<
b−μ ⎞
σ ⎟⎠
VD2: X∼N(0,12; 0,0012), P(0,118
p. 76
•XS của sự sai lệch giữa BNN và kì vọng của nó
P(|X-μ|<ε) = P(μ-ε < X <μ+ε)
Độ dày
trung bình
Độ lệch Giá bán
chuẩn
Áp dụng công thức:
0,12
0,12
0,001
0,0015
Ta có kết luận:
3 usd/1000 chiếc
2,6 usd/1000 ch
X −μ
σ
⎝ σ
= P(u1 < U < u2 )
p. 75
Cửa hàng A
Cửa hàng B
2
⎛b−μ ⎞
⎛a−μ ⎞
p ( a < X < b) = Φ 0 ⎜
⎟ − Φ0 ⎜
⎟
⎝ σ ⎠
⎝ σ ⎠
⎛ε ⎞
p ( X − μ < ε ) = 2 Φ0 ⎜ ⎟
⎝σ ⎠
Nhà sản xuất nên mua gioăng của cửa hàng nào?
p. 77
p. 78
13
VD2: Các vòng bi do một máy tự động sản xuất ra
được coi là đạt tiêu chuẩn nếu đường kính của nó sai
lệch so với đường kính thiết kế không quá 0,7 mm. Biết
rằng đường kính vòng bi là bnn phân phối chuẩn với σ
= 0,4 mm. Tìm tỷ lệ vòng bi đạt tiêu chuẩn của máy đó.
3.4. Quy luật khi bình phương - χ2(n)
•ĐN: X=χ2 gọi là tuân theo quy luật khi bình phương
với n bậc tự do nếu hàm mật độ được xác định:
; x≤0
⎧0
⎪
x n
−
−1
⎪
1
f ( x) = ⎨ n
e 2 x 2 ; x > 0 E(χ2)=n
n
⎛
⎞
⎪ 2 2 .Γ
⎜ ⎟
V(χ2)=2n
⎪
Trong đó, ∞ ⎩
⎝2⎠
x −1 − t
Γ ( x ) = ∫ t e dt là hàm Gamma. P(χ2> χα2(n))=α
2
f(χ )
0
Phụ
lục 7
α
p. 79
2
α
(n )
χ
2
3.5. Quy luật Student - T(n)
3.2.6. Quy luật Fisher-Snedecor – F(n1,n2)
•ĐN: X=T gọi là tuân theo quy luật Student với n bậc tự
do nếu hàm mật độ được xác định:
•ĐN: X=F gọi là tuân theo quy luật Fisher-Snedecor với
n1 vaf n2 bậc tự do nếu hàm mật độ được xác định:
⎛n⎞
n
−
Γ⎜ ⎟
⎡
t2 ⎤ 2
⎝2⎠
∀t
⎢1 +
⎥ ;
⎛ n − 1 ⎞ ⎣ n − 1⎦
π ( n − 1) Γ ⎜
⎟
⎝ 2 ⎠
E(T)=0
f (t ) =
Trong đó Γ(x) là hàm Gamma.
t
χ
p. 80
(n )
1−α
V(T)=n/(n-2)
f(t)
= − tα
(n )
P(T>
α
α
p. 81
t 1(−nα )
0
Tα(n))=α
Phụ
lục 8
t α( n )
p ( F > fα
fα( n1 , n2 ) =
) =α
1
( n2 , n1 )
1−α
f
⎛ n + n2 ⎞ n21 n22
Γ⎜ 1
⎟ .n1 .n2
2 ⎠
C= ⎝
⎛n ⎞ ⎛n ⎞
Γ ⎜ 1 ⎟ .Γ ⎜ 2 ⎟
⎝ 2⎠ ⎝ 2 ⎠
3.3. Một số chú ý
E(F ) =
n2
n2 − 2
V (F ) =
2.n22 ( n1 + n22 − 2)
n1 ( n2 − 2) 2 ( n2 − 4)
fα( n1 , n2 )
;x > 0
p. 82
α
( n1 , n2 )
Trong đó
;x ≤ 0
u
3.2.6. Quy luật Fisher-Snedecor – F(n1,n2)
f(x)
0
⎧
⎪
n1 − n2
⎪
f ( x) = ⎨
x 2
n1 + n2
⎪C
⎪⎩ ( n2 + n1 . x ) 2
x
Phụ
lục 9
p. 83
•Tính khép kín của quy luật chuẩn
Cho Xi (i=1,2,…,n) là n BNN thành phần thỏa mãn
- Độc lập với nhau
- Xi tuân theo quy luật N(μ,σi2)
Khi đó ∑aiXi (ai là các hằng số) cũng tuân theo qlpp
chuẩn với E(∑aiXi)= ∑aiμI
V(∑aiXi)= ∑a2iσ2i
• Với n khá lớn (n>30): X1, X2,,....,Xn là n BNN độc lập
lẫn nhau và cùng tuân theo 1 qlppxs nào đó (không
nhất thiết ql chuẩn) thì X= ∑Xi sẽ tuân theo qlpp
chuẩn với E(Xi)= ∑E(Xi)
V(X)= ∑V(Xi)
p. 84
14
•Giả sử n BNN: X1, X2,,,,,Xn cùng tuân theo N(0,1) thì
X= ∑X2i sẽ tuân theo quy luật χ2 với n bậc tự do.
• U~N(0,1), V~χ2(n)
U, V độc lập
•U, V độc lập
U~χ2(n1), V~χ2(n2)
⇒ T=
U
∼ T ( n)
V
n
U
n
⇒ T = 1 ∼ F (n1 , n2 )
V
n2
PHẦN II. THỐNG KÊ
§1. CƠ SỞ LÝ THUYẾT MẪU
1. Tổng thể, khái niệm về tổng thể
2. Mẫu ngẫu nhiên
3. Thống kê
Khái niệm
Một số thống kê đặc trưng mẫu
Quy luật ppxs của một số TK đặc trưng mẫu
4. Một số bài toán suy diễn thống kê
p. 85
p. 86
2. Mẫu ngẫu nhiên
1. Tổng thể, khái niệm về tổng thể
•Phương pháp mẫu
• Tổng thể (đám đông)
Các lý do không thể nghiên cứu toàn bộ tổng thể
- Giới hạn về thời gian, tài chính, …
- Phá vỡ tổng thể nghiên cứu
- Không xác định được chính xác tổng thể
● Các tham số đặc trưng của TT
-TT được đặc trưng bởi dấu hiệu ng/c X – là một BNN
⇒ khi nói về X là nói về TT
-Mẫu ngẫu nhiên (cỡ mẫu n),
W =(X1,X2,…,Xn)
Là các BNN độc lập nhau và có cùng qlppxs với X
-Mẫu cụ thể: Thực hiện 1 phép thử đối với mỗi thành
phần mnn, giả sử Xi nhận giá trị xi. Khi đó ta có một tập
hợp n giá trị w=(x1,x2,…,xn) là giá trị có thể có của MNN
hay gọi là một mẫu cụ thể.
- Ví dụ:
p. 87
•Ví dụ:
A = “xạ thủ sẽ bắn trúng bia khi bắn mỗi viên đạn” với p(A)=p
X=“Số lần trúng bia của mỗi viên đạn”
X
0
1
⇒X là BNN gốc với qlppxs: X ∼ A(p)
P(x)
q
p
Giả sử tham số p chưa biết, để tìm hiểu về p,
ta dự định cho người đó bắn thử 3 viên:
X1 = “Số lần trúng bia của viên đạn thứ nhất”, X1 ∼ A(p)
X2 = “Số lần trúng bia của viên đạn thứ hai”, X2 ∼ A(p)
X3 = “Số lần trúng bia của viên đạn thứ ba”, X3 ∼ A(p)
⇒ ta đang lập 1 BNN kích thước n=3 với MNN: W=(X1,X2,X3)
Giả sử viên 1 trượt, viên 2 và viên 3 trúng thì ta có mẫu cụ thể
hay một giá trị có thể có của mẫu ngẫu nhiên W:
w=(0,1,1)
p. 89
p. 88
Các phương pháp mô tả số liệu mẫu
• Bảng phân phối tần số: BNN gốc X → w=(x1,x2,…,xn)
xi x1
ni n1
x2 … xi … xk
n2 … ni … nk
Xếp tăng dần
N1+n2+…+nk=n
• Bảng phân phối tần suất: BNN gốc X → w=(x1,x2,…,xn),
xi x1
fi f1
x2 … xi … xk
f2 … fi … fk
f =
ni
n
Xếp tăng dần
f1+f2+…+fk=1
• Ghi chú: Trong trường hợp các giá trị xi quan sát được chênh
lệch với nhau rất ít thì khi hệ thống hóa chúng thành bảng, ta
nên ghép chúng lại từng lớp cho gọn. Khi tiến hành tính toán đối
với bảng ghép lớp, ta lấy giá trị giữa làm đại diện cho toàn lớp.
p. 90
15
•Các đặc trưng cơ bản của mẫu (MNN)
Các tham số đặc trưng mẫu
Định lượng
• Các đặc trưng cơ bản của TT:
TT được đặc trưng bởi dấu hiệu ng/c X
- Định lượng: E(X)= μ là trung bình tổng thể
Var(X)= σ2 là phương sai tổng thể
σ là độ lệch chuẩn của tổng thể
- Định tính: TT có kích thước N, có M phần tử có t/c A quan tâm,
p=M/N gọi là tỷ lệ tổng thể.
X=
-Trung bình mẫu
1 n
∑ Xi;
n i =1
-Phương sai mẫu (chưa hiệu chỉnh)
Bị chệch
1 n
Sˆ 2 = MS = ∑ ( X i − X ) 2
n i =1
không chệch
-Phương sai mẫu (đã hiệu chỉnh) 2
1 n
2
(
)
S =
X
−
X
∑ i
n
n − 1 i =1
⇒ S 2 = MS
- Phương sai mẫu
S *2 =
1 n
∑ ( X i − m)2 với TBTT m = 1
n i =1
N
-Độ lệch chuẩn mẫu (đã hiệu chỉnh)
• Các đặc trưng cơ bản của mẫu (MNN)
S= S
Định tính
F=
-Tỷ lệ mẫu
- Xi có qlppxs 0-1
p. 91
•Các đặc trưng cơ bản của mẫu (mẫu cụ thể)
k
1 k
x = ∑ ni xi ; ∑ ni = n
-Trung bình mẫu
n i =1
i =1
-Phương sai mẫu (chưa hiệu chỉnh)
1 k
ms = ∑ ni ( xi − x ) 2
n i =1
s2 =
-Phương sai mẫu
với ni là…
n
n −1
-Độ lệch chuẩn mẫu
s= s
Định tính
-Tỷ lệ mẫu
f =
Tính toán:
2
1 k
ms = ∑ni xi2 − x 2
n i=1
1
m
∑ xi = n
n i =1
n
0
q
ni
ni xi
ni xi2
13-15 14
5
70
980
15-17 16
18
288
4608
17-19 18
42
756
13608
19-21 20
27
540
10800
21-23 22
8
176
3872
∑
100
1830
33868
Giá
xi
p. 93
3. Thống kê
• MNN W=(X1,X2,…,Xn) → Thống kê G=f(X1,X2,…,Xn)
-Hàm các biến ngẫu nhiên
-là một BNN ∼qlppxs?E(G),V(G)
•Mct w=(x1,x2,…,xn) → g=f(x1,x2,…,xn) giá trị cụ thể
• Quy luật ppxs của một số TK đặc trưng mẫu (BT)
p. 95
1
p
p. 92
∑n x
1830
i i
=
= 18, 3
n
100
2
n
x
∑ i i = 33868 = 338, 68
x2 =
n
100
x=
ms = x 2 − ( x ) 2 = 3, 79
s=
n
ms = 1,9566
n −1
- Giá trung bình? Độ phân tán của giá?
-n là cỡ mẫu, m là số phần tử có dấu hiệu nghiên cứu
BNN
1 k
∑ ni xi2 − X 2
n i =1
Giá (1000 đ)
13-15 15-17 17-19 19-21 21-23
Số phiên giao dịch 5
18
42
27
8
Giải
s 2 = ms
1 n
s = ∑ ( xi − m) 2
n i =1
MS =
Hãy tính các giá trị đặc trưng cơ bản của mẫu?
1 k
∑ ni ( xi − x )2
n − 1 i =1
*2
P(x)
i =1
Chứng minh:
2
Xi
∑ xi
Ví dụ: Giá của một loại cổ phiếu bán trên thị trường
chứng khoán trong 100 phiên giao dịch:
Định lượng
-Phương sai mẫu (đã hiệu chỉnh)
1 n
∑ Xi
n i =1
n −1
N
p. 94
4. SUY DIỄN THỐNG KÊ
Suy diễn TK về TB mẫu: Bnn X∼N(μ,σ2)
Từ TT, lập mẫu W=(X1,X2,…,Xn) → X , S *2 , S 2
⇒ X ∼ N (μ ,
σ2
n
) ⇒ G =U =
X − μ ( X − μ) n
=
∼ N (0,1)
Se( X )
σ
Cách 1:
⎛ b−μ ⎞
⎛ a−μ ⎞
p (a < X < b) = φ0 ⎜
⎟ − φ0 ⎜
⎟
⎝σ n ⎠
⎝σ n ⎠
⎛
p X − μ < ε = 2φ0 ⎜ ε
⎝ σ
(
)
⎞
n ⎟⎠
p. 96
16
Cách 2:
(X − μ ) n
∼ N(0,1)
σ
Với p=1-α cho trước, tìm được α1, α2 t/m α1+ α2= α và
hai giá trị tới hạn chuẩn U1−α ,U α t/m:
⎡ p ( U < u1−α ) = α1
⎢
⎢p U > u = α
α )
2
⎣ (
U=
1
3 TH:
•α1=α2=α/2
σ
σ
⎛
⎞
p⎜μ −
uα /2 ; μ +
uα /2 ⎟ = 1 − α
n
n
⎝
⎠
1
•α1= α, α2=0: CT về gt tối thiểu
σ
⎛
⎞
p⎜μ −
uα ; + ∞ ⎟ = 1 − α
n
⎝
⎠
2
⇒
σ
⎛
⎞
p⎜ X − μ <
uα /2 ⎟ = 1 − α
n
⎝
⎠
hay viết cách khác
2
⎛
⎞
(X − μ) n
< uα 2 ⎟⎟ = 1 − α
p ⎜⎜ −uα1 <
σ
⎝
⎠
σ
σ
⎛
⎞
uα < X < μ +
uα ⎟ = 1 − α
⇒ p⎜μ −
n 1
n 2⎠
⎝
∀α1 + α 2 = α
•α1=0, α2=α: CT về gt tối đa
σ
⎛
⎞
p ⎜ −∞; μ +
uα ⎟ = 1 − α
n ⎠
⎝
p. 97
p. 98
Suy diễn TK về f: X ∼A(p) với p đã biết
Từ TT lập mẫu W=(X1,X2,…,Xn) → f
Nếu n >5 và
p
1− p
−
n < 0,3
1− p
p
Với p=1-α cho trước, tìm được α1, α2 t/m α1+ α2= α và
hai giá trị tới hạn chuẩn u1−α ,uα t/m:
1
2
p ( U > u1−α ) =1 − α1 , p ( U > uα ) = α 2
1
p (1 − p )
E ( f ) = p, V (f) =
Thì f ∼ chuẩn với
n
do đó
p(1 − p ) ⎞
⎛
f ∼ N ⎜ p,
⎟
n
⎝
⎠
⇒U =
f − p ( f − p) n
∼ N ( 0,1)
=
Se( f )
p(1 − p )
⇒
p ( u1−α < U < u α ) =1 − α
⇒
⎛
⎞
( f − p) n
p ⎜ −uα1 <
< uα 2 ⎟ = 1 − α
⎜
⎟
p
(1
p
)
−
⎝
⎠
1
⎛
⇒ p⎜ p −
⎜
⎝
2
p (1 − p )
n
p. 99
•α1=α2=α/2
•GT tối thiểu: α1= α, α2=0
p(1-p) ⎞
uα ⎟⎟ = 1 − α
n
⎠
•GT tối đa: α1=0, α2= α
⎛
P⎜f ≤ p +
⎜
⎝
p(1-p)
n
p(1 − p)
n
⎞
uα 2 ⎟ = 1 − α
⎟
⎠
⎞
uα ⎟ = 1 − α
⎟
⎠
•Suy diễn về phương sai mẫu S2: X∼N(μ,σ2)
Từ TT, lập mẫu W=(X1,X2,…,Xn)
Với p=1-α cho trước, phải tìm (a,b) t/m
P(a < S2
(n − 1) S 2
χ2 =
∼ χ 2 (n − 1)
2
σ
Với p=1-α cho trước, tìm được α1, α2 t/m α1+ α2= α và
2
2
hai giá trị tới hạn chuẩn χα1 (n − 1), χα 2 (n − 1) t/m:
⎧ p ⎡ χ 2 < χ 12−α (n − 1)⎤ = α1
⎦
⎪ ⎣
⎨
⎪⎩ p ⎡⎣ χ 2 > χ 2α (n − 1)⎤⎦ = α 2
1
2
(n − 1)S 2
⎡
⎤
⇒ p ⎢ χ 12−α (n − 1) <
< χ α2 (n − 1)⎥ = 1 − α
σ2
⎣
⎦
p. 102
1
p. 101
uα1 < f < p +
p. 100
⎛
⎞
p(1-p)
P ⎜ |f - p| <
u α ⎟ =1 − α
⎜
2 ⎟
n
⎝
⎠
⎛
P ⎜⎜ f ≥ p −
⎝
2
2
17
•Suy diễn về phương sai mẫu S2: Bnn X∼N(μ,σ2)
•Suy diễn X1 − X 2:
X1∼N(μ1,σ12), X2∼N(μ2,σ22)
Từ TT, lập mẫu W=(X1,X2,…,Xn) → X1 , X 2 , S12 , S 22
Với p=1-α cho trước, phải tìm (a,b) t/m
σ2 2
⎡ σ2 2
⎤
p⎢
χ 1−α (n − 1) < S 2 <
χ α (n − 1)⎥ = 1 − α
n −1
⎣n −1
⎦
1
2
p [a < X1 − X 2 < b ] = 1 − α
•Khoảng gt 2 phía
σ2 2
⎡ σ2 2
⎤
p⎢
χ 1−α /2 (n − 1) < S 2 <
χ α /2 (n − 1)⎥ = 1 − α
n −1
⎣n −1
⎦
•GT tối thiểu α1=α, α2=0
•GT tối đa α1=0, α2= α
⎛ σ2 ⎞
⎛ σ2 ⎞
⇒ X1 ∼ N ⎜ μ1 , 1 ⎟ , X 2 ∼ N ⎜ μ 2 , 2 ⎟
n
n2 ⎠
1⎠
⎝
⎝
σ2 2
⎡
⎤
p ⎢S 2 ≥
χ 1−α (n − 1)⎥ = 1 − α
n −1
⎣
⎦
⎛
σ2 σ2 ⎞
⇒ X1 − X 2 ∼ N ⎜ μ1 − μ 2 , 1 + 2 ⎟
n1 n 2 ⎠
⎝
⇒G=U=
σ2 2
⎡
⎤
χ α (n − 1)⎥ = 1 − α
p ⎢S 2 ≤
n −1
⎣
⎦
(X1 − X 2 )- ( μ1 − μ 2 )
σ12 σ 22
+
n1 n 2
∼ N(0,1)
p. 103
p. 104
⎡
σ2 σ2
σ2 σ2
p ⎢(μ1 − μ2 )- 1 + 2 uα < X1 − X2 < (μ1 − μ2 )+ 1 + 2 uα
n1 n2
n1 n2
⎢⎣
1
2
Khoảng giá trị đ/x
⎤
⎥ = 1− α
⎥⎦
⎡
σ2 σ2
σ2 σ2 ⎤
p ⎢(μ1 − μ2 )- 1 + 2 uα/2 < X1 − X2 < (μ1 − μ2 )+ 1 + 2 uα/2 ⎥ = 1− α
n1 n2
n1 n2 ⎥⎦
⎢⎣
⎡
σ2 σ2 ⎤
p ⎢X1 − X2 ≥ (μ1 − μ2 )- 1 + 2 uα ⎥ = 1− α
n1 n2 ⎥⎦
⎢⎣
Khoảng gt tối thiểu
⎡
Khoảng gt tối đa p ⎢X1 − X2 ≤ (μ1 − μ2 )+
⎣⎢
σ12 σ22 ⎤
+ uα ⎥ = 1− α
n1 n2 ⎦⎥
•Suy diễn về hiệu f1-f2: X1∼A(p1), X2∼A(p2)
Từ TT, lập 2 mẫu đl kích thước n1,n2 thì với p=1-α cho
trước, phải tìm (a,b) t/m p [a < f1 − f2 < b ] = 1 − α
Thiết lập bnn f=f1-f2 Giả sử có:
⎛ p (1 − p1 ) ⎞
⎛ p 2 (1 − p 2 ) ⎞
⇒ f1 ∼ N ⎜ p1 , 1
⎟ , f2 ∼ N ⎜ p 2 ,
⎟
n2
n1
⎝
⎠
⎝
⎠
⎛
p (1 − p1 ) p 2 (1 − p 2 ) ⎞
⇒ f1 − f2 ∼ N ⎜ p1 − p 2 , 1
+
⎟
n1
n2
⎝
⎠
⇒G=U=
(f1 − f2 )- ( p1 − p 2 )
p1(1 − p1 ) p 2 (1 − p 2 )
+
n1
n2
∼ N(0,1)
p. 105
p ⎡⎣( p1 − p 2 ) − u α S f < f1 − f2 < ( p1 − p 2 ) + u α S f ⎤⎦ = 1 − α
1
với
Sf =
Suy diễn về tỷ số hai phương sai:
S2 σ 2
F = 12 . 22 ∼ F (n1 − 1, n2 − 1)
S
2 σ1
Do đó
2
p1(1 − p1 ) p 2 (1 − p 2 )
+
n1
n2
Khoảng giá trị đ/x
p ⎡⎣( p1 − p 2 ) − u α '2S f < f1 − f2 < ( p1 − p 2 ) + u α /2S f ⎤⎦ = 1 − α
Khoảng gt tối thiểu
p ⎡⎣f1 − f2 > ( p1 − p 2 ) − u αS f ⎤⎦ = 1 − α
Khoảng gt tối đa
p. 106
p ⎡⎣f1 − f2 < ( p1 − p 2 ) + u αS f ⎤⎦ = 1 − α
p. 107
⎛
⎞
S2 σ 2
P ⎜ F1(−nα11−1,n2 −1) < F = 12 . 22 < Fα(2n1 −1,n2 −1) ⎟ = 1 − α
S2 σ 1
⎝
⎠
TQ: ⎛ σ 2
2
2
⎞
σ
S
P ⎜ 12 × F1(−nα11−1, n2 −1) < 12 < 12 × Fα(2n1 −1,n2 −1) ⎟ = 1 − α
S2 σ 2
⎝σ2
⎠
-Từ đó suy ra: KGT 2 phía, KGT tối đa, KGT tối thiểu
-Chú ý: Tìm hiểu cách sử dụng máy tính Fx570Ms,
Fx500Ms, Fx500A để tính thống kê mẫu
p. 108
18
§2. BÀI TOÁN ƯỚC LƯỢNG
1. Khái niệm
2. Các phương pháp ước lượng:
A(p)
E(X)
P
N(μ,σ2)
μ
V(X)
p(1-p)
?p
θ
2.1. Ước lượng điểm
2.2. Ước lượng bằng khoảng tin cậy :
- Ước lượng μ, σ2 trong phân bố N(μ,σ2)
- tham số p trong phân bố A(p)
σ2
Tổng thể kích thước N: θ
p
μ
MNN kích thước n: θˆ
f
X
σ2
MS S2 S*2
Ta gọi chung các đặc trưng số của TT là θ, θ là giá trị số cố định
nhưng chưa biết của TT. Từ mẫu ta xây dựng một thống kê G
dùng để ƯL θ. Có 2 pp ƯL cơ bản: ƯL điểm, ƯL khoảng
p. 109
2.1. Ước lượng điểm
Cần ƯL tham số θ của BNN gốc X
Từ TT rút ra MNN kích thước n: W=(X1,X2,…,Xn)
• θ = f (Wn ) = f ( X n , X n ,..., X n ) gọi là một thống kê
là hàm ƯL điểm của θ
là BNN nên có vô số cách chọn hàm f ⇒ có vô số θˆ có thể dùng
làm ƯLθ ⇒ Cần đưa ra tiêu chuẩn đánh giá chất lượng của các
thống kê θˆ để từ đó ta tìm được 1 thống kê xấp xỉ một cách tốt
nhất cho tham số θ cần ước lượng.
•Các tiêu chuẩn lựa chọn hàm ước lượng
•Ước lượng không chệch
•Ước lượng hiệu quả
•Ước lượng vững
•Ước lượng đủ
p. 110
•Ước lượng không chệch
E(θˆ )=θ ↔ θˆ gọi là ƯL không chệch của θ, ví dụ?
E( θˆ )≠θ ↔ θˆ gọi là ƯL chệch của θ, ví dụ?
•Ước lượng hiệu quả
θˆ vàθˆ ' là hai ƯLKC của θ được xd trên 1 mẫu Wn
Nếu var(θˆ) < var(θˆ ') thì ta nói θˆ là ƯL cho θ tốt hơn θˆ '
Nếu var(θˆ) là giá trị nhỏ nhất trong tất cả các ƯLKC
của θ thì ta nói θˆ là ƯL hiệu quả nhất của θ.
•Ước lượng vững
Nếu lim P(| θˆ − θ |< ε ) = 1 thì ta nói θˆ là ƯL vững của θ
n →∞
(hội tụ theo XS đến θ)
Ví dụ?
p. 111
•Độ chệch của ƯL được đo bằng giá trị:
()
BS = E θˆ − θ
Trong TK, ngta chủ trương dùng ƯL ko chệch để ↑ độ
chính xác
Nếu ko tìm được ƯL ko chệch thì ⇒nên chọn ưl có BS
nhỏ nhất trong các ƯLKC
•Bất đẳng thức Cramer- Rao: Để kiểm tra tính hiệu quả
nhất của ƯLKC, ngta dùng bđt Cramer- Rao sau đây
1
V(G) ≥
2
⎡ ∂ ln f (x,θ) ⎤
nE ⎢
⎥⎦
∂θ
⎣
với G là ƯLKC, hàm mật độ f(x, θ) của X t/m một số đk.
p. 113
p. 112
Một vài kết luận của pp hàm ước lượng:
-Trung bình mẫu X là ƯLKC, hq nhất và vững của μ
là BLUE của μ
- Tần suất mẫu f là ƯLKC, hq nhất và vững của tần
suất TT p và là BLUE của p
- Phương sai mẫu S2, S*2 đều là các ƯLKC của σ2
MS sai khác σ2 bởi hệ số n/(n-1)
→ không đáng kể khi n lớn
S2 thường được sử dụng khi n<30
p. 114
19
VD1: Cho BNN X tuân theo quy luật 0-1. Gọi f1 là tần
suất mẫu với kích thước mẫu là 3, f2 là tần suất mẫu
với kích thước mẫu là 4.
a. Chứng tỏ f1, f2 đều là các ƯLKC của p.
b. ƯL nào hiệu quả hơn? Vì sao?
VD2: Cho mẫu ngẫu nhiên 2 chiều (X1,X2) thành lập từ
X∼N(μ,σ2). Ước lượng nào sau đây là hiệu quả nhất
của μ:
X
2X 2
X 3X 2
Y1 = 1 +
Y2 = 1 +
3
3
4
4
X1 X 2
4X1 X 2
Y3 =
+
Y4 =
+
5
5
2
2
p. 115
2.2. Ước lượng bằng khoảng tin cậy :
2
•ƯL μ: X ∼ N μ, σ , μ=E(X) chưa biết, cần ƯL
B1: Từ TT, rút Wn = (X1, X2,…,Xn)
B2: Xây dựng thống kê G
(
)
p. 116
B3:Từ đó ta xd được:
⎛
⎞
( X − μ) n
< uα 2 ⎟⎟ = 1 − α
p ⎜⎜ −uα1 <
σ
⎝
⎠
(X − μ ) n
∼ N(0,1)
TH1: σ2 đã biết, chọn TK: G = U =
σ
Với ĐTC 1-α cho trước, tìm được α1, α2 t/m α1+ α2= α
và hai giá trị tới hạn chuẩn u1−α ,u α thoả mãn các đk:
1
2.2. Ước lượng bằng khoảng tin cậy
Wn→ thống kê G
Xd khoảng (G1,G2): với XS p cho trước thì θ∈(G1,G2),
nghĩa là:
p(G1 <θ< G2) = p[θ∈(G1,G2)] = 1-α
thì (G1,G2) gọi là KTC, KƯL, hay ƯL khoảng của θ
1-α: Độ tin cậy, hệ số tin cậy, mức tin cậy của KƯL
I=G2-G1: độ dài KTC
Chú ý
-Do G là BNN nên (G1,G2) cũng là khoảng NN, θ số cđ
-G1, G2 là BNN ứng với MNN, có gtcụ thể ứng với MCT
-Khi đưa ra KTC (G1,G2) của thống kê θ thì có 2 TH:
+ (G1,G2) thực sự chứa θ: ƯL đúng
+ (G1,G2) không chứa θ: ƯL sai, α: XS mắc sai lầm
B4:Ta bđ biểu thức trên và được
σ
σ
⎛
⎞
p⎜ X −
uα 2 < μ < X +
uα1 ⎟ = 1 − α
n
n
⎝
⎠
∀α1 + α 2 = α
2
p[U < u1−α ] = α1 ⎫⎪
⎬ ⇒ p ⎡⎣ u1−α < U < u α ⎤⎦ = 1 − α
p[U > u α ] = α 2 ⎪⎭
1
1
2
2
⇒ p ⎡⎣ − u α < U < u α ⎤⎦ = 1 − α
1
2
p. 117
Có vô số cặp α1, α2 t/m α1+ α2= α, trong thực tế 3 TH:
•KTC đối xứng: α1=α2=α/2
⎛
⎞
⎜
⎟
σ
σ
P⎜ X −
uα /2 < μ < X +
uα /2 ⎟ = 1 − α
n
n
⎜
⎟
ε
ε
⎝
⎠
p. 118
•ε =
σ
n
uα 2 là độ chính xác của các ƯL
σ
I = 2ε = 2
uα 2
•Độ dài KTC ngắn nhất
n
n ↑, (1-α) giữ nguyên ⇒ ε↓: độ chính xác của ƯL ↑
(1-α)↑, n giữ nguyên⇒uα↑⇒ ε↑: độ c/xác của ƯL ↓
độ chính xác của ƯL (dùng để đo sai số của ƯL)
•Kích thước mẫu tối thiểu n cần đtra để với ĐTC 1-α,
độ dài KTC không vượt quá I0 hay kích thước mẫu ≤ε0:
•KTC bên phải hay ƯL tối thiểu: α1=0, α2=α
σ
⎛
⎞
P⎜μ ≥ X −
uα ⎟ = 1 − α
n ⎠
⎝
n≥
•KTC bên trái hay ƯL tối đa: α1= α, α2=0
σ
⎛
⎞
P⎜μ ≤ X +
uα ⎟ = 1 − α
n
⎝
⎠
p. 119
4σ 2 2
uα
I 02
2
hay
n ≥
σ2 2
u
ε 02 α
2
•Thực hiện phép thử đối với mẫu Wn thu được mẫu cụ
thể. Qua mẫu cụ thể, ta tìm được các KTC cụ thể.
p. 120
20
VD1: Trọng lượng một loại SF là bnn ppchuẩn với độ
lệch chuẩn 1 gam. Cân thử 25 SF loại này, ta thu được
Trọng lượng (gam)
Số SF
18
3
19
5
20
15
21
2
TH2: σ2 chưa biết, chọn TK:
( X − μ) n
G =T =
∼ T ( n − 1)
S
ĐTC 1-α cho trước, tìm được α1, α2 t/m α1+ α2= α và
( n −1) ( n −1)
hai giá trị tới hạn chuẩn t1−α , tα
thoả mãn các đk:
1
a) Với đtc 95%, hãy tìm ktc đx của trọng lượng trung
bình của loại SF nói trên.
b) Với đtc 95%, để độ chính xác của ƯL chỉ là 0,1 thì
phải điều tra một mẫu kích thước là bằng bao nhiêu?
Giải
Gọi X là …………………….…, theo giả thiết X ∼….
Trọng lượng trung bình của SF là tham số …………..
Đây là bài toán ưl tham số … của bnn pp …CT ƯL là...
p[T < t
(n −1)
1− α1
p[U > t
2
] = α1 ⎫⎪
( n −1)
(n −1)
⎬ ⇒ p ⎣⎡ t 1−α < T < t α ⎦⎤ = 1 − α
] = α 2 ⎪⎭
(n −1)
α2
1
2
⎡
(X − μ ) n (n −1) ⎤
⇒ p ⎢ −t (nα −1) <
< tα ⎥ = 1 − α
S
⎣
⎦
1
2
p. 121
B3:Từ đó ta xd được:
p. 122
3 TH:
•KTC đối xứng: α1=α2=α/2
⎛
⎞
(X − μ) n
p ⎜⎜ −Tα(1n −1) < T =
< Tα(2n −1) ⎟⎟ = 1 − α
S
⎝
⎠
S ( n −1)
S ( n −1) ⎞
⎛
P⎜ X −
tα 2 < μ < X +
tα 2 ⎟ = 1 − α
n
n
⎝
⎠
•KTC bên phải hay ƯL tối thiểu: α1=0, α2=α
S ( n −1)
⎛
⎞
P⎜ X −
tα < μ < +∞ ⎟ = 1 − α
n
⎝
⎠
•KTC bên trái hay ƯL tối đa: α1= α, α2=0
S ( n −1) ⎞
⎛
P ⎜ −∞ < μ < X +
tα ⎟ = 1 − α
n
⎝
⎠
•Chú ý: khi n>30 thì qlppxs T(n-1) ∼ N(0,1)
B4:Ta bđ biểu thức trên và được
S ( n −1)
S ( n −1) ⎞
⎛
p⎜ X −
tα 2 < μ < X +
tα ⎟ = 1 − α
n
n 1 ⎠
⎝
∀α1 + α 2 = α
tα( n −1) = tα( n≥30) = uα
p. 123
p. 124
-Trước hết điều tra một mẫu kích thước m≥2:
W1=(x1,x2,…,xm) ⇒ S2
-Lúc đó kích thước mẫu n cần điều tra được tính bằng
công thức:
•KTC đối xứng: ⎛
⎞
⎜
S ( n −1)
S ( n −1) ⎟
tα 2 < μ < X +
tα 2 ⎟
⎜X −
n
n
⎜
⎟
ε
ε
⎝
⎠
•Độ dài KTC ngắn nhất khi KTC là đ/x:
n ≥
S ( n −1)
I = 2ε =
tα 2
n
•Để tìm kích thước mẫu tối thiểu n cần điều tra sao cho
với đtc (1-α) cho trước, độ dài ktc không vượt quá I0
cho trước, người ta dùng phương pháp mẫu kép:
p. 125
4 S 2 ( m −1 ) 2
( tα 2 )
I 02
hay n ≥
S2
ε 02
(t
( m −1 )
α 2
)
2
-Như vậy, chỉ cần điều tra thêm một mẫu bổ sung kích
thước n-m:
w2=(xm+1,xm+2,…,xn)
p. 126
21
BT 7.16
Doanh số CH là BNN pp chuẩn với σ=2 triệu/tháng
Điều tra nn 600 CH tìm được doanh số TB là 8,5 triệu
ĐTC 95%, hãy ước lượng doanh số TB?
BT 7.18 Theo dõi nn quá trình gia công 25 chi tiết
Thời gian gia công
Số chi tiết máy tương ứng
15-17
1
17-19
3
19-21
4
21-23
12
23-25
3
25-27
2
ƯL thời gian gia công trung bình 1 chi tiết với ĐTC 0,95
Giả thiết tgian gia công chi tiết là bnn pp chuẩn
( n −1)
(24)
BT 7.18 n=25, 1-α=0,95 ⇒ tα 2 = t0,025 = 2, 064
Xi
xi
ni
ni xi2
nixi
15-17
16
1
16
256
17-19
18
3
54
972
19-21
20
4
80
1600
21-23
22
12
264
5808
23-25
24
3
72
1728
25-27
26
2
52
1352
25
538
11716
Σ
p. 127
(
p. 128
)
•ƯL σ2: X ∼ N μ, σ , σ2 chưa biết, cần ƯL
B1: Từ TT, rút W = (X1, X2,…,Xn)
B2: Xây dựng thống kê G
2
(
⎛
⎞
nS*2
⇒ p⎜ χ12(−αn1) < 2 < χα2(2n) ⎟ =1−α
σ
⎝
⎠
nS *2
TH1: μ đã biết, chọn TK: G = χ = 2 ∼ χ 2 (n)
σ
2
B3: Với đtc 1-α cho trước, tìm đc α1, α2 t/m α1+ α2=α
2( n )
2( n )
và hai giá trị tới hạn chuẩn χ1−α1 , χα 2 thoả mãn:
(
p( χ
p χ <χ
2
2
2(n)
1−α1
> χα2
2(n)
) =α ⎫⎪
⎬ ⇒ p( χ
) =α ⎪⎭
1
2(n)
1−α1
)
p χ12(−αn1) < χ2 < χα2(2n) =1−α
B4:Ta bđ biểu thức trên và được
⎛ n.S *2
n.S *2 ⎞
p ⎜ 2( n ) < σ 2 < 2( n ) ⎟ = 1 − α
⎜ χα
χ 1−α ⎟⎠
⎝
∀α1 + α 2 = α
)
< χ2 < χα2(2n) =1− (α1 +α2 ) =1−α
2
2
1
p. 129
p. 130
TH2: μ chưa biết, chọn TK:
3 TH
•KTC ứng với α1=α2=α/2
G = χ2 =
⎛ n.S *2
n.S *2 ⎞
P ⎜ 2( n ) < σ 2 < 2( n ) ⎟ = 1 − α
⎜χ
χ 1−α 2 ⎟⎠
⎝ α2
(n − 1)S 2
∼ χ 2 (n − 1)
σ2
B3:Với đtc 1-α cho trước, tìm đc α1, α2 t/m α1+ α2=α và
2( n )
2( n )
hai giá trị tới hạn chuẩn χ1−α1 , χα 2 thoả mãn:
(
(
)
)
p χ2 < χ12(−αn1) = α1 ⎫⎪
2(n)
2
2(n)
⎬ ⇒ p χ1−α1 < χ < χα2 =1− (α1 +α2 ) =1−α
p χ2 > χα2(2n) = α2 ⎪⎭
⎛
⎞
(n − 1) S 2
⇒ p ⎜ χ12(−αn1) <
< χα2(2 n ) ⎟ = 1 − α
2
σ
⎝
⎠
•KTC bên phải hay ƯL tối thiểu: α1=0, α2=α
⎛ n.S *2
⎞
P ⎜ 2( n ) < σ 2 ⎟ = 1 − α
⎝ χα
⎠
•KTC bên trái hay ƯL tối đa: α1= α, α2=0
⎛
n.S *2 ⎞
P ⎜ 0 < σ 2 < 2( n ) ⎟ = 1 − α
χ 1−α ⎠
⎝
(
)
B4:Ta bđ biểu thức trên và được
⎛ (n-1).S 2
(n-1).S 2 ⎞
p ⎜ 2 ( n −1) < σ 2 < 2 ( n −1) ⎟ = 1 − α
⎜ χα
⎟
χ 1− α
⎝
⎠
với MCT w → KTC bằng số
2
p. 131
1
∀α1 + α 2 = α
p. 132
22
•ƯL p:
3 TH
X ∼ A(p), p=M/N
khi ƯL p, có thể: a) Biết N, ước lượng M?
b) Biết M, ước lượng N
1 n
+ Để làm hàm ưl cho p, ta dùng X = ∑ X i mà trong TH
n i =1
này là tần suất f của mẫu
⇒Ưl điểm p
⇒Ưl khoảng tin cậy cho p với độ tin cậy 1-α:
•KTC ứng với α1=α2=α/2
⎛ (n-1).S 2
(n-1).S 2 ⎞
P ⎜ 2( n −1) < σ 2 < 2( n −1) ⎟ = 1 − α
⎜ χ
χ 1−α 2 ⎟⎠
⎝ α2
•KTC bên phải hay ƯL tối thiểu: α1=0, α2=α
⎛ (n-1).S 2
⎞
P ⎜ 2( n −1) < σ 2 ⎟ = 1 − α
⎝ χα
⎠
•KTC bên trái hay ƯL tối đa: α1= α, α2=0
⎛
(n-1).S 2 ⎞
P ⎜ 0 < σ 2 < 2( n −1) ⎟ = 1 − α
χ 1−α ⎠
⎝
μ
X
p
f
σ
f (1 − f )
(xây dựng tương tự ưl μ)
với MCT w → KTC bằng số
p. 133
•TH1: Kích thước mẫu nhỏ n<100
(f − p) n
G=U=
∼ N(0,1)
p(1 − p)
Với đtc 1-α cho trước, tìm được α1, α2 t/m α1+ α2= α
và hai giá trị tới hạn chuẩn u1−α ,u α thoả mãn:
p[U < u1−α ] = α1 ⎫⎪
⎬ ⇒ p ⎡⎣ u1−α < U < u α ⎤⎦ = 1 − α
p[U > u α ] = α 2 ⎪⎭
1
2
p. 134
A⇔
(f − p) n
n(f − p)2
< u α /2 ⇔
< u α2 / 2
p(1 − p)
p(1 − p)
⇔ nf 2 − 2nfp + np 2 < pu α2 /2 − p 2 u α2 /2
⇔ (n + u α2 /2 )p 2 − (uα2 /2 + 2nf)p + nf 2 < 0
1
1
Δ = u α2 / 2 ⎡⎣ 4nf(1 − f) + u α2 /2 ⎤⎦
2
2
⇒ p ⎡⎣ −u α < U < u α ⎤⎦ = 1 − α
⎤
⎥
(f − p) n
< u α /2 ⎥ = 1 − α
p(1 − p)
⎥
⎥⎦
A
1
•α1=α2=α/2: ⎡
⎢
p ⎢ −u α /2
⎢
⎢⎣
1
1
nf + u 2α /2 ± u α /2 nf(1 − f) + uα2 /2
2
4
p1 ,p 2 =
n + u2α /2
2
P [ p1 < p < p 2 ] = 1 − α
p. 135
•TH2: Kích thước mẫu n≥100
Chọn TK
(f − p) n
G=U=
∼ N(0,1)
p(1 − p)
Với đtc 1-α cho trước, tìm được α1, α2 t/m α1+ α2= α
và hai giá trị tới hạn chuẩn u1−α ,u α thoả mãn:
1
2
p[U < u1−α ] = α1 ⎫⎪
⎬ ⇒ p ⎡⎣ u1−α < U < u α ⎤⎦ = 1 − α
p[U > u α ] = α 2 ⎪⎭
⎡
⎤
(f − p) n
⇒ p ⎢ −uα < U =
< uα ⎥ = 1 − α
p(1 − p)
⎣⎢
⎦⎥
⎡
f(1 − f)
f(1 − f) ⎤
⇒ p ⎢f − uα
< p < f + uα
⎥ =1− α
n
n ⎦
⎣
1
1
2
2
1
2
2
p. 136
3 TH
•KTC ứng với α1=α2=α/2
⎛
P⎜f ⎝
⎞
f(1-f)
f(1-f)
Uα < p < f +
Uα ⎟ = 1 − α
2
2
n
n
⎠
•KTC bên phải hay ƯL tối thiểu: α1=0, α2=α
⎛
f(1-f) ⎞
P⎜p ≥ f −
Uα ⎟ = 1 − α
n
⎝
⎠
•KTC bên trái hay ƯL tối đa: α1= α, α2=0
⎛
P⎜ p ≤ f +
⎝
f(1-f) ⎞
Uα ⎟ = 1 − α
n
⎠
1
∀α1 + α 2 = α
với MCT w → KTC bằng số
p. 137
p. 138
23
•KTC đối xứng: ⎛
⎜
⎜f ⎜
⎝
-Trước hết điều tra một mẫu kích thước m>5:
W1=(x1,x2,…,xm) ⇒ f
-Lúc đó kích thước mẫu n cần điều tra được tính bằng
công thức:
⎞
⎟
f(1-f)
f(1-f)
Uα < p < f +
Uα ⎟
2
2
n
n
⎟
⎠
ε
ε
•Độ dài KTC ngắn nhất khi KTC là đ/x:
I = 2ε = 2
f(1-f)
n
Uα
n ≥
2
•Để tìm kích thước mẫu tối thiểu n cần điều tra sao cho
với đtc (1-α), độ dài ktc không vượt quá I0 cho trước,
người ta dùng phương pháp mẫu kép:
4 f (1 − f )
(uα
I 02
) hay
2
2
n ≥
f (1 − f )
ε 02
(u )
-Như vậy, chỉ cần điều tra thêm một mẫu bổ sung kích
thước n-m:
w2=(xm+1,xm+2,…,xn)
p. 139
§3. Kiểm định giả thuyết thống kê
Trong thực tế ta thường gặp vấn đề: Kiểm tra
thông tin mà ta nhận được từ một nguồn tin nào
đó (từ một người, từ một cơ quan, từ một tổ
chức,…) có đáng tin cậy không? có chấp nhận
được không?
Công việc kiểm tra lại nội dung thông tin mà ta
nhận được có đáng tin cậy không là bài toán
kiểm định.
p. 140
VD1: Khi sx một đơn vị sf, người ta định mức chi phí
cho 1 đơn vị sf là 150 nghìn. Có ý kiến cho rằng định
mức này chưa sát với thực tế. Hãy lập giả thuyết để
kiểm chứng yk này?
HD
H0: μ = 150
H1: μ ≠ 150
μ0=150: định mức chi phí đề ra theo người sx
(Giả thuyết thống kê – giả thuyết không)
μ: định mức chi phí TB thực tế cho 1 đơn vị sf
(Giả thuyết đối)
p. 141
VD2: Có ý kiến cho rằng tỷ lệ sinh viên thi đạt môn
XSTK là 70%. Hãy lập giả thuyết thống kê để kiểm định
ý kiến trên?
HD
H0: p = 0,7
H1: p ≠ 0,7
p0=0,7: tỷ lệ sinh viên thi đạt môn XSTK theo yk này
(Giả thuyết thống kê – giả thuyết không)
p: tỷ lệ sinh viên thi đạt môn XSTK theo thực tế
(Giả thuyết đối)
VD3: …………
2
α 2
p. 142
•Các loại sai lầm:
Sai lầm loại 1 (sll1):
sll1=(bác bỏ H0/ Ho đúng)
P(sll1)=p(bác bỏ H0/ Ho đúng) = α
Sai lầm loại 2 (sll2):
sll2=(Chấp nhận H0/ Ho sai)
P(sll2)=p(Chấp nhận H0/ Ho sai)=β
XS không mắc sll2 là 1- β:
P(Không mắc sll2)=p(bác bỏ H0/ Ho sai)=1-β
Giá trị (1-β) gọi là lực kiểm định giả thiết.
p. 143
p. 144
24
Trên thực tế, slll1 và slll2 là mâu thuẫn nhau. Nếu giảm
xs mắc slll1 thì tăng xs mắc slll2, và ngược lại. Để
dung hoà mâu thuẫn trên, người ta thường cho trước
α. Trong các miền Wα, ta sẽ chọn miền nào có β bé
nhất, đó là MBB tốt nhất. Khi đó MBB tốt nhất là:
p(G∈Wα|H0 đúng) = α cho trước
p(G∈Wα|H0 sai) = (1-β) → max
Việc lựa chọn giá trị α tuỳ thuộc vào hậu quả mà sll1
và sll2 mang lại.
•Các bước kiểm định giả thuyết TK
B1: Lập cặp GTTK cần kđ
B2: Từ TT, ta rút ra mẫu nn kích thước n
W = (X1,X2,…,Xn) → X , S, f
B3: Chọn tiêu chuẩn kđ G sao cho nếu H0 đúng thì
qlppxs G hoàn toàn xđ
B4: Xd Wα sao cho: p(G∈Wα/H0) = α
Wα là miền bác bỏ H0, α là mức ý nghĩa của kđ
B5: Với mâũ cụ thể w = (x1,x2,…,xn) ta tìm được gqs
B6: So sánh gqs với Wα để rút ra kết luận:
-Nếu gqs ∈Wα thì bác bỏ H0, chấp nhận H1
-Nếu gqs ∉Wα thì chưa có cơ sở bác bỏ H0
p. 145
•Các dạng kiểm định kiểm định tham số:
Kiểm định giả thuyết về tham số μ
So sánh hai tham số μ1, μ2
Kiểm định giả thuyết và so sánh về tham số σ2
Kiểm định giả thuyết và so sánh về tham số p
trong phân bố A(p)
p. 146
2. Các bài toán kđ tham số
a) Kiểm định giá trị trung bình
Bài toán 1: với mức ý nghĩa α cho trước
H0: μ = μ0
H1: μ ≠ μ0
Bài toán 2: với mức ý nghĩa α cho trước
H0: μ ≥ μ0
H1: μ < μ0
Bài toán 3: với mức ý nghĩa α cho trước
H0: μ ≤ μ0
H1: μ > μ0
p. 147
TH1: σ2 đã biết
Chọn tckđ
G=U=
(X − μ )
n
0
σ
p. 148
TH2: σ2 chưa biết
Chọn tckđ
(X − μ 0 ) (X − μ 0 ) n
G=T=
=
∼ T(n − 1) nếu H0 đúng
S
Se(X)
∼ N(0,1) nếu H đúng
0
(
)
n
⎫⎪
; U < −uα ⎬
⎪⎭
H0: μ = μ0
H1: μ < μ0
⎧⎪
⎫⎪
(X − μ 0 ) n
Wα = ⎨T =
; T < − t (αn −1) ⎬
S
⎪⎩
⎭⎪
(
)
n
⎫⎪
; U > uα ⎬
⎭⎪
H0: μ = μ0
H1: μ > μ0
(X − μ 0 ) n
⎪⎧
⎪⎫
Wα = ⎨T =
; T > t (αn −1) ⎬
S
⎪⎩
⎭⎪
H0: μ = μ0
H1: μ ≠ μ0
(X − μ 0 ) n
⎪⎧
⎪⎫
Wα = ⎨T =
; T > t (αn/2−1) ⎬
S
⎪⎩
⎭⎪
H0: μ = μ0
H1: μ < μ0
⎧⎪
X − μ0
Wα = ⎨U =
σ
⎪⎩
H0: μ = μ0
H1: μ > μ0
⎧⎪
X − μ0
Wα = ⎨U =
σ
⎩⎪
⎧
⎫
H0: μ = μ0 W = ⎪U = ( X − μ 0 ) n ; | U |> u ⎪
⎨
α
α /2 ⎬
σ
H1: μ ≠ μ0
⎪⎩
⎭⎪
p. 149
p. 150
25