Tải bản đầy đủ (.doc) (15 trang)

Toán thống kê cho khoa học xã hội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (299.21 KB, 15 trang )

Phần 1 : LÍ THUYẾT
Lí thuyết xác suất
Câu 1: Phân biệt các khái niệm: Hoán vị, tổ hợp, chỉnh hợp (lặp và không lặp) của một tập con từ tập n phần tử.
Nêu các công thức xác định các số hoán vị, tổ hợp, chỉnh hợp. Thí dụ minh họa.
Nội
dung

Hoán vị

Khái
niệm

Hoán vị của n
phần tử là một
nhóm có thứ tự
gồm đủ mặt n
phần tử đã cho

Công
thức

Pn

Thí
dụ

Tổ hợp

Chỉnh hợp
Không lặp


k ≤n

k ≤n

Tổ hợp chập k của n
phần tử () là một nhóm
không phân biệt thứ tự,
gồm k phần tử khác nhau
chọn từ n phần tử đã cho

Chỉnh hợp (không lặp)
chập k của n phần tử () là
một nhóm (bộ) có thứ tự
gồm k phần tử khác nhau
chọn từ n phần tử đã cho

Cnk

Ank

Số hoán vị của n Số tổ hợp chập k của n Số chỉnh hợp chập k của
phần tử được ký phần tử ký hiệu là
n phần tử ký hiệu là
hiệu là
n
!
n!
k
n−k
k

C
=
=
C
A
=
n
n
n
Pn = n !
k !(n − k )!
(n − k )!

P4 = 4! = 24

C32 = 3

Một bàn có 4 học
sinh. Mỗi cách
xếp chỗ 4 học
sinh vào 1 bàn là
1 hoán vị của 4
phần tử. Do đó số
cách xếp là

Chọn ngẫu nhiên 2
quyển sách từ trên giá
sách có 3 quyển sách.
Mỗi cách chọn là 1 tổ
hợp chập 2 của 3 phần

tử. Do đó có cách chọn

Cho 3 chữ số 1,2,3. Mỗi
số tự nhiên gồm 2 chữ số
khác nhau được lập từ 2
trong 3 chữ số trên là
một chỉnh hợp không lặp
chập 2 của 3 phần tử. Do
đó có thể lập được
A32
= 3.2 = 6 số.

Lặp
Chỉnh hợp lặp chập k của n
phần tử là một nhóm có thứ
tự gồm k phần tử chọn từ n
phần tử đã cho, trong đó mỗi
phần tử có thể có mặt 1,2,
…,k lần trong nhóm
Số chỉnh
Bnk hợp lặp chập
k của n phần
tử ký hiệu là

Bnk = n k

Cho 5 hòn bi vào 3 hộp. Mỗi
cách xếp 5 hòn bi vào 3 hộp
là một chỉnh hợp lặp chập 5
của 3.


B35 = 35 = 243

Do đó có cách xếp

Câu 2 : Thế nào là một phép thử ? Một biến cố (sự kiện) ?
- Quan hệ giữa các biến cố. phép tính của các biến cố.
- Biến cố chắc chắn; không thể; xung khắc; đối lập biểu diễn qua sơ đồ Ven – Euler ?
Trả lời:
- Phép thử: là sự thể hiện một nhóm các điều kiện xác định (G) có tính lặp lại.
Kí hiệu: T
Sự kiện (biến cố) : là kết quả của phép thử. Kí hiệu: E, A, B, C, ….
Có 2 loại sự kiện là:
+ Sự kiện ngẫu nhiên (Random Effect) : có thể xuất hiện hoặc không xuất hiện khi thực hiện phép thử, không
phụ thuộc vào chủ quan. Sự kiện ngẫu nhiên là đối tượng nghiên cứu của khoa học ngẫu nhiên.
+ Sự kiện tất định (Definity Events) : luôn xuất hiện (Ω hoặc Ʊ) hoặc luôn không xuất hiện khi thực hiện phép
thử (Ø)
A⊂
≡B
* Quan hệ (relation) giữa các biến cố:
+ Quan hệ bao hàm:
+ quan hệ tương đương:

\∪BB

C
DAn = Ω
* Phép tính (Calculus):
A...==∪E
 A1 ∪ AA2∩


 Ai ∩ Aj = ∅

1


+ Hợp (tổng):
+ Giao (tích):
+ Trừ (hiệu):
+ Hiệu đối xứng: F = A ∆ B = (A\B) ∪ (B\A)
+ Đối lập (bù): Error: Reference source not found đối lập với A ( có cái này thì ko có cái kia)
+ Xung khắc: (không cùng xảy ra)
+ Nhóm đầy đủ:

2


* Biểu diễn qua sơ đồ Ven – Euler các biến cố:
Biến cố chắc chắn xảy ra:

Biến cố không thể xảy ra: (là một tập rỗng)
Biến cố xung khắc:
Biến
bù (đối lập):

3

cố



Câu 3 :
A, B,C là 3 biến cố
gắn với phép thử G.
Biểu diễn qua A, B,
C các biến cố sau
đây :
- Chỉ có A xảy ra :
A∩B∩C ( tương
tự cho B, C)
- Ít nhất một trong 3
biến cố xảy ra:
A∪B∪C
- Nhiều nhất một
biến cố xảy ra:
(A ∩B ∩C) ∪ (A
∩B ∩C) ∪ (A ∩
B ∩C) ∪ (A ∩B
∩C)
- Không có biến cố
nào
xảy
ra:
A∩B∩C
Câu 4 : Các định
nghĩa xác suất một
biến cố. Ý nghĩa của xác suất là gì?

P( A) = lim P( A) n→∞

Gọi P(A) là tần suất được xuất hiện biến cố

A trong định nghĩa xác suất theo tần suất. Có

thể viết như sau được không?
- Hai biến cố có xác suất bằng nhau thì có tương đương hay không?
- Một biến cố có xác suất 0, có thể xảy ra hay không?
Trả lời :
• Định nghĩa xác suất một biến cố:
-Giả sử phép thử có n biến cố đồng khả năng
m
P( A) =
có thể xảy ra, trong đó có m biến cố đồng khả
n
năng thuận lợi cho biến cố A (A là tổng khả
năng của m biến cố sơ cấp này). Khi đó xác suất của biến c ố A, ký hi ệu P(A) được định ngh ĩa b ởi công
thức sau: , trong đó m là số trường hợp thuận lợi cho A, n là số trường hợp đồng khả năng.
-Có thể viết vì ta có
P( A)% = lim m
P( Am)
n)→∞

P
P
(
(
A
A
)
=
=
lim

Khi cho số phép thử tăng lên vô hạn thì tần suất
n →∞
n n
xuât hiện biến cố A dần về một số xác định gọi là
xác suất của biến cố A.
 A ⊂ B • Hai biến cố có xác suất bằng nhau không
⇔
tương đương vì 2 biến cố A và B tương
B ⊂ A
đương nhau
• Có thể xảy ra một biến cố có xác suất bằng không. Đó là trường hợp không xuất hiện khả năng nào thuận lợi cho
A.
Câu 5 :
• Hai biến cố A và B là độc lập khi và chỉ khi P(A ∩ B) = P(A).P(B).
trong đó, A ∩ B là giao của A và B, nghĩa là, nó là biến cố rằng cả hai biến cố A và B đều xảy ra.
Tổng quát hơn, một tập hợp biến cố bất kỳ (có thể gồm nhiều hơn hai biến cố) là độc lập lẫn nhau khi và chỉ khi với
mọi tập con hữu hạn A1, ..., An của tập hợp trên, ta có

4


• Mối quan hệ giữa khái
niệm độc lập và xung khắc
Công thức nhân xác suất:
1. P(A∩B)
= P(A). P(B)
( Với A, B độc lập )
P(A∩B)
= P(B/A). P(A) = P( A/B). P(B)
2. P(A∩B∩C) = P(A) . P(B) . P(C)

( Với A,B,C độc lập)
= P(A) . P(B/A) . P(C/AB)
3. P( A∪Error: Reference source not foundB)
= P(A) + P(B)
( Với A Error: Reference
source not found B = Error: Reference source not found)
P( AError: Reference source not foundB)
= P( A) + P(B) - P(AError: Reference source not foundB)
( Với A, B bất kì)
4. P(A∪Error: Reference source not foundBError: Reference source not foundC) = P(A) + P(B) + P(C)
=
P(A) + P(B) + P(C) - P(AB) - P(BC) - P(AC) + P(ABC)
• Chứng minh nếu A, B độc lập thì Error: Reference source not found, B và Error: Reference source not found ,
Error: Reference source not foundcũng độc lập
Hai biến cố độc lập là hai biến cố xảy ra nhưng không liên quan gì đến nhau cho nên biến cố đối của A tức Error:
Reference source not found và B cũng độc lập với nhau tức là xảy ra không hề liên quan đến nhau. Tương tự như vậy
thì Error: Reference source not found và Error: Reference source not found cũng độc lập với nhau
• Chứng minh nếu P(A/B)= P(A/Error: Reference source not found) thì A B độc lập
ta có P(A/B)= P(A/Error: Reference source not found) nghĩa là xác suất của biến cố A dưới điều kiện B xảy ra
giống như xác suất của biến cố A dưới điều kiện B không xảy ra=> cho nên hai biến cố AB việc xảy ra hay không
xảy ra biến cố này thì không ảnh hưởng gì đến việc xảy ra của biến cố kia tức là hai biến cố A, B độc lập.
Câu 6: Tại sao lại gọi là một hệ đầy đủ các biến cố? Ý nghĩa của công thức xác suất đầy đủ, công thức Bayes.
Trả lời:
-Gọi là 1 hệ đầy đủ các biến cố vì khi ta thực hiện phép thử ngẫu nhiên sẽ có nhi ều kh ả n ăng x ảy ra, có
thể là đối lập, xung khắc từng đôi….Trong các khả năng xảy ra đó lại xảy ra nhi ều giai đo ạn khác nhau
nữa, những hoạt động tiếp theo phụ thuộc vào hoạt động xảy ra trước đó =>Cần ph ải tính xác su ất để
thức hiện được công việc qua nhiều giai đoạn nhưng tổng của chúng luôn là biến c ố chắc chắn =>Hệ đầy
đủ các biến cố.
-Ý nghĩa của công thức Bayes: Công thức Bayes còn được gọi là công thức xác suất hậu nghiệm khi và chỉ khi
sự kiện đã xảy ra, tìm nguyên nhân gây ra sự kiện đó với xác su ất lớn nhất. công th ức Bayes được ứng

dụng trong Khoa học - Kĩ thuật, đặc biệt trong khoa học lắp ráp.
Câu 7:
- Biến ngẫu nhiên là 1 biến số nhận giá trị tùy thuộc sự kiện ngẫu nhiên.
- Có 2 loại biến ngẫu nhiên:
+ Biến ngẫu nhiên rời rạc (discrete): Tập giá trị nhận là hữu hạn hoặc đếm được.
+ Biến ngẫu nhiên liên tục (continious): Tập giá trị nhận lấp đầy 1 khoảng hữu hạn hoặn vô hạn.)
- Hàm phân phối của biến ngẫu nhiên X được xác định như sau:
F (x) = P {X < x}
¡ là biến X có hàm phân phối là F(x).
Trong đó x là biến của hàm F, Ký hiệu X=F(x) nghĩa x ∈ R
- Tính chất của hàm phân phối:
+ Hàm phân phối xác định với mọi x € (-∞ , +∞)
+ Hàm phân phối là hàm không giảm: nếu x1 < x2 thì F(x1) ≤ F(x2)
F(-∞) = 0, F(+∞) = 1, 0≤F(x)≤1 với mọi x € (-∞ , +∞)
P {a≤x- Giải thích bằng hình học
-∞
x
+∞
{X
5


{Xx1
x2
{ X
a

{X
{ X
b

{a ≤X
- Phân phối nhị thức:
Xét n phép thử Bernoulli với biến cố A có P(A) = p.
Gọi X là số lần xuất hiện biến cố A. Khi đó phân phối của X được gọi là phân phối nhị thức, ký hiệu là B(n,p).
- Phân phối Poison:
Biến ngẫu nhiên X gọi là có phân phối Poison nếu
P{X=k} =e-λ . λk / k!
(k = 0, 1, 2, 3……..)
λ là tham số, λ >0
- Phân phối chuẩn
( x − µ )2
Là phân phối của biến ngẫu nhiên liên tục với

1
2
p( x) =
×e 2δ
hàm mật độ

2π .δ

Câu 8:


x ∈xR
¡
FX ( x) =
∫ f (t )dt

-Định nghĩa hàm mật độ: Biến ngẫu nhiên
X được gọi là có phân phối liên tục tuyệt
đối nếu hàm phân phối có dạng , . Hàm dưới dấu tích phân f(x) được gọi là hàm mật độ của X.
Tính chất của hàm mật độ:
+ tại các điểm liên tục của f(x)
dF ( x )
f ( x) = X
+
f ( x ) ≥ 0, ∀x
dx
+∞
+
b
∫−∞ f ( x)dx = 1
+
P (a ≤ X < b) = ∫ f ( x )dx
a
Câu 9:
* Định nghĩa, ý nghĩa và tính chất của kì vọng:
- Định nghĩa:
Kì vọng của biến ngẫu nhiên X là một số, ký hiệu EX, được xác định như sau:
nếu (X là biến ngẫu nhiên rời rạc) PEX
( X ==∑
xi )x=i ppi i
+∞ i

p ( x)
nếu là hàm mật độ (X là biến ngẫu
EX = ∫ x. p ( x)dx
nhiên liên tục)
−∞
- Ý nghĩa:
Kì vọng của biến ngẫu nhiên là giá trị trung bình mà biến ngẫu nhiên nhạn, hoặc là trọng tâm phân phối xác suất
với khối lượng 1. Kì vọng là trung bình có trọng lượng
Trong trường hợp các xác suất bằng nhau (phân
1p n
EX= i.∑ xi
phối đều rời rạc) thì trung bình có trọng lượng
n i =1
trùng với trung bình số học:
- Tính chất:
1. EC = C (C = const)
2. E(CX) = CEX
−∞

6


±
3. E(XY) = EXEY
4. E(X.Y) = EX . EY ( Nếu X, Y độc lập)
→ Kì vọng bảo toàn tuyến tính.
5. E nếu
f ( PX( )X==∑xi )f =( xip).i pi
+∞ i
Hoặc E nếu p(x) là hàm mật độ

f ( X ) = ∫ f ( x). p ( x)dx
* Định nghĩa, ý nghĩa và tính chất của
−∞
phương sai:
- Định nghĩa:
Phương sai của biến ngẫu nhiên X là một số không âm, ký hiệu DX, được xác định như sau:
2
2
DX = E ( X − EX ) = EX 2 − ( EX )
Nếu X rời rạc:
 EX 2 = ∑ xi2 . pi
Nếu là hàm mật độ:
  2 p+∞( xi)2
 = x . p( x )dx
 EX
- Ý nghĩa :
EX =∫∑ xi . pi
 
−∞
Phương sai của biến ngẫu nhiên là số đo của
i

+∞
mức độ tập trung, phân tán của các giá trị
 EX = x. p( x )dx


biến ngẫu nhiên xung quanh giá trị trung

−∞

bình của nó. DX càng lớn thì các giá trị của
biến ngẫu nhiên càng phân tán. DX càng nhỏ thì các giá trị của X càng tập trung quanh EX. Phương sai còn được
gọi là bình phương độ lệch trung bình.
- Tính chất :
1. DC = 0 ; C = const
2. D(CX) = C2 DX
3. D(-X) = DX
±
4. D(XY) = DX DY (X, Y độc lập)
* Kì vọng, phương sai của các biến ngẫu nhiên theo các phân phối thường gặp :
- Phân phối đều rời rạc :
1
pi = P ( X = xi ) =
+ Kì vọng :
1 n
n
EX=
.∑ x2i
+ Phương sai:
1 n 2 1  nn i =1 
2
2
DX = EX − ( EX ) = ×∑ xi − 2 × ∑ xi ÷
X : B ( n, p )
n i =1
n  i =1 
Phân
phối nhị thức:
qm}===10,
− nnmp. p m .q n − m

với ;
P{ X = m
C
n
Khi đó: + Kì vọng:
EX = n∑ EXi = np
+ Phương sai:
DX= ∑i =1DX i = npq
- Phân phối chuẩn:
X : N (µ ,σ 2 )
i =1
Là phân phối của biến ngẫu nhiên
liên tục với hàm mật độ:
−∞ < x < +∞− ( x − µ )2
()
1
2
2
σ
p( x) =
×e
EX = µ
Ta có: + Kì vọng:
σ 2π
+ Phương sai:
DX=σ 2
Câu 10: * Các mô hình của xác suất thống kê cổ điển. Cho ví dụ
1/ Mô hình siêu hình học (Hyber Geometry)
Bài toán: 1 lô hàng có n sản phẩm trong đó có m phế phẩm. Rút ngẫu nhiên k sản phẩm. Tìm xác suất để:
a) Có đúng p phế phẩm

b) Xét trường hợp p=0, p=k
c) Có ít nhất 1 phế phẩm
d) Có nhiều nhất 1 phế phẩm
Giải:
a) Đặt A là sự kiện có p phế phẩm khi rút k sản phẩm
Công thức: P(A) : =
mA
p
k−p
N=
mA =
P(A) =
Cm .nC
n!n − m
k!(nC−nk k )!

7


b) A0 (p=0) => p(A0)
Ak (p=k) => p(Ak)
Cm0 .Cnk− m Cnk− m
= k
Cnk
Cn
phẩm nào
Có ít nhất 1 phế phẩm => p1 => C là sự kiện của xác ≥ suất
(p < 1 <=> p=0) => = A0
C
k

P(C) = 1 - P() = 1 CC
n−m
hoặc:
Cp nk k − p
k
P(C) =
Cm .Cn −m

Cnk
p =1

p=0 => P(A0) =
p=k => P(Ak) =
Cmk .Cn0− m Cmk
c) Gọi là sự kiện không có phế C k = CCk
n
n

d) Gọi D là sự kiện có nhiều nhất 1 phế phẩm ≤
=> p1 => Có 2 trường hợp là có 1 phế phẩm

và không có phế phẩm nào
Gọi D’ và D’’ lần lượt là sự kiện có 1 phế phẩm và không có phế phẩm nào
mD’ =
Cm1 .Cnk−−m1
mD’’ =
Cnk− m
1 k k −1
mD = mD’ + mD’’ = +
CC

m .nC
−m
n −m
1
P(D) =
Cm .Cnk−−m1 + Cnk− m
Cnk

2/ Mô hình đi tàu
Bài toán: 3 nữ sinh L, H, C đi tàu hỏa với 10 toa tàu. Tính xác suất trong các trường hợp sau đây:
a) Mỗi toa tàu không chứa quá 1 nữ sinh
b) 3 nữ sinh ngồi 3 toa khác nhau
c) 3 nữ sinh ngồi 3 toa liền kề nhau
d) 3 nữ sinh ngồi cùng 1 toa
e) L luôn ngồi toa đầu
f) H, C ngồi các toa đầu cuối
g) Toa 5 không có ai ngồi
Giải:
Số trường hợp đồng khả năng: n = 10.10.10 = 1000 103
a) Gọi A là sự kiện cần tính xác suất
mA = 10.9.8 = 720
1 cách chọn là 1 chỉnh hợp chập 3 của 10 nên số cách A103 chọn là mA = = 8.9.10
Xác suất để mỗi toa tàu không chứa quá 1 nữ sinh là: mA P(A) = = 1%
b) Gọi B là sự kiện 3 nữ sinh ngồi ở 3 toa khác ≡
n nhau => BA
c) Gọi B là sự kiện 3 nữ sinh ngồi 3 toa liền kề
3 cô có thể đổi chỗ cho nhau => có 3! = 6 cách sắp xếp
Có 8 vị trí mà các cố có thể ngồi liền kề nhau
 mC = 3! . 8 = 48 => P(C) = = 4,8%
48

d) Gọi D là sự kiện 3 nữ sinh ngồi cùng 1 toa
1000
mD = 10 ; P(D) = = 1%
10
e) Gọi E là sự kiện L ngồi toa đầu
1000
mE = 1.10.10 = 100
P(E) = = 10% 100
f) Gọi F là sự kiện H, C ngồi các toa đầu cuối => 1000 mF = 2.10 = 20
P(F) = = 2%
20
g) Gọi G là sự kiện toa 5 không có ai ngồi
1000
mG = 9.9.9 = 729
P(G) = = 72,9% 729
1000
3/ Mô hình xếp chỗ ngồi
Bài toán 1: 3 người L, H, C ngồi trên 1 băng ghế trống 10 chỗ. Tìm xác suất:
a) 3 nữ sinh ngồi ở 3 vị trí liền kề
b) L luôn ngồi ở vị trí đầu
c) H, C luôn ngồi ở vị trí đầu cuối

8


Giải:
Số trường hợp đồng khả năng : n = 10.9.8 = 720
a) Gọi A là sự kiện 3 nữ sinh ngồi ở 3 vị trí liền kề
Có 3 ! = 6 cách xếp chỗ cho 3 người
Có 8 chỗ mà 3 người có thể ngồi liền kề


mA = 6.8 = 48
P(A) = 6,6%
48
b) Gọi B là sự kiện L luôn ngồi ở vị trí đầu
720
mB = 1.9.8 = 72
P(B) = = 10%
72
c) Gọi C là sự kiện C, H luôn ngồi ở vị trí đầu cuối 720

mC = 2.8 = 16
P(C) = 2,2%
16
Bài toán 2 : Một tổ gồm 10 người tổ chức liên hoan 720 ngồi quanh bàn tròn. Mọi người ngồi vào chỗ một cách
ngẫu nhiên. Tìm khả năng để cho A và B ngồi cạnh
nhau
Giải :
Số trường hợp đồng khả năng : n = 10!
A có thể ngồi 1 trong 10 chỗ, B có thể ngồi ở 2 chỗ bên cạnh A
=> m = 10.2.8!
Xác suất cần tìm là : P = =
10.2.8!
2
10!
9
4/ Mô hình bắn súng:
Bài toán : 2 xạ thủ bắn vào bia 1 cách độc lập. Xác suất trúng tương ứng là 0,7 và 0,8. Tìm các xác suất:
a) Có đúng 1 xạ thủ trúng đích
b) Có ít nhất 1 xạ thủ trúng đích

Giải:
B
a) P(A)=0,7 => P(Ā)= 1 - 0,7 = 0,3
P(B)=0,8 => P()= 1 - 0,8 = 0,2
Gọi A1 là biến cố có đúng 1 xạ thủ trúng đích.
Xạ thủ A trúng và xạ thủ B trượt hoặc ngược lại
A1 = A.B đối lập ∪ Ā.B
(,) và (Ā, B) là các sự kiện đôi một xung khắc
B
A
=> P(A1)=P(A).P() + P(Ā).P(B)
= 0,7 . 0,2 + 0,3 .0,8 = 0,38
P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B )
b) Có ít nhất 1 xạ thủ trúng đích =>
= 0,7 + 0,8 - 0,56 = 0,94
Lý thuyết thống kê toán
Câu 1: Đối tượng và nội dung nghiên cứu của Thống kê toán là gì?
Thống kê toán học là một ngành khoa học nghiên cứu việc thu thập thông tin qua các dữ liệu của các đối tượng cần nghiên cứu
để từ đó rút ra những kết luận bằng số về bản chất đối tượng tùy theo yêu cầu nghiên cứu.
Đối tượng nghiến cứu của thống kê toán: thông tin qua các dữ liệu.
Nội dung của nghiên cứu thống kê toán: từ thông tin qua các dữ liệu rút ra kết luận bằng số về bản chất đối tượng.
Câu 2: Các khái niệm cơ sở của thống kê toán
1. Khái niệm
Trong những vấn đề thực tế, ta thường phải nghiên cứu một hay nhiều dấu hiệu định tính hoặc định lượng của các phần tử thuộc
một tập hợp nào đó, chẳng hạn như: chiều cao của thanh niên Việt Nam, tình hình thu nhập và chi tiêu của các hệ gia đình…
Để nghiên cứu tập hợp các phần tử theo dấu hiệu nghiên cứu, ta có thể sử dụng phương pháp nghiên cứu toàn bộ, nghĩa là khảo
sát dấu hiệu nghiên cứu trên từng phần tử của tập hợp. Nhưng phương pháp này gặp nhiều khó khăn.
Vì vậy, trong thực tế, người ta thường áp dụng phương pháp nghiên cứu chọn mẫu. Nội dung của phương pháp này là từ tập hợp
nghiên cứu, được gọi là tổng thể, chọn ra một số các phần tử, được gọi là mẫu, khảo sát dấu hiệu nghiên cứu trên mẫu, dựa vào
đó mà phân tích, rút ra kết luận cho tổng thể.

Cơ sở khoa học của phương pháp này là lí thuyết xác suất và thống kê toán.
2. Một số phương pháp chọn mẫu chủ yếu:
a) Chọn mẫu ngẫu nhiên, đơn giản: là loại mẫu được chọn trực tiếp từ danh sách đã được đánh số của tổng thể. Các phần tử của
mẫu được chọn ra từ tổng thể bằng cách rút thăm theo một bảng số ngẫu nhiên.
Phương pháp này có ưu điểm là cho phép thu được một mẫu có tính đại diện cao nếu giữa các phần tử của tổng thể không có gì

9


là khác biệt nhiều. Nếu kết cấu của tổng thể phức tạp thì chọn theo phương pháp này sẽ khó đảm bảo tính đại diện. Một nhược
điểm nữa là trong trường hợp quy mô của tổng thể khá lớn thì việc đánh số tất cả các phần tử sẽ rất khó khăn.
b) Mẫu hệ thống: là loại mẫu mà chỉ có phần tử đầu tiên được chọn ngẫu nhiên, sau đó dựa trên một quy tắc hay một thủ tục
nào đó đề chọn ra các phần tử tiếp theo. Chẳng hạn, trên một danh sách gồm N sinh viên, cần chọn ra một mẫu kích thước n, ta
chia danh sách thành n phần bằng nhau, ở phần T1 gồm “N/n” phần tử, chọn ngẫu nhiên ra 1 phần tử, sau đó cứ cách “N/n” phần
tử cho vào mẫu cho đến khi đủ n phần tử.
Nhược điểm của phương pháp này là dễ mắc sai số hệ thống khi các phần tử của tổng thể không được sắp xếp một cách ngẫu
nhiên mà theo một trật tự chủ quan nào đó. Tuy vậy, do tính đơn giản, mẫu hệ thống thường được dùng ở cấp chọn mẫu cuối
cùng và khi tổng thể tương đối thuần nhất.
c) Mẫu phân tổ
Để chọn mẫu phân tổ, trước hết người ta phân chia tổng thể thành các tổ có độ thuần nhất cao để chọn ra các phần tử đại diện
cho từng tổ. Việc phân tổ có hiệu quả khi tổng thể nghiên cứu không thuần nhất theo dấu hiệu nghiên cứu. Sau khi đã phân tổ
thì kích thước mẫu được phân bổ cho mỗi tổ theo 1 quy tắc nào đó, chẳng hạn tỉ lệ thuận với kích thước mỗi tổ.
3. Ý nghĩa của mẫu
Trong ngành chọn mẫu, khảo sát không nhiều các đơn vị nghiên cứu nên thường được tiến hành trong thời gian ngắn. Dữ liệu
được xử lí, phân tích nhanh chóng nên thông tin thu được từ điều tra chọn mẫu có tính thời sự, cập nhật.
Chi phí cho công tác tổ chức nghiên cứu giảm. Do đó, nghiên cứu chọn mẫu tiết kiệm được nhân lực, vật lực, tài chính.
Có thể mở rộng nội dung nghiên cứu hoặc đi sâu tìm hiểu mặt nào đó của đối tượng.
Có thể tuyển chọn những điều tra viên tốt: Có trình độ, có kinh nghiệm, có điều kiện tập huấn thì thông tin thu được có tính
chính xác cao.
4. Các đặc trưng mẫu


Giả sử (X1, X2, …,Xn) là mẫu ngẫu nhiên sinh ra từ X có EX=µ, DX = Error: Reference source not found 2
a. Thống kê
Hàm T = T(X1, X2,…,Xn) được gọi là một thống kê.
Ví dụ : T = T(X1, X2,…,Xn) = max {X1, X2,…,Xn} là một thống kê
b. Trung bình mẫu (kì vọng mẫu)
Thống kê trung bình mẫu, kí hiệu : X, xác định bởi :
Trên mẫu cụ thể (x1,x2,…,xn), thống kê X nhận
giá trị :
Nếu mẫu sắp xếp theo bảng phân phối tần số thì :
Kì vọng mẫu số là một biến ngẫu nhiên có các
đặc trưng :
c. Phương sai mẫu
Phương sai mẫu, kí hiệu MS xác định
bởi :
Với mẫu thực nghiệm được sắp xếp theo tần
số, phương sai mẫu nhận giá trị tính theo
công thức :
Dùng các phép biến đổi, ta
được:
Thống kê :
Gọi là phương sai mẫu điều chỉnh
d. Độ lệch tiêu chuẩn mẫu
- thống kê được gọi là độ lệch tiêu chuẩn mẫu
- thống kê S = được gọi là độ lệch tiêu chuẩn mẫu
điều chỉnh
e. Phân bố của X và S2
* Nếu (X1, X2,…, Xn) là mẫu ngẫu nhiên được rút ra từ biến ngẫu nhiên chuẩn N(µ, Error: Reference source not

10



found 2) thì:
n.X cũng có phân phối chuẩn
có phân phối
X có phân phối chuẩn
X và S2 độc lập với nhau và ngược lại
có phân
phối student với n-1 bậc tự do
* Nếu (X1, X2,…, Xn) là mẫu từ biến ngẫu nhiên chuẩn N(µ1, Error:
Reference source not found1 2) , còn (Y1, Y2,…, Yn) là mẫu từ biến ngẫu nhiên chuẩn N(µ2, Error: Reference source
not found2 2) độc lập với mẫu trên. Khi đó:

Có phân phối student với n + m - 2 bậc tự do, trong đó S x2, Sy2 là 2
phương sai mẫu tương ứng với mẫu X và mẫu Y.
5. Phân phối thực nghiệm và hàm phân phối thực nghiệm
Giả sử mẫu thực nghiệm (x1, x2, …, xn) sinh từ X. Ta xây dựng hàm:
6.

Được gọi là hàm phân phối thực nghiệm
Định lí Glivenco.
Giả sử F(x) là hàm phân phối của biến ngẫu nhiên X mà ta cần tìm. F n(x) là hàm phân phối thực nghiệm nhận được từ
mẫu ngẫu nhiên cỡ n sinh ra từ X. Khi đó:
Như vậy, hàm phân phối thực
nghiệm là 1 xấp xỉ của hàm phân phối lí thuyết. Với n cố định, hàm phân phối thực nghiệm cho ta hình ảnh hình học
về phân phối lí thuyết cần tìm.
Định lí Glivenco là cách tìm dạng của hàm phân phối thực nghiệm.
Câu 3: Các loại ước lượng tham số (đặc trưng). Các phương pháp ước lượng. Nêu các công thức cơ bản.
Trả lời:
+) định nghĩa: là sử dụng 1 thống kê để đánh giá đối tượng

+) các loại ước lượng tham số( đặc trưng) là: ước lượng không chệch, ước lượng hiệu quả, ước lượng vững, ước
lượng tỉ lệ đám đông, ước lượng trung bình đám đông, ước lượng phương sai đám đông
+) Các phương pháp ước lượng là:
-ước lượng điểm cho kì vọng, phương sai và xác suất
-ước lượng khoảng cho kì vọng và xác suất
+) các công thức:
Tính trung bình mẫu:Error: Reference source not found=Error: Reference source not foundError: Reference source
not found
Tính phương sai đám đông: DX=VarX=Error: Reference source not found
Tính phương sai mẫu:
Error: Reference source not found=Error: Reference source not foundError: Reference source not found
;
Error: Reference source not found
Công thức T tính khoảng tin cậy đối với số trung bình μ trong phân phối chuẩn khi chưa biết phương sai:
Error: Reference source not found −< µ < Error: t (n − 1)(α / 2) * Sx
Reference source not found +
n
Câu 4: Thế nào là kiểm định giả thuyết thống kê? Cách tiến hành kiểm định giả thuyết thống kê. Các kết quả kiểm định chính.
Trả lời:
Kiểm định giả thuyết thống kê (statistical hypothesis test) là phương pháp
ra quyết định sử dụng dữ liệu, hoặc từ thí nghiệm hoặc từ nghiên cứu quan sát (observational study)(không có kiểm soát). Trong

11


thống kê (statistics), một kết quả được gọi là đủ độ tin cậy mang tính thống kê (statistically significant) nếu nó ít có khả năng
diễn ra theo một ngưỡng xác suất cho trước (ví dụ 5% hay 10%).
-Cách tiến hành kiểm định giả thuyết thông kê
Bước 1, nhà nghiên cứu cần phải định nghĩa một giả thuyết đảo (null hypothesis), tức là một giả thuyết ngược lại với những gì
mà nhà nghiên cứu tin là sự thật.

Bước 2, nhà nghiên cứu cần phải định nghĩa một giả thuyết phụ (alternative
hypothesis), tức là một giả thuyết mà nhà nghiên cứu nghĩ là sự thật, và điều cần được “chứng minh” bằng dữ kiện
Bước 3, sau khi đã thu thập đầy đủ những dữ kiện liên quan, nhà nghiên cứu dùng một hay nhiều phương pháp thống kê để kiểm
tra xem trong hai giả thuyết trên, giả thuyết nào được xem là khả dĩ. Cách kiểm tra này được tiến hành để trả lời câu hỏi: nếu giả
thuyết đảo đúng, thì xác suất mà những dữ kiện thu thập được phù hợp với giả thuyết đảo là bao nhiêu. Giá trị của xác suất này
thường được đề cập đến trong các báo cáo khoa học bằng kí hiệu “P value”. Điều cần chú ý ở đây là nhà nghiên cứu không thử
nghiệm giả thuyết khác, mà chỉ thử nghiệm giả thuyết đảo mà thôi.
Bước 4, quyết định chấp nhận hay loại bỏ giả thuyết đảo, bằng cách dựa vào giá trị xác suất trong bước thứ ba.
Bước 5, khi nhà nghiên cứu bác bỏ giả thuyết đảo, thì giả thuyết phụ được mặc nhiên công nhận, nhưng nhà nghiên cứu không
thể xác định giả thuyết phụ nào là đúng với sự thật.
- Các kết quả chính của giả thuyết thống kê

Phần 2 : BÀI TẬP
Bài tập về Biến ngẫu nhiên – Hàm phân phối – Hàm mật độ xác suất. Các phân phối xác suất thường gặp –
Các đặc trưng của biến ngẫu nhiên
Câu 1: Bắn 3 phát vào mục tiêu. Xác suất trúng của mỗi phát là 0,7. Cứ mỗi phát trúng được 5 điểm. gọi x là số điểm
đat được sau 3 phát. Tìm hàm phân phối xác suất của x.
Giải:
Công thức:
Cnk p k q n −k
Có: p = 0,7.
q = 1 – p = 1 – 0,7 = 0,3.
Ta có luật phân phối:
X
0
5
10
15
P = Pk


C30
C31
C32
. 0,70. 0,33 = . 0,71. 0,32 = . 0,72 . 0,3
0,027
0,189
0,441

C33
= . 0,73 . 0,30 =
0,343

Hàm phân phối xác suất của X:
FX (x) = Error: Reference source not found
Câu 2: Tiến hành bắn vào mục tiêu cho đến lúc trúng thì dừng lại. Xác suất trúng mỗi phát là . Gọi x là số lần bắn.
Tìm hàm phân phối xác suất của x.
Giải:
Tiến hành bắn vào mục tiêu cho đến lúc trúng thì dừng lại. Xác suất trúng mỗi phát làError: Reference source not
found . Gọi x là số lần bắn. tìm hàm phân phối xác suất của x.
Ta có đây là biến ngẫu nhiên rời rạc.Error: Reference source not found
Ta có bảng phân phối xác suất.
X
0
1
2
3

n

P


0

Error:
Reference
source not
found (1Error:
Reference
source not
found)

Error:
Reference
source not
found(1Error:
Reference
source not
found)2

12



Error:
Reference
source not
found(1-Error:
Reference
source not
found)n-1



Nếu xError: Reference source not found1 biến cố (XNếu 1< x Error: Reference source not found 2 biến cố (Xsource not found
Nếu 2< xError: Reference source not found 3 biến cố (XReference source not found + (1- Error: Reference source not found )
Nếu x>xn : F(x)= P1+P2+…+Pn=1
Vậy hàm phân bố xác suất:

Câu 3:
Vì X là một
biến
ngẫu
nhiên liên tục
nên
hàm
phân
phối
xác suất F(x) liên tục trên toàn trục số
Xét tại x=1 có
Error: Reference source not found
Mà Error: Reference source not found ; Error: Reference source not found
=> a = 1
Vậy: F(x)=Error: Reference source not found
Hàm mật độ xác suất: f(x) = F’(x)
Với x<0 => F(x) = 0 => f(x) = 0
Với Error: Reference source not found => F(x) = x2 => f(x) = 2x
Với x > 1 => F(x) = 1 => f(x)=0
Tại x = 0 có

F’(0-) = Error: Reference source not found = Error: Reference source not found = Error: Reference source not found
=0
F’ (0+) = Error: Reference source not found = Error: Reference source not found = Error: Reference source not
found= 0
=> f(0) = F’ (0) = 0
Tại x =1 có
F (1-) = Error: Reference source not found = Error: Reference source not found = Error: Reference source not found
F (1+) = Error: Reference source not found = Error: Reference source not found = Error: Reference source not found
=0
Vậy: f(x) = Error: Reference source not found
Xác suất để biến ngẫu nhiên X nhận giá trị trong khoảng Error: Reference source not found là:
P Error: Reference source not found = F Error: Reference source not found – F Error: Reference source not found =
Error: Reference source not found = Error: Reference source not found

λ = M ξλ k .e− λ
Câu 5: , trong đó
P
ξ
=
{ +∞K } 2= λ K e−λ 2
Suy ra
2
2
Dξ = M ξ − ( M ξ ) = ∑
× K! −λ
DξK= λ
Vậy
K!
K =0
Một số bài tập thống kê

+∞
+∞
λ K −1e− λ
λ K e− λ
dạng toán (dạng tổng hợp)
= λ∑ K ×
− λ 2 = λ ∑ ( K + 1) ×
− λ2
Câu 1:
( K − 1)!
K!
K =1
K =0
a) Ta có: n = 111
= λ ( λ + 1) − λ 2 = λ
γ = 1- α = 0,95 => α = 0,05
Tính:
Error: 2,5 * 5 + 3,25 * 8 + 3,75 * 8 + 4,25 * 30 + 4,75 * 24 + 5,25 *16 + 5,75 *10 + 6,5 * 6 + 8 * 4
Reference source
111
not found== 4,7
Phương sai mẫu:
Error: Reference source not 1 found = Error: Reference source not found (Error:
Reference source not found-Error: Reference source not 110 found) =* ( 238,375 - 22,09 ) = 1,96 => S = Error:

13


Reference source not found = 1,402
Tìm t: α = 0.05 => t110 ( 0,05/2 ) = 1,98

Vậy khoảng tin cậy là:
(Error: t (n − 1)(α / 2) * Sx
Reference source not found −;Error: Reference
n
source not found +) = (1,92 ; 7,48 )
Ý nghĩa: ước lượng thu nhập trung bình của các hộ trong thành phố trên nằm trong khoảng từ 1,92 đến 7,48 có khả
năng đúng 95%, sai 5%
b) Hộ có thu nhập 500 ngàn đồng/người/tháng trở lên=> mức thu nhập/người/năm của họ là từ 6 triệu đồng trở lên
được gọi là những hộ có thu nhập cao=> tỉ lệ hộ thu nhập cao là
Error: Reference source not found = Error: Reference source not found = 0,09
Error: Reference source not found = Error: Reference source not found = 0,027 Error: Reference source not
found(Error: Reference source not found) = 0,005
vậy khoảng tin cậy là: p ( f - Error: Reference source not found < p < f + Error: Reference source not found) =
( 0,036 < p < 0,143 )
Vậy với độ tin cậy 95% thì tỉ lệ hộ thu nhập cao dao động trong khoảng từ 0,036 đến 0,143
c) Tính ước lượng trung bình của chỉ tiêu X những hộ có thu nhập cao
tương tự phần a ta có:
Error: Reference source not found = Error: Reference source not found = 7,1
Error: Reference source not found = 0,508 => S = Error: Reference source not found = 0,713
Vậy khoảng tin cậy là:
(7,1 - Error: Reference source not found; 7,1 + Error: Reference source not found) = (
7 ; 7,21 )
Với độ tin cậy là 95% thì thu nhập trung bình của những hộ có thu nhập cao dao động từ 7 đến 7,21
d) Với độ tin cậy 5%=> γ = 0,05 = 1 - α => α = 0,95
Câu 2:
Số liệu về doanh số của 1 siêu thị trong 1 ngày
Doanh số ( triệu đồng / ngày )
24
30
36

42
18
54
60
65
70

Số ngày
5
12
25
35
24
15
12
10
6

a. Ước lượng doanh số bán trung bình trong 1 ngày của siêu thị với độ tin cậy 95%
b. Những ngày có doanh số trên 60 triệu là ngày đắt hàng. Ước lượng tỉ lệ ngày bán đắt hàng với độ tin cậy 90%
c. Ước lượng doanh số bán trung bình của 1 ngày bán đắt hàng với độ tin cậy 95%( giả thiết doanh số bán đắt hàng là đại lượng
ngẫu nhiên có phân phối chuẩn)
d. Trước đây doanh số bán trung bình của siêu thị là 35 triệu/ngày số liệu ở bảng trên thu được khi có 1 phương pháp bán hàng
mới. Hãy nhận xét về phương pháp bán hàng với mức ý nghĩa 5%

Giải:
a, Kích thước mẫu : n=144 >30
Doanh số trung bình x̄͞͞= 40.8 (triệu đồng/ngày)
Theo giả thiết ta có:
γ=95% => Uα/2 =1.96

tính được Ŝ=15.4
ε=Uα/2.(Ŝ /căn n)=(1.96).(15.4/12)=2.5
=>P {40.8-2.5<= μ<= 40.8+2.5}= 0.95 P{38.3<=μ<=43.3}
Vậy với độ tin cậy 95% thì doanh thu bán hàng trung bình trong một ngày của siêu thị rơi vào khoảng từ 38.3 tới 43.3
b, Kích thước mẫu n= 3 < 30
Trung bình số ngày bán đắt hàng x̄= 9.3 ngày
mà γ=90% => tα/22= 2.92
tính được Ŝ= 2.52
ε( khi n <30)=( 2.52).(2.92/căn 3)=4.25.
=>P{9.3 - 4.25<=μ<=9.3 +4.25}
 P{5.05 <=μ<= 13.55}

14


Vậy với độ tin cậy 90% thì tỉ lệ ngày bán đắt hàng rơi vào khoảng từ 5.05 ngày tới 13.55 ngày
c, Kích thước mẫu n= 28<30
Trung bình doanh thu của một ngày đắt hàng là: x̄ = 65 triệu đồng/ngày mà γ = 95% =>tα/2= 2.052
tính được Ŝ = 3.93
ε (khi n< 30 chưa biết apxilon) =( 2.052) .( 3.93/5.3) = 1.52
P{65- 1.52 <=μ<= 65+ 1.52}
P{ 63.48<=μ<=66.52}
Vậy với độ tin cậy 95% thì doanh thu trung bình của một ngày đắt hàng rơi vào khoảng từ 63.48 tới 66.52 triệu
đồng/ ngày
d. Mức ý nghĩa α= 5% =>γ=95%=> Uα/2=1.96
Kích thước mẫu n=144
x̄= 35 triệu đồng/ngày.

15