Tải bản đầy đủ (.pdf) (14 trang)

câu hỏi lý thuyết xác xuất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (340.07 KB, 14 trang )

Phần 1 : LÍ THUYẾT
Lí thuyết xác suất
Câu 1: Phân biệt các khái niệm: Hoán vị, tổ hợp, chỉnh hợp (lặp và không lặp) của một tập con từ tập n phần tử.
Nêu các công thức xác định các số hoán vị, tổ hợp, chỉnh hợp. Thí dụ minh họa.
Nội
dung
Hoán vị Tổ hợp
Chỉnh hợp
Không lặp Lặp
Khái
niệm
Hoán vị của n
phần tử là một
nhóm có thứ tự
gồm đủ mặt n
phần tử đã cho
Tổ hợp chập k của n
phần tử (
k n≤
) là một
nhóm không phân biệt
thứ tự, gồm k phần tử
khác nhau chọn từ n phần
tử đã cho
Chỉnh hợp (không lặp)
chập k của n phần tử (
k n≤
) là một nhóm (bộ)
có thứ tự gồm k phần tử
khác nhau chọn từ n phần
tử đã cho


Chỉnh hợp lặp chập k của n
phần tử là một nhóm có thứ tự
gồm k phần tử chọn từ n phần
tử đã cho, trong đó mỗi phần
tử có thể có mặt 1,2,…,k lần
trong nhóm
Công
thức
Số hoán vị của n
phần tử được ký
hiệu là
n
P
!
n
P n=
Số tổ hợp chập k của n
phần tử ký hiệu là
k
n
C
!
!( )!
k n k
n n
n
C C
k n k

= =


Số chỉnh hợp chập k của
n phần tử ký hiệu là
k
n
A
!
( )!
k
n
n
A
n k
=

Số chỉnh hợp lặp chập k của n
phần tử ký hiệu là
k
n
B
k k
n
B n=
Thí
dụ
Một bàn có 4 học
sinh. Mỗi cách
xếp chỗ 4 học
sinh vào 1 bàn là
1 hoán vị của 4

phần tử. Do đó số
cách xếp là
4
4! 24P = =
Chọn ngẫu nhiên 2 quyển
sách từ trên giá sách có 3
quyển sách. Mỗi cách
chọn là 1 tổ hợp chập 2
của 3 phần tử. Do đó có
2
3
3C =
cách chọn
Cho 3 chữ số 1,2,3. Mỗi
số tự nhiên gồm 2 chữ số
khác nhau được lập từ 2
trong 3 chữ số trên là một
chỉnh hợp không lặp
chập 2 của 3 phần tử. Do
đó có thể lập được
2
3
A
= 3.2 = 6 số.
Cho 5 hòn bi vào 3 hộp. Mỗi
cách xếp 5 hòn bi vào 3 hộp
là một chỉnh hợp lặp chập 5
của 3.
Do đó có
5 5

3
3 243B = =
cách
xếp
Câu 2 : Thế nào là một phép thử ? Một biến cố (sự kiện) ?
- Quan hệ giữa các biến cố. phép tính của các biến cố.
- Biến cố chắc chắn; không thể; xung khắc; đối lập biểu diễn qua sơ đồ Ven – Euler ?
Trả lời:
- Phép thử: là sự thể hiện một nhóm các điều kiện xác định (G) có tính lặp lại.
Kí hiệu: T
Sự kiện (biến cố) : là kết quả của phép thử. Kí hiệu: E, A, B, C, ….
Có 2 loại sự kiện là:
+ Sự kiện ngẫu nhiên (Random Effect) : có thể xuất hiện hoặc không xuất hiện khi thực hiện phép thử, không phụ
thuộc vào chủ quan. Sự kiện ngẫu nhiên là đối tượng nghiên cứu của khoa học ngẫu nhiên.
+ Sự kiện tất định (Definity Events) : luôn xuất hiện (Ω hoặc ) hoặc luôn không xuất hiện khi thực hiện phép thửƱ
(Ø)
* Quan hệ (relation) giữa các biến cố:
+ Quan hệ bao hàm:
A B⊂
+ quan hệ tương đương:
A B≡
* Phép tính (Calculus):
+ Hợp (tổng):
A B C
∪ =
+ Giao (tích):
A B D∩ =
+ Trừ (hiệu):
\A B E=
+ Hiệu đối xứng: F = A ∆ B = (A\B) (B\A)∪

+ Đối lập (bù):
A
đối lập với A ( có cái này thì ko có cái kia)
+ Xung khắc:
A B
∩ = ∅
(không cùng xảy ra)
+ Nhóm đầy đủ:
1 2

n
i j
A A A
A A
∪ ∪ ∪ = Ω



∩ = ∅


1
* Biểu diễn qua sơ đồ Ven – Euler các biến cố:
Biến cố chắc chắn xảy ra:
Biến cố không thể xảy ra: (là một tập rỗng)
Biến cố xung khắc:
Biến cố bù (đối lập):
Câu 3 :
A, B,C là 3 biến cố gắn với phép thử G. Biểu diễn qua A, B, C các biến cố sau đây :
- Chỉ có A xảy ra : A∩B∩C ( tương tự cho B, C)

- Ít nhất một trong 3 biến cố xảy ra: A∪B∪C
- Nhiều nhất một biến cố xảy ra:
(A ∩B ∩C) ∪ (A ∩B ∩C) ∪ (A ∩ B ∩C) ∪ (A ∩B ∩ C )
- Không có biến cố nào xảy ra: A∩B∩C
Câu 4 : Các định nghĩa xác suất một biến cố. Ý nghĩa của xác suất là gì?
- Gọi P(A) là tần suất được xuất hiện biến cố A trong định nghĩa xác suất theo tần suất. Có thể viết như sau được
không?
( ) lim ( )
n
P A P A
→∞
=
- Hai biến cố có xác suất bằng nhau thì có tương đương hay không?
- Một biến cố có xác suất 0, có thể xảy ra hay không?
Trả lời :
• Định nghĩa xác suất một biến cố:
-Giả sử phép thử có n biến cố đồng khả năng có thể xảy ra, trong đó có m biến cố đồng khả năng thuận lợi cho
biến cố A (A là tổng khả năng của m biến cố sơ cấp này). Khi đó xác suất của biến cố A, ký hiệu P(A) được định
nghĩa bởi công thức sau:
( )
m
P A
n
=
, trong đó m là số trường hợp thuận lợi cho A, n là số trường hợp đồng khả
năng.
- Có thể viết
( ) lim ( )
n
P A P A

→∞
=
vì ta có
( )
m
P A
n
=
%
%

( ) lim
n
m
P A
n
→∞
⇒ =
Khi cho số phép thử tăng lên vô hạn thì tần suất xuât hiện biến cố A dần về một số xác định gọi là xác suất của biến cố
A.
•Hai biến cố có xác suất bằng nhau không tương đương vì 2 biến cố A và B tương đương nhau
A B
B A






• Có thể xảy ra một biến cố có xác suất bằng không. Đó là trường hợp không xuất hiện khả năng nào thuận lợi cho

A.
2
Câu 5 :
• Hai biến cố A và B là độc lập khi và chỉ khi P(A ∩ B) = P(A).P(B).
trong đó, A ∩ B là giao của A và B, nghĩa là, nó là biến cố rằng cả hai biến cố A và B đều xảy ra.
Tổng quát hơn, một tập hợp biến cố bất kỳ (có thể gồm nhiều hơn hai biến cố) là độc lập lẫn nhau khi và chỉ khi với
mọi tập con hữu hạn A1, , An của tập hợp trên, ta có
• Mối quan hệ giữa khái niệm độc lập và xung khắc
Công thức nhân xác suất:
1. P(A∩B) = P(A). P(B) ( Với A, B độc lập )
P(A∩B) = P(B/A). P(A) = P( A/B). P(B)
2. P(A∩B∩C) = P(A) . P(B) . P(C) ( Với A,B,C độc lập)
= P(A) . P(B/A) . P(C/AB)
3. P( A∪B) = P(A) + P(B) ( Với A∩ B = ∅)
P( A∪B) = P( A) + P(B) - P(A∩B) ( Với A, B bất kì)
4. P(A∪B∪C) = P(A) + P(B) + P(C) = P(A) + P(B) + P(C) - P(AB) - P(BC) - P(AC) + P(ABC)
• Chứng minh nếu A, B độc lập thì , B và , cũng độc lập
Hai biến cố độc lập là hai biến cố xảy ra nhưng không liên quan gì đến nhau cho nên biến cố đối của A tức và B cũng
độc lập với nhau tức là xảy ra không hề liên quan đến nhau. Tương tự như vậy thì và cũng độc lập với nhau
• Chứng minh nếu P(A/B)= P(A/) thì A B độc lập
ta có P(A/B)= P(A/) nghĩa là xác suất của biến cố A dưới điều kiện B xảy ra giống như xác suất của biến cố A dưới
điều kiện B không xảy ra=> cho nên hai biến cố AB việc xảy ra hay không xảy ra biến cố này thì không ảnh hưởng gì
đến việc xảy ra của biến cố kia tức là hai biến cố A, B độc lập.
Câu 6: Tại sao lại gọi là một hệ đầy đủ các biến cố? Ý nghĩa của công thức xác suất đầy đủ, công thức Bayes.
Trả lời:
-Gọi là 1 hệ đầy đủ các biến cố vì khi ta thực hiện phép thử ngẫu nhiên sẽ có nhiều khả năng xảy ra, có thể là đối
lập, xung khắc từng đôi….Trong các khả năng xảy ra đó lại xảy ra nhiều giai đoạn khác nhau nữa, những hoạt
động tiếp theo phụ thuộc vào hoạt động xảy ra trước đó =>Cần phải tính xác suất để thức hiện được công việc qua
nhiều giai đoạn nhưng tổng của chúng luôn là biến cố chắc chắn =>Hệ đầy đủ các biến cố.
-Ý nghĩa của công thức Bayes: Công thức Bayes còn được gọi là công thức xác suất hậu nghiệm khi và chỉ khi sự

kiện đã xảy ra, tìm nguyên nhân gây ra sự kiện đó với xác suất lớn nhất. công thức Bayes được ứng dụng trong
Khoa học - Kĩ thuật, đặc biệt trong khoa học lắp ráp.
Câu 7:
- Biến ngẫu nhiên là 1 biến số nhận giá trị tùy thuộc sự kiện ngẫu nhiên.
- Có 2 loại biến ngẫu nhiên:
+ Biến ngẫu nhiên rời rạc (discrete): Tập giá trị nhận là hữu hạn hoặc đếm được.
+ Biến ngẫu nhiên liên tục (continious): Tập giá trị nhận lấp đầy 1 khoảng hữu hạn hoặn vô hạn.)
- Hàm phân phối của biến ngẫu nhiên X được xác định như sau:
F (x) = P {X < x}
Trong đó x là biến của hàm F,
x R

¡
Ký hiệu X=F(x) nghĩa là biến X có hàm phân phối là F(x).
- Tính chất của hàm phân phối:
+ Hàm phân phối xác định với mọi x € (-∞ , +∞)
+ Hàm phân phối là hàm không giảm: nếu x
1
< x
2
thì F(x
1
) ≤ F(x
2
)
F(-∞) = 0, F(+∞) = 1, 0≤F(x)≤1 với mọi x € (-∞ , +∞)
P {a≤x<b} = F(b) - F(a)
- Giải thích bằng hình học
-∞ x +∞
{X<x


3
{X<x
2
}
x
1

x
2
{ X<x
1
}

a { X<b } b
{X<a } {a ≤X<b}
- Phân phối nhị thức:
Xét n phép thử Bernoulli với biến cố A có P(A) = p.
Gọi X là số lần xuất hiện biến cố A. Khi đó phân phối của X được gọi là phân phối nhị thức, ký hiệu là B(n,p).
- Phân phối Poison:
Biến ngẫu nhiên X gọi là có phân phối Poison nếu
P{X=k} =e

. λ
k
/ k! (k = 0, 1, 2, 3…… )
λ là tham số, λ >0
- Phân phối chuẩn
Là phân phối của biến ngẫu nhiên liên tục với hàm mật độ
2

( )2
2
1
( )
2 .
x
p x e
µ
δ
π δ


= ⋅
Câu 8:
-Định nghĩa hàm mật độ: Biến ngẫu nhiên X được gọi là có phân phối liên tục tuyệt đối nếu hàm phân phối có
dạng
( ) ( )
x
X
F x f t dt
−∞
=

,
x R∈¡
. Hàm dưới dấu tích phân f(x) được gọi là hàm mật độ của X.
- Tính chất của hàm mật độ:
+
( )
( )

X
dF x
f x
dx
=
tại các điểm liên tục của f(x)
+
( ) 0,f x x≥ ∀
+
( ) 1f x dx
+∞
−∞
=

+
( ) ( )
b
a
P a X b f x dx≤ < =

Câu 9:
* Định nghĩa, ý nghĩa và tính chất của kì vọng:
- Định nghĩa:
Kì vọng của biến ngẫu nhiên X là một số, ký hiệu EX, được xác định như sau:
EX
i i
i
x p=

nếu

( )
i i
P X x p= =
(X là biến ngẫu nhiên rời rạc)
EX . ( )x p x dx
+∞
−∞
=

nếu
( )p x
là hàm mật độ (X là biến ngẫu nhiên liên tục)
- Ý nghĩa:
Kì vọng của biến ngẫu nhiên là giá trị trung bình mà biến ngẫu nhiên nhạn, hoặc là trọng tâm phân phối xác suất
với khối lượng 1. Kì vọng là trung bình có trọng lượng
4
Trong trường hợp các xác suất
i
p
bằng nhau (phân phối đều rời rạc) thì trung bình có trọng lượng trùng với trung
bình số học:
1
1
EX= .
n
i
i
x
n
=


- Tính chất:
1. EC = C (C = const)
2. E(CX) = CEX
3. E(X
±
Y) = EX
±
EY
4. E(X.Y) = EX . EY ( Nếu X, Y độc lập)
→ Kì vọng bảo toàn tuyến tính.
5. E
( )
( ).
i i
i
f X f x p=

nếu
( )
i i
P X x p= =
Hoặc E
( )
( ). ( )f X f x p x dx
+∞
−∞
=

nếu p(x) là hàm mật độ

* Định nghĩa, ý nghĩa và tính chất của phương sai:
- Định nghĩa:
Phương sai của biến ngẫu nhiên X là một số không âm, ký hiệu DX, được xác định như sau:
( ) ( )
2 2
2
DX E X EX EX EX= − = −
Nếu X rời rạc:
2 2
EX .
EX .
i i
i
i i
i
x p
x p

=


=




Nếu
( )p x
là hàm mật độ:
2 2

EX . ( )
EX . ( )
x p x dx
x p x dx
+∞
−∞
+∞
−∞

=




=




- Ý nghĩa :
Phương sai của biến ngẫu nhiên là số đo của mức độ tập trung, phân tán của các giá trị biến ngẫu nhiên xung quanh
giá trị trung bình của nó. DX càng lớn thì các giá trị của biến ngẫu nhiên càng phân tán. DX càng nhỏ thì các giá trị
của X càng tập trung quanh EX. Phương sai còn được gọi là bình phương độ lệch trung bình.
- Tính chất :
1. DC = 0 ; C = const
2. D(CX) = C
2
DX
3. D(-X) = DX
4. D(X

±
Y) = DX
±
DY (X, Y độc lập)
* Kì vọng, phương sai của các biến ngẫu nhiên theo các phân phối thường gặp :
- Phân phối đều rời rạc :
1
( )
i i
p P X x
n
= = =
+ Kì vọng :
1
1
EX= .
n
i
i
x
n
=

+ Phương sai:
( )
2
2
2 2
2
1 1

1 1
DX EX EX
n n
i i
i i
x x
n n
= =
 
= − = ⋅ − ⋅
 
 
∑ ∑
- Phân phối nhị thức:
( , )X B n p:

{ }
. .
m m n m
n
P X m C p q

= =
với
1q p= −
;
0,m n=
Khi đó: + Kì vọng:
1
EX EX

n
i
i
np
=
= =

5
+ Phương sai:
1
DX= DX
n
i
i
npq
=
=

- Phân phối chuẩn:
2
( , )X N
µ σ
:
Là phân phối của biến ngẫu nhiên liên tục với hàm mật độ:
2
2
( )
2
1
( )

2
x
p x e
µ
σ
σ π


= ⋅
(
x−∞ < < +∞
)
Ta có: + Kì vọng:
EX
µ
=
+ Phương sai:
2
DX=
σ
Câu 10: * Các mô hình của xác suất thống kê cổ điển. Cho ví dụ
1/ Mô hình siêu hình học (Hyber Geometry)
Bài toán: 1 lô hàng có n sản phẩm trong đó có m phế phẩm. Rút ngẫu nhiên k sản phẩm. Tìm xác suất để:
a) Có đúng p phế phẩm
b) Xét trường hợp p=0, p=k
c) Có ít nhất 1 phế phẩm
d) Có nhiều nhất 1 phế phẩm
Giải:
a) Đặt A là sự kiện có p phế phẩm khi rút k sản phẩm
Công thức: P(A) : =

A
m
n
N =
)!(!
!
knk
n

m
A
=
.
p k p
m n m
C C


P(A) =
.
p k p
m n m
k
n
C C
C


b) A
0

(p=0) => p(A
0
)
A
k
(p=k) => p(A
k
)
p=0 => P(A
0
) =
0
.
k k
m n m n m
k k
n n
C C C
C C
− −
=
p=k => P(A
k
) =
0
.
k k
m n m m
k k
n n

C C C
C C

=
c) Gọi
C
là sự kiện không có phế phẩm nào
Có ít nhất 1 phế phẩm => p

1 => C là sự kiện của xác suất

C
(p < 1 <=> p=0) =>
C
= A
0
P(C) = 1 - P(
C
) = 1 -
k
n m
k
n
C
C

hoặc:
P(C) =
1
.

p k p
k
m n m
k
p
n
C C
C


=

d) Gọi D là sự kiện có nhiều nhất 1 phế phẩm => p

1 => Có 2 trường hợp là có 1 phế phẩm và không có phế
phẩm nào
Gọi D’ và D’’ lần lượt là sự kiện có 1 phế phẩm và không có phế phẩm nào
6
m
D’
=
1 1
.
k
m n m
C C



m

D’’
=
k
n m
C

m
D
= m
D’
+ m
D’’
=
1 1
.
k
m n m
C C


+
k
n m
C

P(D) =
1 1
.
k k
m n m n m

k
n
C C C
C

− −
+
2/ Mô hình đi tàu
Bài toán: 3 nữ sinh L, H, C đi tàu hỏa với 10 toa tàu. Tính xác suất trong các trường hợp sau đây:
a) Mỗi toa tàu không chứa quá 1 nữ sinh
b) 3 nữ sinh ngồi 3 toa khác nhau
c) 3 nữ sinh ngồi 3 toa liền kề nhau
d) 3 nữ sinh ngồi cùng 1 toa
e) L luôn ngồi toa đầu
f) H, C ngồi các toa đầu cuối
g) Toa 5 không có ai ngồi
Giải:
Số trường hợp đồng khả năng: n = 10.10.10 = 1000 10
3
a) Gọi A là sự kiện cần tính xác suất
m
A
= 10.9.8 = 720
1 cách chọn là 1 chỉnh hợp chập 3 của 10 nên số cách chọn là m
A
=
3
10
A
= 8.9.10

Xác suất để mỗi toa tàu không chứa quá 1 nữ sinh là: P(A) =
A
m
n
= 1%
b) Gọi B là sự kiện 3 nữ sinh ngồi ở 3 toa khác nhau => B

A
c) Gọi B là sự kiện 3 nữ sinh ngồi 3 toa liền kề
3 cô có thể đổi chỗ cho nhau => có 3! = 6 cách sắp xếp
Có 8 vị trí mà các cố có thể ngồi liền kề nhau
 m
C
= 3! . 8 = 48 => P(C) =
48
1000
= 4,8%
d) Gọi D là sự kiện 3 nữ sinh ngồi cùng 1 toa
m
D
= 10 ; P(D) =
10
1000
= 1%
e) Gọi E là sự kiện L ngồi toa đầu
m
E
= 1.10.10 = 100 P(E) =
100
1000

= 10%
f) Gọi F là sự kiện H, C ngồi các toa đầu cuối => m
F
= 2.10 = 20
P(F) =
20
1000
= 2%
g) Gọi G là sự kiện toa 5 không có ai ngồi
m
G
= 9.9.9 = 729 P(G) =
729
1000
= 72,9%
3/ Mô hình xếp chỗ ngồi
Bài toán 1: 3 người L, H, C ngồi trên 1 băng ghế trống 10 chỗ. Tìm xác suất:
a) 3 nữ sinh ngồi ở 3 vị trí liền kề
7
b) L luôn ngồi ở vị trí đầu
c) H, C luôn ngồi ở vị trí đầu cuối
Giải:
Số trường hợp đồng khả năng : n = 10.9.8 = 720
a) Gọi A là sự kiện 3 nữ sinh ngồi ở 3 vị trí liền kề
Có 3 ! = 6 cách xếp chỗ cho 3 người
Có 8 chỗ mà 3 người có thể ngồi liền kề
m
A
= 6.8 = 48 P(A) =
48

720

6,6%
b) Gọi B là sự kiện L luôn ngồi ở vị trí đầu
m
B
= 1.9.8 = 72 P(B) =
72
720
= 10%
c) Gọi C là sự kiện C, H luôn ngồi ở vị trí đầu cuối
m
C
= 2.8 = 16 P(C) =
16
720

2,2%
Bài toán 2 : Một tổ gồm 10 người tổ chức liên hoan ngồi quanh bàn tròn. Mọi người ngồi vào chỗ một cách ngẫu nhiên.
Tìm khả năng để cho A và B ngồi cạnh nhau
Giải :
Số trường hợp đồng khả năng : n = 10!
A có thể ngồi 1 trong 10 chỗ, B có thể ngồi ở 2 chỗ bên cạnh A
=> m = 10.2.8!
Xác suất cần tìm là : P =
10.2.8!
10!
=
2
9

4/ Mô hình bắn súng:
Bài toán : 2 xạ thủ bắn vào bia 1 cách độc lập. Xác suất trúng tương ứng là 0,7 và 0,8. Tìm các xác suất:
a) Có đúng 1 xạ thủ trúng đích
b) Có ít nhất 1 xạ thủ trúng đích
Giải:
a) P(A)=0,7 => P(Ā)= 1 - 0,7 = 0,3
P(B)=0,8 => P(
B
)= 1 - 0,8 = 0,2
Gọi A
1
là biến cố có đúng 1 xạ thủ trúng đích.
Xạ thủ A trúng và xạ thủ B trượt hoặc ngược lại
A
1
= A.B đối lập ∪ Ā.B
(
A
,
B
) và (Ā, B) là các sự kiện đôi một xung khắc
=> P(A
1
)=P(A).P(
B
) + P(Ā).P(B)
= 0,7 . 0,2 + 0,3 .0,8 = 0,38
b) Có ít nhất 1 xạ thủ trúng đích =>
( ) ( ) ( ) ( )P A B P A P B P A B
∪ = + − ∩


= 0,7 + 0,8 - 0,56 = 0,94
Lý thuyết thống kê toán
Câu 1: Đối tượng và nội dung nghiên cứu của Thống kê toán là gì?
Thống kê toán học là một ngành khoa học nghiên cứu việc thu thập thông tin qua các dữ liệu của các đối tượng cần nghiên cứu
để từ đó rút ra những kết luận bằng số về bản chất đối tượng tùy theo yêu cầu nghiên cứu.
Đối tượng nghiến cứu của thống kê toán: thông tin qua các dữ liệu.
Nội dung của nghiên cứu thống kê toán: từ thông tin qua các dữ liệu rút ra kết luận bằng số về bản chất đối tượng.
Câu 2: Các khái niệm cơ sở của thống kê toán
1. Khái niệm
Trong những vấn đề thực tế, ta thường phải nghiên cứu một hay nhiều dấu hiệu định tính hoặc định lượng của các phần tử thuộc
một tập hợp nào đó, chẳng hạn như: chiều cao của thanh niên Việt Nam, tình hình thu nhập và chi tiêu của các hệ gia đình…
8
Để nghiên cứu tập hợp các phần tử theo dấu hiệu nghiên cứu, ta có thể sử dụng phương pháp nghiên cứu toàn bộ, nghĩa là khảo
sát dấu hiệu nghiên cứu trên từng phần tử của tập hợp. Nhưng phương pháp này gặp nhiều khó khăn.
Vì vậy, trong thực tế, người ta thường áp dụng phương pháp nghiên cứu chọn mẫu. Nội dung của phương pháp này là từ tập hợp
nghiên cứu, được gọi là tổng thể, chọn ra một số các phần tử, được gọi là mẫu, khảo sát dấu hiệu nghiên cứu trên mẫu, dựa vào
đó mà phân tích, rút ra kết luận cho tổng thể.
Cơ sở khoa học của phương pháp này là lí thuyết xác suất và thống kê toán.
2. Một số phương pháp chọn mẫu chủ yếu:
a) Chọn mẫu ngẫu nhiên, đơn giản: là loại mẫu được chọn trực tiếp từ danh sách đã được đánh số của tổng thể. Các phần tử của
mẫu được chọn ra từ tổng thể bằng cách rút thăm theo một bảng số ngẫu nhiên.
Phương pháp này có ưu điểm là cho phép thu được một mẫu có tính đại diện cao nếu giữa các phần tử của tổng thể không có gì
là khác biệt nhiều. Nếu kết cấu của tổng thể phức tạp thì chọn theo phương pháp này sẽ khó đảm bảo tính đại diện. Một nhược
điểm nữa là trong trường hợp quy mô của tổng thể khá lớn thì việc đánh số tất cả các phần tử sẽ rất khó khăn.
b) Mẫu hệ thống: là loại mẫu mà chỉ có phần tử đầu tiên được chọn ngẫu nhiên, sau đó dựa trên một quy tắc hay một thủ tục
nào đó đề chọn ra các phần tử tiếp theo. Chẳng hạn, trên một danh sách gồm N sinh viên, cần chọn ra một mẫu kích thước n, ta
chia danh sách thành n phần bằng nhau, ở phần T
1
gồm “N/n” phần tử, chọn ngẫu nhiên ra 1 phần tử, sau đó cứ cách “N/n” phần

tử cho vào mẫu cho đến khi đủ n phần tử.
Nhược điểm của phương pháp này là dễ mắc sai số hệ thống khi các phần tử của tổng thể không được sắp xếp một cách ngẫu
nhiên mà theo một trật tự chủ quan nào đó. Tuy vậy, do tính đơn giản, mẫu hệ thống thường được dùng ở cấp chọn mẫu cuối
cùng và khi tổng thể tương đối thuần nhất.
c) Mẫu phân tổ
Để chọn mẫu phân tổ, trước hết người ta phân chia tổng thể thành các tổ có độ thuần nhất cao để chọn ra các phần tử đại diện
cho từng tổ. Việc phân tổ có hiệu quả khi tổng thể nghiên cứu không thuần nhất theo dấu hiệu nghiên cứu. Sau khi đã phân tổ
thì kích thước mẫu được phân bổ cho mỗi tổ theo 1 quy tắc nào đó, chẳng hạn tỉ lệ thuận với kích thước mỗi tổ.
3. Ý nghĩa của mẫu
Trong ngành chọn mẫu, khảo sát không nhiều các đơn vị nghiên cứu nên thường được tiến hành trong thời gian ngắn. Dữ liệu
được xử lí, phân tích nhanh chóng nên thông tin thu được từ điều tra chọn mẫu có tính thời sự, cập nhật.
Chi phí cho công tác tổ chức nghiên cứu giảm. Do đó, nghiên cứu chọn mẫu tiết kiệm được nhân lực, vật lực, tài chính.
Có thể mở rộng nội dung nghiên cứu hoặc đi sâu tìm hiểu mặt nào đó của đối tượng.
Có thể tuyển chọn những điều tra viên tốt: Có trình độ, có kinh nghiệm, có điều kiện tập huấn thì thông tin thu được có tính
chính xác cao.
4. Các đặc trưng mẫu
Giả sử (X
1
, X
2
, …,X
n
) là mẫu ngẫu nhiên sinh ra từ X có EX=µ, DX =
2
a. Thống kê
Hàm T = T(X
1
, X
2
,…,X

n
) được gọi là một thống kê.
Ví dụ : T = T(X
1
, X
2
,…,X
n
) = max {X
1
, X
2
,…,X
n
} là một thống kê
b. Trung bình mẫu (kì vọng mẫu)
Thống kê trung bình mẫu, kí hiệu : X, xác định bởi :
Trên mẫu cụ thể (x
1
,x
2
,…,x
n
), thống kê X nhận giá trị :
Nếu mẫu sắp xếp theo bảng phân phối tần số thì :
Kì vọng mẫu số là một biến ngẫu nhiên có các đặc trưng :
c. Phương sai mẫu
Phương sai mẫu, kí hiệu MS xác định bởi :
Với mẫu thực nghiệm được sắp xếp theo tần số, phương sai mẫu nhận giá trị tính theo công thức :
9

Dùng các phép biến đổi, ta được:
Thống kê :
Gọi là phương sai mẫu điều chỉnh
d. Độ lệch tiêu chuẩn mẫu
- thống kê được gọi là độ lệch tiêu chuẩn mẫu
- thống kê S = được gọi là độ lệch tiêu chuẩn mẫu điều chỉnh
e. Phân bố của X và S
2
* Nếu (X
1
, X
2
,…, X
n
) là mẫu ngẫu nhiên được rút ra từ biến ngẫu nhiên chuẩn N(µ,
2
) thì:
n.X cũng có phân phối chuẩn
có phân phối
X có phân phối chuẩn
X và S
2
độc lập với nhau và ngược lại
có phân phối student với n-1 bậc tự do
* Nếu (X
1
, X
2
,…, X
n

) là mẫu từ biến ngẫu nhiên chuẩn N(µ
1
,
1
2
) , còn (Y
1
, Y
2
,…, Y
n
) là mẫu từ biến ngẫu nhiên
chuẩn N(µ
2
,
2
2
) độc lập với mẫu trên. Khi đó:
Có phân phối student với n + m - 2 bậc tự do, trong đó S
x
2
, S
y
2
là 2 phương sai mẫu tương ứng với mẫu X và mẫu Y.
5. Phân phối thực nghiệm và hàm phân phối thực nghiệm
Giả sử mẫu thực nghiệm (x
1
, x
2

, …, x
n
) sinh từ X. Ta xây dựng hàm:
Được gọi là hàm phân phối thực nghiệm
6. Định lí Glivenco.
Giả sử F(x) là hàm phân phối của biến ngẫu nhiên X mà ta cần tìm. F
n
(x) là hàm phân phối thực nghiệm nhận được từ
mẫu ngẫu nhiên cỡ n sinh ra từ X. Khi đó:
Như vậy, hàm phân phối thực nghiệm là 1 xấp xỉ của hàm phân phối lí thuyết. Với n cố định, hàm phân phối thực
nghiệm cho ta hình ảnh hình học về phân phối lí thuyết cần tìm.
Định lí Glivenco là cách tìm dạng của hàm phân phối thực nghiệm.
10
Câu 3 : Các loại ước lượng tham số (đặc trưng). Các phương pháp ước lượng. Nêu các công thức cơ bản.
Trả lời:
+) định nghĩa: là sử dụng 1 thống kê để đánh giá đối tượng
+) các loại ước lượng tham số( đặc trưng) là: ước lượng không chệch, ước lượng hiệu quả, ước lượng vững, ước lượng
tỉ lệ đám đông, ước lượng trung bình đám đông, ước lượng phương sai đám đông
+) Các phương pháp ước lượng là:
-ước lượng điểm cho kì vọng, phương sai và xác suất
-ước lượng khoảng cho kì vọng và xác suất
+) các công thức:
Tính trung bình mẫu: =
Tính phương sai đám đông: DX=VarX=
Tính phương sai mẫu:
= ;

Công thức T tính khoảng tin cậy đối với số trung bình μ trong phân phối chuẩn khi chưa biết phương sai:

n

Sxnt *)2/)(1(
α

< µ < +
n
Sxnt *)2/)(1(
α

Câu 4 : Thế nào là kiểm định giả thuyết thống kê? Cách tiến hành kiểm định giả thuyết thống kê. Các kết quả kiểm định chính.
Trả lời:
Kiểm định giả thuyết thống kê (statistical hypothesis test) là phương pháp
ra quyết định sử dụng dữ liệu, hoặc từ thí nghiệm hoặc từ nghiên cứu quan sát (observational study)(không có kiểm soát). Trong
thống kê (statistics), một kết quả được gọi là đủ độ tin cậy mang tính thống kê (statistically significant) nếu nó ít có khả năng
diễn ra theo một ngưỡng xác suất cho trước (ví dụ 5% hay 10%).
-Cách tiến hành kiểm định giả thuyết thông kê
Bước 1, nhà nghiên cứu cần phải định nghĩa một giả thuyết đảo (null hypothesis), tức là một giả thuyết ngược lại với những gì
mà nhà nghiên cứu tin là sự thật.
Bước 2, nhà nghiên cứu cần phải định nghĩa một giả thuyết phụ (alternative
hypothesis), tức là một giả thuyết mà nhà nghiên cứu nghĩ là sự thật, và điều cần được “chứng minh” bằng dữ kiện
Bước 3, sau khi đã thu thập đầy đủ những dữ kiện liên quan, nhà nghiên cứu dùng một hay nhiều phương pháp thống kê để kiểm
tra xem trong hai giả thuyết trên, giả thuyết nào được xem là khả dĩ. Cách kiểm tra này được tiến hành để trả lời câu hỏi: nếu giả
thuyết đảo đúng, thì xác suất mà những dữ kiện thu thập được phù hợp với giả thuyết đảo là bao nhiêu. Giá trị của xác suất này
thường được đề cập đến trong các báo cáo khoa học bằng kí hiệu “P value”. Điều cần chú ý ở đây là nhà nghiên cứu không thử
nghiệm giả thuyết khác, mà chỉ thử nghiệm giả thuyết đảo mà thôi.
Bước 4, quyết định chấp nhận hay loại bỏ giả thuyết đảo, bằng cách dựa vào giá trị xác suất trong bước thứ ba.
Bước 5, khi nhà nghiên cứu bác bỏ giả thuyết đảo, thì giả thuyết phụ được mặc nhiên công nhận, nhưng nhà nghiên cứu không
thể xác định giả thuyết phụ nào là đúng với sự thật.
- Các kết quả chính của giả thuyết thống kê
Phần 2 : BÀI TẬP
Bài tập về Biến ngẫu nhiên – Hàm phân phối – Hàm mật độ xác suất. Các phân phối xác suất thường gặp – Các

đặc trưng của biến ngẫu nhiên
Câu 1: Bắn 3 phát vào mục tiêu. Xác suất trúng của mỗi phát là 0,7. Cứ mỗi phát trúng được 5 điểm. gọi x là số điểm
đat được sau 3 phát. Tìm hàm phân phối xác suất của x.
Giải:
Công thức:
k k n k
n
C p q

Có: p = 0,7.
q = 1 – p = 1 – 0,7 = 0,3.
Ta có luật phân phối:
X 0 5 10 15
11
P = P
k
0
3
C
. 0,7
0
. 0,3
3
=
0,027
1
3
C
. 0,7
1

. 0,3
2
=
0,189
2
3
C
. 0,7
2
. 0,3 =
0,441
3
3
C
. 0,7
3
. 0,3
0
=
0,343
Hàm phân phối xác suất của X: F
X
(x) =
Câu 2: Tiến hành bắn vào mục tiêu cho đến lúc trúng thì dừng lại. Xác suất trúng mỗi phát là
.
Gọi x là số lần bắn.
Tìm hàm phân phối xác suất của x.
Giải:
Tiến hành bắn vào mục tiêu cho đến lúc trúng thì dừng lại. Xác suất trúng mỗi phát là . Gọi x là số lần bắn. tìm hàm
phân phối xác suất của x.

Ta có đây là biến ngẫu nhiên rời rạc.
Ta có bảng phân phối xác suất.
X 0 1 2 3 … n
P 0 (1- )
(1- )
2
… (1- )
n-1
Nếu x 1 biến cố (X<x) là biến cố không thể có, do đó: F
(X)
=0.
Nếu 1< x 2 biến cố (X<x) chỉ xảy ra khi (X=1) , do đó: F
(X)
= P
1
=
Nếu 2< x 3 biến cố (X<x) chỉ xảy ra khi (X=1), do đó: F
(X)
=P
1
+ P
2
= + (1- )
Nếu x>x
n
: F
(x)
= P
1
+P

2
+…+P
n
=1
Vậy hàm phân bố xác suất:
Câu 3:
Vì X là một biến ngẫu nhiên liên tục nên hàm phân phối xác suất F(x) liên tục trên toàn trục số
Xét tại x=1 có

Mà ;
=> a = 1
Vậy: F(x)=
Hàm mật độ xác suất: f(x) = F’(x)
Với x<0 => F(x) = 0 => f(x) = 0
Với => F(x) = x
2
=> f(x) = 2x
Với x > 1 => F(x) = 1 => f(x)=0
Tại x = 0 có
F’(0
-
) = = = = 0
F’ (0
+
) = = = = 0
=> f(0) = F’ (0) = 0
12
Tại x =1 có
F (1
-

) = = =
F (1
+
) = = = = 0
Vậy: f(x) =
Xác suất để biến ngẫu nhiên X nhận giá trị trong khoảng là:
P = F – F = =
Câu 5:
{ }
.
!
k
e
P K
K
λ
λ
ξ

= =
, trong đó
M
λ ξ
=
Suy ra
( )
( )
2
2 2 2
0

1
2 2
1 0
2
!
( 1)
( 1)! !
1
K
K
K K
K K
e
D M M K
K
e e
K K
K K
λ
λ λ
λ
ξ ξ ξ λ
λ λ
λ λ λ λ
λ λ λ λ

+∞
=
− − −
+∞ +∞

= =
= − = ⋅ −
= ⋅ − = + ⋅ −

= + − =

∑ ∑
Vậy
D
ξ λ
=
Một số bài tập thống kê dạng toán (dạng tổng hợp)
Câu 1:
a) Ta có: n = 111
γ = 1- α = 0,95 => α = 0,05
Tính: =
111
4*86*5,610*75,516*25,524*75,430*25,48*75,38*25,35*5,2
++++++++
= 4,7
Phương sai mẫu: = ( - ) =
110
1
* ( 238,375 - 22,09 ) = 1,96 => S = = 1,402
Tìm t: α = 0.05 => t110 ( 0,05/2 ) = 1,98
Vậy khoảng tin cậy là: ( −
n
Sxnt *)2/)(1(
α


; +
n
Sxnt *)2/)(1(
α

) = (1,92 ; 7,48 )
Ý nghĩa: ước lượng thu nhập trung bình của các hộ trong thành phố trên nằm trong khoảng từ 1,92 đến 7,48 có khả
năng đúng 95%, sai 5%
b) Hộ có thu nhập 500 ngàn đồng/người/tháng trở lên=> mức thu nhập/người/năm của họ là từ 6 triệu đồng trở lên
được gọi là những hộ có thu nhập cao=> tỉ lệ hộ thu nhập cao là
= = 0,09
= = 0,027 ( ) = 0,005
vậy khoảng tin cậy là: p ( f - < p < f + ) = ( 0,036 < p < 0,143 )
Vậy với độ tin cậy 95% thì tỉ lệ hộ thu nhập cao dao động trong khoảng từ 0,036 đến 0,143
c) Tính ước lượng trung bình của chỉ tiêu X những hộ có thu nhập cao
tương tự phần a ta có: = = 7,1
= 0,508 => S = = 0,713
Vậy khoảng tin cậy là: (7,1 - ; 7,1 + ) = ( 7 ; 7,21 )
Với độ tin cậy là 95% thì thu nhập trung bình của những hộ có thu nhập cao dao động từ 7 đến 7,21
d) Với độ tin cậy 5%=> γ = 0,05 = 1 - α => α = 0,95
13
Câu 2:
Số liệu về doanh số của 1 siêu thị trong 1 ngày
Doanh số ( triệu đồng / ngày ) Số ngày
24 5
30 12
36 25
42 35
18 24
54 15

60 12
65 10
70 6
a. Ước lượng doanh số bán trung bình trong 1 ngày của siêu thị với độ tin cậy 95%
b. Những ngày có doanh số trên 60 triệu là ngày đắt hàng. Ước lượng tỉ lệ ngày bán đắt hàng với độ tin cậy 90%
c. Ước lượng doanh số bán trung bình của 1 ngày bán đắt hàng với độ tin cậy 95%( giả thiết doanh số bán đắt hàng là đại lượng
ngẫu nhiên có phân phối chuẩn)
d. Trước đây doanh số bán trung bình của siêu thị là 35 triệu/ngày số liệu ở bảng trên thu được khi có 1 phương pháp bán hàng
mới. Hãy nhận xét về phương pháp bán hàng với mức ý nghĩa 5%
Giải:
a, Kích thước mẫu : n=144 >30
Doanh số trung bình x͞͞͞͞͞͞͞͞͞= 40.8 (triệu đồng/ngày)̄
Theo giả thiết ta có: γ=95% => Uα/2 =1.96
tính được S=15.4̂
ε=Uα/2.(S /căn n)=(1.96).(15.4/12)=2.5 =>P {40.8-2.5<= μ<= 40.8+2.5}= 0.95 ̂ P{38.3<=μ<=43.3}
Vậy với độ tin cậy 95% thì doanh thu bán hàng trung bình trong một ngày của siêu thị rơi vào khoảng từ 38.3 tới 43.3
b, Kích thước mẫu n= 3 < 30
Trung bình số ngày bán đắt hàng x= 9.3 ngàȳ
mà γ=90% => tα/22= 2.92 tính được S= 2.52̂
ε( khi n <30)=( 2.52).(2.92/căn 3)=4.25.
=>P{9.3 - 4.25<=μ<=9.3 +4.25}  P{5.05 <=μ<= 13.55}
Vậy với độ tin cậy 90% thì tỉ lệ ngày bán đắt hàng rơi vào khoảng từ 5.05 ngày tới 13.55 ngày
c, Kích thước mẫu n= 28<30
Trung bình doanh thu của một ngày đắt hàng là: x = 65 triệu đồng/ngày mà γ = 95% =>tα/2= 2.052̄
tính được S = 3.93̂
ε (khi n< 30 chưa biết apxilon) =( 2.052) .( 3.93/5.3) = 1.52
P{65- 1.52 <=μ<= 65+ 1.52} P{ 63.48<=μ<=66.52}
Vậy với độ tin cậy 95% thì doanh thu trung bình của một ngày đắt hàng rơi vào khoảng từ 63.48 tới 66.52 triệu
đồng/ ngày
d. Mức ý nghĩa α= 5% =>γ=95%=> Uα/2=1.96 Kích thước mẫu n=144 x= 35 triệu đồng/ngày.̄

14

×