Tải bản đầy đủ (.pdf) (84 trang)

Thong ke xa hoi hoc Lương Đức Thịnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.54 MB, 84 trang )

Th.S. LƯƠNG ĐỨC TRỌNG

THỐNG KÊ XÃ HỘI HỌC
Tài liệu dùng cho nhóm ngành xã hội

KHOA TO\N-TIN
TRƯỜNG ĐẠI HỌC SƯ PHẠM H[ HỘI
H[ NỘI


1

MỤC LỤC
Chương 1. KIẾN THỨC CHUẨN BỊ ......................................................................................... 3
1.1. TẬP HỢP .............................................................................................................................. 3
1.1.1. Tập hợp và các phần tử của tập hợp ................................................................ 3
1.1.2. Các phép toán trên tập hợp .................................................................................. 4
1.2. GIẢI TÍCH TỔ HỢP ........................................................................................................... 5
1.2.1. Hoán vị .......................................................................................................................... 5
1.2.2. Chỉnh hợp không lặp ............................................................................................... 5
1.2.3. Chỉnh hợp lặp ............................................................................................................. 5
1.2.4. Tổ hợp ........................................................................................................................... 5
1.2.5. Nhị thức Newton....................................................................................................... 6
Chương 2. LÝ THUYẾT X\C SUẤT ......................................................................................... 7
2.1. C\C KH\I NIỆM ................................................................................................................ 7
2.1.1. Phép thử và biến cố ................................................................................................. 7
2.1.2. Quan hệ của các biến cố ......................................................................................... 8
2.2. X\C SUẤT V[ CÔNG THỨC TÍNH ............................................................................ 11
2.2.1. Định nghĩa xác suất................................................................................................ 11
2.2.2. Một số qui tắc tính xác suất ................................................................................ 13
Chương 3. ĐẠI LƯỢNG NGẪU NHIÊN................................................................................ 22


3.1. ĐẠI LƯỢNG NGẪU NHIÊN RỜI RẠC....................................................................... 22
3.1.1. Phân phối xác suất. ................................................................................................ 22
3.1.2. Các số đặc trưng ...................................................................................................... 23
3.1.3. Một số phân phối xác suất rời rạc thường gặp .......................................... 25
3.2. ĐẠI LƯỢNG NGẪU NHIÊN LIÊN TỤC .................................................................... 28
3.2.1. Hàm mật độ xác suất và hàm phân phối xác suất ..................................... 28
3.2.2. Các số đặc trưng ...................................................................................................... 31
3.2.3. Một số phân phối xác suất liên tục thường gặp ......................................... 33
THỐNG KÊ XÃ HỘI HỌC


2

3.3. ĐẠI LƯỢNG NGẪU NHIÊN NHIỀU CHIỀU............................................................ 36
3.3.1. Phân phối xác suất đồng thời ............................................................................ 36
3.3.2. Các số đặc trưng ...................................................................................................... 39
Chương 4. THỐNG KÊ ............................................................................................................... 43
4.1. LÝ THUYẾT MẪU ........................................................................................................... 43
4.1.1. Một số phương pháp chọn mẫu........................................................................ 43
4.1.2 Mẫu ngẫu nhiên ....................................................................................................... 44
4.1.3. Cách biểu diễn số liệu ........................................................................................... 46
4.1.4. Các đặc trưng mẫu ................................................................................................. 51
4.2. ƯỚC LƯỢNG THAM SỐ CỦA ĐẠI LƯỢNG NGẪU NHIÊN .............................. 57
4.2.1. Ước lượng điểm ...................................................................................................... 57
4.2.2. Ước lượng khoảng ................................................................................................. 59
 Ước lượng khoảng cho giá trị trung bình ......................................................... 59
 Ước lượng khoảng cho xác suất, tỉ lệ .................................................................. 62
 Ước lượng khoảng cho phương sai ..................................................................... 63
4.3. KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ ...................................................................... 64
 Kiểm định giả thiết về giá trị trung bình ........................................................... 65

 Kiểm định giả thiết về so sánh hai giá trị trung bình ................................... 68
 Kiểm định giả thiết về tỉ lệ ...................................................................................... 69
 Kiểm định giả thiết về so sánh hai tỉ lệ .............................................................. 71
 Kiểm định giả thiết về tính thuần nhất của hai mẫu độc lập .................... 73
 Kiểm định giả thiết về tính thuần nhất của hai mẫu phụ thuộc .............. 75
 Tiêu chuẩn phù hợp 2 ............................................................................................ 77
 Kiểm định tính độc lập .............................................................................................. 78
PHỤ LỤC ......................................................................................................................................... 81

THỐNG KÊ XÃ HỘI HỌC


3

Chương 1
KIẾN THỨC CHUẨN BỊ
1.1. TẬP HỢP
1.1.1. Tập hợp và các phần tử của tập hợp
Tập hợp là một toàn thể các đối tượng cùng loại (theo nghĩa chúng có
chung đặc tính hoặc có chung một dấu hiệu). Ta thường kí hiệu tập hợp bởi
các chữ cái in hoa A, B, C,…
Các đối tượng thiết lập nên tập hợp được gọi là phần tử của tập hợp,
thường được kí hiệu bởi các chữ cái thường a, b,…, x, y,…
a là phần tử của tập hợp A, được kí hiệu là
(a thuộc A) ; b không là
phần tử của tập hợp A, được kí hiệu là
(b không thuộc A).

Ví dụ:
 Tập hợp các họ sinh lớp 3A của Trường tiểu học Quang Trung.

 Tập hợp các quả bóng trong thùng đựng bóng.
 Tập hợp các con bò trong trại nuôi bò .v.v…

Mô tả tập hợp: Để mô tả một tập hợp, ta có thể liệt kê tất cả các phần tử của nó
(ví dụ: A={1,3,4,6}) hoặc nêu một tính chất chung của các phần tử của nó (ví
dụ: B={tập các số chẵn}, C={tập các số lẻ+, …)

Quan hệ giữa các tập hợp
 Tập hợp con: Tập hợp A được gọi là bao hàm trong tập hợp B, được kí
hiệu là
(hoặc là
) nếu mọi phần tử của tập hợp A đều là
phần tử của tập hợp B.

Ví dụ: A=*1,2,3+; B=*1,2,3,4,6,7+. Ta có
.
 Tập hợp bằng nhau : Hai tập hợp A và B được gọi là bằng nhau nếu


. Kí hiệu là = .
 Tập rỗng : Tập hợp không chứa phần tử nào được gọi là tập rỗng và
được kí hiệu là .
THỐNG KÊ XÃ HỘI HỌC


4

Ví dụ :
1. Tập các nghiệm thực của phương trình
1= .

2. Tập S={x :x là những số nguyên dương mà = 3}.
 Không gian : Tập hợp lớn nhất cố định mà mọi tập hợp được xét đều
chứa trong nó được gọi là không gian.

Ví dụ :
1. Xét các tập hợp chứa các điểm nằm trong mặt phẳng, không gian
là toàn bộ mặt phẳng.
2. Xét các tập hợp chứa các số thực, không gian là toàn bộ trục số
thực R.
Phân loại tập hợp :
 Tập hữu hạn : là tập hợp có hữu hạn các phần tử.
 Tập vô hạn : là tập hợp có vô hạn các phần tử.
1. Tập vô hạn đếm được : là tập mà các phần tử của nó có thể đánh
số được theo dãy số tự nhiên.

Ví dụ : tập số tự nhiên, tập số nguyên, tập số hữu tỉ là các tập vô
hạn đếm được.
2. Tập vô hạn không đếm được : là tập mà các phần tử của nó không
thể đánh số được theo dãy số tự nhiên.

Ví dụ : tập số vô tỉ, tập số thực là các tập vô hạn không đếm được.
1.1.2. Các phép toán trên tập hợp
 Hợp : Hợp của hai tập hợp A và B được kí hiệu là
mỗi phần tử của nó hoặc thuộc tập A, hoặc thuộc tập B.

là tập hợp mà

Ví dụ : Cho hai tập hợp A=*1,2,3+ và B=*3,4,5+. Khi đó
={1,2,3,4,5}.
 Giao : Giao của hai tập hợp A và B được kí hiệu là

(hoặc AB) là tập
hợp mà mỗi phần tử của nó đồng thời thuộc cả hai tập A và B.

Ví dụ : Cho hai tập hợp A=*1,2,3+ và B=*3,4,5+. Khi đó
 Hiệu : Hiệu của hai tập hợp A và B được kí hiệu là

={3}.

là tập hợp mà
mỗi phần tử của nó đều thuộc tập A nhưng không thuộc tập B.

Ví dụ : Cho hai tập hợp A=*1,2,4+ và B=*2,3,5+. Khi đó
={3,5}.
 Phần bù của tập hợp : Giả sử U là không gian,
. Ta nói
bù của tập hợp A đối với U, kí hiệu là ̅.
THỐNG KÊ XÃ HỘI HỌC

=*1,4+ và
là phần


5

1.2. GIẢI TÍCH TỔ HỢP
1.2.1. Hoán vị
 Định nghĩa: Ta có n phần tử được xếp vào n vị trí (mỗi chỗ có 1 phần
tử). Mỗi cách sắp xếp như vậy được gọi là 1 hoán vị. Số các hoán vị của n
phần tử là
= = (

1)(
2) … 1.
= .(
=1

1)

Ví dụ : Từ 3 số 1,2,3 ta có thể lập được 3 !=3.2.1=6 số có 3 chữ số khác
nhau : 123, 132, 213, 231, 312, 321.
1.2.2. Chỉnh hợp không lặp
 Định nghĩa: Ta chọn không lặp k phần tử có phân biệt thứ tự trước sau
từ n phần tử cho trước (
). Mỗi cách chọn như vậy được gọi là
một chỉnh hợp chập k của n phần tử. Số các chỉnh hợp chập k của n phần
tử là
=

(

)

= .(

1) … (

1).

Ví dụ : Từ các chữ số 1, 2, 3, 4 ta có thể tạo ra
= 4.3 = 12 số có 2 chữ
số phân biệt : 12, 13, 14, 21, 23, 24, 31, 32, 34, 41, 42, 43.

1.2.3. Chỉnh hợp lặp
 Định nghĩa : Ta chọn k phần tử có phân biệt thứ tự trước sau từ n phần
tử cho trước (mối phần tử có thể chọn nhiều lần,
). Mỗi cách
chọn như vậy được gọi là một chỉnh hợp lặp chập k của n phần tử. Số
các chỉnh hợp lặp chập k của n phần tử là
=

.

Ví dụ : Từ các chữ số 1, 2, 3, 4 ta có thể tạo ra
= 4 = 16 số có 2 chữ
số: 11, 12, 13, 14, 21, 22, 23, 24, 31, 32, 33, 34, 41, 42, 43, 44.
1.2.4. Tổ hợp
 Định nghĩa : Ta chọn không lặp k phần tử không phân biệt thứ tự trước
sau từ n phần tử cho trước (
). Mỗi cách chọn như vậy được
gọi là một tổ hợp chập k của n phần tử. Số các tổ hợp chập k của n phần
tử là
THỐNG KÊ XÃ HỘI HỌC


6

=

=

(


)

.

Ví dụ : Một lớp học có 3 học sinh nam và 2 học sinh nữ. Cần lập ra một
đội văn nghệ gồm 5 nam và 5 nữ từ các học sinh nói trên. Hỏi có bao
nhiêu cách thực hiện việc nay ? Do việc chọn các em học sinh là không
phân biệt thứ tự trước sau nên số cách chọn 5 học sinh nam là
và số
cách chọn 5 học sinh nữ là
. Như vậy số cách chọn ra 5 nam và 5 nữ
tham gia đội văn nghệ là
.
.
1.2.5. Nhị thức Newton
 Tính chất của tổ hợp:
1.
=
.
2.
=
.
) =∑
3. (
.
=
.
) = ∑ ( 1)
4. (
.

=
( 1)
. .
 Tam giác Pascal:
n=0
1
n=1
1 1
n=2
1 2 1
n=3
1 3 3 1
n=4
1 4 6 4 1
n=5
1 5 10 10 5 1
n=6
1 6 15 20 15 6 1
n=7
1 7 21 35 35 21 7 1

………………………………………………

.

.

.

Ví dụ: Cho tập A có n phần tử. Hỏi tập A có bao nhiêu tập con? Do mỗi

tập con gồm k phần tử (
) của A là một tổ hợp chập k của n
phần tử trong A nên số tập con có k phần tử của A là . Như vậy số các
tập con của A là
=2 .

THỐNG KÊ XÃ HỘI HỌC


7

Chương 2
LÝ THUYẾT X\C SUẤT
2.1. C\C KH\I NIỆM
2.1.1. Phép thử và biến cố
Xét việc tung một đồng xu cân đối, đồng chất trên một mặt phẳng nằm
ngang (điều kiện nhất định) thì thường chỉ có 2 khả năng xảy ra: hoặc xuất
hiện mặt ngửa “N” (mặt ngửa là mặt xuất hiện giá trị của đồng xu) hoặc suất
hiện mặt sấp “S”. Việc xuất hiện mặt sấp hay ngửa là ngẫu nhiên (không dự
đoán trước được). Tập hợp các trường hợp xảy ra *S,N+ được gọi là không
gian mẫu và việc tung đồng xu với các điều kiện trên gọi là phép thử ngẫu

nhiên.
 Phép thử ngẫu nhiên được xem như một quá trình thực hiện một nhóm
các điều kiện và quan sát hiện tượng mà kết quả của nó không đoán
trước được.
 Tập hợp các kết quả có thể xảy ra của một phép thử được gọi là không
gian mẫu, kí hiệu là .
 Biến cố là một tập con của không gian mẫu, là tập hợp một số các kết
quả có thể xảy ra. Người ta thường kí hiệu các biến cố bằng các chữ cái

in hoa A, B, C,…
 Biến cố A được gọi là Biến cố sơ cấp nếu A chỉ chứa một phần tử của
không gian mẫu .
 Biến cố chắc chắn là biến cố luôn xảy ra. Không gian mẫu là biến cố
chắc chắn.
 Biến cố không thể là biến cố không thể xảy ra .

Ví dụ: Trong phép thử tung hai đồng xu, nếu kết quả xuất hiện hiện là mặt
“sấp” S hay “ngửa” N thì không gian mẫu sẽ là
=*

,

,

,

+

Người ta qui ước mặt “ngửa” là mặt hiện giá trị của đồng xu và mặt “sấp” là
phía ngược lại.
THỐNG KÊ XÃ HỘI HỌC


8

Biến cố A=”có ít nhất một mặt sấp” là
=*

,


,

+.

Ví dụ: Nếu người ta thực hiện tung một đồng xu cho tới khi xuất hiện mặt sấp
S thì không gian mẫu của phép thử này sẽ là
=* ,

,

,…,

, … +.



Biến cố sơ cấp là
= * +,

=*

+, … ,

= ,⏟ …

-,…




Ví dụ: Xét phép thử tung 2 xúc sắc cân đối đồng chất thì không gian mẫu của
phép thử này sẽ là
= *( , )| ,

;1

,

6+.

Biến cố A=”tổng số chấm là 5” là
|
= *( , )
= 5+
= *( , )| ,
;1
,
6;
= *(1,4); (2,3); (3,2); (4,1)+.
2.1.2. Quan hệ của các biến cố
 Tích của hai biến cố A và B, kí hiệu là
đồng thới xảy ra"

= 5+

hoặc AB, là biến cố "A và B

Ví dụ : Xét phép thử gieo hai xúc sắc cân đối đồng chất. Gọi A là biến cố
"xuất hiện ít nhất 1 xúc sắc có 1 chấm" và B là biến cố "tổng số chấm
xuất hiện là 5". Khi đó tích của hai biến cố A và B là biến cố "hai xúc sắc

xuất hiện có số chấm là 1 và 4".
Ví dụ : Một lớp học có 3 sinh viên biết ít nhất một trong hai ngoại ngữ
tiếng Anh hoặc tiếng Pháp. Chọn ngẫu nhiên một sinh viên, gọi A là biến
cố "sinh viên biết tiếng Anh" và P là biến cố "sinh viên biết tiếng Pháp".
THỐNG KÊ XÃ HỘI HỌC


9

Khi đó tích của hai biến cố A và P là biến cố "sinh viên biết cả tiếng Anh
và tiếng Pháp".
Tổng quát : Tích của n biến cố , , … , , kí hiệu là ∏
=


là biến cố " , , … ,
đồng thời xảy ra".
 Hợp của hai biến cố A và B, kí hiệu
, là biến cố "ít nhất một trong
hai biến cố A, B xảy ra". Trong trường hợp
= thì ta dùng kí hiệu
thay cho
.

Ví dụ : Xét phép thử tung ba đồng xu. Gọi A là biến cố "xuất hiện đúng
hai mặt sấp trong ba đồng xu", B là biến cố "xuất hiện mặt sấp ở cả ba
đồng xu". Khi đó
là biến cố "có ít nhất hai mặt sấp trong ba đồng
xu".
Ví dụ : Một lớp học có 3 sinh viên biết ít nhất một trong hai ngoại ngữ

tiếng Anh hoặc tiếng Pháp. Chọn ngẫu nhiên một sinh viên, gọi A là biến
cố "sinh viên biết tiếng Anh" và P là biến cố "sinh viên biết tiếng Pháp".
Khi đó hợp của hai biến cố A và P là biến cố "sinh viên biết ít nhất một
trong hai thứ tiếng, tiếng Anh và tiếng Pháp".
Tổng quát : Hợp của n biến cố , , … , , kí hiệu là ⋃
=


, là biến cố "ít nhất một trong các biến cố

,

,…,

xảy

ra".
 Biến cố A và B được gọi là xung khắc nếu chúng không đồng thời xảy ra
trong một phép thử, nghĩa là
= .

Ví dụ : Gieo hai xúc sắc cân đối đồng chất. Gọi A là biến cố "tổng số chấm
xuất hiện là lẻ" và B là biến cố "cả hai xúc sắc đều có số chấm là lẻ". Khi
đó A và B là hai biến cố xung khắc.
Ví dụ : Ba đội bóng A, B, C tham gia một giải đấu bóng đá. Gọi M là biến
cố "A vô địch" và N là biến cố "B hoặc C vô đich". Khi đó M và N là hai
biến cố xung khắc.
THỐNG KÊ XÃ HỘI HỌC



10

Tổng quát : Các biến cố

, ,…,
được gọi là đôi một xung khắc nếu
không có hai biến cố nào cùng xảy ra trong một phép thử
=
1
.

Ví dụ : Ba kỳ thủ A, B, C thi đấu vòng tròn tính điểm (mỗi ván đấu chỉ có
thắng hoặc thua, không có hòa). Gọi M là biến cố "A thắng cả hai ván", N
là biến cố "B không thua A" và P là biến cố "C cao điểm hơn A và A cao
điểm hơn B". Khi đó M, N và P là ba biến cố đôi một xung khắc.
 Biến cố A được gọi là kéo theo biến cố B, kí hiệu
, nếu A xảy ra thì
B xảy ra

Ví dụ : Gieo hai xúc sắc cân đối đồng chất. Gọi A là biến cố "tổng số chấm
xuất hiện là lẻ " và B là biến cố "có ít nhất một xúc sắc có số chấm là lẻ".
Khi đó biến cố A kéo theo biến cố B.
Ví dụ : Chọn ngẫu nhiên một gia đình trong một khu vực. Gọi M là biến
cố "cha mẹ thuộc nhóm máu A" và N là biến cố "con cái không thuộc
nhóm máu AB". Khi đó biến cố M kéo theo biến cố N.
Cha Mẹ
Con
1, O x O
=O
2, O x A

= O,A
3, O x B
= O, B
4, O x AB = A, B
5, A x A
= O,A
6, A x B
= O, A, B, AB
7, A x AB = A, B, AB
8, B x B
= O, B
9, B x AB = A, B, AB
10, AB x AB = A, B, AB
 Biến cố đối của biến cố A, kí hiệu ̅ là biến cố “A không xảy ra”.

Ví dụ: Ba xạ thủ A, B, C tập bắn. Gọi A, B và C lần lượt là các biến cố “A
bắn trúng”, “B bắn trúng “ và “C bắn trúng”.
a) Hãy mô tả các biến cố sau
, ̅ ̅ ̅,

.

b) Hãy biểu diễn các biến cố sau theo các biến cố A, B, C.
D= ”Có ít nhất hai xạ thủ bắn trúng”.
THỐNG KÊ XÃ HỘI HỌC


11

E= ”Có nhiều nhất một xạ thủ bắn trúng”.

F= ”Chỉ có một xạ thủ bắn trúng”.
G= ”Chỉ có xạ thủ C bắn trúng”.
Giải
a)
= ”Cả ba xạ thủ đều bắn trúng”.
̅ ̅ ̅ = ”Cả ba xạ thủ đều bắn trượt”.
= “Có ít nhất một xạ thủ bắn trúng”.
b) =
.
= ̅ ̅ ̅ ̅ ̅ ̅.
= ̅̅ ̅ ̅ ̅̅ .
= ̅̅ .

Chú ý:
1. Luật De-Morgan
̅̅̅̅̅̅̅ = ̅ ̅ .
̅̅̅̅ = ̅ ̅ .
̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅

= ̅̅̅ ̅̅̅ … ̅̅̅̅ .
̅̅̅̅̅̅̅̅̅̅̅̅̅

= ̅̅̅ ̅̅̅ … ̅̅̅̅.

2.

̅ = ; ̅ = .

2.2. X\C SUẤT V[ CÔNG THỨC TÍNH
2.2.1. Định nghĩa xác suất

 Định nghĩa xác suất cổ điển: Giả sử không gian mẫu của một phép thử
gồm có ( ) biến cố sơ cấp, các biến cố sơ cấp này có cùng khả năng xảy
ra và biến cố A gồm ( ) biến cố sơ cấp ( ( ) là số phần tử của A). Khi
đó xác suất của biến cố A là số
( )=

số trường hợp có lợi cho A
( )
=
.
tổng số khả năng có thể xảy ra
( )

Ví dụ: Xét phép thử tung hai đồng xu cân đối, đồng chất. Gọi A là biến cố
“có đúng một mặt sấp S”. Khi đó
=*

,

+

,

,

,

Không gian mẫu
=*


+
( ) 2 1
P(A) =
= = .
( ) 4 2
THỐNG KÊ XÃ HỘI HỌC


12

Ví dụ: Gieo hai xúc sắc cân đối, đồng chất. Gọi A là biến cố “tổng số chấm
xuất hiện là 5”. Khi đó
( ) = 4.
= *(1,4); (2,3); (3,2); (4,1)+
Không gian mẫu có số biến cố sơ cấp ( ) = 6.6 = 36. Do đó
( )
4
1
( )=
=
= .
( ) 36 9

Ví dụ: Một công ty cần tuyển hai nhân viên. Có 6 người nộp đơn, trong
đó có 4 nữ và 2 nam. Giả sử rằng khả năng trúng tuyển của 6 người là
như nhau.
a) Tính xác suất để 2 người trúng tuyển đều là nam.
b) Tính xác suất để cả hai người trúng tuyển đều là nữ.
c) Tính xác suất để có ít nhất một nữ trúng tuyển.
Giải

Ta có: ( ) =

= 15.

a) Đặt A="hai người trúng tuyển đều là nam "
( )=

( )
1
= .
( ) 15

b) Đặt B="hai người trúng tuyển đều là nữ "
( )=

( )
6
2
=
=
= .
( ) 15 15 5

c) Đặt C="ít nhất một nữ trúng tuyển ". Do chỉ có duy nhất một trường
hợp là hai nam trúng tuyển nên ( ) = 15 1 = 14
( ) 14
= .
( ) 15
 Định nghĩa xác suất theo thống kê : Nếu số các kết quả có thể là vô hạn
hoặc hữu hạn nhưng không đồng khả năng, cách tính xác suất cổ điển

như trên không còn dùng được. Giả sử phép thử có thể thực hiện lặp
đi lặp lại rất nhiều lần trong những điều kiện giống hệt nhau. Nếu trong
n lần thực hiện phép thử , biến cố A xuất hiện
lần thì tỉ số
( )=

( )=

( )

được gọi là tần suất xuất hiện của biến cố A trong n phép

thử. Khi n tăng tới giá trị vô cùng thì
định được xem là xác suất xuất hiện A
( ) = lim
THỐNG KÊ XÃ HỘI HỌC

( ) đạt tới giá trị giới hạn xác
( ).


13

Tức là khi n lớn ta coi ( )

( ).

Ví dụ : Ở Trung Quốc, từ năm 228 trước Công nguyên, đã tìm thấy tần
suất sinh con trai là . Laplace theo dõi các thành phố London, Saint
Peterbourg và Berlin và công bố tần suất sinh con trai là . Cramer cho

tần suất sinh con trai ở Thụy Điển là ,5 8. Ở Việt Nam năm 1961 tần
suất sinh con trai là ,51.
2.2.2. Một số qui tắc tính xác suất
 Qui tắc cộng đơn giản :
i)
Nếu A, B là hai biến cố xung khắc thì
(
)= ( )
( ̅ ).
Hệ quả : ( ) = 1

( ).

Ví dụ : Trong hộp có 3 bi trắng, 4 bi xanh và 5 bi đỏ. Gọi A là biến
cố "rút được bi trắng", B là biến cố "rút được bi xanh" và C là biến
cố "rút được bi đỏ". Khi đó
( )=

3
4
5
; ( )=
; ( )= .
12
12
12

Xác suất để không rút được bi trắng là
(̅) = 1


( )=1

3
9
3
=
= .
12 12 4

Xác suất để rút được bi xanh hoặc rút được bi đỏ là
(

)= ( )

( )=

4
12

5
9
3
=
= .
12 12 4

Ta cúng có thể tính được xác suất trên theo cách khác. Do
̅ =
nên
(

ii)

Nếu

,

,…,
(

 Qui tắc cộng tổng quát :
THỐNG KÊ XÃ HỘI HỌC

3
) = (̅) = .
4

là các biến cố đôi một xung khắc thì
)= ( )
( )
(


).


14

i)

Nếu A, B là hai biến cố bất kỳ, thì

(
)= ( )

( )

(

)

Ví dụ : Trong một vùng dân cư, tỉ lệ người mắc bệnh tim là 9%,
mắc bệnh huyết áp là 12% và mắc cả hai bệnh là 7%. Chọn ngẫu
nhiên một người trong vùng đó. Tính xác suất để người không
mắc cả bệnh tim và bệnh huyết áp.
Giải
Gọi A là biến cố "Người đó mắc bệnh tim" và B là biến cố "Người
đó mắc bệnh huyết áp". Theo giả thiết ta có
( ) = , 9; ( ) = ,12; ( ) = , 7.

Gọi H là biến cố "Người đó không mắc bệnh tim hoặc bệnh huyết
áp". Biến cố đội ̅là "Người đó mắc bệnh tim hoặc bệnh huyết áp".
Ta có

ii)

̅=
( ̅) = (
)= ( )
( )
( )
= , 9

,12
, 7 = ,14.
( )=1
( ̅) = 1
,14 = ,86.
Nếu A, B, C là ba biến cố bất kỳ thì
(
)= ( )
( )
( )
( )
( )
( )
(

).

Ví dụ : Trên giá sách có n cuốn sách (
4) trong đó có 3 cuốn
sách của cùng một tác giả. Tìm xác suất để không có hai cuốn nào
trong ba cuốn đứng cạnh nhau.
Giải
Kí hiệu ba cuốn sách đó là a, b và c. Gọi H là biến cố "không có hai
cuốn nào trong ba cuốn a, b và c đứng cạnh nhau". Đặt
A="Hai cuốn b, c đứng cạnh nhau "
B="Hai cuốn a, c đứng cạnh nhau"
C=”Hai cuốn a, b đứng cạnh nhau”
Khi đó
̅=
( )=1

(
)
( )
( )
=1
( )
(
)
THỐNG KÊ XÃ HỘI HỌC

( )

(

)

(

)


15

Nếu b, c đứng cạnh nhau, ta tưởng tượng rằng có thể dán chúng
lại theo 2 cách bc, cb và xem chúng như là 1 quyển sách. Khi đó số
cách sắp xếp để b và c đứng cạnh nhau là (
1) . Vậy
( )= ( )= ( )=

2(


1)

=

2

Nếu b, c đứng cạnh nhau; c, a đứng cạnh nhau thì 3 quyển sách a,
b, c phải được xếp theo thứ tự b, c, a. Dán chúng lại theo thứ tự đó
ta được 1 quyển sách và khi đó số cách sắp xếp các cuốn sách
trong trường hợp này là (
2) . Vậy
(

)= (

Hiển nhiên do

=

)= (

(

)=

2)

=


1
(

1)

nên
(

)=

Như vậy
6

6

(

4)(
3)
.
(
(
1)
1)
 Qui tắc nhân: Hai biến cố A và B được gọi là độc lập với nhau nếu việc
xảy ra hay không xảy ra biến cố này không làm ảnh hưởng tới việc xảy
ra hay không xảy ra biến cố kia. Theo xác suất thì
( ) = ( ). ( )
( )=1


=

Tổng quát: Các biến cố

, ,…,
được gọi là độc lập nếu việc xảy ra
)
hay không xảy ra của một nhóm bất kỳ k biến cố trong đó (1
không làm ảnh hường tới việc xảy ra hay không xảy ra của các biến cố
còn lại. Theo xác suất thì
(
… ) = ( ) ( ) … ( ).

Ví dụ: Ba xạ thủ A, B và C độc lập với nhau cùng nổ súng vào một mục
tiêu. Xác suất bắn trúng của xạ thủ A, B và C tương ứng là ,4; ,5 và ,7.
a) Tính xác suất để chỉ có duy nhất một xạ thủ bắn trúng.
b) Tính xác suất để ít nhất có một xạ thủ bắn trúng.
Giải
Đặt
A=”Xạ thủ A bắn trúng”, ( ) = ,4.
B=”Xạ thủ B bắn trúng “, ( ) = ,5.
THỐNG KÊ XÃ HỘI HỌC


16

C=”Xạ thủ C bắn trúng”, ( ) = ,7.
a) Gọi H là biến cố “Chỉ có duy nhất một xạ thủ bắn trúng”
=


̅ ̅

̅

̅

̅̅

Do A, B và C độc lập nên
( ) = ( ) ( ̅ ) ( ̅)
= ,4. ,5. ,3

( ̅) ( ) ( ̅ )
( ̅) ( ̅ ) ( )
,6. ,5. ,3
,6. ,5. ,7 = ,36.

b) Gọi D là biến cố “có ít nhất xạ thủ bắn trúng”
̅ = ̅̅ ̅

Do A, B và C độc lập nên
( ̅ ̅ ̅) = 1
( ̅) ( ̅ ) ( ̅ ) = 1
,6. ,5. ,3 = ,91.
 Xác suất có điều kiện: Giả sử A là một biến cố, B là một biến cố khác. Xác
suất của B được tính trong điều kiện biết rằng A đã xảy ra được gọi là
xác suất của B với điều kiện A, được kí hiệu là (
) và được tính bởi
( )
(

)=
.
( )
( )=1

Ví dụ: Trong một vùng dân cư, tỉ lệ người nghiện thuốc lá và chứng ung
thư họng là 15%. Có 25% số người nghiện thuốc nhưng không ung thư
họng, 50% số người không nghiện thuốc và cũng không ung thư họng và
so 10% số người không nghiện thuốc nhưng mắc ung thư họng. Sử dụng
số liệu thống kê trên có thể rút ra kết luận gì về mối quan hệ giữa ung
thư họng và thói quen hút thuốc lá?
Giải
Chúng ta sẽ so sánh xác suất để một người nghiện thuốc lá bị ung thư
họng với xác suất để một người không nghiện thuốc lá mắc ung thư
họng.
Gọi A là biến cố “Người đó nghiện thuốc lá” và C là biến cố “Người đó bị
ung thư họng”. Ta có
(

) = ,15; (
( )= (
{
( ̅) = ( ̅
(

{

(

THỐNG KÊ XÃ HỘI HỌC


̅ ) = ,25; ( ̅
)
( ̅) =
)
( ̅ ̅) =
( )
)=
=
( )
( ̅)
̅) =
=
( ̅)

̅ ) = ,5; ( ̅ ) = ,1
,15
,25 = ,4
,1
,5 = ,6
,15
= ,375
,4
,1
,167
,6


17


̅). Điều đó có nghĩa là một người
) cao gấp đôi (
Như vậy (
nghiện thuốc lá sẽ có nguy cơ bị ung thư họng lớn gấp đôi người không
nghiện thuốc lá.
 Qui tắc nhân tổng quát: Với A, B là hai biến cố bất kỳ, ta có
(

)= ( ) (

Tổng quát: Với n biến cố bất kỳ
(



)= (

) (

,

,…,

) (

).
ta có
)… (




).

Ví dụ: (Bài toán sinh nhật) Trong một lớp học gồm n sinh viên. Tìm xác
suất để có ít nhất hai sinh viên có cùng ngày sinh nhật (Giả sử không có
ai sinh vào 29 2).
Giải
Đánh số n sinh viên này từ 1 cho tới n.
Nếu n>365 thì hiển nhiên luôn có 2 sinh viên có cùng ngày sinh nhật,
nên ta chỉ cần xét với
365. Đặt
=”sinh viên i không có cùng sinh nhật với i-1 sinh viên trước”, =
̅̅̅̅̅
1, .
H=”có ít nhất hai sinh viên có cùng sinh nhật”
̅=

( ̅) = ( ) (
) (
)… (

)
)
365 364 363 (366
365
=
.
.

=

(365
) 365
365 365 365
365
365
( )=1
( ̅) = 1
.
(365
) 365

Với = 6 thì ( )
,994, điều đó có nghĩa là với một lớp học gồm
6 sinh viên thì gần như chắc chắn sẽ có ít nhất 2 người có cùng sinh
nhật.
 Công thức xác suất toàn phần và công thức Bayes: Các biến cố
, ,…,
được gọi là hệ đầy đủ nếu chúng đôi một xung khắc
(
i)
ii)

=
) và hợp của chúng là biến cố chắc chắn ( =

). Với H là một biến cố bất kỳ thì
Công thức xác suất toàn phần:
( )= ( ) (
( ) (
)

)
(
).
Công thức Bayes:
THỐNG KÊ XÃ HỘI HỌC


18

(

(

)=

) (
( )

)

.

Ví dụ: Trong một nhà máy có ba phân xưởng A, B và C tương ứng là ra
25%, 35% và 4 % tổng số sản phẩm của nhà máy. Biết rằng xác suất
làm ra một sản phẩm hỏng của phân xưởng A, B và C lần lượt là , 1;
, 2 và , 25. Chọn ngẫu nhiên một sản phẩm của nhà máy.
a) Tính xác suất để đó là một sản phẩm hỏng.
b) Giả sử đó là một sản phẩm hỏng. Khả năng cao nhất sản phẩm này là
do phân xưởng nào sản xuất?
Giải

Kí hiệu A, B, C và H là các biến cố sau
A=”sản phẩm của phân xưởng A”
B=”sản phẩm của phân xưởng B”
C=”sản phẩm của phân xưởng C”
H=”sản phẩm đó là sản phẩm hỏng”
Khi đó A, B, C lập thành một hệ đầy đủ với
( ) = ,25; ( ) = ,35; ( ) = ,4

Theo giả thiết thì
(

) = , 1; (

) = , 2; (

) = , 25.

a) Theo công thức xác suất toàn phần thì
( )= ( ) (
( ) (
)
)
= ,25. , 1
,35. , 2

( ) (
)
,4. , 25 = , 195.

b) Theo công thức Bayes thì

(

)=

( ) (
( )

)

(

)=

( ) (
( )

)

(

)=

( ) (
( )

)

=

,25. , 1

= ,1282
, 195

=

,35. , 2
= ,359
, 195

=

,4. , 25
= ,5128
, 195

Như vậy khả năng cao nhất là sản phẩm hỏng này là do phân xưởng C
sản xuất.

THỐNG KÊ XÃ HỘI HỌC


19

Ví dụ: Một test kiểm tra bệnh tiểu đường có độ nhạy là 99% (tức là nếu
xét nghiệm với người bị bệnh, test cho kết quả dương tính với xác suất
99%) và có có độ chuyên là 95% (tức là nếu xét nghiệm với người
không bị bệnh, test cho kết quả âm tính với xác suất là 95%). Sau khi xét
nghiệm cho một khu dân cư, thấy tỉ lệ người có kết quả dương tính là
10%.
a) Hãy tìm tỉ lệ người bị bệnh tại khu dân cư đó.

b) Hãy tìm tỉ lệ người không bị bệnh trong số những ca dương tính.
c) Hãy tìm tỉ lệ người bị bệnh trong những ca âm tính.
Giải
Đặt các biến cố
B=”người đó bị bệnh”
̅ =”người đó không bị bệnh”

D=”người đó có kết quả dương tính”
̅ =”người đó có kết quả âm tính”

Theo giả thiết thì
( ) = ,1; (
( ̅) = 1

) = ,99; ( ̅ ̅ ) = ,95

( ) = ,9; ( ̅
(

̅) = 1

)=1

(

) = , 1;

(̅ ̅) = , 5

a) Đặt ( ) = . Theo công thức xác suất toàn phần thì

( )= ( ) (
,1 = . ,99 (1
,1
=

)
( ̅) ( ̅)
). , 5 = , 5
,94.
, 5
= , 532
,94

Như vậy tỉ lệ người bị bệnh ở khu dân cư đó là 5,32%.
b) Theo công thức Bayes thì


)=

( ̅ ) ( ̅ ) (1
=
( )

THỐNG KÊ XÃ HỘI HỌC

, 532). , 5
= ,4734
,1



20

Như vậy trong số các ca dương tính thì có đến 47,34% là chẩn đoán
sai!!!
c) Theo công thức Bayes thì
(

̅) =

̅
( ) ( )
( ̅)

, 532. , 1
= ,
,9

=

59

Như vậy trong số các ca âm tính thì chỉ có , 59% là chẩn đoán sai.
 Công thức Bernouli: Xét phép thử và một biến cố A liên quan tới phép
thử đó. Xác suất xuất hiện A là p. Ta thực hiện phép thử n lần độc lập.
Khi đó xác suất để biến cố A xuất hiện đúng k lần trong n lần thử là
( ; )=
Với

(1


)

.

Ví dụ: Một sọt cam rất lớn được phân loại theo cách như sau: Chọn ngẫu
nhiên 2 quả cam làm mẫu đại diện. Nếu mẫu này không chứa quả cam
hỏng nào thì sọt cam được xếp loại 1. Nếu mẫu cho một hoặc hai quả
cam hỏng thì sọt cam xếp loại 2. Trong trường hợp còn lại (có từ ba quả
hỏng trở lên) sọt cam được xếp loại 3.
Trên thực tế có 3% số cam trong sọt bị hỏng. Tìm xác suất để sọt
cam được xếp loại:
a) Loại 1.
b) Loại 2.
c) Loại 3.
Giải
Ta coi việc chọn 20 quả cam là 2 lần thử với những điều kiện
như nhau, có xác suất xuất hiện biến cố A=“quả cam bị hỏng” đều là
, 3. Như vậy, số cam hỏng trong 20 quả được chọn chính là số lần biến
cố A xuất hiện trong 20 lần thử. Như vậy
a) Xác suất đê sọt cam được xếp loại 1 là
=

(2 ; , 3) =

. (1

, 3)

,5438.


b) Xác suất để sọt cam được xếp loại 2 là
=

(2 ; , 3)
(2 ; , 3)
=
. , 3. (1
, 3)
,4352.

c) Xác suất để sọt cam được xếp loại 3 là
THỐNG KÊ XÃ HỘI HỌC

. ( , 3) . (1

, 3)


21

=1

THỐNG KÊ XÃ HỘI HỌC

=1

,5438

,4352 = , 21 .



22

Chương 3
ĐẠI LƯỢNG NGẪU NHIÊN
 Một đại lượng mà giá trị của nó là ngẫu nhiên, không dự đoán trước
được, được gọi là một đại lượng ngẫu nhiên (ĐLNN). Chúng ta sử dụng
các chữ cái in hoa như X, Y, Z, … để kí hiệu ĐLNN.
 Một ĐLNN được gọi là rời rạc nếu ta có thể liệt kê tất cả các giá trị có thể
của nó bằng một dãy hữu hạn hay vô hạn x , x , … , x , …. Tập hợp các giá
trị có thể của ĐLNN X được kí hiệu bởi ( ).
 Một ĐLNN được gọi là liên tục nếu
(i) Tập hợp các giá trị có thể của X lấp đầy một hay một số khoảng của
trục số, thậm chí toàn bộ trục số.
(ii) Với mọ số a, P(X = a) = .
 Các ĐLNN , , … ,
được gọi là độc lập nếu như với mọi giá trị i, việc
nhận giá trị ra sao cũng không ảnh hưởng tới việc các giá trị còn lại
có giá trị như thế nào.
3.1. ĐẠI LƯỢNG NGẪU NHIÊN RỜI RẠC
3.1.1. Phân phối xác suất.
 Giả sử là không gian mẫu, X là ĐLNN rời rạc và ( ) = * ,
đó bộ số ( ) xác định bởi
= ( = )
1

, … +. Khi

Được gọi là phân phối xác suất của ĐLNN X. Phân phối xác suất thường
được thể hiện dưới dạng bảng, bảng này được gọi là bảng phân phối xác


suất rời rạc
X







Ví dụ: Một lô hàng chứa 10 sản phẩm, trong đó có 6 sản phẩm tốt và 4
sản phẩm xấu. Chọn ngẫu nhiên từ lô hàng ra 2 sản phẩm. Gọi X là số sản
phẩm tốt có trong 2 sản phẩm được chọn ra. Tìm phân phối xác suất của
X.
THỐNG KÊ XÃ HỘI HỌC


23

Giải
Ta thấy X là ĐLNN rời rạc có thể nhận các giá trị là , 1, 2. Ta có:
= ( = )=
= ( = 1) =
= ( = 2) =

Vậy ĐLNN X có bảng phân phối xác suất
X
0
2
P

15

2
;
15
8
=
;
15
5
=
;
15
=

1

2

8
15

5
15

Chú ý: Nếu ĐLNN X có phân phối xác suất ( ) thì
i.
ii.

1.

. . . = 1.

1

3.1.2. Các số đặc trưng

Cho ĐLNN X có phân phối xác suất ( ).
 Kỳ vọng (Giá trị trung bình):
=
=

Tính chất:
i.
ii.
iii.
iv.

= .
( )= . .
(
)=
.
Nếu , là hai ĐLNN độc lập thì ( . ) =

.

.

Ví dụ: Cho ĐLNN X có phân phối xác suất như sau
X

P

5

6

7

Khi đó giá trị kỳ vọng của X là

THỐNG KÊ XÃ HỘI HỌC

8

9

10

11


24

1
2
6.
12
12
= 7,75.


=

= 5.

3
12

7.

8.

2
12

9.

2
12

1 .

1
12

11.

1
93
=
12 12


Ví dụ: Theo thống kê, xác suất để một người ở độ tuổi 40 sống thêm một
năm là ,995. Một công ty bảo hiểm nhân thọ dự định kế hoạch bán bảo
hiểm như sau: một năm người mua bảo hiểm trả cho công ty 2 triệu
đồng, và nếu người mua chết thì số tiền bồi thường của công ty bảo
hiểm là 5 triệu đồng. Hỏi công ty đó có nên chọn phương án kinh
doanh này không?
Giải
Gọi X là lợi nhuận thu được khi bán bảo hiểm (đơn vị: triệu đồng). Khi
đó X có phân phối xác suất như sau:
X
-48
2
P
0,005
0,995
Như vậy lợi nhuận trung bình của công ty là
=

= ( 48). ,

5

2. ,995 = 1,75.

Vì lợi nhuận dương nên phương án này có thể chấp nhận được.
 Moment bậc k:
=

=


.

.

.

Tổng quát:
( ) = ( ).

( ).

Ví dụ: Cho X là ĐLNN có phân phối xác suất
X
1
3
5
P
0,1
0,4
0,2
Hãy tính các moment bậc 1, 2, 3, 4.
Giải
Ta có
=
=
=
=

= 1. ,1 3.

= 1 . ,1
= 1 . ,1
= 1 . ,1

THỐNG KÊ XÃ HỘI HỌC

,4
3 .
3 .
3 .

(

7
0,2

).

9
0,1

5. ,2 7. ,2 9. ,1 = 4,6.
,4 5 . ,2 7 . ,2 9 . ,1 = 26,6.
,4 5 . ,2 7 . ,2 9 . ,1 = 177,4.
,4 5 . ,2 7 . ,2 9 . ,1 = 1293,8.


×