Tải bản đầy đủ (.pdf) (51 trang)

Một số phương pháp ước lượng điểm trong thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.37 MB, 51 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM
KHOA TOÁN
------------

NGUYỄN THỊ VÂN ANH

MỘT SỐ PHƯƠNG PHÁP ƯỚC
LƯỢNG ĐIỂM TRONG THỐNG KÊ

KHÓA LUẬN TỐT NGHIỆP
NGÀNH TOÁN ỨNG DỤNG

Đà Nẵng - Năm 2019


ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM
KHOA TOÁN
------------

NGUYỄN THỊ VÂN ANH

MỘT SỐ PHƯƠNG PHÁP ƯỚC
LƯỢNG ĐIỂM TRONG THỐNG KÊ

Chuyên ngành: TỐN ỨNG DỤNG
Lớp

: 15CTUDE


KHĨA LUẬN TỐT NGHIỆP
Giảng viên hướng dẫn : TS. LÊ VĂN DŨNG

Đà Nẵng - Năm 2019


LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi. Các số
liệu, kết quả nêu trong luận văn là trung thực và chưa từng được cơng bố
trong các cơng trình khác. Nếu khơng đúng như đã nêu trên, tơi xin hồn
tồn chịu trách nhiệm về đề tài của mình.
Người cam đoan

Nguyễn Thị Vân Anh


LỜI CẢM ƠN
Qua bốn năm học tập và rèn luyện tại trường Đại học Sư phạm Đà
Nẵng, được sự dìu dắt của các thầy cô, tôi đã tiếp xúc được khá nhiều kiến
thức bổ ích. Khóa luận tốt nghiệp này được xem như là thành quả quan trọng
của cả quá trình học tập và rèn luyện. Lời đầu tiên tơi xin gửi lời cảm ơn sâu
sắc tới thầy giáo hướng dẫn TS. Lê Văn Dũng, thầy đã tận tình hướng dẫn
tơi trong suốt q trình thực hiện để tơi có thể hồn thành được khóa luận
này.
Vì điều kiện thời gian và khả năng có hạn nên bài luận khơng thể
tránh khỏi những thiếu sót. Tơi rất mong nhận được ý kiến đóng góp của
Thầy (cơ) để bài luận được hồn thiện hơn.
Tôi cũng xin gửi lời cảm ơn chân thành nhất đến tất cả các thầy cơ
giáo đã tận tình giảng dạy giúp đỡ tôi trong suốt thời gian học tập tại khoa
Toán, Trường Đại học Sư phạm, Đại học Đà Nẵng.

Cuối cùng, tôi cũng xin gửi lời cảm ơn đến các anh chị em trong lớp
15CTUDE và các anh chị khóa trên đã nhiệt tình giúp đỡ tơi trong quá trình
học tập tại trường.
Đà Nẵng, ngày 1 tháng 4 năm 2019
Sinh viên

Nguyễn Thị Vân Anh


MỤC LỤC
MỞ ĐẦU .................................................................................................................... 1
CHƯƠNG 1. KIẾN THỨC CƠ SỞ .......................................................................... 3
1.1. LÝ THUYẾT XÁC SUẤT............................................................................ 3
1.1.1. Khái niệm xác suất ................................................................................... 3
1.1.2. Các phép toán xác suất ............................................................................ 6
1.2. BIẾN NGẪU NHIÊN ................................................................................. 10
1.2.1. Khái niệm biến ngẫu nhiên.................................................................. 10
1.2.2. Phân phối xác suất ............................................................................... 11
1.2.3. Các đặc trưng ....................................................................................... 16
1.3. THỐNG KÊ MÔ TẢ .................................................................................. 19
1.3.1. Các số đặc trưng của một mẫu số liệu .................................................. 19
1.3.2. Phân tích biểu đồ ................................................................................... 22
CHƯƠNG 2. MỘT SỐ PHƯƠNG PHÁP ƯỚC LƯỢNG ĐIỂM .......................... 30
2.1. PHƯƠNG PHÁP ƯỚC LƯỢNG HỢP LÍ CỰC ĐẠI ................................. 30
2.2. PHƯƠNG PHÁP MƠ-MEN ......................................................................... 34
2.3. PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI THIỂU ........................................ 36
2.3.1. Trường hợp k = 2................................................................................... 36
2.3.2. Trường hợp tổng quát ........................................................................... 41
KẾT LUẬN .............................................................................................................. 45
TÀI LIỆU THAM KHẢO ....................................................................................... 46



1

MỞ ĐẦU
1. Tính cấp thiết của đề tài
Xác suất và thống kê đóng vai trị rất quan trọng trong hầu hết mọi lĩnh
vực của thế giới hiện đại, từ khoa học, cơng nghệ, đến kinh tế, chính trị, đến
sức khỏe, mơi trường, v.v. Ngày nay, máy tính giúp cho việc tính tốn các
vấn đề xác suất thống kê ngày càng trở nên dễ dàng, một khi đã có các số liệu
đúng đắn và mơ hình hợp lý. Thế nhưng, bản thân máy tính khơng biết mơ
hình nào là hợp lý. Đấy là vấn đề của người sử dụng: cần phải hiểu được bản
chất của các khái niệm và mơ hình xác suất thống kê, thì mới có thể dùng
được chúng.
Mục đích của bài khóa luận này chính là nhằm phân tích rõ bản chất
của những khái niệm và phương pháp cơ bản nhất của xác suất và thống kê,
và qua đó có thể áp dụng được chúng, đi sâu tìm hiểu được một số phương
pháp ước lượng điểm trong thống kê.
2. Mục tiêu nghiên cứu
Hiểu rõ được bản chất của phương pháp thống kê bằng ước lượng điểm.
Đưa phương pháp ước lượng điểm vào thực tế và ứng dụng của nó.
3. Đối tượng nghiên cứu
Một số phương pháp ước lượng điểm trong thống kê bao gồm:
o Phương pháp ước lượng hợp lí cực đại
o Phương pháp momen
o Phương pháp bình phương tối thiểu
4. Phương pháp nghiên cứu
Tham khảo và trích dẫn các tài liệu có sẵn một cách có chọn lọc để đưa ra



2

cái nhìn cụ thể cho từng phương pháp. Sử dụng định nghĩa và ví dụ để làm rõ
vấn đề.
5. Bố cục đề tài
Bao gồm 2 phần:
Phần 1 trình bày các kiến thức cơ sở về lý thuyết xác suất thống kê, giới
thiệu về biến ngẫu nhiên và sơ lược về thống kê mô tả. Ở mục biến ngẫu
nhiên, sẽ làm rõ về hàm phân phối xác suất và các đặc trưng của nó bao gồm
kỳ vọng, trung vị, phương sai, độ lệch chuẩn, momen. Về phần thống kê mô
tả sẽ tập trung vào tìm hiểu các đặc trưng của một mẫu số liệu và giới thiệu về
một số biểu đồ phân tích.
Phần 2 giới thiệu về 3 phương pháp ước lượng điểm đó là phương pháp
ước lượng hợp lí cực đại, phương pháp momen và phương pháp bình phương
tối thiểu, ở mỗi phương pháp sẽ có các đặc trưng riêng. Bên cạnh sử dụng
định nghĩa, chúng ta cịn có các ví dụ để hiểu rõ hơn từng phương pháp này.
6. Tổng quan tài liệu nghiên cứu
Trong bài khóa luận này, tơi có sử dụng các tài liệu chun ngành xác
suất thống kê của các giáo sư, tiến sĩ đã được cơng nhận và xuất bản rộng rãi
cho tồn sinh viên Việt Nam. Tôi cũng tham khảo tài liệu tiếng anh
Probability and Statistics for Engineering and the Sciences để trau dồi thêm
kiến thức về xác suất và thống kê.


3

CHƯƠNG 1. KIẾN THỨC CƠ SỞ
1.1. LÝ THUYẾT XÁC SUẤT
1.1.1. Khái niệm xác suất
a. Phép thử và sự kiện

Phép thử là một thử nghiệm cho kết quả là một sự kiện (cịn được gọi là
biến cố - event). Ví dụ, tung một con xúc xắc 6 mặt được coi là một phép thử,
kết quả thu được là là xuất hiện mặt 1 chấm, 2 chấm, … 6 chấm, và các kết
quả này được gọi là các sự kiện thu được từ phép thử tung con xúc xắc.
Như vậy ta có thể phân sự kiện thành 3 dạng chính sau:


Sự kiện chắc chắc: là sự kiện luôn luôn xảy ra



Sự kiện bất khả: là sự kiện không bao giờ xảy ra



Sự kiện ngẫu nhiên: là sự kiện có thể xảy ra hoặc khơng

Các sự kiện trong cùng một phép thử có thể có những quan hệ chính sau:


Sự kiện đối: là 2 sự kiện không xảy ra đồng thời. Sự kiện đối
của A được kí hiệu là A . Sự kiện này còn được gọi là sự kiện bù
của A và được kí hiệu là AC .



Sự kiện hợp: là sự kiện xảy ra khi có ít nhất một trong những sự kiện
thành phần xảy ra. Sự kiện hợp của A và B được kí hiệu
là A∪B hoặc A+B.
kiện { Ai }, i  1, n là




Trường hợp tổng quát,

các

sự

n

n

Ai hoặc
i 1

hợp của

A .
i 1

i

Sự kiện giao: Là sự kiện xảy ra khi tất cả các sự kiện thành phần cùng
xảy ra. Giao của 2 sự kiện A và B được kí hiệu là A∩B hoặc AB.


4

Trường hợp tổng quát, giao của các sự kiện { Ai }, i  1, n là


n

Ai
i 1

n

hoặc


A .
i 1

i

Sự kiện xung khắc: Là các sự kiện không đồng thời xảy ra. Các sự
kiện { Ai }, i  1, n xung khắc đôi một khi và chỉ khi



n

Ai  ∅.

i 1

Sự kiện độc lập: Các sự kiện được gọi là độc lập khi và chỉ khi việc
xảy ra sự kiện này không ảnh hưởng tới việc xảy ra tập sự kiện cịn lại.
Như vậy có thể thấy nếu 2 sự kiện A, B là độc lập thì A, B ; A, B; A,

B cũng là độc lập.



Không gian sự kiện: Là tập hợp của tất cả các sự kiện độc lập có thể
xảy ra. Khơng gian sự kiện được kí hiệu là: Ω.

Ở đây ta cần lưu ý rằng, các phép toán quan hệ của các sự kiện trên là
giống như các phép toán trong đại số Boole, nên mọi tính chất và hệ quả của
đại số Boole đều có thể áp dụng cho các sự kiện.






Giao hốn:
o

A∪B = B∪A

o

A∩B = B∩A

Kết hợp:
o

A∪(B∪C) = (A∪B)∪C


o

A∩(B∩C) = (A∩B)∩C

Phân phối:


5



o

A∩(B∪C) = A∩B∪A∩C

o

A∪(B∩C) = (A∪B)∩(A∪C)

Phần bù:
o

A A

o

A B  A B

o


A B  A B

b. Định nghĩa xác suất
Tần số của một sự kiện A là tần số xuất hiện n A của nó sau n lần thực
hiện phép thử.
f n ( A) 

nA
n

Định nghĩa xác suất theo định luật số lớn là giới hạn của tần số sự kiện
khi số lần thử lên tới vô hạn.
P( A)  lim f n ( A)
n

Trên thực tế ta không đủ thời gian và điều kiện để thực hiện vô hạn số
lần gieo phép thử và n đủ lớn thì tần số f n  A  sẽ tiến tới một giá trị gần như
không biến thiên nhiều nên người ta chọn giá trị xấp xỉ đó là xác suất: |P(A) f n  A  | < ϵ với ϵ là một số dương rất bé.

Từ đây ra có thể rút ra được 1 vài điều sau:


Xác suất của sự kiện A bất kì ln nằm trong khoảng 0,1: P(A)  [0, 1],
∀A



Xác suất của sự kiện bất khả bằng 0: P(∅) = 0



6



Xác suất của sự kiện chắc chắn hay không gian sự kiện bằng 1: P(Ω) =
1



Xác suất hợp của 2 sự kiện độc lập A, B là tổng của chúng: P(A+B) =
P(A) + P(B)



Xác suất kéo theo A  B thì: P(A) ≤ P(B)
1.1.2. Các phép tốn xác suất

Tương tự như quan hệ của các sự kiện, ta cũng có quan hệ của các xác
suất.
a. Tổng xác suất
Tổng xác suất là xác suất của sự kiện hợp. Cho tập sự kiện { Ai }, i  1, n ,
khi đó ta có:
P(

n
i 1

n

Ai )   P( Ai ) 

i 1



1i1 i2  n

P( Ai1 Ai2 ) 



1i1 i2 i3  n

P( Ai1 Ai2 Ai3 )  (1) n 1 P ( A1 A2  An )

Hay viết gọn thành:
P(

n
i 1



Trong đó, tổng

1 k1   ki  n

P(

n


Ai )   (1)i 1
i 1

i
j 1



1 k1   ki  n

P(

i
j 1

Ak j )

Ak j ) là tổng của tất cả các xác suất giao của tập

con gồm i phần từ tập {1,2,…,n}. Như vậy ta có thể thấy rằng mỗi tổng này
n

n!

sẽ gồm   
phần tử.
 i  i !(n  i )!
Ví dụ 1.1.
P(A+B) = P(A) + P(B) − P(AB)
P(A+B+C) = P(A) + P(B) + P(C) − P(AB) − P(AC) − P(BC) + P(ABC)

Từ công thức trên ta có thể thấy rằng:


7

n

P(

n

i 1

Ai )   P ( Ai )
i 1

Dấu bằng đạt được khi tập sự kiện này xung khắc đôi một:
n

P(

n

i 1

Ai )   P ( Ai )
i 1

Nếu các sự kiện này tạo thành không gian sự kiện Ω thì:
n


P ()   P ( Ai )  1
i 1

Do, A và A tạo thành không gian sự kiện nên ta có:

P( A)  P( A)  1

P( A)  1  P( A)

P( A)  1  P( A)

b. Xác suất có điều kiện
Là xác suất của một sự kiện xảy ra khi biết xác suất của sự kiện khác đã
xảy ra. Xác suất của sự kiện A khi biết B đã xảy ra được kí hiệu là P(A|B).
Cơng thức tính xác suất của A được xác định như sau:
P(A|B) =

P( AB)
, ∀P(B) > 0
P( B)

Nếu A và B là độc lập, tức A không phụ thuộc vào B thì: P(A|B) = P(A)
và P(B|A) = P(B).
Xác suất có điều kiện cũng có các tính chất giống như xác suất thông
thường:


P(


n
i 1



n

Ai | B)   (1)i 1
i 1



k1   ki

P(

i
j 1

Ak j | B)

P( A | B)  1  P( A | B)
c. Tích xác suất
Tích xác suất là xác suất của sự kiện giao. Từ cơng thức xác suất có

điều kiện ta có thể tính được xác suất giao như sau:


8


P(AB) = P(B)P(A|B) = P(A)P(B|A)
Trường hợp tổng quát, cho { Ai }, i  1, n thì tích xác suất của chúng được
tính như sau:
P(

n

Ai )  P ( A1 ) P ( A2 | A1 ) P ( A3 | A1 A2 )...P ( An | A1 A2 An 1 )

i 1

Hay viết gọn thành:
P(

n
i 1

n

i 1

i 1

j 1

Ai )   P( Ai |

Aj )

Tích xác suất cịn được gọi là quy tắc chuỗi xác suất bởi cách biểu diễn

liên hoàn thành chuỗi như trên.
Nếu {Ai } là độc lập từng đơi một thì ta có:
n

P(

n

i 1

Ai )   P ( Ai )
i 1

Do 0  P( Ai )  1 nên xác suất của tích khơng thể nào lớn hơn xác suất thành
phần được:
P(

n

Ai )  min( P( Ai ))

i 1

d. Xác suất hậu nghiệm - Bayes
Từ cơng thức tính tích xác suất ta có suy luận sau:
P(A)P(B|A) = P(B)P(A|B)
Từ đó, ta có thể tính xác suất của A khi biết B như sau:
P(A|B) =
Trong đó:



P(A|B): xác suất hậu nghiệm



P(A): xác suất tiền nghiệm

P( A) P( B | A)
P( B)


9



P(B): hằng số chuẩn hóa



P(B|A): khả năng

Trường hợp mở rộng, cho hệ xác suất tiền nghiệm { Ai }, i  1, n , với mỗi sự
kiện B bất kì, vì P(

n

Ai )  1 ta có:

i 1


P ( B )  P( B

n

Ai )

i 1
n

P ( B )  P(

BAi )

i 1

n

P ( B )   P ( BAi )
i 1
n

P ( B )   P ( Ai ) P ( B | Ai )
i 1

Công thức trên được gọi là công thức xác suất đầy đủ. Nếu P(B) > 0 thì
với bất kì A  {Ai } , ta tính được xác suất của A sau khi quan sát B như sau:
P( A | B) 

P ( A) P ( B | A)
n


 P( A ) P( B | A )
i 1

i

i

e. Công thức Bec-nu-li (Bernoulli)
Một phép thử mà kết quả chỉ có 2 sự kiện là xảy ra A với xác suất P(A)
= p hoặc không xảy ra A với xác suất P( A)  1  p  q được gọi là phép thử
Bec-nu-li. Khi đó xác suất để xảy ra sự kiện A đúng k lần được tính
bằng cơng thức Bec-nu-li như sau:
n
P ( Ak )    p k q n  k
k 


10

Chứng minh: Đặt B là sự kiện mà A xảy ra đúng k lần. Vì ta khơng quan tâm
n

tới thứ tự xảy ra của các sự kiện A nên ta có cả thảy là   kết quả. Hay nói
k 
n

cách khác B là tổng của   sự kiện. Vì các kết quả này là độc lập với nhau
k 
nên ta có thể biểu diễn P(B) như sau:

n
P( B)    P( B0 )
k 

Trong đó, B0 là sự kiện mà A xảy ra đúng k lần và A xảy ra n−k lần. Do
2 sự kiện này là độc lập nên ta có P(B0) = P( Ak ) P( Ak ) . Ngoài ra, do A xảy
k
ra k lần nên: P ( Ak )  p , còn A xảy ra n−k lần nên: P( Ak )  q nk . Như vậy

P ( B0 )  p k q n  k . Thế P(B0) vào công thức phía trên ta sẽ có:

n
P( B)    p k q n k
k 

Dễ thấy rằng để A xảy ra trong khoảng  k1 , k2  lần thì xác suất sẽ là
tổng của từng xác suất thành phần:
n
P( A; k1 , k2 )   P( A )     p k q nk
k  k1
k  k1  k 
k2

k2

k

1.2. BIẾN NGẪU NHIÊN
1.2.1.


Khái niệm biến ngẫu nhiên

Biến ngẫu nhiên (random variables) là các biến nhận 1 giá trị ngẫu
nhiên đại diện cho kết quả của phép thử. Mỗi giá trị nhận được x của biến
ngẫu nhiên X được gọi là một thể hiện của X, đây cũng là kết quả của phép
thử hay còn được hiểu là một sự kiện.
Biến ngẫu nhiên thực chất là một hàm ánh xạ từ không gian sự kiện đầy
đủ tới 1 số thực: X : 


11

Biến ngẫu nhiên có 2 dạng:


Rời rạc (discrete): tập giá trị nó là rời rạc, tức là đếm được.



Liên tục (continous): tập giá trị là liên tục tức là lấp đầy 1 khoảng trục
số.
1.2.2.

Phân phối xác suất

Là phương pháp xác định xác suất của biến ngẫu nhiên được phân phối
ra sao. Có 2 cách để xác định phân bố này là dựa vào bảng phân bố xác xuất
và hàm phân phối xác suất. Hàm phân phối xác suất của biến ngẫu
nhiên X được xác định như sau:


FX ( x)  P( X  x) , x 
Hàm phân phối xác suất cịn có tên là hàm phân phối tích luỹ (CDF Cumulative Distribution Function) do đặc trưng là lấy xác suất của các biến
ngẫu nhiên bên trái của một giá trị x bất kì nào đó. Hàm này có đặc điểm là
một hàm không giảm, tức là nếu a  b thì FX (a)  FX (b) vì sự kiện b đã bao
gồm cả sự kiện a rồi.
a. Hàm khối xác suất của biến rời rạc
Với các biến ngẫu nhiên ta còn quan tâm xem xác suất tại mỗi tại 1 giá
trị x nào đó trong miền giá trị của nó là bao nhiêu, hàm xác suất như vậy đối
với biến ngẫu nhiên rời rạc được gọi là hàm khối xác suất (PMF - Probability
Mass Function). Giả sử miền xác định của X là D, tức X : 

D thì hàm khối

xác suất được xác định như sau:
 P( X  x ) nÕu x  D
p( x )  p X ( x )  
nÕu x  D
0

Như vậy ta có thể thấy rằng hàm khối xác suất thực chất cũng là một
xác suất nên nó mang đầy đủ tất cả các tính chất của xác suất như:
 0  p ( x)  1


12



 p( x )  1


xi D

i

Ví dụ, ta có hàm phân phối xác suất như sau:
x
 36

12  x
p( x )  
 36
0



nÕu x  ,0  x 6
nếu x , x 70
còn lại

thỡ ta có thể biểu diễn bằng biểu đồ phân phối như sau:

Hàm phân phối tích luỹ F của biến ngẫu nhiên rời rạc có thể được biểu
diễn qua hàm khối xác suất bằng cách lấy tổng:
FX ( x) 



all xi  x

p ( xi ) , x 


Lúc này, hàm phân phối tích luỹ sẽ có dạng bậc thang ứng với mỗi bậc
là khoảng ( xi , xi 1 ) . Ví dụ hàm phân phối tích luỹ của ví dụ trên sẽ có dạng như
sau:


13

0
1 / 36

3 / 36

6 / 36
F( x )  
10 / 36
15 / 36

21 / 36
 ...


nÕu x  1
nÕu 1  x  2
nÕu 2  x  3
nÕu 3  x  4
nÕu 4  x  5
nÕu 5  x  6
nÕu 6  x  7


Và biểu đồ tương ứng là:

b. Hàm mật độ xác suất của biến liên tục
Với các biến ngẫu nhiên liên tục ta có khái niệm hàm mật độ xác
suất (PDF - Probability Density Function) để ước lượng độ tập trung xác suất
tại lân cận điểm nào đó. Hàm mật độ xác suất f(x) tại điểm x được xác định
bằng cách lấy đạo hàm của hàm phân phối tích luỹ F(x) tại điểm đó:
f ( x)  F  ( x)

Như vậy thì nơi nào f(x) càng lớn thì ở đó mức độ tập xác suất càng
cao. Từ đây ta cũng có thể biểu diễn hàm phân phối tích luỹ như sau:
F ( x)  

x



f (t )dt


14

Xác suất trong 1 khoảng (α,β) cũng có thể được tính bằng hàm mật độ
xác suất:


P(  X   )   f ( x)dx


Hàm mật độ xác suất cũng có 2 tính chất như xác suất như sau:



Khơng âm: f ( x)  0 , x 



Tổng toàn miền bằng 1:





f ( x)dx  1



Ví dụ, thời gian tính bằng đơn vị giờ mà một máy tính hoạt động trước
khi xảy ra lỗi được coi như một biến ngẫu nhiên liên tục và được xác định với
hàm mật độ xác suất sau:
 e x /100
f ( x) 
0

nếu x 0
ngược lại

Hóy tớnh xỏc sut ca:


(a) Mt máy tính hoạt động từ 50 giờ tới 150 giờ trước khi xảy ra lỗi?




(b) Một máy tính hoạt động dưới 100 giờ trước khi xảy ra lỗi?

Vì tổng xác suất toàn miền là 1 nên:







f ( x)dx  1


  e  x /100 dx  1




   e  x /100 dx  1



   e  x /100 dx  1
0

  (100)e  x /100 |0  1
 100  1



1
100

(a) Xác suất để 1 máy tính hoạt động được trong khoảng (50, 150) giờ là:


15

P(50  X  150)  

150

50

1  x /100
e
dx
100

 e x /100 |150
50
 e1/2  e3/2
 0.384

Như vậy, xấp xỉ 38.4 phần trăm thời gian một máy tính sẽ hoạt động
trước khi lỗi trong khoảng 50 tới 150 giờ.
(b) Xác suất để 1 máy tính hoạt động được trong vòng 100 trước khi lỗi là:
P( X  100)  


100

0

1  x /100
e
dx
100

 e  x /100 |100
0
 1  e 1
 0.633

Nên xấp xỉ 63.3 phần trăm thời gian một máy tính sẽ lỗi sau 100 giờ sử
dụng.
Ta có thể biểu diễn bằng đồ thị như sau:

Nhìn vào biểu đồ trên ta có thấy xác suất (a) là phần diện tích của hình
thang cong phủ từ 50 < x < 150, còn xác suất (b) là phần diện tích hình thang
cong phủ tới x < 100. x càng lớn thì f(x) cũng càng bé đi nên phần phần diện


16

tích của nó càng hẹp dần đồng nghĩa với mật độ xác suất cũng giảm dần nên
xác suất để máy tính hoạt động được ngày càng thấp đi.
Lưu ý rằng khác với hàm xác suất, hàm mật độ xác suất tại 1 điểm bất
kì ln bằng 0.

x

P( X  x)   f (t )dt  0
x

Ngoài ra, giá trị của hàm mật độ xác suất f(x) có thể lớn hơn 1, miễn
sao đảm bảo được rằng tổng xác suất toàn miền là 1:
1.2.3.







f ( x)dx  1

Các đặc trưng

Qua các hàm phân phối xác suất ở phần trên ta có thể xác định được
xác suất của một biến ngẫu nhiên và dựng được đồ thị biểu diễn nó, nhưng
trong thực tế ta còn phải quan tâm tới các đặc trưng của nó như vị trí trung
bình và độ phân tán ra sao. Trong thực tế khi tìm xác suất ta thường chỉ xác
định các đặc trưng này vì rất khó xác định được hàm phân phối xác suất như
trên.
a. Kỳ vọng
Kỳ vọng (Expectation) của biến ngẫu nhiên là trung bình của biến ngẫu
nhiên. Kỳ vọng của biến ngẫu nhiên X được kí hiệu là E[X]:

  x f ( x )dx

E[ X ]   
 xi pi
 i

nÕu x liên tục
nếu x rời rạc

Lu ý l trung bỡnh của biến ngẫu nhiên ở đây là trung bình với trọng
lượng chứ khơng phải là trung bình cộng của xác suất biến ngẫu nhiên.
Kỳ vọng còn được biết tới với những tên gọi khác như giá trị trung
bình (Mean), giá trị trung bình có trọng lượng (Weighted Average), giá mong
đợi (Expected Value) hay mơ-men bậc một (first moment).
Kỳ vọng có một số tính chất như sau:


17



E(c) = c với c là hằng số



E(cX) = cE(X) với c là hằng số



E[aX+b] = aE[X]+b với a, b là các hằng số




E[X+Y] = E[X] + E[Y]



E[XY] = E[X]E[Y] với X, Y là độc lập




  g ( x ) f ( x )dx nÕu x liªn tơc
 
 g ( xi ) pX ( xi ) nÕu x rêi r¹c
 i

Ví dụ 1.2. cho biến ngẫu nhiên rời rạc X và một hàm g(X) = 𝑋𝑛 , hãy tìm kì
vọng của g(X).
E[ g ( x)]   g ( xi ) p X ( xi )
i

 E[ X ]   xin p X ( xi )
n

i

E[𝑋𝑛 ] ở trên cịn được biết tới với tên gọi mơ-men bậc n (nth moment) của X.
b. Phương sai
Dựa vào kì vọng ta sẽ có được trung bình của biến ngẫu nhiên, tuy
nhiên nó lại khơng cho ta thơng tin về mức độ phân tán xác suất nên ta cần 1
phương pháp để đo được độ phân tán đó. Một trong những phương pháp đó là

phương sai (variance).
Phương sai Var(X) là trung bình của bình phương khoảng cách từ biến
ngẫu nhiên X tới giá trị trung bình:

Var ( X )  E[( X  E[ X ])2 ]
Việc tính tốn dựa vào công thức này khá phức tạp, nên trong thực tế
người ta thường sử dụng công thức tương đương sau:


18

Var ( X )  E[ X 2 ]  E 2 [ X ]
Chứng minh:
Var(X) = E[(X - E[X])2 ]
= E[X 2 - 2XE[X]+ E 2 [X]]
= E[X 2 ]- E[2XE[X]]+ E[E 2 [X]]   ,E[X] lµ h»ng sè
= E[X 2 ]- 2E[X]E[X]+ E 2 [X]
= E[X 2 ]- 2E 2 [X]

Như vậy ta có thể thấy rằng phương sai ln là một giá trị không âm và
phương sai càng lớn thì nó thể hiện mức độ phân tán dữ liệu càng rộng hay
nói cách khác mức độ ổn định càng nhỏ.
Phương sai có một số tính chất sau:


Var(c) = 0 với c là hằng số



Var (cX )  c 2Var ( X ) với c là hằng số




Var (aX  b)  a 2Var ( X ) với a, b là các hằng số



Var(X+Y) = Var(X) + Var(Y) với X, Y là độc lập
c. Độ lệch chuẩn
Vì đơn vị của phương sai là bình phương nên việc tính để khớp với đơn

vị của biến ngẫu nhiên là bất khả nên người ta đưa vào thêm khái niệm độ
lệch chuẩn (SD-standard deviation) bằng căn bậc 2 của phương sai.

 ( X )  Var ( X )
Từ đây người ta cũng có thể sử dụng  2 ( X ) để thể hiện phương sai của
biến ngẫu nhiên X.
Lưu ý với độ lệch chuẩn ta phải lấy trị tuyệt đối của hằng số khi nhân
vì độ lệch chuẩn cũng là khơng âm:

 (cX ) | c |  ( X )


19

d. Trung vị
Trung vị (median) là điểm chia đều xác suất thành 2 phần giống nhau,
kí hiệu là med(X):
P( X  med ( X ))  P( X  med ( X ))  0.5


Như vậy trung vị là nghiệm của phương trình hàm tích lũy xác
suất: FX  x   0.5
e. Mơ-men
Là khái niệm tổng qt của kì vọng và phương sai. Một mô-men
bậc k đối với c được định nghĩa như sau:

mk  E[( X  a ) k ]
Nhận xét rằng:


Kỳ vọng là mô-men bậc 1 với a = 0



Phương sai là mô-men bậc 2 với a = E[X]
Khi a = E[X] người ta thường gọi là mơ-men quy tâm, cịn a = 0 gọi là

mơ-men gốc. Vậy nên ta có thể gọi kỳ vọng là mô-men gốc bậc 1 và phương
sai là mô-men quy tâm bậc 2.
1.3. THỐNG KÊ MÔ TẢ
1.3.1. Các số đặc trưng của một mẫu số liệu
a. Trung bình mẫu, phương sai mẫu và độ lệch chuẩn mẫu
Cho {x1 , x2 ,..., xn } là mẫu số liệu của biến ngẫu nhiên X.
1) Trung bình mẫu, kí hiệu là x ,được tính theo công thức:
x1  x2  ...  xn 1 n
x
  xi
n
n i 1


2) Phương sai mẫu}, kí hiệu là s 2 , được tính theo cơng thức:
1 n
1  n 2

2
s 
( xi  x ) 
xi  n( x ) 2 



n  1 i 1
n  1  i 1

2


20

3) Độ lệch chuẩn mẫu.
s  s2 

1  n 2

xi  n( x )2 


n  1  i 1



Chú ý:
1) Mẫu số liệu cho dạng bảng phân bố tần số rời rạc:
X x1 x2 … xm
ni n1 n2 … nm
- Kích thước mẫu: n  n1  n2  ...  nm .

- Trung bình mẫu: x 

1 m
 ni xi .
n i 1

- Phương sai mẫu: s 2 

1 m

ni xi2  nx 2  .


n  1  i 1


2) Mẫu số liệu cho dạng bảng phân bố tần số liên tục:
X a0 – a1 a1 - a2 … am-1 – am
ni

n1

n2




Trong đó ak 1  ak   ak 1 ; ak  .
Đặt xk 

ak 1  ak
ta được:
2

X x1 x2 … xm
ni n1 n2 … nm

nm


×