Chương 3: Thống kê xác suất ứng dụng
trong tính toán thủy văn
THUỶ VĂN CÔNG TRÌNH
Khoa Thuỷ văn – Tài nguyên nước
Bộ môn Thuỷ văn – Tài nguyên nước
1
3.1 Khái niệm về xác suất và tần suất
1. Các khái niệm cơ bản
Phép thử: Thc hiện mt thử nghiệm và quan sát kt quả thc
hiện đối với mt hiện tượng ngẫu nhiên nào đó trong cùng
mt điều kiện nhất định.
Kt quả của mt phép thử ngẫu nhiên gọi là bin cố ngẫu
nhiên, hoặc nói ngắn gọn là bin cố / bin cố cơ bản. Tp hợp
cc bin cố có thể xy ra trong mt php thử gọi l không gian
bin cố.
2
3.1 Khái niệm về xác suất và tần suất
Phân loại bin cố
Bin cố chắc chắn: là bin cố nhất định phải xuất hiện trong
mt phép thử.
Bin cố không thể có: là bin cố không thể xuất hiện trong
mt phép thử.
Bin cố đc lp: là bin cố mà s xuất hiện của nó không phụ
thuc vào s xuất hiện của các bin cố khác
Bin cố phụ thuc: là bin cố mà s xuất hiện của nó phụ
thuc vào s xuất hiện của bin cố khác
3
3.1 Khái niệm về xác suất và tần suất
Phân loại bin cố
Bin cố tổng: bin cố C được gọi là bin cố tổng của hai bin cố A
và B nu hoặc A xuất hiện, hoặc B xuất hiện, hoặc cả A và B cùng
xuất hiện đều dẫn đn sự xuất hiện của C.
Bin cố tích: Bin cố C được gọi là bin cố tích của hai bin cố A
và B khi và ch khi cả 2 bin cố A và B đng thi xuất hiện tạo nên.
4
A
B
A
B
C=A+B
C=A.B
3.1 Khái niệm về xác suất và tần suất
Xác suất
Định nghĩa cổ điển: Xác suất xuất hiện của mt bin cố
A nào đó bằng tỷ số giữa số bin cố cơ bản thun lợi
cho A xuất hiện trên tổng các bin cố cơ bản của không
gian bin cố.
Công thức tính xác suất của bin cố A theo định nghĩa cổ
điển:
n là tổng số các bin cố cơ bản của không gian bin cố đang xét;
m là số bin cố cơ bản thun lợi cho bin cố A xuất hiện.
5
n
m
AP )(
3.1 Khái niệm về xác suất và tần suất
Định nghĩa theo thống kê: Xác suất xuất hiện của mt
bin cố A nào đó là tần số xuất hiện của bin cố đó khi
số lần thc hiện phép thử tăng lên vô hạn.
Công thức tính xc suất theo định nghĩa thông kê:
n l số lần thc hiện php thử
m l số lần xuất hiện bin cố A
6
n
m
AP
n
lim
)(
3.2 Đại lượng ngẫu nhiên và luật phân bố
xác suất của đại lượng ngẫu nhiên
1. Khái niệm đại lượng ngẫu nhiên
Đại lượng ngẫu nhiên (ĐLNN) l mt đại lượng m trong mt php thử
nó nhn mt gi trị có thể trong tp giá trị hay trong mt khoảng trên trục
số với xc suất tương ứng của nó.
Ký hiệu X = {x
1
, x
2
, x
3
, …, x
n
}
Phân loại:
o Đại lượng ngẫu nhiên ri rạc: Nu nó nhn mt số gi trị hữu hạn trong
khoảng xc định của nó.
o Đại lượng ngẫu nhiên liên tục: Nu nó nhn bất kỳ gi trị trong khoảng
xc định của nó
7
2. Lut phân bố xác suất của ĐLNN và Hàm phân bố xác suất
8
Giá
trị có thể của
ĐLNN
X
1
X
2
X
3
X…
Xn
Xác
suất (P)
P
1
P
2
P
3
P…
Pn
x
xxXxP
xf
x
lim
0
)(
2. Lut phân bố xác suất của ĐLNN và Hàm phân bố xác suất
9
x
dxxf )(
Ví dụ:
10
Hàm mt đ xác suất chun có dạng:
2
)(
2
2
exp
2
1
)(
x
xf
mx
x
3. Tính chất và đ thị của hàm PPXS
11
PPXS
dạng F(x) = P(X≤ x)
PPXS dạng F(x) = P(X ≥ x)
1.
Giá trị F(x) ≥0 nhn giá trị trong
khoảng [0,1]
-
F(-∞) = P(x≤-∞) = 0;
F(+∞) = P(x≤+∞) = 1
-
Với (-∞ ≤ x ≤ +∞) ta có
(0 ≤ F(x) ≤ 1)
1.
Giá trị F(x) ≥0 nhn gi trị trong
khoảng [0,1]
-
F(-∞) = P(x≥-∞) = 1;
F(+∞) = P(x≥+∞) = 0
-
Với (-∞ ≤ x ≤ +∞) ta có
(0 ≤ F(x) ≤ 1)
2.
F(x) là hàm đng bin không giảm
trên
toàn trục số x
2
≥ x
1
thì F(x
2
)
≥ F(
x
1
). Đ thị luân đi lên
2.
F(x) là hàm nghịch bin không tăng
trên
toàn trục số x
2
≥ x
1
thì F(x
2)
≤ F(
x
1
). Đ thị luân đi xuống
3. F(x
) = P(X≤ x) liên tục trái tại mỗi
điểm
x
o
bất kỳ trên trục số
lim F(x) = F(x
o
)
3. F(x) = P(X≤ x)
liên tục trái tại mỗi
điểm
x
o
bất kỳ trên trục số
lim
F(x) = F(x
o
)
oo
xx
oo
xx
4. Các đặc trưng biểu thị của đại lng ngẫu nhiên (ĐLNN)
12
1: Kỳ vọng toán của ĐNN là mô men gốc bc nhất của hàm
mt đ xác suất ký hiệu m
x
= M[X] biểu thị mức đ tp trung
của ĐLNN
- Với ĐLNN liên tục m
x
=
- Với ĐLNN ri rạc m
x
nu xác suất p(x
i
) phân bố đều thì p(x
i
) = và kỳ vọng
toán sẽ là:
x
dxxfx )(.
n
i
ii
xpx
1
)(
n
1
4. Các đặc trưng biểu thị của đại lng ngẫu nhiên (ĐLNN)
13
3. Hệ số thiên lệch
Đ thị hàm mt đ có thể đối xứng(như phân bố chun)
hoặc không đối xứng quanh trục tung có gốc là kỳ vọng
tính đối xứng được đnh giá momen bc ba:
+ Đối với ĐLNN liên tục
+Đối với ĐLNN ri rạc
Hệ số thiên lệch ký hiệu Cs
dxxfmx
x
)()(
3
3
)()(
3
1
3 ix
n
i
i
xpmx
3
3
x
s
C
4. Các đặc trưng biểu thị của đại lng ngẫu nhiên (ĐLNN)
14
2. Phương sai và khoảng lệch quân phương biểu thị mức đ phân tán của
ĐLNN
- Phương sai ký hiệu D
x
=M[ (x – m
x
)
2
] là kỳ vọng của kỳ vọng toán.
+ Đối với ĐLNN liên tục
+ Đối với ĐLNN ri rạc
- Khoảng lệch quân phương
- Hệ số phân tán: là đặc trưng không thứ nguyên biểu thị đ phân tán của
ĐLNN so với kỳ vọng ký hiệu C
v
dxxfmx
x
x
D
)()(
2
)()(
2
1
ic
n
i
i
x
xpmx
D
xx
D
x
x
v
m
C
4. Các đặc trưng biểu thị của đại lơng ngẫu nhiên (ĐLNN)
15
3. Hệ số thiên lệch
Đ thị hàm mt đ có thể đối xứng(như phân bố chun)
hoặc không đối xứng quanh trục tung có gốc là kỳ vọng
tính đối xứng được đnh giá momen bc ba:
+ Đối với ĐLNN liên tục
+Đối với ĐLNN ri rạc
Hệ số thiên lệch ký hiệu Cs
3.3 Khái niệm về mẫu và tổng thể,
phương pháp chọn mẫu
Tổng thể Số lượng các giá trị có thể mà ĐLNN có
thể nhn được là lớn vô cùng. Tp hợp tất cả các
giá trị mà ĐLNN X có thể nhn được gọi là tổng
thể. Ký hiệu: N
Mẫu Trong nghiên cứu không thể nào NC ht tất
cả các giá trị của tổng thể mà ch NC trên mt tp
giá trị với số lượng rất nhỏ. Tp hợp hữu hạn các
số liệu thu thp được của tổng thể gọi là mẫu.
Ký hiệu: n
16
3.3 Khái niệm về mẫu và tổng thể,
phương pháp chọn mẫu
Các yêu cầu của mẫu trong thống kê:
o Tính đại biểu: mẫu được chọn có những tính chất của
tổng thể. Muốn vy, dung lượng mẫu phải đủ lớn đảm
bảo sai số lấy mẫu; mẫu phải bao gm các giá trị số đặc
trưng lớn, nhỏ và trung bình
o Tính đc lp: các số liệu của mẫu không phụ thuc lẫn
nhau
o Tính đng nhất: cùng loại, cùng nguyên nhân hình
thành hoặc cùng điều kiện xuất hiện
17
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
Khái niệm
Trong thống kê toán thưng ch thu được hữu hạn các gía
trị của ĐLNN (mẫu có dung lượng n) tức là thu được các
giá trị ri rạc từ tổng thể mặc dù ĐLNN có thể là liên tục.
Do vy có thể dùng các công thức định nghĩa của ĐLNN
ri rạc để tính toán. Các hiện tượng thủy văn là ĐLNN liên
tục, các giá trị thu được ri rạc vì vy trong thủy văn qui
ước cách gọi riêng: Xác suất gọi là Tần suất và theo đó có
Hàm mt đ xác suất-Hàm mật độ tần suất; Hàm PPXS-
Hàm tần suất tích lũy
18
19
Hàm phân bố xác suất của đại lượng ngẫu nhiên
dùng trong Thủy văn
Hàm phân bố xác suất F(x) l xc suất để cho
đại lượng ngẫu nhiên X nhn cc gi trị lớn hơn
hoặc bằng mt gi trị x, trong đó x l bin số nhn
cc gi trị có thể trên miền xc định của nó.
F(x) = P(X x)
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
20
0
1
F(x)
x
Đ thị hm tan suat tich luy
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
21
Tính chất hàm phân bố xác suất:
Luôn dương v nhn gi trị trong khoảng [0,1]
F(-)=1
F()=0
L hm nghịch bin v không tăng trên ton trục số
x
2
x
1
thì F(x
2
)F(x
1
)
Liên tục bên phải tại mỗi điểm x
0
0
0
lim
0
xFxF
xx
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
22
Công thức:
Tính chất:
1.
2. Hm f(x) luôn dương v bin đổi từ 0 đn 1
3.
dxxfxF
x
x
xxXxP
xf
x
lim
0
)(
1
dxxf
Hàm mật độ xác suất
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
23
x
f(x)
Đồ thị hàm mật độ xác suất dạng quả chuông
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
Đặc điểm của đồ thị hàm mật độ xác suất
Hon ton nằm trên trục honh
Hình dạng đ thị hàm mt đ tần suất có dạng hình quả
chuông
Hm mt đ xc suất nhn trục 0x lm tiệm cn ngang
Có mt gi trị cc đại
24
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
Hàm tần suất luỹ tích/Hàm phân bố xác suất
Trong thống kê toán học, thưng ch thu được mẫu có
dung lượng n (ri rạc).
Mẫu n đó được coi là đại lượng ngẫu nhiên ri rạc.
F(x
i
) = P(X x
i
)
Được gọi là hàm tần suất luỹ tích.
Đ thị của nó thưng được gọi là “đưng tần suất”
25