Tải bản đầy đủ (.pdf) (14 trang)

PHƯƠNG PHÁP THỐNG KÊ TRONG HẢI DƯƠNG HỌC Phạm Văn HuấnTừ khóa: Đại lượng docx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (565.84 KB, 14 trang )



Từ khóa: Đại lượng ngẫu nhiên, luật phân bố, phân bố thống kê, tiêu chuẩn phù hợp, ước lượng tham số, xác suất tin cậy, khoảng tin
cây, quá trình ngẫu nhiên, tương quan, phương pháp bình phương nhỏ nhất, khai triển phổ, phân tích điều hòa, là trơn, chu trình tuần
hoàn, trung bình trượt.

Tài liệu trong Thư viện điện tử Trường Đại học Khoa học Tự nhiên có thể được sử dụng cho mục đích học tập và nghiên cứu
cá nhân. Nghiêm cấm mọi hình thức sao chép, in ấn phục vụ các mục đích khác nếu không được sự chấp thuận của nhà xuất
bản và tác giả.








PHƯƠNG PHÁP THỐNG KÊ TRONG
HẢI DƯƠNG HỌC

Phạm Văn Huấn

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN


Phạm Văn Huấn

PHƯƠNG PHÁP THỐNG KÊ
TRONG HẢI DƯƠNG HỌC








Nhà xuất bản Đại học Quốc gia Hà Nội - 2010


Lời nói đầu
Giáo trình “Phương pháp thống kê trong hải dương học” phục vụ
cho môn học cùng tên với thời lượng hai tín chỉ trong chương trình đào
tạo cử nhân ngành hải dương học ở Trường Đại học Khoa học Tự nhiên,
Đại học Quốc gia Hà Nội.
Sách chọn giới thiệu một cách tóm tắt những khái niệm, phương
pháp cơ bản của lý thuyết thống kê toán học hay được sử dụng trong
phân tích số
liệu quan trắc hải dương học và được sắp xếp thành năm
chương theo nhóm vấn đề. Đầu mỗi chương thường ôn lại những khái
niệm và công thức cơ bản từ toán học thống kê, sau đó giới thiệu sự ứng
dụng thông qua các thí dụ để rèn luyện thói quen hiểu ý nghĩa thực tế của
khái niệm và kỹ năng thực hành tính toán cụ thể của sinh viên. Cuối mỗi
chương có phụ lục gồm các đoạn mã chương trình máy tính chính là
nhằm mục đích đó. Những thí dụ ứng dụng phương pháp thống kê trong
hải dương học chưa bao quát hết những vấn đề hải dương học thống kê,
mới chỉ giới thiệu ở mức độ giúp cho sinh viên bước đầu biết áp dụng các
khái niệm và phương pháp, tính toán đúng theo các công thức liên quan,
chưa giành chú ý nhiều đến cách đặ
t vấn đề, lý giải kết quả phân tích và
ý nghĩa thực tế của mỗi bài toán. Nội dung sách cũng chưa bao gồm

những kết quả nghiên cứu biển và đại dương theo hướng thống kê trong
hải dương học trên thế giới và ở Việt Nam. Sinh viên ngành hải dương
học sẽ thấy những khía cạnh này trong các môn học cơ sở khác của
ngành như hải dương học khu vực, thông tin và dự báo khí tượ
ng thủy
văn biển, thủy triều, sóng và các bài báo khoa học, sách chuyên khảo
về biển.

Tác giả

3 4

MỤC LỤC


Chương 1. Khái niệm về đại lượng ngẫu nhiên 3
1.1. Những đại lượng ngẫu nhiên và luật phân bố 3
1.2. Quy luật phân bố chuẩn 7
Phụ lục chương 1 10
Chương 2. Những khái niệm cơ bản của lý thuyết xử lý số liệu quan
trắc
13
2.1. Hàm phân bố thống kê 13
2.2. Sự phù hợp của phân bố lý thuyết và phân bố thống kê 15
2.2.1. Tiêu chuẩn
2
χ
15
2.2.2. Sơ đồ ứng dụng tiêu chuẩn
2

χ
để đánh giá sự phù hợp 18
2.2.3. Tiêu chuẩn phù hợp của Kolmogorov 19
2.3. Khái niệm về ước lượng tham số của phân bố 20
2.4. Ước lượng của kỳ vọng toán học và phương sai 20
2.5. Khoảng tin cậy và xác suất tin cậy 20
2.5.1. Khoảng tin cậy đối với kỳ vọng toán học 22
2.5.2. Khoảng tin cậy đối với phương sai 23
2.5.3. Những phương pháp chính xác dựng khoảng tin cậy cho các
tham số của đại lượng ngẫu nhiên phân bố chuẩn
25
2.6. Ước lượng xác suất theo tần suất 30
Phụ lục chương 2 34
Chương 3. Khái niệm về hệ các đại lượng ngẫu nhiên và ứng dụng
37
3.1. Hệ các đại lượng ngẫu nhiên 37
3.2. Các đặc trưng số của hệ hai đại lượng ngẫu nhiên. Mô men tương
quan. Hệ số tương quan
39
3.3. Phép là trơn các mối phụ thuộc thực nghiệm bằng phương pháp
bình phương nhỏ nhất
41
Phụ lục chương 3 49
Chương 4. Những khái niệm cơ bản của lý thuyết hàm ngẫu nhiên
và ứng dụng
51
4.1. Các đặc trưng của hàm ngẫu nhiên 51
4.2. Khái niệm về hàm ngẫu nhiên dừng 52
4.3. Tính chất egođic của những hàm ngẫu nhiên dừng 53
4.4. Xác định các đặc trưng của hàm ngẫu nhiên dừng egođic theo

một hiện
53
4.5. Khai triển phổ hàm ngẫu nhiên dừng trên khoảng thời gian hữu
hạn
54
Phụ lục chương 4 61
Chương 5. Ứng dụng lý thuyết hàm ngẫu nhiên vào phân tích số liệu
hải dương học
63
5.1. Phân tích chuỗi thời gian trong hải dương học 63
5.1.1. Phân tích các chu trình tuần hoàn 64
5.1.2. Xác định các chu trình tuần hoàn bằng phương pháp phân
tích điều hòa
65
5.2. Phổ phương sai của chuỗi thời gian 68
5.3. Loại bỏ chu trình tuần hoàn khỏi chuỗi thời gian 69
5.3.1. Loại bỏ chu trình tuần hoàn bằng phân tích điều hòa 69
5.3.2. Loại bỏ biến trình năm từ chuỗi quan trắc năm 71
5.3.3. Loại bỏ chu trình tuần hoàn và phân tích các chu trình
không tuần hoàn trong thực tế xử lý số liệu
71
5.4. Hàm tương quan và hàm phổ đối với chuỗi thời gian các yếu tố
hải dương học
73
Phụ lục chương 5 75
Tài liệu tham khảo 77
5 6

Chương 1
KHÁI NIỆM VỀ ĐẠI LƯỢNG NGẪU NHIÊN

1.1. Những đại lượng ngẫu nhiên và luật phân bố
Đại lượng ngẫu nhiên là đại lượng mà trong thử nghiệm có thể nhận
một giá trị nào đó không biết trước cụ thể. Những giá trị có thể có của đại
lượng ngẫu nhiên rời rạc có thể được kể ra từ trước. Những giá trị có thể
có của đại lượng ngẫu nhiên liên tục không thể kể ra trước được và chúng
phân bố liên tục trên một khoảng nào đó.
Đối với đại lượng ngẫu nhiên rời rạc
X
, nếu ta biết xác suất
P
của
từng giá trị có thể có của nó
n
xxx , , ,
21
, tức biết
() ()
(
)






=
=
=
==
=

=

=
n
i
i
nn
p
pxXPpxXPpxXP
1
2211
1
; ; ; ;

thì ta nói rằng đại lượng ngẫu nhiên ấy hoàn toàn đã được xác định về
phương diện xác suất. Mối liên hệ giữa các giá trị có thể có của đại lượng
ngẫu nhiên và những xác suất tương ứng của chúng được gọi là luật phân
bố của đại lượng ngẫu nhiên. Luật phân bố có thể được cho bởi bảng
phân bố hoặc đa giác phân bố.
Đối với đại l
ượng ngẫu nhiên liên tục, chúng ta không thể kể ra hết
tất cả các giá trị có thể có, hơn nữa từng giá trị riêng biệt của đại lượng
ngẫu nhiên liên tục thường có xác suất bằng không, nên người ta cho
phân bố bằng hàm phân bố
)(xF :
(
)
xXPxF
<
=

)( (1.1)
Người ta còn gọi
)(xF là hàm phân bố tích phân hay luật phân bố
tích phân.
Hàm phân bố là đặc trưng vạn năng nhất của đại lượng ngẫu nhiên.
Nó tồn tại cho cả các đại lượng ngẫu nhiên rời rạc lẫn liên tục. Hàm phân
bố có tính chất là hàm không giảm, tức
(
)
(
)
12
xFxF ≥ nếu
12
xx > ,
bằng không ở âm vô cùng
(
)
0)(
=

∞F và bằng một ở dương vô cùng
(
)
1)(
=
+∞F .
Hàm phân bố của đại lượng ngẫu nhiên rời rạc bất kỳ luôn luôn là
một hàm bậc thang gián đoạn. Trong thực tế thông thường hàm phân bố
của đại lượng ngẫu nhiên liên tục là hàm liên tục.

Khi giải những bài toán thực tế nhiều khi đòi hỏi tính xác suất của
sự kiện đại lượng ngẫu nhiên rơi vào khoảng giá trị từ
x
đến xx Δ+ :
)( )( )( xFxxFxxXxP

Δ
+
=
Δ
+
<
<

hoặc xác suất trung bình đối với một đơn vị độ dài trong khoảng giá trị
đó
x
xFxxF
Δ

Δ
+
)( )(
.
Nếu
0→Δx thì
)()(
)( )(
lim
0

xfxF
x
xFxxF
x
=

=
Δ

Δ
+
→Δ
. (1.2)
Hàm
)(xf
(đạo hàm của hàm phân bố) đặc trưng cho mật độ mà
các giá trị của đại lượng ngẫu nhiên phân bố ở điểm đã cho. Hàm này
được gọi là mật độ phân bố (hay “mật độ xác suất”) của đại lượng ngẫu
7 8
nhiên. Đôi khi người ta còn gọi hàm
)(xf là hàm phân bố vi phân hoặc
luật phân bố vi phân của đại lượng ngẫu nhiên liên tục
X
.
Xác suất giá trị của đại lượng ngẫu nhiên
X
rơi vào khoảng từ
α

đến

β
sẽ bằng

=<<
β
α
βα
dxxfXP )()( (1.3)
Có thể biểu thị hàm mật độ phân bố qua hàm phân bố bằng công
thức (1.2). Ngược lại, có thể biểu thị hàm phân bố qua hàm mật độ

∞−
=
x
dxxfxF )()(
. (1.4)
Mật độ phân bố là hàm không âm
)0)(( ≥xf , tích phân của hàm
mật độ với các giới hạn vô cùng bằng một (


∞−
= 1)( dxxf ). Như vậy,
đường cong phân bố luôn luôn nằm trên trục hoành, diện tích đầy đủ giới
hạn bởi đường cong phân bố và trục hoành bằng một.
Thứ nguyên của hàm phân bố
)( xF giống như xác suất không có
thứ nguyên, thứ nguyên của mật độ phân bố
)(xf nghịch đảo với thứ
nguyên của đại lượng ngẫu nhiên.

Trong nhiều vấn đề thực tế, không nhất thiết phải đặc trưng đại
lượng ngẫu nhiên một cách đầy đủ bằng hàm phân bố
)(xF
mà chỉ cần
chỉ ra những tham số bằng số riêng biệt ở mức độ nào đó đặc trưng cho
những nét chủ yếu của đại lượng ngẫu nhiên. Đó là những đặc trưng số
của đại lượng ngẫu nhiên:
1) Kỳ vọng toán học (giá trị trung bình) của đại lượng ngẫu nhiên:
Nếu đại lượng ngẫu nhiên rời rạc
X
có các giá trị có thể có
n
xxx , , ,
21
với xác suất
n
ppp , , ,
21
thì kỳ vọng toán học của đại
lượng ngẫu nhiên sẽ bằng
[]



=
=
=
==
+++
+++

==
n
i
ii
n
i
i
n
i
ii
n
nn
x
px
p
px
ppp
pxpxpx
Xm
1
1
1
21
2211


M . (1.5)
Như vậy, kỳ vọng toán học của đại lượng ngẫu nhiên là tổng của các
tích của tất cả các giá trị có thể có của đại lượng ngẫu nhiên với những
xác suất của các giá trị ấy.

Kỳ vọng toán học có liên quan với trung bình số học. Giả sử chúng
ta thực hiện
N thí nghiệm độc lập, trong mỗi lần thí nghiệm đại lượng
X
nhận giá trị xác định: giả sử giá trị
1
x xuất hiện
1
m lần, giá trị
2
x
xuất hiện
2
m lần, nói chung, giá trị
i
x xuất hiện
i
m lần. Công thức tính
trung bình số học các giá trị quan trắc đại lượng
X
sẽ là
N
mxmxmx
mmm
mxmxmx
XM
nn
n
nn
+

+
+
=
+++
+
+
+
=




][
2211
21
2211


11
*
2
2
1
1
∑∑
==
==+++=
n
i
n

i
ii
i
i
n
n
px
N
m
x
N
m
x
N
m
x
N
m
x
(1.6)
trong đó
N
m
p
i
i
=

là tần suất (hay xác suất thống kê).
Như vậy, trung bình số học của các giá trị quan trắc của đại lượng

ngẫu nhiên bằng tổng của các tích của tất cả các giá trị có thể có của đại
lượng ngẫu nhiên với tần suất của những giá trị đó.
Đối với đại lượng ngẫu nhiên liên tục
X
kỳ vọng toán học tính theo
công thức
9 10
[]


∞−
== dxxfxXm
x
)(M . (1.7)
2) Mốt của đại lượng ngẫu nhiên là giá trị hay xảy ra nhất của nó.
Cụm từ “hay xảy ra nhất” chỉ hoàn toàn chính xác đối với các đại lượng
ngẫu nhiên rời rạc, đối với đại lượng ngẫu nhiên liên tục thì mốt là giá trị
mà tại đó mật độ xác suất cực đại. Người ta ký hiệu mốt bằng chữ M.
Trên hình 1.1 biểu diễn mốt của các đạ
i lượng ngẫu nhiên rời rạc và liên
tục.
x
p
i
M
0

0
M
x

f(x)

Hình 1.1. Biểu diễn mốt của các đại lương ngẫu nhiên rời rạc và liên tục
Trong trường hợp tổng quát thì mốt và kỳ vọng toán học của đại
lượng ngẫu nhiên không trùng nhau. Khi nào phân bố là đối xứng và có
mốt (tức có một mốt) và tồn tại kỳ vọng toán học thì kỳ vọng toán học
trùng với mốt và tâm đối xứng của phân bố.
3) Trung vị của đại lượng ngẫu nhiên (thường chỉ dùng cho đại
lượng liên tục) là giá trị Me của nó sao cho
)()( MeXPMeXP >=< .
Trên đồ thị phân bố, trung vị là hoành độ của điểm mà diện tích giới
hạn bởi đường cong phân bố bị chia làm đôi. Trong trường hợp phân bố
đối xứng có mốt thì trung vị trùng với kỳ vọng toán học và mốt.
4) Các mô men:
Mô men gốc bậc
s của đại lượng ngẫu nhiên rời rạc
X
là tổng
dạng
[]

=
=
n
i
i
s
is
pxX
1

α
. (1.8)
Đối với đại lượng ngẫu nhiên liên tục
X
, mô men gốc bậc
s
là tích
phân
[]


∞−
= dxxfxX
s
s
)(
α
. (1.9)
Từ các công thức (1.8) và (1.9) thấy rằng kỳ vọng toán học chính là
mô men gốc bậc một.
Các công thức (1.8) và (1.9) có thể thống nhất thành một công thức
chung cho cả các đại lượng ngẫu nhiên rời rạc lẫn liên tục là
[
]
[
]
s
s
XMX =
α

. (1.10)
Như vậy, mô men gốc bậc
s của đại lượng ngẫu nhiên
X
là kỳ
vọng toán học của mũ bậc
s của đại lượng ngẫu nhiên đó.
5) Đại lượng ngẫu nhiên
o
X
nhận được bằng công thức
x
o
mXX −= (1.11)
gọi là đại lượng ngẫu nhiên quy tâm tương ứng của đại lượng
X
. Dễ
dàng thấy rằng kỳ vọng toán học của đại lượng ngẫu nhiên quy tâm bằng
không.
Các mô men của đại lượng ngẫu nhiên quy tâm được gọi là các mô
men tâm. Mô men tâm bậc
s của đại lượng ngẫu nhiên
X
là kỳ vọng
toán học của luỹ thừa bậc
s của đại lượng ngẫu nhiên quy tâm tương ứng
11 12
[]
()
[

]
s
x
o
s
s
mXMXMX −=






=
μ
. (1.12)
Đối với đại lượng ngẫu nhiên rời rạc:
()

=
−=
n
i
i
s
xis
pmx
1
μ
, (1.13)

còn đối với đại lượng ngẫu nhiên liên tục:
()


∞−
−= dxxfmx
s
xs
)(
μ
. (1.14)
Rõ ràng đối với đại lượng ngẫu nhiên bất kỳ mô men tâm bậc một
bằng không.
Tồn tại những công thức liên hệ giữa các mô men tâm và gốc như
sau:







+−=
−=
=

,23
,
,0
3

233
2
22
1
xx
x
mm
m
ααμ
αμ
μ
(1.15)
6) Mô men tâm bậc hai là đặc trưng đặc biệt quan trọng trong số các
mô men khác, được ký hiệu là
][ D X
(hoặc
x
D ) và thường gọi là
phương sai:






=
o
XMX
2
2

=][D
μ
. (1.16)
Như vậy, phương sai của đại lượng ngẫu nhiên
X
là kỳ vọng toán
học của bình phương đại lượng ngẫu nhiên quy tâm tương ứng.
Các công thức để tính trực tiếp phương sai của các đại lượng ngẫu
nhiên rời rạc và liên tục tuần tự là:
()

=
−=
n
i
ixi
pmxX
1
2
][ D , (1.17)
()


∞−
−= dxxfmxX
x
)(][D
2
. (1.18)
Phương sai của các đại lượng ngẫu nhiên là đặc trưng phân tán, tản

mạn của những giá trị đại lượng ngẫu nhiên xung quanh kỳ vọng toán
học của nó.
7) Phương sai có thứ nguyên bình phương của đại lượng ngẫu nhiên.
Để đặc trưng rõ hơn độ tản mạn người ta dùng một đại lượng có thứ
nguyên trùng với thứ nguyên của đại lượng ngẫu nhiên gọi là độ lệch
bình ph
ương trung bình
[
]
X
σ
(hay ký hiệu bằng
x
σ
):
][][ XDX =
σ
. (1.19)
Phương sai và độ lệch bình phương trung bình có thể tính theo mô
men gốc bậc hai
2
α
và kỳ vọng toán học bằng các công thức:





−==
−=

.
,
2
2
2
2
xxx
xx
mD
mD
ασ
α
(1.20)
8) Mô men tâm bậc ba
3
μ
dùng để đặc trưng tính bất đối xứng của
phân bố. Nếu phân bố đối xứng đối với kỳ vọng toán học thì
3
μ
(và tất
cả các mô men bậc lẻ) bằng không (xét theo cấu trúc của các công thức
(1.13) và (1.14)).
Mô men tâm bậc ba có thứ nguyên lập phương đại lượng ngẫu
nhiên. Người ta dùng đại lượng
13 14
3
3
σ
μ

=
k
S (1.21)
không có thứ nguyên để đặc trưng cho tính bất đối xứng của phân bố gọi
là hệ số bất đối xứng. Khi
0>
k
S ta có phân bố bất đối xứng dương
(đường cong 1), khi
−< 0
k
S bất đối xứng âm (đường cong 2) trên hình
1.2.

Hình 1.2. Các đường cong phân bố bất đối xứng
9) Mô men tâm bậc bốn dùng để đặc trưng “độ dốc”, tức mức độ
đỉnh nhọn hay đỉnh dẹt của phân bố. Người ta dùng đại lượng gọi là độ
nhọn
x
E của đại lượng ngẫu nhiên liên quan với mô men bậc bốn như
sau:
3
4
4
−=
σ
μ
x
E . (1.22)
Đối với luật phân bố chuẩn rất quan trọng và thường gặp trong tự

nhiên thì tỷ số
3
4
4
=
σ
μ
, nên độ nhọn 0
=
x
E . Những phân bố có đỉnh
nhọn hơn so với phân bố chuẩn thì
0>
x
E , những phân bố có đỉnh dẹt
hơn so với phân bố chuẩn sẽ có
0
<
x
E (xem hình 1.3).

x
0
f (x)
E
x
< 0
Ex
= 0
Ex

> 0

Hình 1.3. Các đường cong phân bố có độ nhọn khác nhau
10) Nhiều khi người ta sử dụng những mô men tuyệt đối (gốc và
tâm) mà trong số đó thường dùng nhất là mô men tâm tuyệt đối bậc một:
[]
M M
1 x
o
mXX −=






=
γ
. (1.23)
gọi là độ lệch trung bình số học, cũng đặc trưng cho độ tản mạn.
1.2. Quy luật phân bố chuẩn
Trong lý thuyết xác suất người ta đặc biệt quan tâm tới một kiểu luật
phân bố gọi là luật phân bố chuẩn (hay phân bố Gauss). Đây là kiểu phân
bố thường gặp nhất trong thực tế. Người ta đã chứng minh được rằng
tổng của một s
ố lượng đủ lớn các đại lượng ngẫu nhiên độc lập (hoặc phụ
thuộc ít) tuân theo những quy luật phân bố bất kỳ nào đó sẽ xấp xỉ tuân
theo quy luật chuẩn và điều này được thể hiện càng chính xác nếu lấy
tổng của càng nhiều các đại lượng ngẫu nhiên. Điều hạn chế chủ yếu là
các đại lượng ngẫu nhiên được cộng lại phả

i có vai trò đều nhau và tương
15 16
đối nhỏ trong tổng chung.
Quy luật phân bố chuẩn được đặc trưng bởi mật độ xác suất dạng:
()
2
2
2
2
1
)(
σ
πσ
mx
exf


= , (1.24)
trong đó

m kỳ vọng toán học của đại lượng ngẫu nhiên

σ
,X
độ
lệch bình phương trung bình của nó.

Hình 1.4. Đồ thị hàm mật độ phân bố chuẩn
Đường cong phân bố theo luật chuẩn có dạng hình đồi đối xứng
(hình 1.4). Tung độ cực đại của đường cong bằng

πσ
2
1
ứng với
hoành độ
m
x
=
. Xa dần m mật độ phân bố giảm đi và khi

±

x

đường cong tiệm cận dần tới trục hoành. Điểm
m
là tâm đối xứng của
phân bố, gọi là tâm tản mạn; tham số
σ
là đặc trưng tản mạn. Khi
σ

tăng thì tung độ cực đại giảm và đường cong phân bố trở nên phẳng hơn,
duỗi dài theo trục hoành, ngược lại, khi
σ
giảm đường cong phân bố nhô
cao lên trên, đồng thời co hẹp hai bên lại.
Tính toán các đặc trưng bằng số của phân bố chuẩn cho các kết quả
sau:
0 ;1

10
=
=
μ
μ
(và tất cả các mô men bậc lẻ bằng không);
;15 ;3 ;
6
6
4
4
2
2
σμσμσμ
=== nói chung các mô men bậc
s
tính
theo công thức truy hồi
2
2
)1(

−=
ss
s
μσμ
; 0 ;0
=
=
xk

ES .
Để tính được xác suất mà đại lượng ngẫu nhiên
X
tuân theo quy
luật chuẩn với các tham số
m và
σ
rơi vào khoảng giá trị từ
α
tới
β

phải dùng công thức tổng quát
)()()(
α
β
β
α
FFXP

=
<
<
, (1.25)
trong đó

)(xF hàm phân bố của đại lượng ngẫu nhiên
X
tính theo
công thức (1.4):

∫∫
∞−∞−


==
xx
mx
dxedxxfxF
2
2
2
)(
2
1
)()(
σ
πσ
.
Nếu thay biến
t
mx
=

σ
có thể dẫn tích phân trên tới dạng


∞−

=

σ
π
mx
dtexF
t
2
2
2
1
)(
. (1.26)
Tích phân (1.26) không biểu thị được bằng các hàm cơ bản, nhưng
có thể tính nó qua hàm đặc biệt biểu thị tích phân xác định của biểu thức
2
t
e

hay
2
2
t
e

(tích phân xác suất) đã lập thành bảng.
Thí dụ, nếu ta dùng hàm

∞−


=

x
dtex
t
2
2
2
1
)(
π
φ
, (1.27)
thì ta tính







=

σ
φ
mx
xF )(
. (1.28)
Do đó
17 18
















=<<
∗∗
σ
α
σ
β
βα
φφ
mm
XP )(
. (1.29)
Như vậy, chúng ta đã biểu thị xác suất của đại lượng ngẫu nhiên
X

phân bố theo luật chuẩn với các tham số bất kỳ rơi vào khoảng giá trị cho
trước từ
α

đến
β
qua hàm phân bố tiêu chuẩn )(* x
φ
ứng với luật
phân bố chuẩn đơn giản nhất có các tham số tuần tự là
0
=
m và 1
=
σ
.
Hàm
)(* x
φ
đã được bảng hóa và các giá trị của nó có ở các sách giáo
khoa về lý thuyết xác suất và toán thống kê bất kỳ, ở các tài liệu chuyên
khảo và các cẩm nang toán học. Bảng 1.1 là một dạng thuộc loại các bảng
đó.
Độ lệch xác suất. Trong nhiều ứng dụng lý thuyết xác suất người ta
thường dùng một đặc trưng tản mạn gọi là độ lệch xác suất, ký hiệu bằng
E
.
Độ lệch xác suất của đại lượng ngẫu nhiên
X
phân bố theo luật
chuẩn là nửa độ dài của một đoạn đối xứng qua tâm tản mạn mà xác suất
rơi vào đó bằng 0,5 (xem hình 1.5).
Có thể viết
()

5,0 =<− EmXP
hay
5,0)(
=
+
<<− EmXEmP .
Dùng công thức (1.29) ta có:






−−






=+<<−
∗∗
σσ
φφ
EE
EmXEmP )(
.
Theo tính chất của hàm
*
φ


)(1)( xx −−=
∗∗
φ
φ
,
ta suy ra
5,012 =−







σ
φ
E
,
do đó
75,0=







σ
φ

E
.

x
0
m
m

E
m+E
f
(
x
)

Hình 1.5. Biểu diễn độ lệch xác suất
Theo bảng giá trị của hàm

φ
ta tìm ngược lại được
σ
σ
674,0 674,0 =→= E
E
. (1.30)
Ý nghĩa của
E
là với số lượng lớn thí nghiệm về trung bình sẽ có
một nửa số giá trị của đại lượng ngẫu nhiên
X

lệch khỏi m vượt quá
E

và một nửa - nhỏ hơn
E
. Vì vậy
E
còn được gọi là độ lệch trung tâm.

19 20
Bảng 1.1. Bảng các giá trị của tích phân xác suất

∞−

=

x
dtx
t
e
2
2

2
1
)(
π
φ

x


*
φ

x

*
φ

x

*
φ

x

*
φ

0,0 0,500000
-3,9 0,000048 -1,9 0,028717 0,1 0,539828 2,1 0,982136
-3.8 0,000072 -1,8 0,035930 0,2 0,579260 2,2 0,986097
-3,7 0,000108 -1,7 0,044565 0,3 0,617911 2,3 0,989276
-3,6 0,000159 -1,6 0,054799 0,4 0,655422 2,4 0,991802
-3,5 0,000233 -1,5 0,066807 0,5 0,691462 2,5 0,993790
-3,4 0,000337 -1,4 0,080757 0,6 0,725747 2,6 0,995339
-3,3 0,000483 -1,3 0,096801 0,7 0,758036 2,7 0,996533
-3,2 0,000687 -1,2 0,115070 0,8 0,788145 2,8 0,997445
-3,1 0,000968 -1,1 0,135666 0,9 0,815940 2,9 0,998134
-3,0 0,001350 -1,0 0,158655 1,0 0,841345 3,0 0,998650

-2,9 0,001866 -0,9 0,184060 1,1 0,864334 3,1 0,999032
-2,8 0,002555 -0,8 0,211855 1,2 0,884930 3,2 0,999313
-2,7 0,003467 -0,7 0,241964 1,3 0,903199 3,3 0,999517
-2,6 0,004661 -0,6 0,274253 1,4 0,919243 3,4 0,999663
-2,5 0,006210 -0,5 0,308538 1,5 0,933193 3,5 0,999767
-2,4 0,008198 -0,4 0,344578 1,6 0,945201 3,6 0,999841
-2,3 0,010724 -0,3 0,382089 1,7 0,955435 3,7 0,999892
-2,2 0,013903 -0,2 0,420740 1,8 0,964070 3,8 0,999928
-2,1 0,017864 -0,1 0,460172 1,9 0,971283 3,9 0,999952
-2,0 0,022750 2,0 0,977250




Phụ lục chương 1
A. Những định lý về các đặc trưng số
1. Kỳ vọng toán học của hằng số bằng chính hằng số:
cc
=
][M .
2. Phương sai của đại lượng không ngẫu nhiên:
0][D
=
c
.
3. Đưa đại lượng không ngẫu nhiên ra ngoài dấu KVTH:
][M][M XccX
=
.
4. Đưa đại lượng không ngẫu nhiên ra ngoài dấu phương sai:

][D][D
2
XccX = ,
][][ XccX
σσ
= .
5. KVTH của tổng các ĐLNN:
][M][M][M YXYX
+
=
+

(đúng đối với tổng của nhiều số hạng).
6. KVTH của hàm tuyến tính của một số đối số ngẫu nhiên:
n
XXX ,,,
21
:
[]
[] []
.MM
MMM
11
n
1i
n
1i
bXabXa
bXabXa
i

n
i
iii
n
i
iiii
+=+
=+






=






+
∑∑
∑∑
==
==

7. Phương sai của tổng các ĐLNN:
xy
KYXYX 2][D][D][D

+
+
=
+
,
21 22
∑∑∑
===
=






n
j
ij
n
i
i
KX
11
n
1i
D .
Nếu các ĐLNN không tương quan lẫn nhau:
[]
∑∑
==

=






n
i
ii
XX
1
n
1i
DD .
8. Phương sai của hàm tuyến tính của một số ĐLNN:
[]
iiii
XabXa DD
n
1i
2
n
1i
∑∑
==
=







+ .
9. KVTH của tích các ĐLNN:
xy
KYXXY
+
×= ][M][M][M ,
Nếu
X

Y
không tương quan:
][M][M][M YXXY
×
=
,
∏∏
==
=






n
i
i

n
i
i
XX
11
][MM .
10. Phương sai của tích các ĐLNN:
][D][D][D][D][D
22
XmYmYXXY
yx
++= ,
][D][D][D YXYX
&&&&
= .
B. Kỳ vọng toán học và phương sai của một số đại lượng ngẫu nhiên
Định lý 1: Nếu

n
XXX ,,,
21
những đại lượng ngẫu nhiên
phân bố như nhau, KVTH của từng ĐLNN trong số chúng bằng
a
, thì
KVTH của tổng các ĐLNN đó bằng
na
, còn KVTH của trung bình số
học bằng
a

:
naXXXXXX
nn
=
+
+
+
=
+
+
+
][M ][M][M] [M
2121
.
ana
n
XXX
nn
XXX
n
n
==+++=






+++
1

] [M
1

M
21
21
.
Định lý 2: Nếu

n
XXX ,,,
21
những ĐLNN phân bố như nhau,
phương sai của từng ĐLNN bằng
2
σ
, thì phương sai của tổng bằng
2
σ
n , còn phương sai của trung bình số học bằng n/
2
σ
:
2
2121
][D ][D][D] [D
σ
nXXXXXX
nn
=+++=+++ ,

nn
n
XXX
n
n
XXX
n
n
/
1
] [D
1

D
22
2
21
2
21
σσ
==+++=






+++
.
Định lý 3: KVTH của ĐLNN phân bố theo quy luật nhị thức, tức

của số lần xuất hiện sự kiện
A
trong n thí nghiệm độc lập, mà trong
từng thí nghiệm sự kiện ấy có thể xuất hiện với xác suất không đổi
p
,
bằng
np , còn phương sai bằng npq , với pq

=
1 .
Chứng minh: Xem ĐLNN trên là tổng của của các ĐLNN
1
X ,
2
X ,
,
n
X biểu thị số lần xuất hiện sự kiện
A
tuần tự trong thí nghiệm thứ
nhất, thứ hai, , thứ
n . Vậy chúng chỉ có thể có hai giá trị: bằng 0 nếu
sự kiện
A không xảy ra trong lần thí nghiệm i ( ni ,,2,1
=
), bằng 1
nếu
A xảy ra. Vậy
1

X ,
2
X , ,
n
X phân bố như nhau và độc lập,
quyluật phân bố của từng ĐLNN trong chúng có dạng sau:
giá trị 0 1
xác suất
q
p

Ta tìm KVTH của từng
i
X theo công thức tính KVTH (công thức
(1.5)):
ppqXXX
n
=

+

=
=
=
=
10][M ][M][M
21
.
23 24
pqqppqpqqp

ppqpXXX
n
=+=+=
⋅−+⋅−====
)(
)1()0(][D ][D][D
22
22
21

(theo công thức (1.17)).
Do đó:
npXXXX
n
=
+
+
+= ] [M][M
21
.
npqXXXDX
n
=
+
++
=
] [][D
21
.
Định lý 4: KVTH của tần suất của sự kiện

A trong n thí nghiệm
độc lập, mà trong từng thí nghiệm sự kiện
A có thể xảy ra với xác suất
không đổi
p
, bằng chính xác suất
p
, còn phương sai bằng npq / .
Chứng minh: Tần suất của sự kiện
A
trong n thí nghiệm có thể
được xem như trung bình số học của các ĐLNN
1
X ,
2
X , ,
n
X phân bố
như nhau, độc lập:
n
XXX
p
n
+
++
=

21
*
,

[]
[]
[] [] []
()
.
1
M MM
1
M
1

MM
21
21
21
*
pnp
n
XXX
n
XXX
n
n
XXX
p
n
n
n
==+++=
+++=







+++
=

[]
[]
n
pq
npq
n
XXX
n
n
XXX
p
n
n
==+++=






+++

=
2
21
2
21
*
1
D
1

DD

hay
npq /=
σ
.

C. Mã Fortran của chương trình con tính giá trị hàm mật độ xác suất
của phân bố chuẩn theo công thức (1.24)

C
m và
s
là kỳ vọng toán học và độ lệch chuẩn
FUNCTION Gauss(m,s,x)
PARAMETER (pi=3.141593)
REAL x, m, s
x = (x-m)/s
x = -0.5*x*x
Gauss = 1.0/(s*sqrt(2*pi))*exp(x)

RETURN
END

D. Mã Fortran của chương trình con tra giá trị hàm tích phân xác
suất theo đối số
xx
mx
σ
/)(

theo bảng 1.1 (công thức (1.28))
C Từ
x
, m ,
σ
(s) tra xác suất phân bố )/)(()(
*
σφ
mxxF −= , −
*
φ
tích phân
C xác suất (bảng 1.1), được lưu trong file BANG1_1.TKE với quy cách ghi như
C sau: một dòng tiêu đề trên cùng, nối tiếp sau từng cặp đối số và hàm
*
φ
, giá
C trị nhỏ nhất của đối số: -3,99, lớn nhất: 3,99.

FUNCTION TraB1_1 (x, m, s)

REAL x, m, s, z, v, z1, z2, v1, v2
z = (x-m)/s
IF (z.LT 3.99) THEN
v=0.000003
ELSE IF (z.GT.3.99) THEN
v=0.999967
ELSE
25 26
OPEN (1, FILE = ‘bang1_1.tke’)
READ (1, *)
READ (1, *) z1, v1
2 READ (1, *) z2, v2
IF (z.GE.z1.AND.z.LE.z2) THEN
v = v1+(v2-v1)/(z2-z1)*(z-z1)
CLOSE (1)
GOTO 1
ELSE
z1 = z2
v1 = v2
GOTO 2
ENDIF
ENDIF
1 TraB1_1 = v
RETURN
END
















Chương 2
NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT
XỬ LÝ SỐ LIỆU QUAN TRẮC
Giả sử cần nghiên cứu đại lượng ngẫu nhiên
X
nào đó mà luật
phân bố của nó chưa biết trước đích xác, phải xác định quy luật đó từ thí
nghiệm hay kiểm tra bằng thực nghiệm giả thuyết về một quy luật nào
đó. Khi đó, người ta làm một loạt thí nghiệm với đại lượng ngẫu nhiên
X
và trong mỗi thí nghiệm (quan trắc), đại lượng
X
nhận một giá trị
nhất định. Tập hợp các số liệu quan trắc của đại lượng được gọi là tập
hợp thống kê đơn giản hay chuỗi thống kê đơn giản. Thông thường, tập
hợp thống kê đơn giản được trình bày dưới dạng bảng.
2.1. Hàm phân bố thống kê
Hàm phân bố thống kê của đại lượng ngẫu nhiên
X
là tần suất của

sự kiện
xX
<
trong chuỗi thống kê đó
(
)
(
)
xXPxF <=
∗∗
. (2.1)
Để tìm giá trị của hàm phân bố thống kê ứng với
x
cho trước chỉ
cần đếm số quan trắc mà trong đó đại lượng
X
nhận giá trị nhỏ hơn
x

và chia cho tổng số quan trắc đã thực hiện n .
Hàm phân bố thống kê của đại lượng ngẫu nhiên bất kỳ - rời rạc hay
liên tục - sẽ là một hàm bậc thang gián đoạn (hình 2.1). Khi tăng số quan

×