Tải bản đầy đủ (.docx) (33 trang)

ĐỀ CƯƠNG ôn tập môn KHÍ hậu THỐNG kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.37 MB, 33 trang )

ĐỀ CƯƠNG ÔN TẬP MÔN KHÍ HẬU THỐNG KÊ
Câu 1 & 2) Không gian sự kiện và xác suất sự kiện??? Các qui tắc tính xác
suất???
TL:
- Không gian sự kiện là tập hợp tất cả những sự kiện cơ sở có thể có. Không gian
mẫu biểu diễn mọi kết cục hay sự kiện có thể có. Nó tương đương với sự kiện
phức hợp lớn nhất.
- Ví dụ về không gian sự kiện:

1) Không có giáng thuỷ; 2) Giáng thuỷ lỏng; 3) Giáng thuỷ rắn; 4) Giáng thuỷ hỗn
hợp
- Xác suất của sự kiện là đại lượng đo độ chắc chắn của sự kiện. Xác suất của sự
kiện A nào đó nằm trong khoảng từ 0 đến 1: 0 ≤ P(A) ≤ 1.
- Tần suất của sự kiện là ước lượng của xác suất sự kiện: P(A) ≈p = m/n
Trong đó: A là sự kiện hiện tượng khí tượng xuất hiện, n là số lần quan sát hiện
tượng, m là số lần xuất hiện hiện tượng trong n lần quan sát. Trị số của tần suất
nói chung phụ thuộc vào số lượng phép thử được tiến hành n. Khi n bé, tần suất
thay đổi rõ rệt nếu ta chuyển từ loạt n phép thử này sang loạt n phép thử khác.
Tuy nhiên thực nghiệm chứng tỏ rằng đối với phạm vi khá rộng, tần suất có tính
ổn định, nghĩa là khi số phép thử n khá lớn thì trị số của tần suất biến thiên rất ít
xung quanh một hằng số xác định nào đó. Khái niệm tần suất là một khái niệm
mang tính trực giác, kinh nghiệm nhưng có cơ sở lý thuyết vững chắc. Nó được
ứng dụng rất có hiệu quả để ước lượng xác suất khí hậu.
 Một số phép tính và quan hệ về sự kiện và xác suất sự kiện:
- Sự kiện xung khắc: Hai sự kiện A và B được gọi là xung khắc với nhau nếu A
xuất hiện thì B không xuất hiện và ngược lại. Các sự kiện A1, A2,..., An được gọi
là lập thành nhóm đầy đủ các sự kiện nếu chúng xung khắc với nhau từng đôi
một và nhất thiết một trong chúng phải xuất hiện.
- Sự kiện đối lập: Sự kiện B được gọi là sự kiện đối lập với sự kiện A nếu chúng
không đồng thời xuất hiện và chúng lập thành nhóm đầy đủ các sự kiện. Ví dụ,
1




các sự kiện “có giáng thuỷ” và “không có giáng thuỷ” là hai sự kiện đối lập.
Trong trường hợp này ta có hệ thức:
P(A) + P(B)= 1 hay P(B) = 1- P(A)
- Xác suất của tổng hai sự kiện : Sự kiện B được gọi là tổng của hai sự kiện A1 và
A2 nếu B xuất hiện kéo theo A1 hoặc A2 hoặc đồng thời cả A1 và A2 xuất hiện.
Xác suất của sự kiện B trong trường hợp này bằng xác suất của tổng các sự kiện
A1 và A2:
P(B) = P(A1+A2) = P(A1) + P(A2) - P(A1.A2)
Trong đó: P(A1.A2) là xác suất để A1 và A2 đồng thời xuất hiện. Nếu A1, A2
xung khắc thì
P(A1.A2) = 0
Mở rộng :
P(A1+A2+A3) = P(A1) + P(A2)+P(A3) - P(A1.A2) - P(A2.A3) - P(A3.A1) +
P(A1.A2.A3)
- Xác suất điều kiện: Nếu A là sự kiện đang xét, B là điều kiện cho trước thì xác
suất có điều kiện của A là xác suất của sự kiện A khi cho trước điều kiện B đã
hoặc sẽ xuất hiện.

Ví dụ: Tính xác suất của sự kiện xuất hiện mưa đá khi biết rằng có giáng thuỷ
xảy ra; hoặc tính xác suất các cấp tốc độ gió ở một số vị trí nào đó ven bờ biển
khi biết rằng bão đang đi đến gần và sẽ đổ bộ vào đất liền.
- Các sự kiện độc lập: hai sự kiện được gọi là độc lập với nhau nếu sự xuất hiện
hoặc không xuất hiện của sự kiện này không làm ảnh hưởng đến xác suất xuất
hiện của sự kiện kia và ngược lại. Sự độc lập giữa các sự kiện A và B cũng có
nghĩa là:
P(A/B) = P(A) và P(B/A) = P(B) . Từ tính chất độc lập của các sự kiện A và B
suy ra:
P(A.B) = P(A).P(B)

- Qui tắc cộng xác suất
Xét nhóm đầy đủ các sự kiện xung khắc Ai, i=1..L trên không gian mẫu được
quan tâm và B cũng là một sự kiện được xác định trên không gian mẫu này. Khi
đó xác suất của sự kiện B có thể được tính bởi công thức:
2


- Qui tắc nhân xác suất :  Đây chính là công thức xác suất toàn phần. Lưu ý :
CT chỉ đúng khi các sự kiện Ai tạo thành nhóm đầy đủ các sự kiện xung khắc của
không gian mẫu.
- Định lý Bayes là sự kết hợp lý thú của qui tắc cộng và nhân xác suất. Trong tính
toán thông thường, định lý Bayes được dùng để tính ngược xác suất có điều kiện.

- CT Becnulli: Gọi B là sự kiện “trong n lần trắc nghiệm sự kiện A xuất hiện k lần”.
Sự kiện B có thể được thực hiện theo nhiều cách khác nhau: Sự kiện A xuất hiện
trong tổ hợp k phép thử bất kỳ của n phép thử. Như vậy có tất cả cách. Ta có:
Xác suất xuất hiện sự kiện A là P(A) = p.
Xác suất xuất hiện sự kiện là P() = 1− p = q.
 Xác suất hiện sự kiện B sẽ là:  Công thức Bernoulli
Trong khí hậu công thức này thường được ứng dụng để tính xác suất các sự kiện
thông thường(sự kiện có xác suất xuất hiện và không xuất hiện gần tương đương
nhau). Lưu ý: công thức Bernoulli chỉ được áp dụng khi xác suất xuất hiện sự
kiện không đổi và không phụ thuộc vào số thứ tự lần trắc nghiệm.
Nhược điểm : Công thức Bernoulli trên đây chỉ cho kết quả chính xác khi số
lượng phép thử n bé và p càng gần 0.5; khi p quá bé hoặc quá lớn thì sai số mắc
phải sẽ khá lớn, hơn nữa khi n rất lớn việc tính toán càng trở nên phức tạp.
- CT Poisson: Xác suất “trong n lần trắc nghiệm sự kiện A xuất hiện k lần” là
Trong đó: n là số lần quan sát, k là số lần xuất hiện hiện tượng, p là xác suất hiện
hiện tượng, λ là trung bình số lần xuất hiện hiện tượng (λ=np). Điều kiện ràng
buộc là các lần trắc nghiệm đều phải thoả mãn tiêu chuẩn Bernoulli và xác suất

xuất hiện hiện tượng phải khá nhỏ
(p << 1). Trong khí hậu, công thức này thường được ứng dụng để tính xác suất
hiện sự kiện hiếm (Sự kiện hiếm là sự kiện có xác suất xuất hiện rất nhỏ so với
đơn vị).
3


Câu 4) Các đặc trưng số của biến ngẫu nhiên???
TL:
- Đại lượng ngẫu nhiên hay biến ngẫu nhiên là đại lượng mà trong kết quả của
phép thử hay một lần thí nghiệm, nó nhận một và chỉ một giá trị từ tập những giá
trị có thể, giá trị này hoàn toàn không thể đoán trước được. VD: Kết quả của một
lần quan trắc lượng mây có thể nhận một trong các tình huống “trời quang”, “ít
mây”, “mây rải rác” hoặc “nhiều mây”. Chia bầu trời làm 10 phần. Kết quả mỗi
lần quan trắc giá trị của lượng mây chỉ có thể nhận một trong các trị số 0,1,...,10
(phần mười bầu trời) và ta chỉ có thể biết được giá trị này sau khi tiến hành quan
trắc.
- Các đặc trưng số:
 Kì vọng: Kì vọng toán hay giá trị trung bình của biến ngẫu nhiên X là một
số thực, kí hiệu E(X) hoặc ( được xác định bởi:

Ý nghĩa: kì vọng toán phản ánh giá trị trung tâm của phân phối xác
suất của biến ngẫu nhiên.
 Phương sai , độ lệch chuẩn: Phương sai của biến ngẫu nhiên X là một số

thực không âm, kí hiệu D(X) được xác định bởi CT:
DX = E(X - E(X))2 hay D(X) = E(X2) – (E(X))2
Phương sai của một BNN được dùng để đặc trưng cho mức độ phân tán
các giá trị của BNN đó xung quanh giá trị trung bình của nó. Đại lượng
được gọi là độ lệch chuẩn của BNN X.

 Các mômen phân bố:
• Mômen gốc bậc r: =
4


=  Kì vọng toán học: là giá trị trung bình của chuỗi lịch sử khi chuỗi này dài
vô cùng và càng nhiều theo thời gian, là giá trị không thể biết trước được.
=  Tổng độ lớn của biến ngẫu nhiên.
 Ý nghĩa của kì vọng: Khi có giá trị kì vọng thì các giá trị đối xứng
nhau qua trục đường kì vọng (
• Mômen trung tâm bậc r:

 Mod và Med
- Mod của BNN X ( xmod ) là giá trị của BNN mà tại đó phân phối đạt giá
trị lớn nhất. Như vậy, nếu X là BNN rời rạc thì Mod là giá trị mà tại đó
xác suất tương ứng lớn nhất. Còn nếu X là BNN liên tục thì Mod là giá
trị làm cho hàm mật độ f(x) đạt cực đại.
- Med ( trung vị) của BNN X, kí hiệu xmed là giá trị của BNN mà tại đó giá
trị của hàm phân phối bằng 1/2 , nghĩa là F(x med) = ½. Như vậy, Med là
điểm phân đôi khối lượng xác suất thành 2 thành phần bằng nhau.
( Lấy thêm phần Mod, Med này ở câu 7)
Câu 13) Các đặc trưng biểu thị độ tập trung???
TL: - Độ tập trung đặc trưng cho xu thế dồn vào tâm của các thành phần trong
chuỗi, phản ánh độ lớn chung của các giá trị số liệu.
- Tính chất tập trung của các thành phần trong chuỗi số liệu thường được
đánh giá thông qua đặc trưng trung bình số học. Nhưng nói chung trung
bình số học có độ ổn định kém, nhất là trong những trường hợp số liệu
biến động mạnh và có thể có những trị số đột xuất hoặc sai số thô. Do đó,
mặc dù có độ chính xác kém hơn, trong nhiều trường hợp người ta dùng
trung vị thay cho trung bình số học. Ngoài ra, đôi khi người ta còn xem

xét thêm cả mốt.
5


- Đặc trưng phức tạp hơn chút ít của độ tập trung là trimean. Trimean được
định nghĩa là trung bình có trọng số của trung vị và các phân vị dưới và
trên, trong đó trung vị nhận hai lần trọng số lớn hơn trọng số của mỗi
phân vị kia:
Trimean =
Trimean thường được xem là đại lượng chứa đựng thông tin về độ lớn của
tập số liệu.
- Trung bình hiệu chỉnh:

trong đó k, là số nguyên làm tròn của tích α.n, là số thành phần bị cắt bỏ,
tính từ hai đầu mút, của chuỗi trình tự; α là số phần trăm thành phần sẽ bị
cắt bỏ ở mỗi đầu mút và được gọi là bậc hiệu chỉnh.
- So với trung bình số học, mức độ nhạy cảm đối với các giá trị biên (các
giá trị ở hai đầu mút của chuỗi trình tự) của trung bình hiệu chỉnh giảm đi
do việc khử bỏ một phần những trị số nhỏ nhất và lớn nhất. Khi α =0 thì
trung bình hiệu chỉnh chính là trung bình số học.
Câu 14) Các đặc trưng biểu thị độ phân tán???
TL: Độ phân tán biểu thị mức độ biến động hoặc sự tản mạn của số liệu xung
quanh giá trị tâm.

6


Câu 5) Một số luật phân bố thường dùng trong khí hậu???
TL:
 Phân bố của các biến ngẫu nhiên rời rạc:

a) Phân bố nhị thức:
- Bài toán: Tiến hành n phép thử độc lập, cùng loại và trong cùng những
điều kiện như nhau. Mỗi một phép thử chỉ có 2 kết cục là A và . Xác suất
xuất hiện sự kiện A ở mỗi phép thử không đổi, bằng p và không phụ
thuộc vào chỉ số phép thử. Tính xác suất để trong n lần thử sự kiện A
xuất hiện k lần.
- Bước làm:
o Lập biến ngẫu nhiên
o Biến X sẽ có phân bố dạng:
Khi

đó



thể

biểu

diễn

phân

bố

của

X

bởi:


 Đây được gọi là phân bố nhị thức, nó phụ thuộc vào 2 tham sốlà n và
p.
b) Phân bố Poisson:
- Để mô tả số sự kiện xuất hiện trong một chuỗi liên tiếp các sự kiện rời
rạc cùng loại độc lập nhau, thông thường là chuỗi các sự kiện thời gian
( VD: sự xuất hiện các cơn bão trên một vùng biển nào đótrong mùa bão;
sự xảy ra những năm hạn hán hay rét đậm…)
7


- Dùng để mô tả sự xuất hiện các hiện tượng hiếm.
- Điều kiện chuỗi các sự kiện theo thời gian áp dụng phân bố Poisson:
o Xác suất xuất hiện sự kiện vào khoảng thời gian đang xét phụ
thuộc vào số các sự kiện và độ dài khoảng thời gian nhưng không
phụ thuộc vào thời điểm đầu của khoảng
o Xác suất của số lần xuất hiện sự kiện trong khoảng thời gian đang
xét không phụ thuộc vào sự xuất hiện sự kiện trước thời điểm ban
đầu
o Xác suất xuất hiện hai hay nhiều sự kiện vào một khoảng thời gian
vô cùng bé nhỏ hơn rất nhiều so với xác suất xuất hiện một sự kiện
trong khoảng đó.
- Phân bố Poisson của X được xác định bởi :
(k=0,1,2….)
 Phân bố của các biến ngẫu nhiên liên tục
a) Phân bố chuẩn và phân bố chuẩn chuẩn hóa
- Phân bố chuẩn ( :
o Biến ngẫu nhiên X được gọi là có phân bố chuẩn nếu hàm mật độ
phân bố xác suất có dạng :


Lưu ý: Kỳ vọng càng lớn đồ thị càng dịch sang phải ; Độ lệch chuẩn
càng lớn đồ thị càng giãn (sự phân tán càng lớn).
o Một số đặc trưng số:

8


o Liên hệ giữa hàm phân bố và hàm Laplace :

- Phân bố chuẩn chuẩn hóa:
o Cho , thực hiện phép biến đổi:

o Đồ thị là một đường cong có trục đối xứng là trục tung.
- Phân bố Gamma:
9


Ứng dụng: Thường dùng để xấp xỉ phân bố lượng mưa
- Phân bố Weibull :

- Phân bố Beta:
10


Ứng dụng: thường được áp dụng đối với những yếu tố mà miền biến
thiên bị chặn cả hai phía và thường là bị giới hạn trong đoạn [0; 1] . VD:
Lượng mây được đo bằng phần mười bầu trời; Độẩm tương đối…
- Phân bố chuẩn loga:

Thường được áp dụng đối với những đại lượng bị chặn dưới (>0). VD:

Giáng thủy,…
Kết luận :
o Nói chung các phân bố trên đây thường được dùng làm phân bố lý
thuyết để xấp xỉ hàm phân bố thực nghiệm
o Đối với các yếu tốkhí tượng, khí hậu chúng thường được ứng dụng
trong các trường hợp sau:
 Phân bố nhị thức: Những hiện tượng thông thường (khả
năng xuất hiện và không xuất hiện gần tương đương nhau)
 Phân bố Poisson: Những hiện tượng hiếm (xác suất xuất
hiện nhỏ)
 Phân bố chuẩn: Thường áp dụng cho những biến có phân bố
không quá bất đối xứng (như nhiệt độ).
 Phân bố Gamma: Các yếu tố bị chặn dưới, phân bố lệch
phải. Thông thường được áp dụng cho lượng mưa
 Phân bố Weibull: Tốc độ gió, nhất là gió bề mặt
11


 Phân bố Beta: Các biến bị chặn cả hai phía, như lượng mây,
độ ẩm tương đối
 Phân bố chuẩn lôga: Đối với các biến có phân bố lệch phải,
miền giá trị dương
 Các phân bố chuẩn nhiều chiều: Ứng dụng trong phân tích
phân biệt.
 Các phân bố mẫu:
a) Phân bố chuẩn chuẩn hóa: (đã trình bày )
b) Phân bố χ2 (Khi bình phương)

o Phân bố χ2 phụ thuộc vào chỉ một tham số n là số bậc tự do của phân bố.
o Khi n ≤ 2 hàm mật độ fn(x) luôn luôn giảm với mọi x>0

o Khi n>2 hàm fn(x) có cực đại duy nhất tại x= n – 2
- :

12


Đồ thị hàm mật độ : f(x)=f(-x) nên đây là một hàm chẵn, đối xứng nhau
qua trục tung. Phụ thuộc vào tham số n (số bậc tự do).
- Phân bố fisher:

Câu 6 & 7 ) Quan trắc khí tượng và quan trắc khí hậu??? Tổng thể, mẫu,
chuỗi???
TL:
Quan trắc khí tượng ⎯→ Số liệu khí tượng ⎯→ Chuỗi số liệu khí hậu
- Quan trắc khí tượng được tiến hành để theo dõi sự xuất hiện của các hiện
tượng vật lý xảy ra trong khí quyển, đo đạc một số tính chất vật lý của
khí quyển cấu thành thời tiết.
- Khi nghiên cứu một hiện tượng nào đó người ta thường tiến hành khảo
sát nhiều lần trong cùng những điều kiện như nhau nhằm mục đích giảm
bớt sự tác động của các mối liên hệ thứ yếu, làm nổi bật những mối liên
hệ cơ bản để xác định qui luật của hiện tượng. Chính vì vậy việc quan
13


trắc khí tượng nói chung được tiến hành tại những địa điểm được chọn
sẵn (là vị trí trạm khí tượng), vào những thời điểm qui định (là kỳ quan
trắc) và theo một thể thức bắt buộc (qui trình, qui phạm quan trắc). Các
yếu tố được quan trắc phải mô tả đầy đủ trạng thái thời tiết. Vị trí các
trạm quan trắc được lựa chọn sao cho có thể bao quát được một vùng
không gian nhất định. Các kỳ quan trắc phải được ấn định vào những thời

điểm điển hình, đủ để mô tả được biến trình thời gian của yếu tố. Việc
tuân thủ qui trình, qui phạm quan trắc bảo đảm tính nhất quán trong số
liệu thu nhập được.
- Kết quả của quan trắc khí tượng cho ta tập số liệu đo đạc thực nghiệm
các hiện tượng khí tượng, các tính chất vật lý của khí quyển mô tả điều
kiện thời tiết. Từ tập số liệu này, bằng các phương pháp chọn mẫu khác
nhau người ta mới thành lập các chuỗi số liệu khí hậu.
- Chuỗi số liệu khí hậu là một bộ phận của tổng thể khí hậu. Nó là bộ phận
duy nhất mà ta có thể có để từ đó tiến hành thống kê tính toán và nhận
định phán đoán. Tổng thể khí hậu là tập hợp mọi thành phần có thể của
đặc trưng yếu tố khí hậu. Tổng thể khí hậu bao gồm 3 nhóm: 1) Nhóm
các trị số đã xảy ra nhưng không được quan trắc; 2) Nhóm các trị số đã
xảy ra và đã được quan trắc; 3) Nhóm các trị số chưa xảy ra. Số thành
phần của tổng thể là vô hạn. Tổng thể luôn luôn bao quát đầy đủ mọi sắc
thái hình thù của đặc trưng yếu tố khí hậu.
- Trên cơ sở các chuỗi số liệu khí hậu ta có thể tiến hành xử lý, tính toán
các đặc trưng tham số khí hậu, phân tích, phán đoán và mô tả đặc điểm,
tính chất, cấu trúc bên trong, tiến đến dự báo khí hậu. Chất lượng tính
toán phụ thuộc vào khả năng của chuỗi (dung lượng mẫu - độ dài chuỗi).
Thông thường các thành phần của chuỗi cách nhau một năm, nên số
lượng các năm quan trắc càng nhiều thì dung lượng mẫu càng lớn, kết
quả tính toán sẽ càng đảm bảo độ ổn định thống kê và do đó những phân
tích, phán đoán càng chính xác.
Như vậy, dung lượng mẫu  chuỗi số liệu khí hậu  Tổng thể khí hậu.
Câu 8) Các đặc trưng thường dùng trong khí hậu???
TL:
a) Các phân vị và mốt:
 Các phân vị
14



- Phân vị mẫu qp là số có cùng đơn vị đo với số liệu và có giá trị vượt quá
những trị số khác của tập số liệu với xác suất bằng p. Có thể hiều phân vị
qp như là giá trị mà tại đó tần suất tích luỹ bằng p: qp= x(F(x)=p).
- Các phân vị mẫu thường được dùng để khảo sát, thăm dò một cách khái
quát tập số liệu.
- Trung vị Me ( q0.5) là giá trị nằm ở vị trí trung tâm của chuỗi số liệu đã
sắp xếp theo thứ tự tăng dần (chuỗi trình tự) sao cho số thành phần của
chuỗi có trị số nhỏ hơn Me bằng số thành phần lớn hơn Me. Nếu số thành
phần của chuỗi là lẻ thì trung vị đơn giản là giá trị nằm ở vị trí giữa của
chuỗi trình tự. Tuy nhiên, nếu số thành phần của chuỗi là chẵn thì chuỗi
có hai giá trị giữa và trung vị được qui ước lấy bằng trung bình của các
giá trị giữa này.

- Phân vị dưới (q0.25) và phân vị trên (q0.75) chúng nằm giữa trung vị Me và
các cực trị xmin = x(1) và xmax=x(n). Như vậy các phân vị dưới và trên
là hai trung vị của hai nửa tập số liệu giữa Me=q0.5 và các cực trị. Nếu n
lẻ thì mỗi nửa tập số liệu này bao gồm (n+1)/2 điểm và cả hai đều chứa
trung vị. Nếu n chẵn thì mỗi nửa này chứa n/2 điểm và chúng không đè
lên nhau (không giao nhau).
- Trong khí tượng, khí hậu các phân vị được sử dụng để khảo sát sơ bộ số
liệu ban đầu. Ưu điểm chính của việc sử dụng các đặc trưng này là chúng
không bị ảnh hưởng đáng kể bởi những số liệu có chứa sai số thô. VD :
khi xử lý chuỗi số liệu gió cực đại, tốc độ gió có thể khá lớn và dao động
mạnh, nếu sử dụng trung bình số học sẽ thiếu chính xác. Trong trường
hợp này người ta dùng trung vị chứ không dùng trung bình số học.
 Mốt :
- Mốt (mode): kí hiệu là Mo, là giá trị của biến ngẫu nhiên mà tại đó hàm
mật độ xác suất đạt cực đại:


trong đó f(x) là hàm mật độ xác suất.
15


- Như vậy, về nguyên tắc, tuỳ thuộc vào dạng hàm mật độ xác suất f(x),
một phân bố có thể có nhiều mốt hoặc không có mốt nào. Khi xét cụ thể
một tập số liệu nào đó, mốt là trị số có tần suất xuất hiện lớn nhất, tức là
người ta thường chỉ quan tâm đến mốt quan trọng nhất.
- Ví dụ 2.2.2 Xét tập số liệu sau {1, 2, 3, 4, 2, 5, 4, 6, 4, 8} ta thấy xuất
hiện hai mốt là Mo1=4 và Mo2=2. Nhưng tần số xuất hiện giá trị 4 (3
lần) lớn hơn tần số xuất hiện trị số 2 (2 lần), do đó ta chỉ sử dụng mốt thứ
nhất: Mo=Mo1=4.
b) Các mômen phân bố:
• Mômen gốc bậc r
• Mômen trung tâm bậc r:
( Tài liệu giống câu 4)
Liên hệ giữa moomen gốc và moomen trung tâm:

c) Trung bình số học:
- Ý nghĩa cơ bản của trung bình số học là nó chứa đựng thông tin quan
trọng nhất về chế độ của đặc trưng yếu tố khí hậu. Chức năng của trung
bình số học trong nghiên cứu khí hậu là phản ánh một cách khái quát độ
lớn của các thành phần trong chuỗi, dung hoà được các dao động thăng
dáng và biểu thị trạng thái trung gian hay giá trị nền của chuỗi.
- Đôi khi nó còn dược gọi là kỳ vọng mẫu, và được xác định theo công
thức sau:

16



d) Phương sai và độ lệch chuẩn:
- Phương sai Dx là đại lượng đặc trưng cho sự phân bố tản mạn của các giá
trị của đại lượng ngẫu nhiên X xung quanh kỳ vọng toán học. Phương sai
mẫu là ước lượng thống kê của phương sai Dx và được xác định bởi:
trong đó xt, t=1..n, là chuỗi các giá trị quan trắc của X. Căn bậc hai của
phương sai mẫu được goi là độ lệch tiêu chuẩn hay độ lệch chuẩn sx: sx =
Song do , nó thiếu tính rõ ràng vì thứ nguyên của nó bằng bình phương thứ
nguyên của đại lượng được đo. Trong khi đó s x có cùng thứ nguyên với đại lượng
được đo. Do vậy thông thường người ta dùng độ lệch chuẩn sx làm thước đo mức
độ phân tán của các thành phần trong chuỗi xung quanh giá trị trung bình. Độ lệch
chuẩn sx càng lớn thì độ tản mạn của chuỗi càng lớn và ngược lại.
e) Một số đặc trưng thông dụng khác:
 Độ bất đối xứng:
- Độ bất đối xứng
- Nếu đại lượng ngẫu nhiên có phân phối đối xứng thì μ 3 = 0, ngược lại thì
μ3 ≠ 0. Do đó độ bất đối xứng A là đại lượng dùng làm thước đo mức độ
thiếu cân đối của phân bố thực nghiệm, phản ánh sự phân bố không đồng
đều của các thành phần trong chuỗi xung quanh tâm phân phối - giá trị
trung bình số học.
- Nếu A>0 thì mật độ phân bố có dạng đuôi lệch phải, đặc trưng cho sự tản
mản của các thành phần có trị số lớn hơn trung bình số học; nếu A<0 thì
17


mật độ phân bố có dạng đuôi lệch trái, đặc trưng cho sự phân tán của các
thành phần có trị số nhỏ hơn trung bình số học.
 Hệ số độ nhọn
- Độ nhọn là đại lượng đặc trưng cho mức độ tập trung của phân phối. Nó
phản ánh tình trạng tập trung hay phân tán của các giá trị của đại lượng
ngẫu nhiên xung quanh tâm phân phối. Hệ số nhọn là ước lượng của độ

nhọn, dùng làm thước đo mức độ tập trung của các thành phần trong
chuỗi xung quanh giá trị trung bình.
- E càng lớn thì phân phối càng tập trung, hàm mật độ càng có dạng
"nhọn", mức độ tản mạn của các thành phần trong chuỗi sẽ nhỏ.
 Độ lệch trung bình tuyệt đối (độ lệch tuyệt đối)
- Phản ánh mức độ phân tán của các thành phần trong chuỗi, ta có CT:
trong đó là giá trị tuyệt đối của độ lệch của các thành phần trong chuỗi so
với trung bình số học.
 Hệ số biến thiên
- Là tỷ số giữa độ lệch tiêu chuẩn và trung bình số học, là đại lượng phản
ánh tương quan so sánh giữa mức độ dao động trung bình s x và độ lớn
của chuỗi
- CT : .100%
 Biên độ
- Biên độ của chuỗi (QA) là hiệu giữa giá trị lớn nhất và giá trị nhỏ nhất của
các thành phần trong chuỗi., ta có: Q A = max{xt, t=1..n} − min{ xt,
t=1..n} = xmax – xmin
- Biên độ là đại lượng đặc trưng cho mức độ dao động tối đa của chuỗi. Để
có sự tương quan so sánh giữa mức độ dao động tối đa và độ lớn của
chuỗi người ta còn xét tỷ số giữa biên độ và trung bình số học:
Câu 20) Bổ khuyết số liệu ???
TL:
- Bài toán: Giả sử trên một khu vực nào đó có M trạm quan trắc. Khi tiến
hành xử lý số liệu cho mục đích nghiên cứu, người ta thấy rằng chỉ có K
trong số M trạm đó có độ dài chuỗi đủ lớn, còn M-K trạm khác độ dài
chuỗi khá bé. Điều này dẫn đến việc các đặc trưng tính toán được trên MK chuỗi dung lượng bé không bảo đảm tính ổn định thống kê của điều
kiện khí hậu, và do đó chúng không có ý nghĩa sử dụng trong việc so
sánh, phân tích. Vậy, vấn đề đặt ra là, từ lượng thông tin của K trạm dài
18



năm, hãy bổ sung số liệu cho M-K trạm ngắn năm để những đặc trưng
thống kê của chúng trở nên có ý nghĩa
- Các phương pháp bổ khuyết số liệu:
Xét các chuỗi số liệu của hai trạm A và B, trong đó chuỗi trạm A có N
thành phần {xt}={x1,x2,...,xn,xn+1,...,xN), chuỗi trạm B có n thành phần
{yt}={y1,y2,...,yn}, hơn nữa n thành phần {yt, t=1..n} của chuỗi trạm B
tương ứng cùng thời gian với n thành phần {xt, t=1..n} của chuỗi trạm A.
Tức là ta có n năm cả hai chuỗi đồng thời có số liệu. Từ tập {(xt,yt),
t=1..n} ta tiến hành xây dựng phương trình hồi qui tuyến tính

19


20


Câu 17) Phân tích tương quan và hồi quy tuyến tính một biến???
TL:

21


22


- Phân tích phương sai phương trình hồi qui tuyến tính một biến:

- Chuẩn sai thặng dư (s):
s là thước đo mức độ dao động của các giá trị thực nghiệm xung quanh trị

số hồi qui, và được gọi là chuẩn sai thặng dư ; s càng nhỏ thì các điểm
thực nghiệm càng nằm sát đường hồi qui; Chuẩn sai thặng dư là thước đo
phần đóng góp trung bình của nhân tố ngoài hồi qui đối với sai số của
phép hồi qui; s là chỉ tiêu phản ánh độ chính xác của hồi qui.
Câu 16) Vấn đề tương quan và hồi quy trong khí hậu học???
TL:
23


Tóm tắt lí thuyết chương 5

24


25


×