Tải bản đầy đủ (.pdf) (80 trang)

CÁC PHƯƠNG PHÁP THỐNG KÊ TRONG THUỶ VĂN - CHƯƠNG 4 doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (976.1 KB, 80 trang )

Chơng 4
Kiểm tra thống kê các giả thuyết về tính đồng nhất,
ngẫu nhiên và phù hợp của thông tin khí tợng thuỷ văn
Việc ứng dụng đờng phân phối lý luận để mô tả các chuỗi thống kê , nói
một cách nghiêm túc, chỉ có thể thực hiện đợc trong trờng hợp nếu nh chuỗi này
đợc tạo nên bởi các phần tử về định tính là đồng nhất và độc lập với nhau. Vì vậy
làm sáng tỏ tính đồng nhất thống kê của chuỗi nghiên cứu và tính ngẫu nhiên hình
thành mẫu là yếu tố quan trọng của việc đánh giá mức độ tin cậy trong khái quát
hoá thống kê.
Ngoài ra, khi sử dụng đờng phân phối lý luận cần phải trình bày đầy đủ rõ
ràng mức độ đờng phân phối lý luận để đợc dùng phù hợp với tài liệu thực
nghiệm.
Việc phân tích các phơng pháp thống kê cho phép giải các bài toán trên và
là nội dung của chơng này.
4.1. Phân tích tính đồng nhất chuỗi đặc trng thuỷ văn.
4.1.1. Tổng quan.
Các chuỗi đặc trng thuỷ văn không phải là những tổng thể mà là các mẫu
ngẫu nhiên của chúng. Vì vậy không thể mặc nhiên coi các chuỗi đó thuộc một
tổng thể đợc.
Nh đã biết, trong lý thuyết xác suất có rất nhiều chỉ tiêu đồng nhất mà ta có
thể sử dụng để xác định tính đồng nhất của các tham số mẫu của phân phối trong đó
có trị bình quân và phơng sai, hoặc xác định trực tiếp một số mẫu có thuộc cùng
một tổng thể hay không. Sau đây chúng ta sẽ xét một vài chỉ tiêu đó đợc dùng
trong thực tế phân tích thuỷ văn.
Ta biết rằng việc đánh giá tính đồng nhất về mặt thống kê của các chuỗi đặc
trng thuỷ văn là đặc biệt phức tạp, vì vậy trong nhiều trờng hợp phép toán này trở
nên không thể xác định đợc.

193
Thật vậy, do tính đa nhân tố của rất nhiều các đặc trng thuỷ văn, thờng
khó tách ra đợc các nguyên nhân phá vỡ trạng thái đồng nhất của chuỗi tài liệu


quan trắc đợc ra khỏi các yếu tố tạo nên chuỗi thuỷ văn nh là một chuỗi của biến
ngẫu nhiên.
Thí dụ nh lu lợng nớc lớn nhất trong năm, nh ta đã biết rõ, đợc hình
thành dới tác động của rất nhiều nhân tố, trong đó có lớp tuyết phủ quyết định đến
dòng chảy lũ mùa xuân, lợng ma rơi sinh ra lũ do ma. Vì thế, một vấn đề tất
nhiên sẽ xảy ra là đối với sông nghiên cứu, lớp tuyết phụ và lợng ma rơi với nhiều
nhân tố khác tạo nên tính chất ngẫu nhiên dao động nhiều năm của dòng chảy lũ
mùa xuân, và ngợc lại , một nhân tố đó trong những năm khác nhau tác động lên
hiện tợng nghiên cứu rất độc lập với nhau điều đó đã gây nên tính không đồng nhất
về mặt hình thành nó .
Trong trờng hợp thứ nhất, lu lợng lớn nhất không phụ thuộc vào điều kiện
hình thành nó (lũ do ma và lũ mùa xuân ) tạo nên một chuỗi thống kê duy nhất,
còn trong trờng hợp thứ hai do xét riêng biệt lũ do ma và lũ mùa xuân nh là hai
chuỗi thống kê độc lập. Vì thế một vấn đề nảy ra là sử dụng lợng thông tin tổng
hợp có trong hai chuỗi thống kê đó nh thế nào, nếu nh thiết kế công trình thuỷ lợi
cần tính lu lợng nớc lớn nhất ứng với tần suất cho trớc không phụ thuộc vào
điều kiện hình thành nó (lũ do m
a hay lũ mùa xuân). ở chơng này ta sẽ xét một
trong số các phơng pháp có thể mô tả thống kê các chuỗi nh vậy.
Trong một số trờng hợp việc đánh giá tính đồng nhất của tài liệu thuỷ văn
quan trắc có ý nghĩa rất quyết định. Thí dụ nh việc lựa chọn trạm tơng tự, khi xác
định đợc tính đồng nhất của các yếu tố địa vật lý và khí hậu của dòng chảy dựa vào
sự phân tích định tính chung trên hai lu vực.
Trong các trờng hợp khác cần phải đánh giá tính đồng nhất trong chuỗi đặc
trng dòng chảy của con sông khi nó bị phá vỡ bởi những nguyên nhân tự nhiên
hoặc do con ngời, chẳng hạn nh sự thay đổi dòng chảy tự nhiên do nó đợc điều
tiết bằng kho nớc. Nguyên nhân tự nhiên phá vỡ tính đồng nhất của chuỗi tài liệu
thuỷ văn quan trắc điển hình là ảnh hởng của những chỗ trũng lớn nhỏ không thoát
đợc nớc ở những vùng không đủ ẩm. Việc làm sáng tỏ mức độ đồng nhất của các
chuỗi dòng chảy đối với những sông khác nhau là điều râts quan trọng khi kết hợp

các chuỗi đó lại thành một chuỗi không- thời gian thống nhất.

194
Trong tất cả các thí dụ trên cần phải đánh giá tính đồng nhất của các đặc
trng thuỷ văn khác nhau. Điều đó đều đợc tiến hành đối với các trờng hợp , khi
mà các nhân tố quyết định các đặc trng thuỷ văn khác nhau (lợng ma bốc hơi,
nhiệt độ không khí v.v ) đợc phân tích đồng nhất. Thờng thờng việc phân tích
tính đồng nhất chỉ đợc thực hiện dựa vào những đánh giá định tính và không sử
dụng các chỉ tiêu định lợng khách quan. Trong nhiều trờng hợp điều đó đã là đủ.
Thật vậy, cha hẳn đã có sự nghi ngờ tính không đồng nhất của chuỗi dòng chảy lớn
nhất trớc và sau khi xây dựng kho nớc điều tiết mùa. Nếu nói đến ảnh hởng điều
tiết dòng chảy của kho nớc trờng hợp đó chắc hẳn là nhỏ. Trong một số trờng
hợp theo quan điểm thực tế dòng chảy năm của một con sông trớc và sau khi xây
dựng nhà máy thuỷ điện có thể coi là đồng nhất.
Khi phân tích bản chất tính đồng nhất của các đặc trng thuỷ văn hoặc của
các nhân tố tạo nên chúng, việc sử dụng các phơng pháp thống kê cho phép ta đánh
giá tính đồng nhất của chuỗi tài liệu nghiên cứu quan trắc dới dạng định lợng là
điều cần thiết nhng cha đủ. Hơn nữa, thờng cần phải đánh giá tính đồng nhất của
các chuỗi thuỷ văn, khi mà không có lợng thông tin về nguồn gốc phá vỡ trạng thái
đồng nhất. Trong các trờng hợp nh vậy, các phơng pháp thống kê tính đồng nhất
của tài liệu thực nghiệm là những phơng pháp duy nhất. Hơn nữa nhờ các phơng
pháp đó ta có thể xác định đợc phạm vi cần phải tìm nguyên nhân vật lý phá vỡ
tính đồng nhất của chuõi tài liệu quan trắc đợc và cũng chính các phơng pháp này
sẽ giúp cho các nhà nghiên cú tìm ra đợc nguyên nhân đó.
Có thể xảy ra tình trạng, khi mà nguyên nhân vật lý làm phá vỡ trạng thái
đồng nhất thì đã biết nhng theo quan điểm thực tế đến nay vẫn cha biết trờng
hợp nguyên nhân này có thể không xét. Các phơng pháp thống kê cũng có thể giải
đáp đợc các vấn đề tơng tự nh vậy.
Tóm lại, trong các thí dụ đã xét ở trên rõ ràng là phép phân tích vật lý và các
phơng pháp thống kê nghiên cứu tính đồng nhất các phơng pháp khác nhau đối

với cùng một quy luật (vật lý và thống kê) của các chuỗi quan trắc đợc. Ngoài ra
việc sử dụng đồng thời các phơng pháp thống kê và vật lý vào phân tích tài liệu
thực nghiệm khi đánh giá tính đồng nhất, vì các phơng pháp này thờng bổ sung và
làm chính xác cho nhau. Khi nghiên cứu tính đồng nhất của các chuỗi quan trắc
đợc theo quan điểm vật lý thông thờng chỉ có thể đi đến các kết luận về định tính

195
mà không có định lợng ; các phơng pháp thống kê nghiên cứu tính đồng nhất cho
phép các kết luận định tính đó đợc bổ sung vào các đánh giá về mặt định lợng.
Để làm thí dụ, ta sẽ xét sự phân bố độ cao của một lớp tuyết phủ ở trong rừng
và ngoài đồng. Xuất phát từ nhận thức vật lý thuần tuý về sự hình thành lớp tuyết
phủ có thể đi đến một kết luận là trờng hợp độ cao lớp tuyết phủ ở trong rừng phải
lớn hơn và độ cao này ít thay đổi hơn so với ở ngoài đồng với các điều kiện khác
nh nhau. Thật vậy, các kết quả quan trắc đợc đã khẳng định điều đó. Song khi sử
dụng các phơng pháp thống kê phân tích tính đồng nhất có thể xác định đợc một
vài sai khác đó. Ngoài ra cấu trúc thống kê cuả lớp tuyết phủ trên khoảng không
gian rất lớn ở trên đồng (hay trong rừng cũng chịu sự thay đổi dới ảnh hởng của
các nhân tố nh khí hậu chẳng hạn. Trong trờng hợp này các phơng pháp thống kê
có thế u việt khi tách các đặc trng đồng nhất của lớp tuyết phủ ở trên đồng (hay ở
trong rừng ).
Trớc khi xét tới các phơng pháp thống kê phân tích tính đồng nhất của tài
liệu quan trắc ta phải xem xét một số những đặc tính và hạn chế của việc sử dụng
các chỉ tiêu đồng nhất về mặt thống kê trong tính toán thuỷ văn.
Đối với các chuỗi ngẫu nhiên độc lập trong chuỗi, ngời ta đã nghiên cứu
đợc một số chỉ tiêu thống kê của tính đồng nhất. Các chuỗi thuỷ văn quan trắc, nh
chúng ta sẽ rõ ở các chơng sau, thờng không thoả mãn yêu cầu này. Cho nên việc
sử dụng các chỉ tiêu tính đồng nhất đã biết đối với các chuỗi thuỷ văn có mối tơng
quan nội tại có thể đi đến những kết quả không đúng, vì mối tơng quan nội tại của
chuỗi đã làm giảm bớt dung lợng thông tin độc lập có trong tài liệu quan trắc đợc.
Điều đó sẽ mở rộng phạm vi dao động (phân tán) các giá trị mâu thuẫn của tham số

đó đợc xác định theo chuỗi của các giá trị độc lập về mặt thống kê có cùng dung
lợng. Sự mở rộng độ phân tán dẫn tới sự mở rộng khoảng tin cậy tơng ứng đối
với chỉ tiêu đồng nhất.
Vì vậy, việc sử dụng chỉ tiêu đồng nhất đã đợc nghiên cứu cho các chuỗi
không có tơng quan nội tại, vào các chuỗi thuỷ văn quan trắc có mối tơng quan đó
đôi khi đối với các chuỗi tài liệu quan trắc ta đã biết chắc chắn là đồng nhất thì có
thể bị coi là không đồng nhất, nghĩa là trong các trờng hợp này chỉ tiêu đồng nhất
là thừa khi đánh giá tính đồng nhất.

196
Việc sử dụng không đúng nh vậy các chỉ tiêu đồng nhất đôi khi còn gặp
trong thực tế tính toán thuỷ văn sẽ đi đến những kết quả của đánh giá mức độ an
toàn không cần thiết. Sử dụng đúng đắn các chỉ tiêu đồng nhất đối với các giá trị
tơng quan đối với nhau là ở chỗ đánh giá đợc dung lợng thông tin độc lập cần
phải tính đến khi tính toán đồng nhất.
Sự đánh giá mức độ ngẫu nhiên của các chuỗi thuỷ văn sẽ đợc nghiên cứu ở
mục sau của chơng này. ở đây ta chỉ đề cập đến nững hạn chế cần phải chú ý khi
ứng dụng các chỉ tiêu thống kê của tính đồng nhất.
Hạn chế thứ hai khi sử dụng các chỉ tiêu thống kê của tính đồng nhất đối với
tài liệu thuỷ văn có mối tơng quan giữa các chuỗi với nhau là khoảng tin cậy của
các chỉ tiêu đồng nhất bị thu hẹp lại. Điều đó sẽ dẫn đến sự ứng dụng chỉ tiêu thống
kê của tính đồng nhất, mà không xét đến mối tơng quan giữa các chuỗi thuỷ văn
quan trắc đợc thì các tài liệu ta đã biết chắc chắn là không đồng nhất có thể chấp
nhận là đồng nhất. Những sai lầm này rất thờng gặp khi đánh giá tính đồng nhất tài
liệu thuỷ văn, vì tài liệu thuỷ văn (dòng chảy năm, dòng chảy lớn nhất, dòng chảy
mùa v.v ) ở các sông gần nhau thực ra là có tơng quan với nhau. Nếu không tính
đến các mối tơng quan đó có thể là những tài liệu ta đã biết chắc là không đồng
nhất lại đợc chấp nhận là đồng nhất.
Nh vậy, nếu nh không tính đến mối quan hệ nội tại của các chuỗi tài liệu
quan trắc sẽ đa đến những lời giải của tính đồng nhất thiên về an toàn (tài liệu ta

biết chắc là đồng nhất có thể xếp vào loại không đồng nhất) còn khi không xét đến
mối tơng quan giữa các chuỗi thuỷ văn quan trắc đợc thì ngợc lại sẽ mở rộng
khái niệm đồng nhất (tài liệu biết chắc là không đồng nhất có thể xếp vào loại đồng
nhất.) .
Ngoài những hạn chế trên thờng bị bỏ qua khi sử dụng các chỉ tiêu thồng kê
của tính đồng nhất, còn có một số hạn chế khác thờng th
ờng đợc phân tích khi
mô tả các chỉ tiêu đó vì vậy ta phải chú ý khi sử dụng chúng. Trong số các hạn chế
đó, chẳng hạn nh điều kiện tuân theo luật phân phối lý luận này hay luật khác
thờng là chấm, của các chuỗi tài liệu thống kê nghiên cứu các chỉ tiêu loại này (thí
dụ nh chỉ tiêu đồng nhất của giá trị bình quân Student hay chỉ tiêu đồng nhất của
phơng sai Fisher) đợc gọi là chỉ tiêu tham số, nó khác với các chỉ tiêu không tham
số là không phụ thuộc vào lợng phân bố của tài liệu gốc (thí dụ nh chỉ tiêu

197
Wincooson). Ta nhận thấy rằng các chỉ tiêu tham số thờng có hiệu quả hơn so với
các chỉ tiêu không tham số, vì nó sử dụng lợng thông tin gốc đầy đủ hơn, phân tích
các chỉ tiêu thống kê của các giả thiết ra lại tham số và không tham số nh trên, đều
thuộc về phần sau của chơng này. Các chỉ tiêu không tham số thờng đơn giản hơn
và không cần lập luận bổ xung của tính chất dúng đắn khi ứng dụng chúng đối với
dạng phân phối gốc khi sử dụng các chỉ tỉêu tham số với tính đồng nhất ngời ta
phải đánh giá các tham số của phân phối (trị bình quân, số biến đổi và hệ số không
đối xứng ) .
Sau đây ta sẽ xét một số chỉ tiêu cổ điển đánh giá tính đồng nhất (không kể
chỉ tiêu tổng quát của Student và chỉ tiêu Bartlet đối với trờng hợp nhiều chuỗi) chỉ
thích hợp đối với phân tích của tính đồng nhất của hai chuỗi thực nghiệm. Khi có
nhiều chuỗi đợc đem đánh giá tính đồng nhất sự so sánh từng đôi một trị bình quân
hoặc phơng sai của chúng sẽ làm xuất hiện một loạt những giá trị của chỉ tiêu
tơng ứng chuỗi giá trị này cho phép ta đánh giá tính đồng nhất của các chuỗi
nghiên cứu so với mức độ phù hợp của đờng phân phối lý luận của các chỉ tiêu

đồng nhất đợc xét với đờng thực nghiệm trong trờng hợp các đờng phân phối
đó phù hợp tất thì giả thiết đồng nhất đợc công nhận là đúng trong trờng hợp các
đờng phân phối đó không phù hợp thì giả thiết đồng nhất bị loại. Mức độ giữa phân
phối lý luận và thực nghiệm có thể đánh giá bằng các chỉ tiêu phù hợp mà ta sẽ xét ở
bài 3 chơng này.
4.1.2. Các bớc chính phân tích tính đồng nhất chuỗi tài liệu quan trắc.
Sự phân tích thống kê tính đồng nhất của các chuỗi tài liệu quan trắc bao
gồm các bớc chính nh sau: xây dựng các giả thiết không vì giả thiết chệch, định
mức ý nghĩa, chọn miền giới hạn, loại bỏ hay chấp nhận giả thiết. Vì các b
ớc đó về
nguyên tắc không thể tách khỏi bất kỳ công trình nghiên cứu thống kê tính đồng
nhất của các chuỗi tài liệu quan trắc nên chúng ta phải điểm qua chúng. Trớc hết,
ta giả thiết rằng các kết quả quan trắc là đồng nhất, khi chúng đều thuộc cùng một
tổng thể. Trong đó, tất cả tài liệu quan trắc đợc coi là độc lập trong nội bộ (hay nói
một cách khác điều kiện chọn ngẫu nhiên đã đợc chấp thuận) cũng nh giữa các
chuỗi tài liệu quan trắc đợc nghiên cứu.
Xây dựng các giả thiết không và giả thiết chệch.Bất kỳ một kết luận
thống kê nào về tính đồng nhất của các chuỗi tài liệu quan trắc đợc phân tích xác

198
suất. Sự phân tích thống kê tính đồng nhất của các chuỗi tài liệu quan trắc đợc bắt
đầu từ giả thiết không có sự khác nhau giữa các tham số của các chuỗi đem ra so
sánh (giả thuyết không). Khi đó thông thờng ngời ta giả thiết rằng các chuỗi
nghiên cứu có cùng một luật phân phối, điều này đợc rút ra từ nhận thức về bản
chất hay từ kinh nghiệm tích luỹ từ trớc, nhng có thể chỉ khác nhau ở các tham số
phân phối: trị bình quân, hệ số biến đổi và hệ số không xứng đối xứng. Trong nhiều
trờng hợp, tất cả các tham số đợc kiểm tra theo giả thiết không. Giả thiết đối lập
với giả thiết không là giả thiết chệch.
Giả sử, cần phải đánh giá tính đồng nhất trị bình quân lợng nớc của lớp
tuyết phủ theo tài liệu của hai tuyến đo tuyết. Trong đó

21
x,x
là trị bình quân lợng
nớc của lớp tuyết phủ trên hai tuyến. Trong trờng hợp này giả thiết không là
21
xx =
còn giả thiết chệch có thể có ba;
21
xx
hoặc
21
xx >
hoặc
21
xx <

Chọn mức sử dụng. Mức sử dụng là giá trị xác suất rất nhỏ mà trong trờng
hợp cụ thể có thể dùng làm đặc trng cho các biến đổi có thực tế không thể có. Sự
xuất hiện một biến cố hiếm cho thấy tính chất không đúng đắn của giả thiết không,
khi xác suất không giả thiết vợt mức sử dụng cho trớc. Lúc này với xác suất bằng
mức sử dụng, thì giả thiết không có thể bị loại, mặc dù nó có thể là đúng hay nh
ngời ta thờng gọi là phạm sai lầm loại một. Trong trờng hợp khác khi cho mức
sử dụng khá nhỏ có thể thu đợc giả thiết chệch không đúng hay phạm sai lầm loại
hai. Rõ rànglà không thể tránh sai lầm loại một và loại hai đợc. Lúc này thờng có
sự liều lĩnh. Sự liều lĩnh phạm sai lầm loại một chỉ có thể giảm đi bằng cách tăng sai
lầm khác. Thông thờng ngời ta lấy mức sử dụng với xác suất là 5,2 hoặc 1%.
Trong những trờng hợp riêng mức sử dụng có thể lấy 0,1% và nhỏ hơn hoặc lớn
hơn 5%.
Mức sử dụng càng giảm xác suất loại bỏ giả thiết không giảm theo, khi đó
giả thiết là đúng do đó xác suất phạm sai lầm loại một giảm đi. Nhng mức sử dụng

càng giảm, miền các giá trị cho phép càng tăng, do đó xác suất chấp nhận giả thiết
không đợc tăng lên, khi đó giả thiết này không đúng, hay xác suất phạm sai lầm
loại hai tăng lên. Mặt khác khi tăng mức sử dụng chúng ta sẽ làm tăng xác suất
phạm sai lầm loại một (nghĩa là gải thiết không ban đầu bị loại mặc dù nó là đúng)
và tơng ứng ta làm cho xác suất phạm sai lầm loại hai giảm đi.

199
Việc chọn mức sử dụng cần phải đặt ra khi kiểm tra tính đồng nhất các
chuỗi thuỷ văn, khi phối hợp các kết quả có phạm sai lầm loại một và sai lầm loại
hai. Ngoài ra trong đó phải thờng xuyên chú ý đến sai số của tài liệu gốc.
Chọn miền tới hạn. Việc chọn miền tới hạn đợc thực hiện nh thế nào đó
để cho xác suất rơi vào miền này với độ chímh xác bằng mức sử dụng khi giả thiết là
đúng. Miền bổ xung cho miền tới hạn thờng đợc gọi là miền các giá trị cho phép
hay miền sử dụng. Việc lựa chọn miền tới hạn ứng với mức sử dụng cho trớc cần
phải dựa vào những hiểu biết khác nhau về bản chất và sự khác biệt đợc giả thiết
trong các tham số phân phối của đại lợng nghiên cứu. Hay nói một cách khác miền
tới hạn đợc chọn sao cho xác suất rơi vào nó của chỉ tiêu là lớn nhất, khi đó giả
thiết chệch là đúng; nghĩa là giả thiết đối lập với giả thiết không, xác suất mà thờng
gọi là sức mạnh của chỉ tiêu càng lớn thì xác suất phạm sai lầm loại hai càng nhỏ.
Với mức sử dụng cho trớc ta có thể xét những miền tới hạn nh sau:
(h.4.1)
: 1- Miền khoảng lệch dơng lớn là (I) ; 2- Miền khoảng lệch âm lớn là (II) ; 3-
Miền giá trị tuyệt đối của khoảng lệch lớn là (III) ; 4- Miền giá trị tuyệt đối của khoảng
lệch nhỏ là (IV).
Hình 4.1
C
ác miền tới hạn của chỉ tiêu (x)
Chúng ta giải thích những điều đó bằng thí dụ nh sau; giả sử ta quan tâm
đến tính đồng nhất của độ cao bình quân lớp tuyết phủ theo tài liệu của các tuyến đo
trong rừng và ngoài đồng nằm ở vùng đồng nhất về địa vật. Mức sử dụng ta lấy bằng

1%. Xuất phát từ nhận thức logic thuần tuý có thể giả thiết rằng độ cao bình quân
của lớp tuyết phủ ở trong rừng (
1
x
) lớn hơn ở ngoài đồng (
2
x
), vì ở trong rừng tác
động của gió bị yếu đi do đó ở trong rừng mật độ của tuyết nhỏ hơn và không bị thổi
đi. Lấy
21
xx =
làm giả thiết không và
21
xx >
làm giả thuyết chệch. Trong trờng

200
hợp này miền tới hạn nên là miền khoảng lệch dơng lớn, vì chỉ có trong trờng hợp
dó xác suất của chỉ tiêu đồng nhất rơi vào miền tới hạn là lớn nhất.
Nếu nh giá trị mẫu của chỉ tiêu rơi vào miền tới hạn thì giả thiết không là
đúng, và cần phải chấp nhận giả thiết chệch. Trong các trờng hợp nếu giá trị của
chỉ tiêu rơi vào miền cho phép thì điều đó nghĩa là với tài liệu thực nghiệm này,
không có cơ sở để loại bỏ giả thiết không vì vậy nó đợc chấp nhận trong mọi
trờng hợp cho đến khi các tài liệu bổ sung quan trắc đợc loại bỏ nó.
4.1.3 Những chỉ tiêu đánh giá tính đồng nhất của trị bình quân.
Sự phân tích các chỉ tiêu đồng nhất của trị bình quân ta sẽ bắt đầu từ
trờng hợp mất hay gặp là trị bình quân mẫu đợc phân phối theo luật chuẩn. ĐIều
đó xảy ra khi phân phối của các chuỗi gốc tuân theo luật chuẩn hoặc các chuỗi tài
liệu quan trắc đợc rất dài, vì trong trờng hợp này ngoài sự phụ thuộc vào luật phân

phốicủa các chuỗi gốc, phân phối của trị bình quân mẫu tiệm cậnvới phân phối
chuẩn.
Ta sẽ đánh giá tính đồng nhất của các chuỗi tài liệu quan trắc đợc gồm có:
n
x
và n
y
số hạng. Giả sử các chuỗi đó là các mẫu của tổng thể phân phối chuẩn. Khi
đó tính kiểm tra tính đồng nhất của trị bình quân có thể lấy giá trị chỉ tiêu (z).

)xy(
xy
x



=
(4.1)
trong đó
y
2
y
x
2
x
xy(
nn
)

+




(4.2)
ở đây
x
,
y
khoảng lệch quân phơng của các chuỗi gốc đang nghiên cứu.
Tất nhiên giả thiết "không" ta thấy là
yx
. ứng với điều kiện ban đầu sử
dụng luật phân phối chuẩn ta dễ dàng nhận đợc miền tới hạn đối với
yx
ứng với
mức sử dụng cho trớc. Để lấy thí dụ ta sẽ so sánh trị bình quân của độ cao mặt đầm
thợng(lamin - ruo) so với độ cao giả định trong miền vị cảnh quan gò đầm và các
loại cây rêu, bụi thông theo tài liệu của 900 lần đo trong miền vi cảnh quan đó.

201
Trị bình quân dối với miền gò đầm là x=20,28m, còn đối với miền cây bụi
thông là y=10,34m.
Ta lấy x=y làm giả thiết không. Còn x khác y làm giả thiết chệch. Miền tới
hạn lấy là miền giá trị tuyệt đối của khoảng lệch lớn (miền III trên hình 4.1).
Khoảng lệch quân phơng đối với các chuỗi thành phần quan trắc đợc

x
=8,6m và
y
=4,6m theo công thức (4.2) ta tính đợc:


33,0024,0082,0
900
6,4
900
6,8
22
)yx(
=+=+=


Còn theo công thức (4.1) thì chỉ tiêu đồng nhất của trị bình quân:

30
33,0
94,9
33,0
34,1028,20
z ==

=

Với giả thiết không
yx =
chỉ tiêu này đợc phân phối theo luật chuẩn vì các
chuỗi nghiên cứu có số lợng số hạng khá lớn (900 lần đo). Trong trờng hợp này sử
dụng bảng phân phối chuẩn với mức sử dụng cho trớc chẳng hạn bằng 5% ta sẽ tìm
đợc khoảng miền cho phép của các khoảng lệch đợc giới hạn từ -1,96 đến1,96.
Miền tới hạn nằm về hai phía của miền đó(>1,96 và <-1,96). Chỉ tiêu vừa nhận đợc
z=30 lớn hơn rất nhiều so với giới hạn trên của miền tới hạn do đó nó nằm trong

miền này. Trong trờng hợp này giả thuyết không phải loại bỏ mà chấp nhận giả
thuyết chệch
yx

Khi sử dụng chỉ tiêu ta đang nghiên cú phải giả thuyết rằng các giá trị độ
cao mặt cầu vì cảnh quan đo đạc đợc không có tơng quan nội tại và giữa các
chuỗi nối tơng quan giữa các bề mặt của các vi cảnh quan khác nhau không có
đợc rút ra từ các nhận biết chung về sự hình thành địa hình nghiên cứu. Với điều
kiện đó thì những đo đạc bề mặt vi cảnh quan đợc tiến hành khá dày (cách 10cm )
theo trắc diện, ta có thể dự đoán là chuỗi độ cao bề mặt của đầm lầy có mối tơng
quan nội tại khá lớn, điều đó đã đợc tính toán xác nhận. Vì vậy kết luận độ cao
bình quân của các vi cảnh quan đầm lầy khác nhau không đồng nhất không xét tới
mối tơng quan nội tại của chuỗi , chỉ nên coi là sơ bộ.

202
Bất đẳng thức giữa độ cao bình quân bề mặt đầm lầy với mực gia định ngày
nay là phù hợp với nhận thức vệ bản chất về sự hình thành vi cảnh quan trên các gò
đầm.
Chỉ tiêu đánh giá tính đồng nhất của trị bình quân nên sử dụng đối với các
chuỗi có số hạng khá lớn, khi đó mới có khả năng tính đợc khoảng lệch quân
phơng không có sai số lớn. Trong trờng hợp khi chuỗi quan trắc ngắn cần phải
kiểm tra tính đồng nhất của trị bình quân, có thể dùng chỉ tiêu Student đợc. Song
khi đó cần phải chú ý rằng chỉ trong khoảng lệch quân phơng của tổng thể và các
chuỗi bằng nhau
x
=
y
= thì dùng nó mới đúng.
Các phơng pháp đánh giá tính đồng nhất của các chuỗi quan trắc đợc đối
với sự cân bằng khoảng lệch quân phơng với tổng thể của chúng sẽ đợc xét đến ở

mục sau của phần này.
Chỉ tiêu Student đợc viết dới dạng .

yx
yxyx
y
2
xx
nn
)2nn(nn
nn
xy
t
+
+
+

=
(4.3)
Chỉ tiêu này phân theo luật phân phối Student có số bậc tự do bằng k=n
x
-n
y
-2.
Khi dùng chỉ tiêu Student để kiểm tra giả thuyết không x = y nên lấy miền tới hạn
với mức sử dụng q% là miền giá trị tuyệt đối lớn của khoảng lệch
[
ktqt ,>
]
. Giá trị

tq,k đợc xác định theo bảng phân phối Student nh đã trình bày trong công trình
(89) .
Để minh hoạ điều vừa phân tích ta sẽ xét tính đồng nhất của các chuỗi bình
quân dòng chảy năm sông Volga - trạm iarôxlavl trớc và sau(năm 1940) xây dựng
kho nớc điều tiết dòng chảy theo mùa nằm ở tuyến đo này. Trị bình quân dòng
chảy năm trong thời đoạn thứ nhất (1877 - 1940) bằng
/s1120 x
m3
=
=
trong thời
đoạn thứ hai (1941 - 1955) bằng
s/1060y
3m
=
. Ta lấy
yx =
làm giả thuyết
không, còn
yx >
làm giả thuyết chệch. Khoảng lệch quân phơng tơng ứng bằng
75600
x
= và
72100
y
=
. Tính đồng nhất của khoảng lệch quân
phơng sẽ đợc kiểm tra ở phần sau của mục này.


203
Theo công thức (4.3) ta đã tính đợc ghi nhận dợc sự biến đổi của các
phơng sai mẫu. Do đó, nói đúng hơn ,chỉ tiêu này đợc dùng để đánh giá tính đồng
nhất của trị bình quân mẫu. Chỉ tiêu Wincooson dựa vào sự kiểm kê số lợng nghịch
thế xuất hiện trong kết quả của một thủ pháp này.
Những tài liệu quan trắc đợc tạo nên hai mẫu (thí dụ nh các tài liệu này thu
nhập đợc ở hai trạm so sánh ), ta đem những giá trị của chúng phân bố trong chuỗi
trung theo trật tự giảm dần (hoặc tăng dần ) thí dụ nh: y
1
x
1
x
2
y
2
y
3
y
4
x
3
y
5
y
6
x
4
Trong đó x
1
, x

2
, x
3
và x
4
những số lợng của mẫu thứ nhất ; y
1
, y
2
y
6

những số hạng của mẫu thứ hai
Nếu nh một giá trị y đứng trớc giá trị x nào đó tạo nên sự nghịch thế (với
y
4
,y
3,
y
2
và y
1,
) và x
4
cho ở nghịch thế (với y
6
, y
5
, y
4

, y
3
, y
2
và y
1
) trong trờng hợp
này toàn bộ nghịch thế sẽ bằng u = 1+1 + 4 + 6 = 12. Lý thuyết đã chứng minh đợc
rằng trong các chuỗi đồng nhất, mỗi chuỗi đợc coi là một mẫu có dung lợng lớn
hơn 10 số hạng, thì số lợng các nghịch thế đợc phân phối gần nh luật chuẩn với
kỉ vọng toán.

2
n.m
)u(M =
(4.4)
và phơng sai
)1nm(
12
n.m
)u(D ++= (4.5)
trong đó n và m là số hạng của mẫu thứ nhất và thứ hai

8,0
1564
)21564(15.64
72100.1575600.64
10601120
t
+

+
+

=

Theo bảng phân phối Student ta tìm đợc những giá trị tới hạn tq,k ứng với
mức sử dụng khác nhau
q% 5 1 0.1
tq,k 1,96 2,58 3,29

204
So sánh t và tq,k ta thấy rằng ngay cả mức sử khá lớn bằng
ktq, 5% t> cho
nên các chuỗi đem đánh giá không thể coi là không đồng nhất đợc. Trong trờng
hợp này giả thuyết không, đợc chấp nhận, còn giả thuyết chệch bị loại. ở đây miền
giá trị tuyệt đối lớn của khoảng chệch đợc lấy làm miền tới hạn.
Vì vậy, kho nớc Rbinski điều tiết dòng chảy theo mùa không có ảnh hởng
đến trị bình quân của dòng năm, còn sự khác biệt ở trị quân ở các thời đoạn nghiên
cứu có thể là do những dao động ngẫu nhiên của các chuỗi có độ dài hữu hạn.
Chỉ tiêu đồng nhất Student của trị bình quân đã xét ở trên thuộc loại chỉ tiêu
tham số, cho nên ứng dụng nó cần phải dùng luật phân phối chuẩn đối với mẫu
nghiên cứu.
Trong số các chỉ tiêu không tham số đánh giá tính đồng nhất của trị bình
quân, thì chỉ tiêu đồng nhất Wilcoxen thờng dùng để ghép hai mẫu vào trong một
tổng thể. Thực tế, chỉ tiêu này khá nhậy đối với trị bình quân mẫu nhng hầu nh
không .
Bây giờ cần phải chọn giới hạn của các giá trị cho phép để tách miền tới hạn
ra. Khi cho mức sử dụng q = 0.1;1,0; 5% v.v Ta tách ra đợc miền giá trị lớn nhất
của khoảng lệch, trong trờng hợp xác suất rơi vào miền đó, thì khi đó giả thuyết
đồng nhất là đúng với độ chính xác bằng mức sử dụng. Lúc đó, xác suất rơi vào

miền giá trị cho phép, với giả thuyết của chúng ta là đúng sẽ bằng:
=(100-q).%
Xác suất đợc gọi là mức tin cậy.
Nếu giá trị của chỉ tiêu tính theo tài liệu quan trắc rơi vào miền tới hạn thì giả
thuyết không của tính đồng nhất bị loậi, và giả thuyết chệch của tính đồng nhất đợc
chấp nhận với xác suất
Nếu chính giá trị đó của chỉ tiêu rơi vào miền khoảng lệch so với kì vọng
toán cho phép, thì có thể khẳng định rằng giả thuyết - không là đúng.
Miền tới hạn đối với giả thuyết - không của tính đồng nhất là miền giá trị
tuyệt đối lớn của khoảng lệch.

205
up
t)u(Mu
(4.7)
up
t)u(Mu +
(4.8)
Trong đó
)u(D
u
=
; t
p
- khoảng lệch chuẩn hoá ứng với mức sử dụng q.
Ta nhận thấy rằng chỉ tiêu đồng nhất Wincooson chỉ thích ứng với bài toán so
sánh hai mẫu (hai chuỗi quan trắc ) hoậc dùng để so sánh từng cặp mẫu của S điểm
quan trắc trên một vùng đợc giả thiết là đồng nhất.
Những khái quát hoá của chỉ tiêu này cho những trờng hợp số mẫu lớn hơn
hai là rất phức tạp và tốn công. Sự mong muốn có độ chính xác toán học làm cho

tính toán thống kê của các chỉ tiêu và giá trị tới hạn của nó trở nên rất phức tạp.
ĐIều đó làm khó khăn cho việc ứng dụng các chỉ tiêu này và làm cho chúng kém
hiệu quả. Thí dụ nh chỉ tiêu Kruxkal-Uolix chỉ có thể dùng đối với trờng hợp số
mẫu không lớn hơn ba (3) và dung lợng của các mẫu đó không nhiều hơn năm (5).
Ta sẽ minh hoạ việc sử dụng chỉ tiêu Wincooson để đánh giá tính đồng nhất
của dòng chảy lớn hơn trong năm nớc sông Volga - trạm iaroxlavl trong các thời
kỳ chảy tự nhiên (1877 - 1910) và đợc điều tiết (1941 - 1955).
Ta đem phân bố lu lợng lớn nhất của toàn bộ thời kì kì quan trắc đợc theo
trật tự giảm dần trong đó lu lợng nớc của thời kì từ 1941 đến 1955 đợc đa vào
trong dấu ngoặc:
1160, 1080, 1060, 976, 966, 960, 948, 931, 928, 92, 906, 906, 886, 881, 881,
875, 863, 859, 854, 850, 850, 813, 811, 809, 805, 803, 800, 781, 752, 723, 716, 694,
683, 669, 866, 662, 659, 638, 634, 630, 629, 626, 610, 605, 592, 589, 581, 577, 575,
564, 555, 551, 551, 52, 474, (459) , 453, 423, 419, 416, 416, 406, 367, (330), (210),
(198), (193), (188), (182), (177), (163), (154), (148), (140), (133), (122).
Ta tính số lợng nghịch thế:
u = 57.1 + 64.14 = 953
Theo các công thức (4.4) và (4.5) tìm đợc M(u) và D(u):

480
2
15.64
)u(M ==


206
6400)11564(
12
15.64
)u(M =++==

806400)u(D
u
===

Ta xác định miền tới hạn cho giả thuyết không, nghĩa là sự đồng nhất sự phân
phối các trị bình quân dòng chảy lớn hơn nớc sông Volga - trạm Iaroxlav trớc và
sau khi xây dựng nhà máy thuỷ điện Rubinxkaia. Ta cho mức sử dụng bằng 1% và
theo bảng tính sẵn cho công trình [89] tìm đợc tp = 2,58 khi p = 0,05 vì xét giới
hạn tin cậy hai đầu. Theo các phơng trình (4.7) và (4.8) ta nhận dợc các miền tới
hạn đối với:


68680.58,2480u
27480.58,2480u
=+
=
Giá trị u = 953 vừa nhận dợc nằm trong miền tới hạn, vì vậy trị bình quân
mẫu của dòng chảy lớn nhất trớc và sau khi xây dựng nhà máy thuỷ điện
Rubinxkaia thuộc các tổng thể khác nhau.
Sự đánh giá hai trị bình quân mẫu cùng thuộc một tổng thể có thể thực hiện
theo chỉ tiêu dấu. Cũng nh trờng hợp trên coi trị bình quân mẫu của hai chuỗi
cùng thuộc một tổng thể làm giả thuyết không. Trong trờng hợp này, các hiệu số x
i

- y
i
=R
i
, trong đó chỉ xét dấu của chúng, cần phải đấu nối quanh số không. Xác suất
xuất hiện dấu cộng hoặc dấu trừ đều bằng 1/2. Vì vậy, khoảng lệch của hiệu số quan

trắc dợc (chỉ xét dấu của chúng ) khác 1/2 thì giả thuyết không không đợc thực
hiện. Giá trị tới hạn của một số ít trờng hợp khoảng lệch dơng hoặc âm đợc tính
theo công thức :

1Nk
2
1N
m
k,N
+

= (4.9)
Trong đó N - số hạngcủa các chuỗi đem so sánh ; k - giá trị lấy theo bảng đặc
biệt ứng với mức sử dụng trong [89] .
Thực tế sử dụng chỉ tiêu này khá đơn giản. Song cần phải thấy rằng nó không
sử dụng toàn bộ lợng thông tin trong các chuỗi quan trắc đợc vì nó chỉ xét dấu của
hiệu hai giá trị. Chỉ tiêu này có u điểm là đơn giản và không có hạn chế nào về luật

207
phân phối của các chuỗi nghiên cứu. Khi sử dụng chỉ tiêu này các chuỗi quan trắc
đợc đem so sánh cần phải có dung lợng.
Ta sẽ so sánh tài liệu về độ cao lớp tuyết phủ theo quan điểm đồng nhất
chúng và có sử dụng chỉ tiêu dấu
Trong bản đo vẽ lớp tuyết phủ tiến hành đồng thời ngoài đồng và trong rừng
đã đo đợc độ cao của lớp tuyết phủ ở 120 điểm. So sánh các chuỗi đó ta thấy có 26
trờng hợp độ cao lớp tuyết phủ ngoài đồng lớn hơn trong rừng k
N
(+) còn 76 trờng
- nhỏ hơn k
N

(-).
Theo công thức (4.9) ta xác định đợc giá trị tới hạn đối với số ít các trờng
hợp (26).

41110298,0
2
1102
I
Nk


=
Trong trờng hợp không đồng nhất
k,m)(k
N


còn khi các chuỗi đồng nhất
k,m)(k
g
N

k
Trong trờng hợp này k
N
(+) = 26, còn
41m
k,N
=
, cho nên các chuỗi độ cấp

lớp tuyết phủ ở ngoài đồng và trong rừng là không đồng nhất.
Còn một số chỉ tiêu không tham số cụ thể khác về tình hình đồng nhất chúng
ta sẽ không xét, vì chúng đã đợc phân tích khá đầy đủ trong công trình [137]. ở
đây ta chỉ nhấn mạnh rằng khi sử dụng nhiều chỉ tiêu đồng nhất phải dẫn đến một
kết luận duy nhất vì chúng phụ thuộc rất nhiều vào nhau. Trong các chỉ tiêu đó, chỉ
tiêu hiệu nghiệm nhất là chỉ tiêu sử dụng đầy đủ lợng thông tin gốc và dựa vào các
điều kiện bổ xung tài liệu gốc (các chỉ tiêu tham số) ; các chỉ tiêu kém hiệu nghiệm
hơn. Nhng đơn giản hơn chủ yếu là yêu cầu ít hơn đối với các điều kiện của lợng
thông tin gốc ( các chỉ tiêu không tham số ). Sự phân tích khá đầy đủ và có hệ thống
các chỉ tiêu đồng nhất đã đợc tiến hành chẳng hạn nh trong cuốn sách của Van-
đen Var-đen [31].

208
Trong thực tế nghiên cứu thuỷ văn ngời ta thờng yêu cầu đánh giá tính
đồng nhất của số lớn trị bình quân để làm cơ sở cho việc kết hợp đứng đắn nhiều
mẫu cụ thể vào một chuỗi .
Trong các trờng hợp đó, ngoài việc xác định tính đồng nhất của trị bình
quân còn cần phải đánh giá tính đồng nhất của các hệ số biến đổi và hệ số không đối
xứng.
Chính trong trờng hợp này, vấn đề đợc giải quyết là có sự khác nhau giữa
các trị bình quân mẫu , hay chỉ là những dao động ngẫu nhiên của trị bình quân do
các mẫu có đúng lợng ngắn.
Để làm chỉ tiêu chúng ta sử dụng mối quan hệ tuân theo luật phân phối
Student có số bậc tự do k = n - 2.

2
m
m
mymn
)2n(my

t


=
(4.10)
Trong đó
m
m
m
x;
xx
y


=
- trị bình quân mẫu tính theo m giá trị quan
trắc đợc ,là khoảng lệch lớn nhất so với trị bình quân của tất cả chuỗi liên kết,
x
-
trị bình quân của tất cả chuỗi gồm n giá trị quan trắc đợc;


= ;mn
i
-
khoảng lệch quân phơng theo tài liệu của tất cả các chuỗi.
Để đặc trng cho tính đồng nhất của trị bình quân mẫu
m
x
, thông thờng

ngời ta chọn giá trị y
m
lớn nhất nếu tham số t trong trờng hợp y
m
này rơi vào miền
các giá trị cho phép ứng với mức sử dụng q cho trớc thì tất cả các trị bình quân x
m

đợc coi là đồng nhất. Trong trờng hợp ngợc lại, giá trị lớn nhất đó đợc coi là
không đồng nhất đối với tất cả chuỗi tài liệu, và khi cần thiết phải nghiên cứu tính
đồng nhất của giá trị x
m
lớp tiếp sau.
ứng dụng chỉ tiêu này vào đành giá tình đồng nhất của một số chuỗi cần phải
đánh giá sơ bộ tính đồng nhất của phơng sai.
Để làm thí dụ, chúng ta xét tính đồng nhất của các chuỗi đặc trng lợng trữ
nớc trong lớp tuyết phủ ở những miền rừng trong lu vực sông sêlôn đo đạc ở 5
tuyến. Trên mỗi tuyến đo 8 điểm.

209
Bảng 4.1Trị bình quân và phơng sai lợng trữ nớc trong tuyết của các
tuyến đo.
Tuyến đo 1 2 3 4 5
Trị bình quân x
i
,mm 113 104 107 95 102
Phơng sai, mm
2
509 718 957 676 1129
Trị bình quân và phơng sai lợng trữ nớc trong tuyến trên mỗi tuyến đo đã

đợc trình bày ở bảng 4.1.
Trị bình quân cho tất cả các chuỗi theo (1.6) bằng 104 mm.
Phơng sai chung có thể xác định theo công thức (1.18) dạng.

2
k
1i
2
)i(
k
1i
2
i
2
chung
mm850
k
)xix(
k
=

+

=

==

Ta tính đợc giá trị
30,0
29

104113
xx
y
chung
m1
m
=

=


=

và chỉ tiêu Student
71,0
30,0.5540
)240(530,0
t
2
=


=

Theo bảng trong công trình [89] ta tính đợc giá trị tới hạn ứng với mức sử
dụng 5% t = 1,96. Giá trị của chỉ tiêu t = 0,71 là nhỏ hơn giá trị tới hạn ứng với mức
sử dụng 5% cho nên các trị bình quân của những chuỗi nghiên cứu là đồng nhất.
Việc đánh giá tính đồng nhất của phơng sai của các chuỗi đó đợc trình bày
ở phần sau đây.
4.1.4. Những chỉ tiêu đánh giá tính đồng nhất của độ lệch quân phơng.

Nh đã thấy ở trên, khi đánh giá tính đồng nhất của mẫu trị bình quân theo
phơng pháp Student nhất thiết phải chứng tỏ độ lệch quân phơng của chính các
tổng thể đó, mà đại biểu các mẫu dới dạng các chuỗi thuỷ văn, là bằng nhau. Khi ta

210
kết hợp các chuỗi thuỷ văn hay tham số của chúng vào một chuỗi hoặc đôi khi,
chẳng hạn nh, cần phải làm rõ phải chăng sự điều tiết dòng chảy làm thay đổi độ
lệch quân phơng của chuỗi v.v nhất thiết phải có sự phân tích nh vậy.
Ngày nay nh đã biết không ít chỉ tiêu đánh giá tính đồng nhất của khoảng
lệch quân phơng. Trong thuỷ văn ngời ta chỉ sử dụng một số ít trong các chỉ tiêu
đó, và thờng hay dùng là chỉ tiêu Fisher dới dạng :
2
2
y
x
F


=
(4.11)
Trong đó
x

y
các khoảng lệch quân phơng tính theo các chuỗi, mà đợc
giả thuyết là tuân theo luật phân phối chuẩn. Tình trạng đó đã đợc thu hẹp phần
nào khả năng của chỉ tiêu này. Song chỉ tiêu Fishen thờng đợc dùng khi tính
không đối xứng của các chuỗi không lớn.
ở tử số của biểu thức (4.11) là khoảng lệch quân phơng lớn nhất trong hai
chuỗi đem nghiên cứu phân phối Fisher phụ thuộc vào số bậc tự do k

1
= n
1
- 1 và k
2

= n
2
- 2 ; trong đó n
1
và n
2
- số số hạng trong mỗi chuỗi nghiên cứu.
Để xác định những giá trị tới hạn F
k
ta sử dụng bảng phân phối Fisher đã
đợc trình bày chẳng hạn trong công trình [89].
Chỉ tiêu đang xét này là chỉ tiêu tham số, vì nó yêu cầu các khối gốc phải
tuân theo luật phân phối chuẩn.
Trong số chỉ tiêu không tham số ta có thể kể đến chỉ tiêu Xigel và Takei. Nội
dung chỉ tiêu này đã đợc phân tích trong cuốn sách [137] .
ở mục tiêu trớc ta đã xét một thí dụ nghiên cứu tính đồng nhất của trị bình
quân dòng chảy năm sông Volga trạm iarỗlavl trớc và sau khi xây dựng kho nớc
Rubinski (1940) theo chỉ tiêu Student trong đó có sử dụng giả thuyết khoảng lệch
quân phơng của các chuỗi nghiên cứu là bằng nhau. Ta nhớ lại là trong thời kỳ
quan trắc từ năm 1877 đến năm 1940 khoảng lệch quân phơng
75600
y
=


từ năm 1941 đến năm
còn
721001955 cầu xác nhận sự khác nhau nhận
đợc giữa các giá trị khoảng lệch quân phơng mẫu là thực hay có thể là do những
x
= yêu

211
dao động ngẫu nhiên của các mẫu có dung lợng hữu hạn trong tổng thể gây nên. Ta
lấy
22
x
=
thuyết không.
y
làm giả
Để đánh giá tính đồng nhất của khoảng lệch quân phơng ta sử dụng chỉ tiêu
này. Theo công thức (4.1) ta tính đợc :

05,1
72100
75600
F ==
Chỉ tiêu này tuân theo phân phối Fisher có số bậc tự do k
1
= 64 - 1 = 63 và k
2

= 15 - 1 = 14. Cho bảng phân phối r[89] khi q = 10 và 2% ta định đợc miền tới hạn
F

th
, mad đối với k = 63 đợc nội suy giữ các giá trị k
1
= 50 và k
1
= 75, với mức sử
dụng 10% F
10%
= 2,23, với mức sử dụng2%; F
2%
=3,18. Vì vậy giá trị mẫu r = 1,05
nằm trong miền các giá trị cho phép ứng với bất kỳ mức sử dụng nào đó mà ta chọn,
vì thế giả thiết về sự bằng nhau giữa các khoảng lệch quân phơng là không mâu
thuẫn với tài liệu dòng chảy năm quan sát đợc ở sông Volga - trạm Iarôxlav.
Ta cũng sử dụng chỉ tiêu F để đánh giá tính đồng nhất của khoảng lệch quân
phơng lu lợng lớn nhất trong năm nớc sông Volga - trạm Iarôrlav trớc và sau
khi xây dựng kho nớc điều tiết dòng chảy mùa Rbinskj.
Khoảng lệch quân phơng lu lợng lớn nhất trong giai đoạn 1877 - 1940 là
3354000
1
= còn trong giai đoạn từ năm 1941-1955 là 795200
2
= Theo
công thức (4.11) ta nhận đợc:
22,4
795200
3354000
F ==
Để làm giả thuyết không ta lấy
1

=
2
, còn giả thuyết chệch lấy
1

2
. Do
số lợng của chuỗi trong mỗi thời kỳ cũng đúng nh đối với dòng chảy năm, nên ta
có k
1
= 63 và k
2
= 14. Vì vậy những giá trị tới hạn F
th
khi mức sử dụng bằng 10 và
2% cũng tơng tự nh thí dụ trên là F
10%
= 2,23 và F
2%
= 3,18.
Giá trị nhận đợc của chỉ tiêu F bằng 4,22 ngay cả khi mức sử dụng là 2%
nằm trong miền tới hạn (Fth<F). Từ đó, ta rút ra là khoảng lệch quân phơng thực
nghiệm nhận đợc từ những tổng thể khác nhau không thể coi là đồng nhất đợc.
Nói một cách khác giả thuyết ở trên bị loại, mà chấp nhận giả thuyết chệch vè tính

212
không đồng nhất của khoảng lệch quân phơng dòng chảy lớn nhất nớc sông Volga
- trạm Iarôrlavl trớc và sau khi xây dựng nhà máy thuỷ điện Rbinskcia.
Khi phân tích tài liệu thuỷ văn, thông thờng phải đánh giá đồng nhất các
khoảng lệch quân phơng của một số các chuỗi quan trắc.

Chỉ tiêu đơn giản kiểm tra tính đồng nhất của một khoảng lệch quân phơng
ta có thể sử dụng chỉ tiêu G
2
đợc biểu diễn bằng quan hệ:

2
k
1
2
2
1
max
2

G
+++

=
(4.12)
trong đó
max
- khoảng lệch quân phơng lớn nhất trong các khoảng lệch
quân phơng thực nghiệm
1
,
2
,
k
- các khoảng lệch quân phơng tính theo các
chuỗi tài liệu quan trắc đợc.

Chỉ tiêu đồng nhất này ta sử dụng đối với các chuỗi nghiên cứu có cùng dung
lợng. Trong cuốn khả cổ [89] đã trình bày phân phối chỉ tiêu G
t
2
với k mẫu và số
hạng trong mỗi mâu là n ứng với các mức sử dụng là 5 và 1%. Miền tới hạn là G
t
2
.
h

<G
2
.
Thí dụ sử dụng chỉ tiêu (4.12) để đánh giá tính đồng nhất của phơng sai
lợng trữ nớc trong các lớp tuyết phủ theo tài liệu đã trình bày ở bảng 4.1.

28,0
1129676967218590
1129
2
=
+
+
++
=G

Với mức sử dụng 5% giá trị tới hạn G
2
= 0,46, giá trị vừa nhận đợc của chỉ

tiêu G
2
=0,28 rơi vào miền các giá trị cho phép, và vì vậy phơng sai của các chuỗi
nghiên cứu là thống nhất.
Cuối cùng ta sẽ sử dụng chỉ tiêu khác nhau để đánh giá tính đồng nhất đối
với cùng một tài liệu về dòng chảy lớn nhất. Việc xác định lu lợng lớn nhất trong
năm ứng với xác suất vợt cho trớc là nằm trong số những bài toán rất phổ biến
trong tính toán thuỷ văn. Trong trờng hợp này, khi chuỗi gốc không có nghi ngờ gì
về tính đồng nhất của các giá trị chứa trong nó, bài toán này giải bằng cách dựa vào
toàn bộ mẫu có đợc mà xây dựng đờng tần suất. Tình trạng này có thể có, nếu nh

213
chuỗi tài liệu bao gồm các giá trị đồng nhất về pha đối với lũ mùa xuân hoặc ngợc
lại hoàn toàn thuộc về phạm trù lũ do ma.
Điều đó tất nhiên là đúng khi không có những nguyên nhân khác phá hoại
trạng thái đồng nhất của tài liệu gốc (thí dụ nh sự điều tiết dòng chảy bằng kho
nớc hoặc những tác động khác theo một hớng).
Song có những trờng hợp hay gặp là trên cùng một tuyến đo, lu lợng lớn
nhất trong năm có những năm đợc hình thành do tuyết tan, có những năm là do
ma. Sự khác nhau của điều kiện hình thành đó có thể tạo nên tính không đồng nhất
về mặt thống kê của chuỗi tài liệu gốc quan trắc đợc. Điều đó làm phức tạp hoá bài
toán xây dựng dờng tần suất theo các mẫu, vì vậy mà những hàm phân phối lý luận
xét ở chơng II cũng nh tất cả những hàm phân phối lý luận nói chung, đều đợc
dùng mô tả các chuỗi thống kê đồng nhất.
Trong những trờng hợp cụ thể (tất nhiên không chỉ đối với mẫu thống kê lu
lợng lớn nhất) khi không có sự tin cẩytên nghiên cứu về tính đồng nhất của tài
liệu gốc thì phải đánh giá tính đồng nhất của chúng. Trong trờng hợp nếu giả
thuyết đồng nhất không đợc chấp nhận đờng tần suất lại phù hợp tất cả chuỗi
(không đồng nhất có thể nhận đợc bằng cách xếp chồng những phân đồng nhất hai,
ba có thể nhiều hơn ) đợc tách ra từ các chuỗi không đồng nhất. Trong phơng

pháp xây dựng đờng tần suất đó sẽ đợc phân tích ở phần sau của chơng này.
Để làm thí dụ ta sẽ xét lu lợng lớn nhất nớc sông Xtri - trạm Turk và
sông Alava - trạm Xixien đã đợc trình bày ở bảng 4.2. Từ những tài liệu đó ta thấy
lu lợng lớn nhất ở những tuyến nghiên cứu có những năm đợc hình thành do
tuyết tan mùa xuân (đánh dấu bằng dấn ngoặc đơn), còn những năm khác là do
ma. Với đặc trng đó mỗi mẫu có thể tách ra làm 2 phần. Đối với sông Xtri lu
lợng lớn nhất trong 43 năm quan trắc đợc có 24 lần đợc hình thành trong thời kỳ
mùa xuân và 19 lần trong thời kỳ hè thu đối với sông Abava lu lợng lớn nhất
trong năm do tuyết tan mùa xuân quan trắc đợc 20 lần còn 15 lần là do ma.
Đối với các chuỗi đã đựoc tách ra lu lợng lớn nhất mùa xuân và hè thu các
thám số của phân phối đã đợc tính toán và trình bày trong bảng 4.3.
Ta sẽ làm sang tỏ những giá trị tham số vừa nhận đợc thuộc các chuỗi đồng
nhất hay không đồng nhất.

214
Bảng 4.2 Số liệu gốc vê lu lợng dòng chảy lớn nhất trong năm s.Xtri và
S.Abava - trạm Xixien.
SXtri - trạm Turk F = 897 km
2
SXtri - trạm Turk F = 897 km
2
Năm Qmax (m
3
/s) Ngày tháng Năm Qmax (m
3
/s) Ngày tháng
1907
1908
1909
1910

1913
1914
1916
1917
1918
1922
1923
1924
1925
1926
1927
1928
1929
1931
1932
1933


1927
1928
1929
1930
1931
1932
1933
1934
1935
1936
1937
1938

1939
1940
1941
1942

(248)
(215)
(296)
(108)
335
(143)
239
(114)
281
(174)
88,4
(446)
268
385
515
(238)
222
222
(330)
239



(137)
183

105
179
(316)
(207)
146
103
291
(107)
(155)
57,8
89,1
(191)
(188)
(303)
30/IV
4/III
24/III
24/II
3/VIII
11/III
19,22/VII
1/IV
9/I
3/III
6/VI
25/III
28/VI
24/X
31/VIII
30/III

14/VII
26/IX
5/IV
8/VII
5/XI


8/III
20/V; 22/VI
20/XI
8/VIII
24/IV
9/IV
17/III
21/I
23/II
14/III
25/III
6/II
11/II
15/IV
16/IV
12/IV
1934
1935
1936
1937
1938
1939
1942

1944
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
1960
1943
1944
1945
1946
1947
1948
1950
1951
1952
1953
1954
1955
1956
1957

1958
1959
1960
1961
1962
(198)
(150)
119
239
(222)
198
(114)
(222)
(93)
(299)
395
(359)
(77,3)
(137)
(396)
155
(108)
(206)
(143)
190
213
121
108

61,0

(125)
(119)
(164)
(146)
235
89,4
(306)
(149)
(158)
62,6
172
(258)
94,6
(174)
(79,6)
88,6
101
(242)
12/III
12/IV
23/I
20/VIII
10/III
13/VI
20/IV
18/VI
6/IV
23/II
17/VII
8/IV

28/2
15/III
2/IV
1/I
5/III
25/III
15/IV
23/VI
23/IX
4/VIII
28/VII
18/II
11/V
4/IV
24/III
1/IV
4/II
16/XI
9/IV
12/IV
27/III
22/I
1/V
26/IV
21/IV
18/IV
9/III
7/XII
7/XII
8/IV

Chú thích: trong dấu ngoặc là lu lợng lớn nhất nớc lũ mùa xuân

215
Sử dụng chỉ tiêu Fisher ta đánh giá tính đồng nhất các khoảng lệch quân
phơng đối với sông Xtri

02,1
9777
9988
F
2
mu
a
2
muaxuan
=


=

Đối với sông Abava

00,1F
2
mu
a
2
muaxuan




=

Miền tới hạn đối với chuỗi lu lợng lớn nhất trong sông Xtri với mức sử
dụng 5% bằng F
5%
= 2,07; lấy theo bảng tính sẵn trong công trình [89] với số bậc tự
do đối với phơng sai lớn bằng k
1
= n
1
- 1=18 đối với phơng sai lớn bằng k
2
=n
2
-
1=23.
Bảng 4.3Các tham số của các mẫu thống kê lu lợng lớn nhất lũ tuyết tan và
lũ do ma .
S.Ktrui - trạm Turk; s.Abava - Trạm Xixien
Pha

x x
Lũ mùa xuân
Lũ mùa ma
210
244
89,9
99,8
184

128
66,7
66,6
Đối với chuỗi lu lợng lớn nhất trong năm sông Abava miền tới hạn bằng
k
5%
= 2,26 với k
1
= 14 và k
2
= 19. Trong cả hai trờng hợp những giá trị của chỉ tiêu
F rới vào trong miền tới hạn ứng với mức sử dụng 5% điều lớn nhất giá trị ta vừa
nhận đợc. Điều đó nghĩa là trong trờng hợp này chỉ tiêu đồng nhất rơi vào miền
những giá trị cho phép. Vì vậy, giả thuyết không ban đầu thừa nhận lu lợng lớn
trong năm do lũ mùa xuân và lũ do ma có phơng sai đồng nhất, trong trờng hợp
này không có gì mâu thuẫn vỡi tài liệu quan trắc có thể chấp nhận hơn nữa cho đến
nay những tài liệu thực nghiệm mới lại khẳng định phủ định đó.
Bây giờ ta chuyển sang đánh giá tính đồng nhất của trị bình quan của các
chuỗi nghiên cứu, trong đó ta nhận thấy rằng trong các chuỗi nghiên cứu không có
tơng quan nội tại và tơng quan giữa các chuỗi vừa đợc tách ra của dòng chảy lớn
nhất do ma và dòng chảy lớn nhất do lũ mùa xuân đối với mỗi tuyến nghiên cứu.

216
Để giải quyết vấn đề đồng nhất của trị bình quân ta sẽ sử dụng chỉ tiêu
Student. Khi sử dụng chỉ tiêu này nh đã rõ ở trên, yêu cầu cần phải đảm bảo đồng
nhất phơng sai của tính chuẩn của luật phân phối của các chuỗi tài liệu gốc.
Điều kiện đồng nhất của phơng sai đã đợc xác minh ở trên. Điều kiện
chuẩn của luật phân phối có thể kiển tra bằng các chỉ tiêu phù hợp giữa phân phối
thực nghiệm và lý luận, mà ta sẽ xét ở bài 3 của chơng này. ở đây ta chỉ nhấn
mạnh rằng việc sử dụng các chỉ tiêu không tham số không phụ thuộc vào dạng các

phân phối gốc, xác nhận những kết luận nhận đợc theo chỉ tiêu Student. Điều đó
chứng minh rằng: trong trờng hợp này sự lệch so với luật chuẩn là không cơ bản,
để ảnh hởng đến kết quả cuối cùng trong đánh giá tính đồng nhất của trị bình quân
bằng cách sử dụng chỉ tiêu Student.
Ta tính chỉ tỉêu Student cho sông Xtri - trạm Turk.

09,1
1924
)21924(19.24
9,99.199,98.24
210244
nn
)2nn(nn
nn
xy
t
22
yx
yxyx
2
yy
2
xx

+
+
+

=
+

+
+

=
và sông Abava trạm Xixien

35,2
1520
)21520(15.20
4455.154439.20
128184
t =
+
++
+

=

ở đây x - ký hiệu lu lợng lớn nhất lũ mùa xuân, còn y - lu lợng lớn nhất
lũ mùa ma.
Giá trị tới hạn của chỉ tiêu Student với mức sử dụng 5% và số bậc tự do k =
n
1
+n
2
- 2 bằng tq, k=1,96.
Nh vậy giá trị tính toán đợc của chỉ tiêu t đối với sông Xtri rơi vào miền
cho phép [t] < tq,k (1,09<1,96), còn đối với sông Abava chỉ tiêu tính đợc rơi vào
miền tới hạn [t] >tq, k (2,35>1,96).
Vì vậy, giả thuyết đồng nhất trị bình quân lu lợng nớc lớn nhất của lũ

mùa xuân và lũ do ma đối với sông Xtri - trạm Turk đã đợc xác nhận, còn đối
với sông Abava trạm Xixien đã bị loại và chấp nhận giả thuyết - chệch. Tính không
đồng nhất đó là do các điều kiện hình lũ mùa xuân và lũ do ma khác nhau.

217

×