Tải bản đầy đủ (.pdf) (133 trang)

Nghiên cứu mô hình hồi quy gamma bậc 1 GAR(1) ứng dụng trong lãnh vực thủy văn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.31 MB, 133 trang )

iii

BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG

NGUYỄN VĂN HƢNG

NGHIÊN CỨU MÔ HÌNH HỒI QUY
GAMMA BẬC 1 [GAR(1)]
ỨNG DỤNG TRONG LÃNH VỰC THUỶ VĂN

LUẬN ÁN TIẾN SĨ KỸ THUẬT

Đà Nẵng - Năm 2016


iv

BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG

NGUYỄN VĂN HƢNG

NGHIÊN CỨU MÔ HÌNH HỒI QUY
GAMMA BẬC 1 [GAR(1)]
ỨNG DỤNG TRONG LÃNH VỰC THUỶ VĂN

Chuyên ngành: Khoa học máy tính
Mã số: 62.48.01.01

LUẬN ÁN TIẾN SĨ KỸ THUẬT



Ngƣời hƣớng dẫn khoa học:
1. PGS.TSKH. Trần Quốc Chiến
2. GS.TS. Huỳnh Ngọc Phiên

Đà Nẵng - Năm 2016


iii

LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong Luận án là trung thực và chƣa từng đƣợc
ai công bố trong bất kỳ công trình nào khác.

Tác giả Luận án

NGUYỄN VĂN HƢNG


iv

MỤC LỤC
LỜI CAM ĐOAN .................................................................................................... iii
MỤC LỤC ................................................................................................................ iv
DANH MỤC CÁC KÍ HIỆU ................................................................................. vii
DANH MỤC CÁC BẢNG ...................................................................................... x
DANH MỤC CÁC HÌNH ..................................................................................... xiii
MỞ ĐẦU ................................................................................................................... 1
1. Đặt vấn đề.............................................................................................................. 1

2. Mục tiêu nghiên cứu ............................................................................................. 3
3. Đối tƣợng và phạm vi nghiên cứu ....................................................................... 4
4. Phƣơng pháp nghiên cứu ...................................................................................... 5
5. Những đóng góp của đề tài .................................................................................. 6
6. Bố cục của Luận án............................................................................................... 7
CHƢƠNG 1: TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU ................................. 8
1.1. MỘT SỐ VẤN ĐỀ CƠ BẢN CỦA LÝ THUYẾT XÁC SUẤT................... 8
1.1.1. Đại lƣợng ngẫu nhiên và luật phân phối ....................................................... 8
1.1.2. Các đặc trƣng số của đại lƣợng ngẫu nhiên ................................................ 13
1.2. PHÂN PHỐI GAMMA .................................................................................. 16
1.2.1. Hàm mật độ xác suất của phân phối gamma .............................................. 16
1.2.2. Các đặc trƣng số của phân phối gamma...................................................... 18
1.3. MÔ HÌNH HỒI QUY GAMMA BẬC 1 [GAR(1)] ..................................... 18
1.3.1. Mô hình GAR(1) .......................................................................................... 19
1.3.2. Ƣớc lƣợng các tham số của mô hình GAR(1) ............................................ 20
1.3.3. Thuật toán mô phỏng với mô hình GAR(1) ............................................... 22
1.4. SINH BIẾN NGẪU NHIÊN THEO MÔ HÌNH GAR(1) ............................ 23
1.5. BÀI TOÁN MÔ PHỎNG LƢU LƢỢNG DÒNG CHẢY ........................... 26
1.6. BÀI TOÁN DUNG TÍCH HỒ CHỨA .......................................................... 30


v

KẾT LUẬN CHƢƠNG 1 ...................................................................................... 32
CHƢƠNG 2: CÁC THUẬT TOÁN SINH BIẾN NGẪU NHIÊN GAR(1)...... 34
2.1. NGHIÊN CỨU MỘT SỐ THUẬT TOÁN DÙNG ĐỂ SINH BIẾN
NGẪU NHIÊN GAR(1)......................................................................................... 34
2.1.1. Thuật toán sinh biến ngẫu nhiên có phân phối đều liên tục ....................... 35
2.1.2. Thuật toán sinh biến ngẫu nhiên có phân phối mũ ..................................... 36
2.1.3. Thuật toán sinh biến ngẫu nhiên có phân phối chuẩn ................................ 37

2.1.4. Thuật toán sinh biến ngẫu nhiên có phân phối Poisson ............................. 38
2.1.5. Thuật toán sinh biến ngẫu nhiên có phân phối gamma .............................. 40
2.2. ĐỀ XUẤT THUẬT TOÁN SINH BIẾN NGẪU NHIÊN GAMMA VỚI

a
GIÁ TRỊ BẤT KỲ CỦA THAM SỐ HÌNH DẠNG ...........................................
47
2.3. ĐỀ XUẤT BỔ SUNG TIÊU CHÍ ĐÁNH GIÁ HIỆU QUẢ CỦA
THUẬT TOÁN SINH BIẾN NGẪU NHIÊN ...................................................... 47
2.4. MÔ PHỎNG THỰC NGHIỆM...................................................................... 48
2.4.1. Phƣơng pháp mô phỏng ............................................................................... 48
2.4.2. Kết quả mô phỏng ........................................................................................ 50
KẾT LUẬN CHƢƠNG 2 ...................................................................................... 58
CHƢƠNG 3: MÔ PHỎNG LƢU LƢỢNG DÒNG CHẢY VỚI QUÁ
TRÌNH NGẪU NHIÊN GAR(1) .......................................................................... 61
3.1. BÀI TOÁN MÔ PHỎNG LƢU LƢỢNG DÒNG CHẢY ........................... 61
3.2. MÔ HÌNH THOMAS-FIERING ................................................................... 62
3.3. PHƢƠNG PHÁP FRAGMENTS .................................................................. 64
3.4. ĐỀ XUẤT CÁC MÔ HÌNH MÔ PHỎNG LƢU LƢỢNG DÒNG
CHẢY HÀNG THÁNG VỚI QUÁ TRÌNH NGẪU NHIÊN GAR(1) .............. 65
3.4.1. Mô hình GAR(1)-Monthly........................................................................... 65
3.4.2. Mô hình GAR(1)-Fragments ....................................................................... 68
3.5. MÔ PHỎNG THỰC NGHIỆM...................................................................... 70


vi

3.5.1. Số liệu và phƣơng pháp mô phỏng .............................................................. 70
3.5.2. Kết quả mô phỏng ........................................................................................ 71
KẾT LUẬN CHƢƠNG 3 ...................................................................................... 83

CHƢƠNG 4: DUNG LƢỢNG TRUNG BÌNH CỦA HỒ CHỨA VỚI
DÒNG VÀO LÀ QUÁ TRÌNH NGẪU NHIÊN GAR(1) ................................. 86
4.1. DUNG LƢỢNG CỦA HỒ CHỨA ................................................................ 87
4.1.1. Phƣơng trình tính dung lƣợng hồ chứa tổng quát ....................................... 87
4.1.2. Dung lƣợng trung bình của hồ chứa với dòng chảy vào là các biến ngẫu
nhiên độc lập ........................................................................................................... 88
4.2. PHÂN TÍCH LÝ THUYẾT............................................................................ 89
4.2.1. Các đặc trƣng số cơ bản của tổng các biến ngẫu nhiên GAR(1) ............... 90
4.2.2. Biểu thức xấp xỉ của dung lƣợng trung bình hồ chứa với dòng chảy vào
là các biến ngẫu nhiên GAR(1) .............................................................................. 94
4.3. MÔ PHỎNG THỰC NGHIỆM...................................................................... 95
4.3.1. Số liệu và phƣơng pháp mô phỏng .............................................................. 95
4.3.2. Kết quả mô phỏng ........................................................................................ 97
KẾT LUẬN CHƢƠNG 4 .................................................................................... 105
KẾT LUẬN ........................................................................................................... 106
DANH MỤC CÁC TÀI LIỆU THAM KHẢO
CÁC BÀI BÁO KHOA HỌC TÁC GIẢ ĐÃ CÔNG BỐ
PHỤ LỤC


vii

DANH MỤC CÁC KÍ HIỆU
: tham số hình dạng của phân phối gamma
[ ]

: phần nguyên của tham số hình dạng
: lƣu lƣợng lịch sử của năm
: lƣu lƣợng lịch sử của tháng j năm


[ ][

]

: mảng lƣu lƣợng lịch sử hàng tháng của

năm lịch sử

: tham số tỉ lệ của phân phối gamma
: hệ số hồi quy trong mô hình Thomas-Fiering
: hàm số xác định trong thuật toán sinh biến ngẫu nhiên có
phân phối Poisson
: tham số vị trí của phân phối gamma
: hiệp phƣơng sai (moment tƣơng quan) của



: biến ngẫu nhiên trong mô hình GAR(1)
∼E(0,1)

: biến ngẫu nhiên

có phân phối mũ đơn vị

: kỳ vọng của biến ngẫu nhiên
: dung lƣợng trung bình của hồ chứa
: dung lƣợng trung bình của hồ chứa với biến ngẫu nhiên chƣa
đƣợc chuẩn hóa
: hàm số xác định trong thuật toán sinh biến ngẫu nhiên có
phân phối Poisson

: ƣớc lƣợng của
: độ lệch của mẫu thống kê
: ƣớc lƣợng không lệch của
GAR

: hồi quy gamma (gamma autoregressive)

GAR(1)

: hồi quy gamma bậc 1 (the first-order gamma autoregressive)

GAR(1)-F

: GAR(1) phân mảnh (GAR(1)-Fragments)


viii

GAR(1)-M

: GAR(1) hàng tháng (GAR(1)-Monthly)

IMGAG

: cải tiến thuật toán sinh biến ngẫu nhiên gamma của Minh
(improvement of Minh’s gamma generator)
: dòng chảy vào hồ chứa (năm )
: ƣớc lƣợng của
: lƣợng thiếu hụt của tổng riêng
: giá trị trung bình của mẫu thống kê

: ƣớc lƣợng không lệch của
: lƣợng dƣ thừa của tổng riêng
: fragment của tháng năm
: kích thƣớc mẫu mô phỏng
: kích thƣớc mẫu thống kê
: dòng chảy ra khỏi hồ chứa (năm )
: biến ngẫu nhiên có phân phối Poisson
: lƣu lƣợng của năm
: giá trị trung bình của chuỗi lƣu lƣợng lịch sử hàng năm
: giá trị trung bình của chuỗi lƣu lƣợng lịch sử theo tháng
: lƣu lƣợng của tháng năm

[ ][

]

: mảng lƣu lƣợng sinh hàng tháng cho

năm

: ƣớc lƣợng của
: hệ số tƣơng quan giữa tháng

và tháng

lƣợng lịch sử
: hệ số tƣơng quan của mẫu thống kê
: hệ số tƣơng quan bậc
: biên độ dao động của dung lƣợng hồ chứa
: ƣớc lƣợng không lệch của


của chuỗi lƣu


ix

: ƣớc lƣợng của
: độ lệch chuẩn của chuỗi lƣu lƣợng lịch sử theo tháng
: độ lệch chuẩn của mẫu thống kê
: ƣớc lƣợng không lệch của
: tổng của biến ngẫu nhiên
Th.Fiering

: Thomas-Fiering
: biến ngẫu nhiên trong mô hình Thomas-Fiering

∼U(0,1)

: biến ngẫu nhiên

có phân phối đều đơn vị

: biến ngẫu nhiên
: biến ngẫu nhiên GAR(1)
: biến ngẫu nhiên
,

: biến ngẫu nhiên
: phƣơng sai của biến ngẫu nhiên


∼N(0,1)

: biến ngẫu nhiên

có phân phối chuẩn tắc

: cực đại của giá trị trung bình
: hàm gamma
: kỳ vọng
: độ lệch chuẩn
: hằng số = 3.14159
: hệ số hồi quy trong mô hình GAR(1)


x

DANH MỤC CÁC BẢNG
Số hiệu

Tên bảng

bảng
2.1.

Trang

Thời gian (mili giây) sinh 10.000 số ngẫu nhiên gamma
theo thuật toán IMGAG, thuật toán MARSAGLIA và
thuật toán AHRENS


2.2.

50

Giá trị trung bình của 10.000 số ngẫu nhiên gamma đƣợc
sinh theo thuật toán IMGAG, thuật toán MARSAGLIA và
thuật toán AHRENS

2.3.

50

Phƣơng sai của 10.000 số ngẫu nhiên gamma đƣợc sinh
theo thuật toán IMGAG, thuật toán MARSAGLIA và
thuật toán AHRENS

2.4.

51

Hệ số lệch của 10.000 số ngẫu nhiên gamma đƣợc sinh
theo thuật toán IMGAG, thuật toán MARSAGLIA và
thuật toán AHRENS

2.5.

52

Hệ số tƣơng quan của 10.000 số ngẫu nhiên gamma đƣợc
sinh theo thuật toán IMGAG, thuật toán MARSAGLIA và

thuật toán AHRENS

2.6.

53

Thời gian (mili giây) sinh 10.000 số ngẫu nhiên gamma
theo thuật toán IMGAG, thuật toán MARSAGLIA và
thuật toán TADIKAMALLA

2.7.

54

Giá trị trung bình của 10.000 số ngẫu nhiên gamma đƣợc
sinh theo thuật toán IMGAG, thuật toán MARSAGLIA và
thuật toán TADIKAMALLA

54


xi

2.8.

Phƣơng sai của 10.000 số ngẫu nhiên gamma đƣợc sinh
theo thuật toán IMGAG, thuật toán MARSAGLIA và
thuật toán TADIKAMALLA

2.9.


55

Hệ số lệch của 10.000 số ngẫu nhiên gamma đƣợc sinh
theo thuật toán IMGAG, thuật toán MARSAGLIA và
thuật toán TADIKAMALLA

2.10.

56

Hệ số tƣơng quan của 10.000 số ngẫu nhiên gamma đƣợc
sinh theo thuật toán thuật toán IMGAG, thuật toán
MARSAGLIA và thuật toán TADIKAMALLA

57

3.1.

Danh sách các trạm đo có dữ liệu đƣợc sử dụng

71

3.2.

Các tham số thu đƣợc sau khi điều chỉnh độ lệch và đƣợc
sử dụng trong mô hình GAR(1)-Fragments

3.3.


72

Tham số hình dạng của phân phối gamma đƣợc sử dụng
trong mô hình GAR(1)-Monthly và mô hình ThomasFiering

3.4.

72

Hệ số tƣơng quan của các chuỗi lƣu lƣợng dòng chảy lịch
sử

73

3.5.

Giá trị trung bình tại trạm đo Nông Sơn

73

3.6.

Giá trị trung bình tại trạm đo Thạnh Mỹ

74

3.7.

Giá trị trung bình tại trạm đo Yên Bái


75

3.8.

Độ lệch chuẩn tại trạm đo Nông Sơn

76

3.9.

Độ lệch chuẩn tại trạm đo Thạnh Mỹ

77

3.10.

Độ lệch chuẩn tại trạm đo Yên Bái

78

3.11.

Hệ số lệch tại trạm đo Nông Sơn

79

3.12.

Hệ số lệch tại trạm đo Thạnh Mỹ


80

3.13.

Hệ số lệch tại trạm đo Yên Bái

81


xii

3.14.

Các đặc trƣng số thống kê hàng năm tại trạm đo Nông
Sơn

3.15.

82

Các đặc trƣng số thống kê hàng năm tại trạm đo Thạnh
Mỹ

83

3.16.

Các đặc trƣng số thống kê hàng năm tại trạm đo Yên Bái

83


4.1.

Giá trị dung lƣợng trung bình của hồ chứa với trƣờng hợp
hệ số hồi quy

4.2.

và hệ số lệch g

100

và hệ số lệch g

101

và hệ số lệch g

102

Giá trị dung lƣợng trung bình của hồ chứa với trƣờng hợp
hệ số hồi quy

4.8.

99

Giá trị dung lƣợng trung bình của hồ chứa với trƣờng hợp
hệ số hồi quy


4.7.

và hệ số lệch g

Giá trị dung lƣợng trung bình của hồ chứa với trƣờng hợp
hệ số hồi quy

4.6.

98

Giá trị dung lƣợng trung bình của hồ chứa với trƣờng hợp
hệ số hồi quy

4.5.

và hệ số lệch g

Giá trị dung lƣợng trung bình của hồ chứa với trƣờng hợp
hệ số hồi quy

4.4.

97

Giá trị dung lƣợng trung bình của hồ chứa với trƣờng hợp
hệ số hồi quy

4.3.


và hệ số lệch g

và hệ số lệch g

103

Giá trị dung lƣợng trung bình của hồ chứa với trƣờng hợp
hệ số hồi quy

và hệ số lệch g

104


xiii

DANH MỤC CÁC HÌNH
Số hiệu

Tên hình

hình

Trang

1.1.

Đồ thị hàm phân phối của đại lƣợng ngẫu nhiên rời rạc

10


1.2.

Đồ thị hàm phân phối của đại lƣợng ngẫu nhiên liên tục

10

1.3.

Xác suất của đại lƣợng ngẫu nhiên

12

1.4.

Đồ thị của các đƣờng cong phân phối với các độ nhọn
khác nhau

1.5.

16

Đồ thị hàm mật độ xác suất của phân phối gamma ứng với
tham số hình dạng a = 2, 3, 4, 5 và 10

17

1.6.

Sơ đồ mối quan hệ giữa các nội dung nghiên cứu


33

2.1.

Giá trị trung bình với các tham số hình dạng a

51

2.2.

Phƣơng sai với các tham số hình dạng a

52

2.3.

Hệ số lệch với các tham số hình dạng a

53

2.4.

Giá trị trung bình với các tham số hình dạng a: 1 < a ≤ 5

55

2.5.

Phƣơng sai với các tham số hình dạng a: 1 < a ≤ 5


56

2.6.

Hệ số lệch với các tham số hình dạng a: 1 < a ≤ 5

57

3.1.

Giá trị trung bình tại trạm đo Nông Sơn

74

3.2.

Giá trị trung bình tại trạm đo Thạnh Mỹ

75

3.3.

Giá trị trung bình tại trạm đo Yên Bái

76

3.4.

Độ lệch chuẩn tại trạm đo Nông Sơn


77

3.5.

Độ lệch chuẩn tại trạm đo Thạnh Mỹ

78

3.6.

Độ lệch chuẩn tại trạm đo Yên Bái

79

3.7.

Hệ số lệch tại trạm đo Nông Sơn

80

3.8.

Hệ số lệch tại trạm đo Thạnh Mỹ

81


xiv


3.9.

Hệ số lệch tại trạm đo Yên Bái

4.1.

Hệ số hồi quy

= 0.3, hệ số lệch g = 0.5

98

4.2.

Hệ số hồi quy

= 0.3, hệ số lệch g = 1.0

99

4.3.

Hệ số hồi quy

= 0.3, hệ số lệch g = 2.0

100

4.4.


Hệ số hồi quy

= 0.3, hệ số lệch g = 3.0

101

4.5.

Hệ số hồi quy

= 0.2, hệ số lệch g = 2.0

102

4.6.

Hệ số hồi quy

= 0.4, hệ số lệch g = 2.0

103

4.7.

Hệ số hồi quy

= 0.6, hệ số lệch g = 2.0

104


4.8.

Hệ số hồi quy

= 0.8, hệ số lệch g = 2.0

105

82


1

MỞ ĐẦU
1. Đặt vấn đề
Ngày nay ngành khoa học máy tính có vai trò rất quan trọng trong sự
phát triển của toàn cầu, đã tác động sâu sắc đến hầu hết các ngành, lĩnh vực
kinh tế xã hội. Trên thế giới đã có nhiều công trình trong lĩnh vực khoa học
máy tính nghiên cứu về Tin viễn thông, Tin y-sinh học đã và đang mang lại
hiệu quả to lớn cho đời sống con ngƣời, trong khi đó, các công trình nghiên
cứu về Tin thủy văn vẫn còn hạn chế.
Trong thực tế, nhiều bài toán trong lãnh vực thủy văn liên quan đến các
yếu tố bất định, vì vậy các quá trình ngẫu nhiên đƣợc nghiên cứu và áp dụng
cho các bài toán này. Sau khi Abraham de Moivre đề xuất phân phối chuẩn
vào năm 1734, các nhà khoa học quan tâm phát triển ứng dụng về xác suất
thống kê đã tập trung nghiên cứu các quá trình ngẫu nhiên và đề xuất nhiều
kiểu phân phối phục vụ cho mục đích mô phỏng các bài toán thực tế nhƣ:
phân phối đều, phân phối mũ, phân phối chuẩn, phân phối Poisson, phân phối
gamma hoặc nhiều kiểu phân phối khác. Với nhiều kiểu phân phối xác suất
đƣợc ứng dụng trong thực tế thì phân phối gamma đƣợc tập trung nghiên cứu

với nhiều kết quả có giá trị cả về lý thuyết và ứng dụng. Theo Fernandez và
Salas [16]; phân phối gamma đƣợc sử dụng để mô tả khoảng thời gian đến và
thời gian phục vụ trong lý thuyết hàng đợi, điều phối truyền thông, mô tả
dòng chảy trong thuỷ văn, nghiên cứu trong y-sinh học, thời gian sản xuất thử
nghiệm, kiểm soát dự trữ và nhiều lĩnh vực khác.
Trong những năm qua, các bài toán liên quan đến quá trình ngẫu nhiên
có phân phối gamma đƣợc nhiều nhà nghiên cứu quan tâm. Để làm cơ sở cho
việc nghiên cứu quá trình ngẫu nhiên có liên quan đến phân phối gamma và
quá trình ngẫu nhiên hồi quy gamma phụ thuộc, các thuật toán sinh biến ngẫu
nhiên đƣợc nghiên cứu áp dụng. Trong việc nghiên cứu các quá trình ngẫu


2

nhiên phức tạp, khi chƣa có phƣơng pháp lý thuyết thì phƣơng pháp mô
phỏng ngẫu nhiên trên máy tính có thể đƣợc sử dụng.
Các mô hình biểu thị mô phỏng lƣu lƣợng dòng chảy trong thuỷ văn
gồm các loại mô hình phi tham số và mô hình có tham số. Với giả thiết không
quan tâm đến kiểu phân phối xác suất của chuỗi lƣu lƣợng lịch sử, gần đây có
một số mô hình phi tham số đƣợc nghiên cứu đề xuất. Với giả thiết chuỗi lƣu
lƣợng lịch sử là độc lập hoặc phụ thuộc và có liên quan đến kiểu phân phối
xác suất thì các mô hình có tham số đƣợc áp dụng. Dựa vào chuỗi lƣu lƣợng
lịch sử quan trắc đƣợc tại các trạm đo thuỷ văn, các mô hình đƣợc áp dụng để
phát sinh chuỗi số liệu và đƣợc sử dụng trong việc dự báo, quy hoạch, thiết kế
và vận hành các dự án liên quan đến thuỷ văn. Yếu tố quan trọng để xác định
tính hiệu quả của các mô hình biểu thị mô phỏng lƣu lƣợng dòng chảy là
chuỗi số liệu đƣợc sinh bởi mô hình (có độ dài n đủ lớn) phải bảo toàn tốt các
đặc trƣng số thống kê cơ bản là giá trị trung bình, độ lệch chuẩn, hệ số lệch
và hệ số tương quan của chuỗi lƣu lƣợng lịch sử.
Các công trình nghiên cứu của Phatarfod [45], Fernandez và Salas [16]

xác định rằng lƣu lƣợng theo chuỗi thời gian của các dòng chảy trong thuỷ
văn thƣờng có độ lệch và phụ thuộc, và mô hình hồi quy gamma bậc 1- kí
hiệu là mô hình GAR(1) đƣợc Lawrance và Lewis [30] đề xuất là mô hình có
tham số đƣợc nghiên cứu áp dụng rất hiệu quả, đặc biệt, trong các nghiên cứu
về lƣu lƣợng dòng chảy hàng năm và dung tích hồ chứa. Cho đến nay, việc
nghiên cứu mô hình GAR(1) ứng dụng trong lãnh vực thủy văn vẫn còn hạn
chế.
Các nghiên cứu về hồ chứa tuỳ thuộc vào các trƣờng hợp hồ chứa có
dung tích hữu hạn, bán hữu hạn hoặc vô hạn. Một hồ chứa có dung tích hữu
hạn có thể có lƣợng nƣớc trong hồ tràn đầy hoặc cạn kiệt. Hồ chứa có dung
tích bán hữu hạn chỉ có thể có một trong hai trƣờng hợp hoặc tràn đầy hoặc


3

cạn kiệt. Đối với hồ chứa có dung tích vô hạn thì giả thiết rằng hồ chứa không
bao giờ tràn đầy hoặc kiệt nƣớc trong khoảng thời gian hoạt động của nó là n
năm. Đối với các hồ chứa có dung tích vô hạn, áp dụng việc phân tích biên độ
dao động của dung lƣợng hồ chứa đã đƣợc nghiên cứu rộng rãi trong nửa cuối
của thế kỷ trƣớc. Các nghiên cứu về hồ chứa bằng việc phân tích biên độ dao
động của dung lƣợng có ý nghĩa thực tế trong việc thiết kế các hồ chứa có
dung tích lớn (hàng trăm triệu m3) dẫn đến chi phí rất lớn để xây dựng. Do đó,
từ những năm cuối của thế kỷ 20, vấn đề này không đƣợc các nhà khoa học
tiếp tục nghiên cứu. Tuy nhiên, với sự biến đổi khí hậu toàn cầu hiện nay,
mƣa và khô hạn đều kéo dài dẫn đến thiên tai lũ lụt và hạn hán phổ biến ở
nhiều quốc gia, thực tế này đòi hỏi cần nghiên cứu xây dựng các hồ chứa có
dung tích lớn để điều tiết nguồn nƣớc hợp lý. Với yêu cầu thực tế hiện nay,
việc nghiên cứu biên độ dao động của dung lƣợng hồ chứa để phục vụ việc
thiết kế các hồ chứa có dung tích lớn cần đƣợc quan tâm.
Từ những vấn đề nêu trên, bằng phƣơng pháp luận, kỹ thuật mô phỏng

của chuyên ngành khoa học máy tính và mong muốn góp phần tích cực vào
thực hiện mục tiêu: Công nghệ thông tin thực sự trở thành nền tảng của
phƣơng thức phát triển mới, phát triển công nghệ thông tin của từng ngành,
lĩnh vực, Tác giả lựa chọn đề tài “NGHIÊN CỨU MÔ HÌNH HỒI QUY
GAMMA BẬC 1 [GAR(1)] ỨNG DỤNG TRONG LÃNH VỰC THUỶ
VĂN” nhằm góp phần phát triển về Tin thuỷ văn hiện nay và trong tƣơng lai.
2. Mục tiêu nghiên cứu
Từ các vấn đề nêu trên, mục tiêu nghiên cứu của Luận án bao gồm:
- Thứ nhất, nghiên cứu mô hình GAR(1), đánh giá và đề xuất các
phƣơng pháp sinh biến ngẫu nhiên theo mô hình GAR(1);
- Thứ hai, nghiên cứu và đề xuất các mô hình biểu thị mô phỏng lƣu
lƣợng dòng chảy với quá trình ngẫu nhiên GAR(1);


4

- Thứ ba, nghiên cứu mô phỏng và đề xuất phƣơng pháp tính dung
lƣợng trung bình của hồ chứa với dòng chảy vào hồ chứa là chuỗi các biến
ngẫu nhiên GAR(1).
3. Đối tƣợng và phạm vi nghiên cứu
3.1. Đối tượng nghiên cứu
Luận án đi sâu nghiên cứu mô hình GAR(1) và các ứng dụng của nó
trong lãnh vực thủy văn bao gồm các đối tƣợng nghiên cứu sau đây:
- Lý thuyết xác suất thống kê;
- Phƣơng pháp mô phỏng, các lƣợc đồ và thuật toán sinh biến ngẫu
nhiên;
- Các mô hình biểu thị mô phỏng lƣu lƣợng dòng chảy hàng tháng,
hàng năm;
- Bài toán tính dung lƣợng trung bình hồ chứa;
- Dữ liệu thực tế về lƣu lƣợng dòng chảy hàng tháng tại một số trạm đo

thuỷ văn.
3.2. Phạm vi nghiên cứu
Với đối tƣợng nghiên cứu nêu trên, để đáp ứng mục tiêu nghiên cứu,
Luận án xác định phạm vi nghiên cứu, cụ thể là:
- Một số vấn đề cơ bản về xác suất thống kê, phƣơng pháp mô phỏng
ngẫu nhiên, các thuật toán sinh các biến ngẫu nhiên có phân phối đều, phân
phối mũ, phân phối chuẩn, phân phối Poisson và phân phối gamma để từ đó
sinh các biến ngẫu nhiên theo mô hình GAR(1);
- Nghiên cứu bài toán mô phỏng lƣu lƣợng dòng chảy với quá trình
ngẫu nhiên GAR(1), nghiên cứu bài toán tính dung lƣợng trung bình hồ chứa
có dung tích vô hạn với dòng chảy vào hồ chứa là quá trình ngẫu nhiên
GAR(1);
- Thu thập số liệu về lƣu lƣợng dòng chảy thực tế tại trạm đo thuỷ văn


5

Nông Sơn trên sông Thu Bồn, trạm đo thủy văn Thạnh Mỹ trên sông Vu Gia
thuộc tỉnh Quảng Nam từ năm 1980 đến năm 2010 và trạm đo thủy văn Yên
Bái trên sông Thao thuộc tỉnh Yên Bái từ năm 1958 đến năm 2011;
- Sử dụng ngôn ngữ lập trình C để cài đặt các lƣợc đồ và thuật toán và
thực hiện mô phỏng trên máy tính.
4. Phƣơng pháp nghiên cứu
Phƣơng pháp luận cơ bản đƣợc sử dụng là nghiên cứu lý thuyết, nghiên
cứu thực tiễn và kế thừa các kết quả nghiên cứu của các tác giả trong và ngoài
nƣớc. Các phƣơng pháp nghiên cứu cụ thể sau đây đƣợc Tác giả sử dụng:
- Phƣơng pháp phân tích và tổng hợp lý thuyết: Phân tích các tài liệu
sẵn có từ các nguồn tài liệu liên quan đến đề tài. Tác giả nghiên cứu các tài
liệu về xác suất thống kê, các thuật toán sinh biến ngẫu nhiên có phân phối
đều, phân phối mũ, phân phối chuẩn, phân phối Poisson và phân phối gamma,

nghiên cứu các mô hình biểu thị mô phỏng lƣu lƣợng dòng chảy và phƣơng
pháp tính dung lƣợng của hồ chứa. Trên cơ sở đó, Tác giả hệ thống hóa thành
cơ sở lý luận để nghiên cứu và đề xuất các kết quả của Luận án;
- Phƣơng pháp mô phỏng: Dựa vào các lƣợc đồ, thuật toán sinh các
biến ngẫu nhiên, mô hình sinh các biến ngẫu nhiên GAR(1), các mô hình biểu
thị mô phỏng lƣu lƣợng dòng chảy, mô hình bài toán tính dung lƣợng trung
bình hồ chứa, Tác giả cài đặt các thuật toán để mô phỏng, từ đó thu đƣợc các
số liệu cần thiết để phục vụ việc phân tích và đánh giá;
- Phƣơng pháp thực nghiệm khoa học: Thực nghiệm khoa học là cơ sở
để Tác giả có thông tin, số liệu nhằm bổ sung cho phần lý luận. Thực nghiệm
khoa học đƣợc thực hiện thông qua việc sử dụng các giá trị khác nhau của các
tham số, thu thập số liệu thống kê thực tế về lƣu lƣợng dòng chảy lịch sử hàng
tháng qua các năm của một số trạm đo thủy văn và sử dụng các số liệu từ kết
quả mô phỏng. Tác giả tiến hành sắp xếp các số liệu thành một hệ thống logic


6

và khoa học, sau đó tính toán các đặc trƣng số thống kê, so sánh và tổng hợp
để làm cơ sở cho việc rút ra những nhận xét, đánh giá tính hiệu quả của những
phƣơng pháp, thuật toán và mô hình đƣợc đề xuất.
5. Những đóng góp của đề tài
Qua quá trình nghiên cứu thực hiện đề tài, những đóng góp chủ yếu
gồm:
- Đề xuất bổ sung tiêu chí và phƣơng pháp đánh giá tính hiệu quả của
các thuật toán sinh biến ngẫu nhiên có kiểu phân phối xác định là dựa vào kỹ
thuật mô phỏng và sử dụng thuật toán để sinh một chuỗi số ngẫu nhiên. Trên
cơ sở chuỗi số ngẫu nhiên thu đƣợc, kiểm tra tính độc lập của chuỗi số ngẫu
nhiên và đánh giá sự bảo toàn các đặc trƣng số cơ bản gồm kỳ vọng, phƣơng
sai và hệ số lệch của phân phối xác suất xác định;

- Đề xuất thuật toán IMGAG để sinh biến ngẫu nhiên gamma với giá trị
bất kỳ của tham số hình dạng (shape parameter) của phân phối gamma trên cơ
sở cải tiến thuật toán của Minh [39]. Mô phỏng và đánh giá thuật toán
IMGAG tốt hơn thuật toán đã đƣợc cài đặt trong thƣ viện GSL và phần mềm
Matlab “gamrnd” do Marsaglia và Tsang [36] đề xuất, đánh giá chọn lựa các
thuật toán thích hợp để sinh các biến ngẫu nhiên GAR(1);
- Phân tích lý thuyết và đạt đƣợc các biểu thức giải tích về các đặc
trƣng số kỳ vọng và phƣơng sai của tổng các biến ngẫu nhiên GAR(1).
- Đề xuất biểu thức xấp xỉ dùng để tính dung lƣợng trung bình của hồ
chứa với dòng chảy vào hồ chứa là quá trình ngẫu nhiên GAR(1) và so sánh
với kết quả mô phỏng.
- Đề xuất mô hình GAR(1)-Monthly và mô hình GAR(1)-Fragments
dùng để mô phỏng lƣu lƣợng dòng chảy hàng tháng. Đề xuất tính giá trị tuyệt
đối của hệ số tƣơng quan của chuỗi lƣu lƣợng lịch sử hàng tháng để loại trừ
trƣờng hợp hệ số hồi quy

âm khi áp dụng mô hình GAR(1)-Monthly, điều


7

này tạo khả năng cho mô hình GAR(1)-Monthly có thể đƣợc áp dụng rộng rãi
trong thực tế. Kiểm chứng tính hiệu quả của mô hình GAR(1)-Monthly và mô
hình GAR(1)-Fragments bằng việc mô phỏng với số liệu thực tế về lƣu lƣợng
dòng chảy tại các trạm đo thuỷ văn Nông Sơn, Thạnh Mỹ và Yên Bái.
6. Bố cục của Luận án
Ngoài phần Mở đầu, Kết luận, Tài liệu tham khảo và Phụ lục, Luận án
đƣợc kết cấu 4 chƣơng:
Chƣơng 1: Tổng quan tình hình nghiên cứu. Nội dung chƣơng này
trình bày nghiên cứu các tài liệu, các công trình lý thuyết và thực nghiệm đã

đƣợc công bố có liên quan đến những vấn đề về lý thuyết xác suất, các thuật toán
sinh biến ngẫu nhiên, các phƣơng pháp, mô hình biểu thị mô phỏng lƣu lƣợng
dòng chảy và các nghiên cứu về hồ chứa;
Chƣơng 2: Các thuật toán sinh biến ngẫu nhiên GAR(1). Nội dung
chƣơng này trình bày các thuật toán sinh các biến ngẫu nhiên GAR(1) và sử
dụng phƣơng pháp mô phỏng để đánh giá hiệu quả của các thuật toán;
Chƣơng 3: Mô phỏng lƣu lƣợng dòng chảy với quá trình ngẫu nhiên
GAR(1). Nội dung chƣơng này trình bày nghiên cứu về các phƣơng pháp mô
phỏng lƣu lƣợng dòng chảy trong lãnh vực thuỷ văn. Bằng phƣơng pháp mô
phỏng, các mô hình và các thuật toán đƣợc thử nghiệm và đánh giá về sự bảo
toàn các đặc trƣng số thống kê của chuỗi lƣu lƣợng dòng chảy lịch sử;
Chƣơng 4: Dung lƣợng trung bình của hồ chứa với quá trình ngẫu
nhiên GAR(1). Nội dung chƣơng này trình bày nghiên cứu về bài toán tính
dung lƣợng trung bình của hồ chứa. Các kết quả đạt đƣợc bằng phƣơng pháp
lý thuyết và mô phỏng thực nghiệm đƣợc phân tích và đánh giá.


8

CHƢƠNG 1
TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU
Để đáp ứng mục tiêu nghiên cứu của đề tài “Nghiên cứu mô hình hồi quy
Gamma bậc 1 [GAR(1)] ứng dụng trong lãnh vực thuỷ văn”, Tác giả nghiên cứu
các tài liệu, công trình về lý thuyết và thực nghiệm đã được công bố trong và
ngoài nước có liên quan đến những vấn đề nghiên cứu cơ bản về lý thuyết xác
suất (Kazakevit [22]), cơ sở mô phỏng ngẫu nhiên (Trần Lộc Hùng [68]), các
thuật toán sinh biến ngẫu nhiên, các phương pháp, mô hình biểu thị mô phỏng
lưu lượng dòng chảy hàng tháng, hàng năm và các nghiên cứu về hồ chứa. Trên
cơ sở nghiên cứu tổng quan, Tác giả rút ra những vấn đề còn hạn chế và định
hướng nhiệm vụ nghiên cứu của Luận án.

1.1. MỘT SỐ VẤN ĐỀ CƠ BẢN CỦA LÝ THUYẾT XÁC SUẤT
1.1.1. Đại lƣợng ngẫu nhiên và luật phân phối
Đại lƣợng ngẫu nhiên là đại lƣợng mà khi tiến hành một loạt phép thử
trong cùng một điều kiện nhƣ nhau có thể mỗi lần nhận đƣợc giá trị này hoặc
giá trị khác hoàn toàn không biết trƣớc đƣợc. Đại lƣợng ngẫu nhiên có 2 loại
bao gồm đại lượng ngẫu nhiên rời rạc và đại lượng ngẫu nhiên liên tục. Đại
lƣợng ngẫu nhiên rời rạc là đại lƣợng ngẫu nhiên mà mọi giá trị có thể của nó
có thể liệt kê ra đƣợc, tức là có thể đánh số thứ tự bằng tập các số tự nhiên.
Đại lƣợng ngẫu nhiên liên tục là đại lƣợng ngẫu nhiên mà mọi giá trị có thể
của nó phủ đầy một đoạn của trục số và do đó không thể đánh số thứ tự đƣợc.
Giả sử đại lƣợng ngẫu nhiên rời rạc
với xác suất

có thể nhận các giá trị

,

,…,

.

Khi đã liệt kê đƣợc mọi giá trị mà đại lƣợng ngẫu nhiên có thể có và
cho trƣớc xác suất mà mỗi giá trị của nó nhận, ta hoàn toàn xác định đƣợc đại
lƣợng ngẫu nhiên đó.
Hàm phân phối tích lũy

của đại lƣợng ngẫu nhiên

đƣợc định



9

nghĩa là xác suất để cho đại lƣợng ngẫu nhiên

nhận giá trị nhỏ hơn một số

nào đó:
(1.1)
ở đây

là ký hiệu xác suất của sự kiện
Nếu xem đại lƣợng ngẫu nhiên

.

nhƣ là vị trí của điểm trên trục số, thì

có nghĩa là xác xuất để điểm này nằm bên trái điểm .

giá trị của hàm

Sự lý giải hình học nhƣ vậy làm rõ các tính chất sau đây của hàm phân phối:
-

là hàm không giảm theo đối số, nghĩa là với
;

- (–


)

thì

là xác suất của sự kiện bất khả;

-

là xác suất của sự kiện tất yếu.

Đối với đại lƣợng ngẫu nhiên rời rạc, giá trị hàm phân phối



tổng xác suất pi mọi giá trị có thể xi nhỏ hơn x, tức là:


(1.2)

Từ đó thấy rằng, đồ thị hàm phân phối của đại lƣợng ngẫu nhiên rời rạc
là đƣờng bậc thang có các điểm gián đoạn tại xi và giá trị đột biến ở các điểm
đó bằng:
Hình 1.1 biểu diễn đồ thị hàm phân phối của đại lƣợng ngẫu nhiên là số
điểm xuất hiện khi gieo con xúc xắc. Trong trƣờng hợp này mỗi một giá trị
trong số các giá trị từ 1 đến 6 tƣơng ứng với cùng xác suất

.

𝐹 𝑥
1

5/6
4/6
3/6
2/6
1/6

0

1

2

3

4

5

6

Hình 1.1. Đồ thị hàm phân phối của đại lƣợng ngẫu nhiên rời rạc

𝑥


10

Đồ thị hàm phân phối của đại lƣợng ngẫu nhiên liên tục mà các giá trị
có thể của nó lấp đầy một đoạn [


,

] nào đó thƣờng là một đƣờng cong

liên tục tăng từ 0 đến 1 (hình 1.2).
𝐹 𝑥
1

0

𝑑

𝑑

𝑥

Hình 1.2. Đồ thị hàm phân phối của đại lƣợng ngẫu nhiên liên tục
Đại lƣợng ngẫu nhiên mà hàm phân phối của nó liên tục và khả vi là
đại lƣợng ngẫu nhiên liên tục.
Khi đã biết hàm phân phối có thể xác định đƣợc xác suất để đại lƣợng
ngẫu nhiên nhận giá trị trong khoảng cho trƣớc.
Xác suất
giá trị lớn hơn hoặc bằng
Xác suất

là xác suất mà đại lƣợng ngẫu nhiên
và nhỏ hơn

nhận


.

để cho đại lƣợng ngẫu nhiên nhận giá trị nhỏ hơn

có thể coi nhƣ tổng xác suất của hai đại lƣợng xung khắc:
(1.3)
Từ đó:
(1.4)
Nhƣ vậy, xác suất mà đại lƣợng ngẫu nhiên nhận giá trị trong khoảng
cho trƣớc, hoặc xác suất mà đại lƣợng ngẫu nhiên rơi vào khoảng cho trƣớc


11

bằng số gia của hàm phân phối trên khoảng đó.
Đối với đại lƣợng ngẫu nhiên liên tục có thể viết công thức (1.4) để tính
xác suất rơi vào một khoảng của đại lƣợng ngẫu nhiên dƣới dạng:
(1.5)
Đối với đại lƣợng ngẫu nhiên liên tục, hàm phân phối của nó liên tục và
khả vi nên có thể sử dụng đạo hàm của hàm phân phối với tƣ cách là luật phân
phối, đƣợc ký hiệu bằng

và:
(1.6)

đƣợc gọi là hàm mật độ phân phối xác suất hay mật độ phân

Hàm
phối.


Mật độ phân phối là đạo hàm của hàm không giảm
không âm, tức là

nên nó là hàm

với mọi .

Biểu diễn hàm phân phối

qua mật độ phân phối

rồi lấy tích

phân đẳng thức (1.6) trong khoảng từ – ∞ đến , ta nhận đƣợc:



(1.7)

, nên:


(1.8)

Từ các công thức (1.6) và (1.8) ta thấy rằng hàm phân phối và mật độ
phân phối biểu diễn đƣợc qua nhau và do đó đối với đại lƣợng ngẫu nhiên liên
tục chỉ cần một trong hai hàm phân phối hoặc hàm mật độ là đủ để đặc trƣng
cho nó.
Ðể đơn giản ký hiệu, khi biến số



,

thực, nghĩa là từ –

có các trị số trong khoảng [

, ngƣời ta thƣờng xem nhƣ
đến

],

có trị số trên toàn đƣờng số

∞ bằng cách xác định nhƣ sau:

khi


×