Tải bản đầy đủ (.pdf) (54 trang)

Kỹ thuật và quản lý hệ thống nguồn nước ( Đại học Quốc gia Hà Nội ) - Chương 6 pot

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.76 MB, 54 trang )



223
PhÇn
2
Kü thuËt
Vµ Qu¶n lý
cÊp níc


230



231
CHƯƠNG
6
Dự BáO
NHU CầU
DùNG NƯớC




6.1. Sử DụNG NƯớC Và Dự BáO
Sử dụng nớc có thể chia thành hai nhóm, nhóm ngành tiêu thụ nớc,
trong đó một phần nớc lấy từ các nguồn nớc tự nhiên nh nớc mặt hay
nớc ngầm không thể sử dụng đợc nữa bởi nó bị bốc hơi, do thoát hơi nớc
của thực vật, đa vào các sản phẩm công nghiệp và sản phẩm nông nghiệp,
hoặc sử dụng bởi con ngời và vật nuôi. Và nhóm ngành lợi dụng nớc, trong
đó nớc là phơng tiện cho một mục đích nào đó. Nhóm ngành tiêu thụ nớc


bao gồm đô thị, nông nghiệp, công nghiệp và khai thác mỏ. Nhóm ngành lợi
dụng nớc gồm có sử dụng nớc trong dòng chảy nh là thủy điện, vận tải và
giải trí. Từ góc nhìn kinh tế, chúng ta có khả năng lớn nhất trong việc mô hình
hóa các hình thức tiêu thụ nớc. Các hình thức tiêu thụ nớc đợc mô hình
hóa bằng các hàm tổn thất và các hình thức lợi dụng nớc đợc mô hình hóa
bằng các hàm sản lợng. Sử dụng nớc nói đến lợng nớc sử dụng để đạt
đợc các mục đích khác nhau, nh vậy nó là một khái niệm miêu tả. Nhu cầu
dùng nớc là danh mục của các lợng nớc đợc ngời sử dụng nớc sử dụng
trong mỗi đơn vị thời gian cho một giá nớc cụ thể, nó là một khái niệm phân
tích.
Sử dụng nớc cho đô thị có thể đợc chia thành các loại nh cho nhà riêng
(nhà và căn hộ), thơng mại (kinh doanh và cửa hàng), cơ quan (trờng học và
bệnh viện), công nghiệp, và các loại khác (công viên nớc, bể bơi, cứu hỏa).
Đối với sự phân phối nớc cho các loại sử dụng nớc này (hoặc các loại tiêu
thụ nớc), phải đợc thêm vào tổn thất do sự rò rỉ của hệ thống phân phối
nớc để quyết định lợng nớc xử lý (hoặc sản xuất); sau đó, thêm vào lợng
nớc hao phí do các quá trình xử lý, từ đó tính đợc lợng nớc lấy từ tất cả


232
các nguồn nớc, hoặc lợng nớc cấp, cho thành phố. Không giống nh nớc
sử dụng trong nông nghiệp, nơi mà nớc là đầu vào của một hệ thống sản
xuất, nớc sử dụng cho đô thị phần lớn là đáp ứng nhu cầu của con ngời mà
không có một hệ quả kinh tế trực tiếp.
Nớc sử dụng cho ngành công nghiệp nhẹ nằm trong loại nớc sử dụng
cho đô thị, nhng một số ngành công nghiệp cần nhiều nớc nên cần đợc
nhận biết và nghiên cứu riêng. Quan trọng nhất trong những ngành này là
nớc làm lạnh cho nhà máy phát điện dùng hơi nớc. Một số ngành sử dụng
nhiều nớc khác là lọc dầu, hóa chất và sản xuất thép, dệt, sản xuất thức ăn,
nghiền và các nhà máy giấy. Nớc sử dụng cho nông nghiệp gồm có nớc

dùng cho tới ruộng và cho chăm sóc động vật, cho động vật uống. Tới dùng
nhiều nớc nhất, có thể đợc phân loại thành tới ngập, tới phun, và tới nhỏ
giọt, tùy thuộc vào phơng pháp sử dụng.
Khả năng quản lý và vận hành các nhà máy cung cấp nớc đã có và sau đó
là lập kế hoạch và thiết kế các nhà máy cung cấp nớc mới liên quan đến khả
năng mô tả nớc sử dụng cho hiện tại và tơng lai. Thời đoạn dự báo có thể là
giờ, ngày, tuần, tháng, hoặc năm, phụ thuộc vào vấn đề cụ thể. Dự báo nhu
cầu dùng nớc thờng là dự báo nớc sử dụng trong tơng lai dựa trên nớc
sử dụng trớc đó và kinh tế xã hội, các thông số thời tiết của quá khứ, sử dụng
nớc hiện tại. Nhu cầu dùng nớc hoặc sử dụng nớc có thể biến đổi hằng giờ,
hằng ngày, hằng tháng, hằng mùa và hằng năm. Hình 6.1.1 minh họa sự phân
phối theo thời gian của lợng nớc sử dụng của ba thành phố của Mỹ. Các
thành phố khác nhau có các nhân tố khác nhau ảnh hởng đến sự sử dụng
nớc. Austin, Texas (hình 6.1.1a) cho thấy sự biến đổi theo mùa của sử dụng
nớc tơng tự nhau. Boca Raton, Florida (hình 6.1.1b) cho thấy sự biến đổi
theo mùa ít hơn so với Austin, Texas; tuy nhiên, có sự phát triển theo thời gian
trong số liệu của Florida. Xu hớng của Allentown, Pennsylvania (hình.
6.1.1c) lại khác; xu hớng phát triển rõ ràng đến khoảng 1976 1977, sau đó
giảm đi, điều này có thể phản ánh các xu thế kinh tế và xu thế dân c trong
bang.
Tất cả các nguồn cung cấp nớc hầu nh đợc lấy từ hai nguồn: nớc mặt
(ví dụ: sông, suối, hồ) và nớc ngầm. Ngời ta ớc lợng hàng ngày có hơn
bốn nghìn tỉ galông (tơng đơng khoảng 150 tỷ m
3
, 1 gallon = 0,00378533
m
3
) giáng thủy rơi trên 48 bang giáp nhau. Nớc Mỹ sử dụng khoảng 450 đến
700 tỉ galông mỗi ngày (1,7 tỷ đến 2,6 tỷ m
3

) tức là khoảng hơn 10% tổng
lợng giáng thủy (Dzurick, 1988). Phần lớn lợng giáng thủy tổng cộng,
khoảng 65%, trở lại khí quyển bởi bốc hơi và sự thoát hơi nớc của cây. Xét
về tổng thể tích của nớc mặt và nớc ngầm có thể dùng đợc, Mỹ có thể
đợc coi là một quốc gia nhiều nớc.
Dự báo là một ớc lợng các trạng thái tơng lai của một thông số, nó có
bốn biến số: số lợng, chất lợng, thời gian và không gian. Trong dự báo nhu
cầu dùng nớc, thông số quan trọng có thể là lợng nớc sử dụng trung bình
ngày, lợng nớc sử dụng nhiều nhất ngày, và các thông số khác. Trong thiết


233
kế và lập kế hoạch của dự án nớc, các nhân tố quan trọng nhất quyết định chi
phí dự án là lợng nớc cần để trữ, xử lý, phân phối, và lợng nớc thải cần
đợc thu gom, xử lý và loại bỏ mỗi năm. Đặc tính, kích thớc, và thời gian
hoạt động của các nhà máy nớc trong tơng lai phụ thuộc nhiều vào sự sử
dụng nớc trong tơng lai và sử dụng nớc trong tơng lai này phải đợc dự
báo. Bởi vậy, khả năng quản lý và vận hành các nhà máy nớc sẵn có và sau
đó là lập kế hoạch và thiết kế các nhà máy nớc mới trong tơng lai có liên
quan trực tiếp đến khả năng mô tả sử dụng nớc hiện tại và tơng lai.
Tơng lai có thể là giờ, ngày, tuần, tháng hoặc năm, phụ thuộc vào từng
vấn đề cụ thể. Do quy mô và tầm quan trọng của hầu hết các dự án nớc, nhu
cầu dùng nớc thờng đợc dự báo trong khoảng 15 25 năm đối với dự báo
hạn vừa và 50 năm đối với dự báo hạn dài. Dự báo không hoàn toàn là một
phơng pháp có tính khoa học, bởi có thể nói rằng, tơng lai không tồn tại
(Encel và các cộng sự, 1976).


234


Hình 6.1.1
Các xu thế sử dụng nớc tháng ở ba thành phố của Mỹ.
(Maidment và các cộng sự, 1985).


Nhu cầu dùng nớc đợc định nghĩa theo các thuật ngữ kinh tế có liên
quan với giá nớc. Nó không giống với khái niệm yêu cầu nớc (water
requirement) sử dụng trong phân tích khoa học. Các dự báo nhu cầu dùng
nớc nên đồng thời phản ánh sự thay đổi công nghệ trong các quá trình sản
xuất, sản phẩm đầu ra, nguyên liệu thô, xử lý nớc và các phơng pháp xử lý
nớc thải, thị hiếu xã hội, và các chính sách chung về sử dụng nớc và phát
triển. Các nhân tố này rất quan trọng trong dự báo hạn vừa và hạn dài. Mặt
khác, các kết quả dự báo có thể có giá trị nhất định trong việc đa ra quyết


235
định. Bởi vậy, các phơng pháp quá đơn giản nh ngoại suy tuyến tính của
nhu cầu dùng nớc quá khứ (còn đợc gọi là sự dự báo) thờng không thích
hợp cho dự báo hạn dài. Tuy nhiên, các phơng pháp này vẫn thích hợp cho
quản lý nớc trong thời kỳ khủng hoảng, thời kì mà thời gian dự báo ngắn.Do
sự thay đổi tự nhiên, liên tục của xã hội, kinh tế, và chính trị trong vùng nên
tồn tại nhiều điều không chắc chắn trong dự báo. Lỗi trong các dự báo sử
dụng nớc có thể do những giả định không phù hợp khi xác định các thông số
dự báo. Nó bao gồm dân số tơng lai, tổ hợp công nghiệp, và mối quan hệ
giữa các giá trị của các thông số mô hình, mức sử dụng nớc. Bất kể nguyên
nhân gì, lỗi trong dự báo tạo ra các chi phí kinh tế và chi phí môi trờng vợt
mức. Những chi phí này có thể tránh đợc bằng việc sử dụng những phơng
pháp dự báo tốt hơn. Hơn nữa, cải tiến phơng pháp dự báo nhu cầu dùng
nớc đợc dùng để giải thích cho: (1) sự gia tăng các mâu thuẫn giữa sử dụng
nớc và ngời sử dụng nớc; (2) tăng sự nhận thức về mối quan hệ qua lại

giữa các nguồn nớc khác nhau; và (3) tăng cơ hội và quy mô phát triển tài
nguyên nớc.
Sử dụng nớc tổng hợp là tổng của sự dùng nớc các hộ dùng nớc khác
nhau cho các mục đích khác nhau. Các phơng pháp tổng hợp thờng che đậy
tất cả nhng có mẫu xu thế chung. Lợi thế của việc sử dụng các phơng pháp
không tổng hợp là có thể đánh giá các tác động vào tổng nhu cầu do thay đổi
trong mỗi bộ phận.
6.2. Dự BáO Sử DụNG NƯớC CHO ĐÔ THị Và CÔNG
NGHIệP
6.2.1. Phân loại các phơng pháp
Dự báo nhu cầu sử dụng nớc đô thị là một nhiệm vụ quan trọng cho các
cơ quan khai thác và quản lý, bao gồm ba hoạt động có liên quan đến nhau.
Hoạt động thứ nhất là quản lý nguồn cung cấp có liên quan với dự báo nhu
cầu dùng nớc để có thể xác định quy mô, sắp xếp và định thời gian cho các
đầu t vào các nhà máy cung cấp nớc mới. Hoạt động có liên quan thứ hai là
quản lý nhu cầu dùng nớc, nó xác định ảnh hởng của việc lắp đặt đồng hồ
đo nớc, phát hiện rò rỉ, kiểm soát rò rỉ, sự thay đổi giá cả, các biện pháp bảo
tồn, và chế độ phân phối. Hoạt động thứ ba là quản lý nhu cầu nguồn cấp, nó
sử dụng các dự báo sử dụng nớc để hợp nhất và phối hợp nguồn cung cấp với
các chính sách quản lý nhu cầu.
Boland và các cộng sự (1981) phân các phơng pháp dự báo thành 3 loại:
(a) các phơng pháp hệ số đơn, chỉ có duy nhất một biến số; (b) các phơng
pháp đa hệ số, có nhiều hơn một biến số; và (c) các phơng pháp thống kê hay
các phơng pháp cây sự kiện (contigency tree methods). Bảng 6.2.1 so sánh
các phơng pháp dự báo khác nhau. Các biến giải thích là các biến đợc sử


236
dụng để giải thích nhu cầu dùng nớc, ví dụ nh dân số, giá cả, thu nhập và
lợng giáng thủy hàng năm.

PHƯƠNG PHáP Hệ Số ĐƠN: Những phơng pháp này bao gồm các
phơng pháp: bình quân đầu ngời, bình quân kết nối, và hệ số đơn vị sử
dụng. Thờng thì chỉ có dữ liệu về toàn bộ lợng nớc sản xuất cho một thành
phố cùng với số dân của thành phố là có thể có đợc, bởi vậy phơng pháp
bình quân đầu ngời đợc sử dụng. Trong những trờng hợp này, mối tơng
quan gần đúng đợc sử dụng để ớc lợng sử dụng nớc đô thị:
Q(t) = u(t)POP(t) (6.2.1)
Q(t) là sử dụng nớc trung bình ngày, POP(t) là dân số trong khoảng thời gian
t, và u(t) là sử dụng nớc trung bình ngày của mỗi ngời (gallons/ngời/ngày
hoặc lít/ngời/ngày). Sử dụng phơng trình (6.2.1), dân số POP(t) và lợng sử
dụng nớc trung bình mỗi ngời u(t) phải đợc ớc lợng hoặc dự đoán trớc.
Để tính đợc mức sử dụng nớc lớn nhất ngày, lớn nhất giờ, tỉ lệ sử dụng bình
quân nhận đợc từ phơng trình (6.2.1) đợc với hệ số tỷ lệ lớn nhất - trung
bình nằm trong khoảng 1,5 tới 3,0,
Phơng pháp bình quân đầu ngời đợc sử dụng rất rộng rãi; tuy nhiên, nó
có những thiếu sót nghiêm trọng nh hầu hết các ứng dụng dự báo khác
(Boland và các cộng sự, 1981) bởi vì nó bỏ qua rất nhiều các nhân tố ảnh
hởng tới sử dụng nớc. Đó là loại nhà, diện tích nhà, khí hậu, các hoạt động
thơng mại, thu nhập, giá cả Những tiêu chí chính của Các nguyên tắc và
hớng dẫn của Hội đồng tài nguyên nớc quốc gia Hoa Kỳ (1983) chỉ ra rằng
các nhân tố ảnh hởng này cần phải đợc tính đến, và phơng pháp phân chia
các nghành dùng nớc chính hay là sự phân chia sử dụng nớc bởi các khu
vực sử dụng nớc chủ yếu cũng nên đợc sử dụng trong dự báo. Cả hai tiêu
chí trên đều cha đợc thực hiện trong phơng pháp bình quân đầu ngời. Để
cải tiến phơng pháp bình quân đầu ngời, hệ số sử dụng nớc trung bình mỗi
ngày u(t) có thể phát triển cho nhiều loại sử dụng nớc khác nhau. Các hệ số
cũng có thể phân chia theo khu vực địa lý hay theo mùa.
Nh một biến thể của phơng pháp bình quân đầu ngời, nớc cung cấp
cho thành phố hay cộng đồng có thể ớc lợng bằng phơng pháp bình quân
kết nối (per connection method):


1
1
( ) ( ) ( )
n
i i
i
Q t C t W t






(6.2.2)
trong đó Wi(t) là sử dụng nớc bình quân đầu ngời hoặc bình quân kết nối
nớc của sử dụng nớc loại i, Ci(t) là số kết nối tới hệ thống phân phối nớc
của loại i,
i = 1, 2, , n, và

là hiệu suất
(0 1)


ứng với lợng nớc rò rỉ và tổn thất
trong quá trình xử lý. Đối với một hệ thống đợc quản lý tốt thì

= 0,9.



237
Phơng pháp trung bình kết nối (số kết nối hoặc khách hàng) thờng có
thuận lợi là dễ dàng có đợc các dữ liệu lịch sử về số lợng kết nối. Về cơ bản
thì phơng pháp này có những u điểm và nhợc điểm nh của phơng pháp
bình quân đầu ngời. Một phơng pháp một biến số mô tả khác là phơng
pháp hệ số đơn vị sử dụng (unit use coefficient method). Ví dụ về đơn vị sử
dụng là nớc sử dụng của mỗi công nhân trong công nghiệp và trong dự báo
nhu cầu dùng nớc thơng mại, bình quân nớc sử dụng trên mỗi đơn vị đất
canh tác của một vụ mùa trong dự báo nớc nông nghiệp. Những phơng pháp
này khi sử dụng trong một dự báo không tổng hợp, dự báo mà các biến quan
trọng không bị bỏ sót, có thể đợc cải tiến phù hợp với Các nguyên tắc và
hớng dẫn của Hội đồng tài nguyên nớc quốc gia Hoa Kỳ (US WRC, 1983).
Trong tất cả mọi trờng hợp, các phơng pháp một hệ số dựa vào sự dự đoán
biến số chính và hệ số đơn vị sử dụng trong tơng lai. Những phơng pháp
này cung cấp những kết quả dự báo hạn ngắn khá tin cậy nhng sự thiếu tin
cậy tăng lên trong các dự báo hạn dài.
PHƯƠNG PHáP ĐA Hệ Số: Những phơng pháp này có thể phân
loại thành mô hình yêu cầu (requirements models) và mô hình nhu cầu
(demand models). Mô hình yêu cầu gồm có biến vật lý và biến tâm lý, những
biến này tơng quan với sử dụng nớc nhng không nhất thiết bao gồm cả giá
nớc và hộ sử dụng hoặc thu nhập bình quân đầu ngời.Mô hình nhu cầu dựa
trên những lý luận kinh tế và chỉ bao gồm những biến tơng quan đáng kể với
sử dụng nớc và những biến đợc cho rằng có quan hệ nhân quả với sử dụng
nớc (Boland và các cộng sự, 1981). Ví dụ, mô hình nhu cầu gồm có giá và
thu nhập cộng với các biến mô tả khác.
Bảng 6.2.1
So sánh các phơng pháp dự báo (Boland và các cộng sự, 1983)
Các phơng pháp một hệ số Các phơng pháp đa hệ số
Các
phơng

pháp
thống kê

Bình
quân
đầu
ngời
Bình
quân
kết nối

Hệ số đơn vị
sử dụng
Mô hình yêu cầu

Mô hình nhu
cầu
Cây sự
kiện
Dễ dự báo, phù hợp
với Các nguyên tắc
và hớng dẫn
Không Không
Khi sử dụng
trong các dự
báo không
tổng hợp
Khi sử dụng trong
các dự báo không
tổng hợp

Khi sử dụng
trong các dự
báo không
tổng hợp

Dễ đánh giá các
biện pháp bảo vệ
nguồn nớc
Không Không
Khi sử dụng
trong các dự
báo không
tổng hợp
Khi sử dụng trong
các dự báo không
tổng hợp
Khi sử dụng
trong các dự
báo không
tổng hợp

Phù hợp với các
nghiên cứu ban đầu

Có Có Có
Không, quá phức
tạp
Không, quá
phức tạp
Không,

quá phức
tạp
Phù hợp với các
ứng dụng quy
hoạch dự án
Không Không
Khi sử dụng
trong các dự
báo không
tổng hợp
Khi sử dụng trong
các dự báo không
tổng hợp
Khi sử dụng
trong các dự
báo không
tổng hợp

Lợng dữ liệu cần
dùng
Rất ít Rất ít Vừa phải Vừa phải tới lớn
Vừa phải tới
lớn
Phụ thuộc
vào ứng
dụng


238
Độ khó của việc thu

thập dữ liệu
Thấp Thấp
Từ thấp tới
vừa phải
Vừa phải tới cao
Vừa phải tới
cao
Phụ thuộc
vào ứng
dụng
Nguồn: phỏng theo bảng III-2. trang III-35, trong Forecasting Assessment.
Một mô hình nhu cầu cho sử dụng nớc hàng năm có thể có dạng sau:

0 1 2
3 4
a a a
a a
Sử dụng nớc hàng năm = + (dân số) + (giá)
+ (thu nhập) + (giáng thủy năm)
(6.2.3)
Hoặc ở dạng phi tuyến tính:

3
1 2
4
0
( ( (
(
b
b b

b
bSử dụng nớc hàng năm = Dân số) giá) thu n
hập)
giáng thủy năm)
(6.2.4)
Số lợng và kiểu của biến mô tả sử dụng trong mô hình nhu cầu hoặc mô
hình yêu cầu biến đổi từ ứng dụng này đến ứng dụng khác. Các số liệu sẵn có,
độ chính xác yêu cầu, và điều kiện địa phơng tất cả đều có ảnh hởng tới số
lợng và kiểu của các biến mô tả. Khi ứng dụng trong các dự báo không tổng
hợp các phơng pháp đa hệ số phù hợp với những yêu cầu của Các nguyên tắc
và hớng dẫn của Hội đồng tài nguyên nớc quốc gia Hoa Kỳ (1983). Một lần
nữa, để dự báo sử dụng nớc trong tơng lai bằng phơng pháp đa hệ số, giá
trị trong tơng lai của các yếu tố ngẫu nhiên cần đợc dự báo bằng những
phơng pháp khác.
CáC PHƯƠNG PHáP CÂY Sự KIệN: Các phơng pháp này đề cập
đến những yếu tố thay đổi trong dự báo sử dụng nớc. Tiêu biểu là một nền
tảng dự báo đợc chuẩn bị bởi một trong các phơng pháp trên, và sau đó dự
báo đợc sửa đổi để phản ánh tổ hợp của các yếu tố thay đổi. Một xác suất
chung của mỗi tổ hợp các yếu tố thay đổi này đợc xác định cho liên kết với
dự báo sử dụng nớc.
Để chọn lựa một phơng pháp dự báo cần phải xem xét với ứng dụng dự
báo cụ thể. Hầu hết các phơng pháp có thể đợc sử dụng cho dự báo sử dụng
nớc tổng hợp hàng năm. Tuy nhiên, nếu dự báo sẽ đợc sử dụng trong thiết
kế của một hệ thống xử lý và phân phối nớc, thì sự ớc đoán chắc chắn về sử
dụng nớc lớn nhất ngày là cần thiết. Thiết kế của bể chứa nớc cung cấp có
thể yêu cầu các dự báo sử dụng nớc mùa hoặc tháng cộng với dự báo sử dụng
nớc năm. Một số ứng dụng dự báo khác có thể biểu hiện sự ảnh hởng ở các
mức độ khác nhau của phát triển kinh tế đối với sử dụng nớc. Trong loại ứng
dụng này, mô hình cần bao gồm cả các biến kinh tế cần thiết. Tóm lại, phơng
pháp dự báo cần sử dụng tốt nhất dữ liệu có đợc, từ đó cung cấp thông tin về

yêu cầu sử dụng nớc cho quá trình thiết kế sơ bộ.
6.2.2. Dạng chung của mô hình
Một mô hình về nhu cầu sử dụng nớc thông thờng có thể đợc biểu diễn
nh sau:


239

1 2
(. )
k
Q f x x x


(6.2.5)
trong đó f là hàm của các biến mô tả x
1
, x
2
x
k
, và là sai số ngẫu nhiên (biến
ngẫu nhiên) mô tả ảnh hởng chung lên Q của tất cả những yếu tố thay đổi mà
cha đợc đề cập đến rõ ràng bởi các biến mô tả xi. Sai số ngẫu nhiên đợc
cho là có kỳ vọng bằng 0, phơng sai là một hằng số, và các sai số tơng quan
có kỳ vọng của
i
.
j
bằng 0,

Đối với các ứng dụng thực tế, mô hình nhu cầu dùng nớc không có dạng
giải tích nh đã suy diễn mà thờng có tính chất cộng, nhân, hoặc cả hai tính
chất này. Mô hình nhu cầu điển hình thờng có dạng tuyến tính, lôgarít, bán
loga, lần lợt nh sau:

0 1 1


k k
Q a a x a x

(6.2.6)
hoặc

0 1 1
ln ln ln

k k
Q b b x b x

(6.2.7)
hoặc
0 1 1
ln ln

k k
Q c c x c x

(6.2.8)
Những dạng mô hình nhu cầu này cho phép ớc lợng dễ dàng các thông

số của mô hình, a
0,
a
k
, b
0,
b
k
, và c
0,
c
k
, bằng cách sử dụng phân tích hồi quy
với giả thiết các biến mô tả đợc xác định một cách độc lập từ các biến phụ
thuộc. Nếu các biến mô tả bao gồm các thứ nguyên khác của nhu cầu dùng
nớc thì điều kiện về sự độc lập trên không đợc thỏa mãn. Ví dụ, nếu lợng
nớc đòi hỏi và giá nớc đều đợc xác định trong cùng một tiến trình, thì đó
là một lỗi xác định đồng thời. Trong phần 6.3, lý thuyết về phân tích hồi quy
sử dụng phơng pháp sai số bình phơng nhỏ nhất để ớc lợng thông số mô
hình dựa trên bộ số liệu đã cho sẽ đợc giới thiệu.
6.2.3. Các loại dữ liệu
Để xây dựng đề cơng về mô hình nhu cầu dùng nớc, cần nhiều loại dữ
liệu khác nhau của các biến mô tả. Trong thực tế, các loại dữ liệu có sẵn quyết
định các biến nào có thể sử dụng đợc trong mô hình dự báo. Bảng 6.2.2 liệt
kê một số dữ liệu điển hình và các nguồn có thể có.
6.3. CáC MÔ HìNH HồI QUY DùNG CHO Dự BáO Sử DụNG
NƯớC
6.3.1. Khái niệm hồi quy dùng cho dự báo sử dụng nớc
Rất nhiều nghiên cứu kinh nghiệm trong các bài toán hệ thống nguồn
nớc có liên quan tới việc thiết lập mối quan hệ giữa các phản ứng của hệ

thống và các yếu tố tác động vào hệ thống. Ví dụ, các nhà thủy văn học
thờng liên kết các đặc điểm của dòng chảy mặt nh dòng chảy lớn nhất, hoặc


240
lợng dòng chảy mặt với các đặc điểm khí tợng và địa lý của lu vực nh
lợng ma, cờng độ giáng thủy, kích thớc lu vực, khu vực thành thị
Trong dự báo nhu cầu dùng nớc, các kỹ s tài nguyên nớc mong muốn xây
dựng một mô hình liên kết sử dụng nớc với các yếu tố tờng minh nh xã
hội, dân số, kinh tế và thủy văn. Tính từ "tờng minh" đợc sử dụng vì, trong
rất nhiều các nghiên cứu kinh nghiệm, mối quan hệ nhân quả không đợc
hiểu hoàn toàn thấu đáo. Tuy nhiên, sự phát triển của những quan hệ kinh
nghiệm giúp cho những nhà phân tích có những hiểu biết sâu sắc về hoạt động
của hệ thống.
Phân tích hồi quy thờng hay sử dụng phơng pháp thống kê để nghiên
cứu và mô hình hóa những quan hệ kinh nghiệm này. Nó đợc ứng dụng rộng
rãi hầu nh trong mọi lĩnh vực của kỹ thuật và khoa học. Để minh họa cho
khái niệm phân tích hồi quy, giả sử rằng các kỹ s của thành phố của Austin,
Texas phát triển một mô hình để dự báo sử dụng nớc trong tơng lai. Nhiệm
vụ đầu tiên là nhận biết các yếu tố có thể ảnh hởng đến sử dụng nớc có thể
có, nhng không chỉ giới hạn trong đó nh quy mô dân số, giá nớc, thu nhập
bình quân, và lợng giáng thủy hàng năm. Khi các yếu tố đã đợc xác định,
dữ liệu đợc thu thập cho các yếu tố khác nhau theo thời gian đợc trình bày
trong bảng 6.3.1. Có thể tởng tợng là tổng lợng nớc sử dụng hàng năm
cho Austin là kết quả tổng hợp các ảnh hởng của rất nhiều yếu tố. Để dùng
cho mục đích minh họa, phơng pháp bình quân đầu ngời đợc sử dụng để
nghiên cứu mối quan hệ giữa tổng lợng sử dụng nớc hàng năm với dân số.
Đơng nhiên, trực giác cho chúng ta biết sử dụng nớc hàng năm sẽ tăng
nh khi dân số tăng. Tuy nhiên, một câu hỏi hữu ích hơn là tại sao sử dụng
nớc thay đổi tơng ứng với quy mô dân số. Nếu mối quan hệ nh thế này có

thể đợc thiết lập, kỹ s và những ngời nghiên cứu quy hoạch thành phố có
thể dự đoán đợc lợng nớc sử dụng cho sự tăng trởng dân số biết trớc, để
có thể cung cấp nớc đầy đủ. Bớc đầu tiên để thiết lập mối quan hệ nh thế
này là vẽ biểu đồ phân bố: quy mô dân số (trên trục hoành) với lợng nớc sử
dụng tơng ứng (trên trục tung) nh hình vẽ 6.3.1. Các điểm trong hình vẽ
6.3.1 biểu hiện một mức độ phân tán, tuy nhiên, có thể nhìn thấy đợc một xu
thế hớng lên khá rõ ràng.
Bớc tiếp theo là xây dựng một hàm toán học để mô tả xu thế đi lên của sử
dụng nớc tơng ứng với quy mô dân số. Có thể giả thiết rằng sử dụng nớc,
Q, cho thành phố của Austin tơng quan tuyến tính với dân số của thành phố,
POP. Dân số này có thể đợc mô tả bởi phơng trình sau:

0 1
Q POP


(6.3.1)
trong đó

0
là giao điểm và
1
là độ dốc của đờng thẳng. Phơng trình (6.3.1)
là mô hình tất định mà trong đó sử dụng nớc (Q) đợc xác định đơn trị bởi
dân số (POP). Trong thực tế, các điểm dữ liệu trong hình 6.3.1 không chính
xác là nằm thẳng hàng, vì vậy phơng trình (6.3.1) đợc sửa thành:

0 1

Q POP



(6.3.2a)


241
hoặc:

0 1

y x


(6.3.2b)
trong đó y là Q, x là POP, và

là sai số giới hạn biểu thị sự khác nhau giữa sử
dụng nớc quan trắc (Q hay y) và giá trị ớc lợng bởi phơng trình đờng
thẳng
0 1
( )
POP


. Nói theo cách khác, sai số giải thích cho sự không hoàn
toàn đúng của mô hình đa ra với số liệu quan trắc. Nguyên nhân gây nên các
sai số này có thể nảy sinh do sai số đo đạc, mô hình không đầy đủ, và do ảnh
hởng của những yếu tố khác lên sử dụng nớc.
Phơng trình (6.3.2) là một mô hình hồi quy tuyến tính. Biến y đợc gọi
là biến phụ thuộc (hoặc kết quả) và biến x là biến độc lập (hoặc biến hồi

quy). Chính xác hơn, phơng trình (6.3.2) là mô hình hồi quy tuyến tính
đơn giản bởi vì nó chỉ có một biến độc lập. Sự mở rộng thờng thấy của
phơng trình (6.3.2) là có nhiều hơn một biến độc lập, nó đợc gọi là mô hình
hồi quy tuyến tính bội. Có thể đợc biểu diễn dới dạng:

0 1 1


k k
y x x


(6.3.3)
Khi mà dạng của mô hình đã đợc giả định, giai đoạn tiếp theo của phân
tích hồi quy là ớc lợng các hệ số hồi quy, những thông số cha biết của mô
hình. Sử dụng số liệu quan trắc cho các biến phụ thuộc và các biến độc lập.
Việc làm cho mô hình phù hợp với số liệu yêu cầu một tiêu chuẩn đo mức độ
phù hợp. Tiêu chuẩn thờng đợc sử dụng nhất dựa trên nguyên tắc bình
phơng nhỏ nhất, sẽ đợc mô tả ở sau. Trong giai đoạn ớc lợng thông số mô
hình, ngời phân tích cần nghiên cứu tỉ mỉ sự thích hợp của mô hình và chất
lợng của sự phù hợp. Bớc này là cần thiết để bảo đảm mô hình hồi quy hữu
ích trong thực tế và đúng với lý thuyết. Kiểm tra sự thích hợp của mô hình là
một bớc quan trọng để xác định mọi thiếu sót tiềm ẩn trong mô hình và có
thể dẫn tới thay đổi và cải tiến mô hình.
Phát triển một mô hình gồm một biến phụ thuộc và nhiều biến độc lập
(hay biến hồi quy) bằng phân tích hồi quy là một quá trình lặp đi lặp lại. Sự
thành công trong việc phát triển một mô hình hợp lý phụ thuộc rất lớn vào kỹ
năng của ngời phân tích: dịch mô hình và liên hệ hoạt động của mô hình với
tiến trình dới sự phân tích tỉ mỉ.
Trớc khi giải thích về mặt kỹ thuật, có một vài khái niệm quan trọng

trong phân tích hồi quy mà chúng ta cần biết. Các mô hình hồi quy thờng thì
không bao hàm một quan hệ nhân quả giữa các biến tham gia. Quan hệ nhân
quả giữa các biến nên đợc xác nhận bởi các dấu hiệu khác với những gì biểu
lộ từ bộ số liệu. Trong rất nhiều nghiên cứu kinh nghiệm, các kỹ s thờng có
đủ hiểu biết về quá trình và có khả năng lựa chọn các biến độc lập, các biến
này là các yếu tố nhân quả giúp tìm ra kết quả. Trong những trờng hợp nh
thế, phân tích hồi quy có thể đợc dùng để cung cấp các xác nhận về những
mối quan hệ nhân quả này. Phơng trình đợc xây dựng bằng phân tích hồi
quy chỉ là một phép tính xấp xỉ về các tơng quan phức tạp trong các quá trình


242
thực thế. Hơn thế nữa, tất cả các mô hình hồi quy chỉ chính xác trong miền dữ
liệu đã sử dụng trong phân tích. Các lỗi nghiêm trọng có thể phát sinh nếu áp
dụng một phơng trình hồi quy vào bộ số liệu ngoài miền giá trị của biến hồi
quy. Do đó, để nâng cao khả năng ứng dụng của mô hình hồi quy, ngời phân
tích nên thu thập số liệu tiêu biểu cho quá trình nghiên cứu.
Bảng 6.2.2
Loại dữ liệu và các nguồn có sẵn (Boland và các cộng sự, 1983)
Loại dữ
liệu
Các mục dữ liệu riêng Nguồn dữ liệu có sẵn
1. Dân số
a. Dân số, độ lớn của hộ
b. Dự báo dân số
Số liệu điều tra về dân số, số hộ của Mỹ; Các cục và sở quy hoạch; các
quyển niên giám thành phố và tỉnh; dân số bang; các quyển phát triển
kinh tế địa phơng và trung ơng; các công ty kinh tế; các niên giám
thống kê trung ơng và địa phơng; các dự báo khu vực OBERS.
2. Nhà

a. Số đơn vị nhà theo loại và theo giá trị
thị trờng; mật độ nhà; diện tích đất
trung bình; giá trị ớc tính.

Số liệu điều tra về dân số, số hộ của Mỹ. Số liều điề tra và đặc tính của
các hộ; Các cục và sở quy hoạch; các cơ quan đánh giá nhà đất; dân số
bang; các cục tài chính bang; các cục phát triển kinh tế bang và địa
phơng; hội đồng quy hoạch địa phơng; các công ty kinh tế; các dự
báo khu vực OBERS.
3. Việc
làm
a. Tổng việc làm trong các khu vực
công nghiệp chính; Việc làm phân chia
bởi chuẩn phân loại công nghiệp 3 và
4 con số; lịch sử tỉ lệ tăng trởng việc
làm địa phơng.
b. Các dự báo việc làm tổng hợp và
không tổng hợp (bởi SIC)*.
Số liệu điều tra về dân số của Mỹ; Các đặc chng chi tiết về kinh tế xã
hội; Tổng điều tra Mỹ: Các loại hình kinh doanh ở hạt; Tổng điều tra
các nhà sản xuất, dịch vụ Mỹ, , Các nhà thơng mại bán buôn; Tổng
quan hàng tháng về lao động; các tổ chức an toàn nghề nghiệp; Các
cục phát triển kinh tế trung ơng và địa phơng; các cơ quan kinh tế
trung ơng;các công ty kinh tế; các nhà máy sdản xuất địa phơng; các
ngành dịch vụ địa phơng; các dự báo khu vực OBERS.
4. Các
biến
kinh tế
khác
a. Chỉ số giá cả tiêu dùng; chỉ số giá xây

dựng; thu nhập cá nhân và gia đình.
b. Dự báo thu nhập.
Số liệu điều tra về dân số của Mỹ; Các đặc chng chi tiết về kinh tế xã
hội; Tổng điều tra Mỹ: Các loại hình kinh doanh ở hạt; Vụ thơng mại;
Tổng quan hàng tháng về lao động; các thống kê tóm tắt của bang và
quốc gia; Văn phòng thống lao động Mỹ; các công ty kinh tế; các dự
báo khu vực OBERS.
5. Khí hậu
Kiểu thời tiết địa phơng: lợng ma,
nhiệt độ, tốc độ bốc hơi, độ ẩm thiếu hụt
(bình thờng và các điều kiện tạm thời)
Cơ quan khí quyển và đại dơng quốc gia (NOAA); Trung tâm thời tiết
quốc gia; Các trạm thí nghiệm của các trờng đại học; các đơn vị bảo
tồn đất và nớc; các sân bay địa phơng
6. Sử dụng
đất
Kiểu đất sử dụng; các quy định phân
vùng.
Số liệu điều tra nông nghiệp mỹ; Các cục và sở quy hoạch; các hội
đồng quy hoạch thành phố; các số liệu thành phố; Các báo cáo điều tra
Mỹ; Các báo cáo thống kê
7. Các
thống kê
về nớc
Giá nớc/ nớc thải và tốc độ xây dựng;
quá trình sử dụng nớc hàng tháng bởi
loại khách hàng; số liệu lịch sử của tổn
thất không tính toán đợc, phạm vi của
những ngời dùng nớc tự cấp.
Các cục cấp nớc; các báo cáo kỹ thuật ; các khảo sát về nớc của liên

bang; các khảo sát khách hàng; cục điều phối liên bang; các tổ chức
địa phơng
8. Bảo tồn
thiên
nhiên
Các biện pháp bảo tồn môi trờng đã
thực hiện; các biện pháp bảo tồn dự
kiến; những đo đạc về mức độ giảm,
mức độ hiệu quả của các biện pháp; sự
chấp nhận của xã hội; khung chính
sách; các đơn vị dùng nớc.
Các cục cấp nớc; các cục điều phối liên bang; các thông kê của địa
phơng; Các cục và sở quy hoạch; từ phỏng vấn các nhân viên nhà
nớc và công chúng; các báo cáo về sự hài lòng của khách hàng; các
nhà sản xuất có tiêu thụ nớc; các nghiên cứu đã có
*SIC nghĩa là chuẩn phân loại công nghiệp.

Bảng 6.3.1
Dữ liệu về nhu cầu nớc của Austin, Texas
Năm

Dân số Giá nớc ($/1000 gal) Thu nhập ($/ngời) Giáng thủy năm (inches) Sử dụng nớc (ac-ft)

1965

216,733

0,98 5,919 40,57 39,606
1966


223,334

0,95 5,970 25,19 40,131
1967

230,135

1,20 6,521 33,54 45,667
1968

237,144

1,15 7,348 40,43 40,780


243
1969

244,366

1,10 7,965 33,59 45,330
1970

251,808

1,05 8,453 30,64 50,683
1971

259,900


1,00 8,713 24,95 56,600
1972

268,252

1,20 9,286 26,07 57,157
1973

276,873

1,13 9,694 40,46 57,466
1974

285,771

1,06 9,542 36,21 63,263
1975

294,955

0,98 9,684 36,81 57,357
1976

304,434

0,93 10,152 39,17 51,163
1977

314,217


0,87 10,441 22,14 68,413
1978

324,315

0,81 10,496 30,97 69,994
1979

334,738

1,10 10,679 37,50 65,204
1980

345,496

1,05 10,833 27,38 78,564
1981

354,401

0,96 11,060 45,73 76,339
1982

368,135

0,91 11,338 26,63 87,309
1983

383,326


0,87 11,752 33,98 82,120
1984

399,147

0,84 12,763 26,30 97,678
1985

424,120

1,41 12,748 32,49 97,708
6.3.2. Hồi quy tuyến tính
Từ phơng trình (6.3.3), biểu thức sử dụng cho từng lần quan trắc số liệu
có thể biểu diễn nh sau:

0 1 1

, 1,2, ,
i i k ik i
y x x i n


(6.3.4)
trong đó y
i
là số liệu lần quan trắc thứ i của biến phụ thuộc, x
ik
là số liệu lần
quan trắc thứ i của biến độc lập thứ k,


i
là sai số tơng ứng, và n là tổng số
lần quan trắc của bộ số liệu. Theo dạng ma trận, mô hình hồi quy tuyến tính
tơng ứng với phơng trình (6.3.4) có thể viết nh sau:


y X


(6.3.5)


244

Hình 6.3.1
Biểu đồ sử dụng nớc hàng năm theo dân số cho thành phố Austin, Texas.
trong đó:
11 12 11
2 21 22 2
1 2
0 1
1 2
n
1
1
1


=


k
k
n
n n nk
k
x x x
y
y x x x
y X
y
x x x





























K
K
M
M M M M M
K
M M

Trong phân tích hồi quy, các giả thiết đặc trng là:
1. Sai số ngẫu nhiên tơng ứng với mỗi lần quan trắc thờng đợc
phân bố với kỳ vọng bằng 0 và phơng sai
2

cha biết, hay là E(
i
)
= 0 và Var(
i
) =
2

với i = 1,2, ,n.

2. Tất cả các sai số ngẫu nhiên có tính độc lập thống kê, tức là,
Cov(
i
,
j
) = 0 với i j.
3. Giá trị của các biến độc lập x
1
, x
2
, , x
k
không tính đến sai số đo
đạc.
4. Biến phụ thuộc y là một biến ngẫu nhiên với kỳ vọng và phơng sai
lần lợt nh sau:

1 2 0 1 1
( , , , )
k k k
E y x x x x x


(6.3.6a)

2
1 2
( , , , )
k
Var y x x x



(6.3.6b)


245
Từ các phơng trình (6.3.6a, b), kỳ vọng của y là một hàm tuyến tính của
các biến độc lập trong khi phơng sai của y là một hằng số không phụ thuộc
vào giá trị của các biến độc lập.
Nói chung, các biến độc lập x, trong phơng trình (6.3.3), có thể là các
biến số khác nhau. Trong trờng hợp đặc biệt, khi mô hình là một hàm đa thức
của cùng một biến độc lập:

2
0 1 2


k
k
y x x x


(6.3.7)
trong đó k là bậc của hàm đa thức. Một dạng thờng đợc sử dụng khác của
mô hình hồi quy tuyến tính đa biến là các phơng trình (6.2.7) và (6.2.8)
(tham khảo hình 6.3.2) lần lợt có dạng biến đổi loga nh sau:

0 1 2

1 2


k
k
y e x x x e






(6.3.8)


0 1 2

1 2

y
k
k
e e x x x e






(6.3.9)
Một nhiệm vụ quan trọng của phân tích hồi quy là ớc lợng các hệ số hồi
quy dựa trên bộ số liệu quan trắc. ở hình 6.3.1, có thể vẽ rất nhiều đờng

thẳng khác nhau xuyên qua các điểm dữ liệu. Câu hỏi ở đây là "đờng thẳng
nào phù hợp với số liệu nhất?" Trong phân tích hồi quy, các hệ số hồi quy
cha biết đợc xác định bởi nguyên tắc bình phơng nhỏ nhất, tổng nhỏ nhất
của bình phơng các sự khác nhau giữa số liệu quan trắc và kết quả tính đợc
của biến phụ thuộc y. Một cách chính xác, tiêu chuẩn bình phơng nhỏ nhất
trong hồi quy tuyến tính có thể phát biểu nh sau:
à à à
$
0 1
2
, , ,
1
2
1

( )
k
n
i
i
n
i
i
i
Minimize D
y y










à à à
2
0 1 1
1
( )
n
ki i ik
i
y x x







(6.3.10)
trong đó D là tiêu chuẩn để đánh giá mức độ phù hợp, y
i
là giá trị quan trắc thứ
i, và
$
i
y
là giá trị tính toán thứ i với các giá trị cụ thể của

à à à
0 1
, , , ,
k

bằng
công thức:
$
à à à
0 1
1
.
k
i ik
i
y x x



Sự xác định các hệ số hồi quy, về cơ bản, là một bài toán nhỏ, tự nhiên với
phơng trình (6.3.10) nh là một hàm mục tiêu. Các hệ số hồi quy cha biết
có thể đợc xác định bằng phơng pháp tối u ở phần 4.4. Sử dụng điều kiện
tối


246
u của phơng trình (4.4.2) giá trị của làm cho D nhỏ nhất phải thỏa
mãn các điều kiện sau:
à à à
à à à

0 1
0 1
1 ik
1
0
, ,
2 ( ) 0
k
n
k
i i
i
D
y x x











(6.3.11a)
à à à
à à à
0 1
0 1

1 ik ij
1
, ,
2 ( ) 0, 1,2, ,
k
n
k
i i
i
j
D
y x x x j k













(6.3.11b)
Các phơng trình (6.3.11a, b) có thể đơn giản hóa thành các phơng trình
thờng (normal equation) với k + 1 biến cha biết và k + 1 phơng trình.

à à à à

à à à à
à à à à
0 1 2
1 2
1 1 1 1
2
0 1 2
1 1 1 2 1 1
1 1 1 1 1
2
0 1 21 2
1 1 1 1 1



n n n n
k
i i ik i
i i i i
n n n n n
k
i i i i i ik i i
i i i i i
n n n n n
k
ik ik i ik i ik i ik
i i i i i
n x x x y
x x x x x x y x
x x x x x x y x













M M M M M
(6.3.12)
trong đó x
ij
tơng ứng với lần quan trắc thứ i của j biến độc lập, i = 1, 2, , n

j = 1, 2, , k.
ở dạng ma trận, các phơng trình thờng (6.3.12) có thể biểu diễn là:

à
( )
T T
X X X y


(6.3.13)
trong đó T biểu thị sự chuyển vị của ma trận hoặc vectơ. Phơng trình (6.3.13)
có thể đợc giải theo

à

để thu đợc biểu thức toán học của bình phơng nhỏ
nhất của các hệ số hồi quy nh sau:

à
1
( )
T T
X X X y



(6.3.14)
trong đó
à à à à
0 1
( , , , ) .
T
k



1
( )
T
X X

là ma trận vuông (k+1) ì (k+1), nó
luôn có ma trận nghịch đảo nếu các biến độc lập là độc lập tuyến tính; nghĩa

là không có cột nào của ma trận X là sự tổng hợp tuyến tính của các hàng
khác.
Khi các hệ số hồi quy đã đợc ớc lợng, các biến phụ thuộc
$
,
i
y
có thể
đợc tính bởi:

$
à à à
0 1
1

k
i ik
i
y x x


(6.3.15)
Tham khảo phơng trình (6.3.2a), phơng trình này chỉ có một biến độc
lập là dân số, vì thế k =1. Gán x = x
1
, lời giải của phơng trình (6.3.12) là:

à à
0 1
y x



(6.3.16)


247


µ
1
/
xy xx
S S


(6.3.17)
trong ®ã trung b×nh cña y
i
vµ x
i
lµ:
1 1
1 1
n n
i i
i i
y y and x x
n n
 
 

 



2
2 2
1 1
( )
n n
xx i i
i i
S x x x nx
 
   
 
(6.3.18)

1 1
( )
n n
xy i i i i
i i
S y x x y x nxy
 
   
 
(6.3.19)


H×nh Hµm tuyÕn tÝnh

PhÐp
biÕn ®æi

D¹ng tuyÕn tÝnh

a, b
1
0
y x




' ln
' ln
y y
x x



0 1
' ln '
y x
 
 

c, d
1
0
x

y e




' ln
y y


0 1
' ln
y x
 
 

e, f
0 1
ln
y x
 
 

' ln
x x


0 1
'
y x
 

 



g, h
0 1
x
y
x
 



1
'
1
'
y
y
x
x



0 1
'
y x
 




H×nh 6.3.2
C¸c hµm tuyÕn tÝnh. Daniel vµ Wood, 1980,


248
Ví dụ 6.3.1. Dựa trên số liệu đã cho trong bảng 6.3.1 dựng một phơng trình hồi quy tuyến tính đơn
giản giữa sử dụng nớc hàng năm tính bằng ac-ft (AF) với dân số cho thành phố của Austin, Texas phù
hợp với các điểm dữ liệu trong hình 6.3.1.
Lời giải Từ bảng 6.3.1, tính đợc n = 21;
6.341.600;
i
x


1.328.538;
i
y


2
1.989.270.175.744;
i
x


301.980,9;
x
and
63.263,7.

y
Từ các phơng trình (6.3.18) và
(6.3.19), tính đợc
74.228.039.680 , 21.170.978.816.
xx xy
S S
Sử dụng các phơng trình (6.3.16) và
(6.3.17), các hệ số hồi quy cha biết có dạng:
$
1
/ 0, 2852
xy xx
S S



$
0
22.865,9.


Mô hình
hồi quy cuối cùng là:
22.865,9 0,2852
y x

$
trong đó
$
y

là tổng lợng nớc sử dụng hàng năm
tính bằng ac-ft (AF) và x là dân số (tính bằng ngời). Đờng thẳng biểu diễn phơng trình hồi quy kết
quả là đờng thẳng trong hình 6.3.1.
6.3.3. Độ chính xác của các mô hình hồi quy
Trong phân tích hồi quy, có một số các hệ số hồi quy khác có ích và cần
ớc tính. Chúng gồm các phần d và phần biến đổi của mô hình hồi quy. Ta
gọi sự khác nhau giữa các giá trị quan trắc và các giá trị dự báo của các biến
phụ thuộc là các phần d. Chúng có thể đợc ớc tính bởi

$
à à à
0 1
1
( ), 1,2, ,
k
i i i i iki
e y y y x x i n


(6.3.20)
Các phần d đóng vai trò quan trọng trong việc kiểm tra sự phù hợp của
kết quả của mô hình hồi quy. Phơng sai của mô hình hồi quy
2
s
bằng

2
2
1
( 1) 1

n
i
T
i
e
e e
s
n k n k




(6.3.21)
trong đó
1 2
( , , , )
T
n
e e e e

là véctơ của các sai số. Tử số của phơng trình
(6.3.21) đợc gọi là bậc tự do, có đợc bằng cách tính hiệu của một số các hệ
số hồi quy cha biết trong mô hình từ một số các dữ liệu quan trắc. Căn bậc
hai của phơng sai của mô hình (s) đợc gọi là độ lệch chuẩn.
Hơn nữa, giá trị của hệ số xác định giữa biến phụ thuộc y và các biến hồi
quy độc lập có thể đợc tính nh sau

2
2
1

2
1
1 1
( )
n
i
i e
n
yy
i
i
e
SS
r
S
y y






(6.3.22)
với
2
1
n
e i
i
SS e




là tổng bình phơng phần d và
2
1
( )
n
yy i
i
S y y



đợc
gọi là tổng bình phơng của giá trị trung bình của biến phụ thuộc. Hệ số xác
định có giá trị trong khoảng từ 0 đến 1 mô tả phần trăm biến thiên của biến
phụ thuộc y mà kết quả của phơng trình hồi quy giải thích đợc. Do vậy, số
hạng
( / )
e yy
SS S
trong phơng trình (6.3.22) cho biết phần biến đổi của y cha
đợc giải thích bởi mô hình hồi quy.


249
Ví dụ 6.3.2. Sử dụng các kết quả của ví dụ 6.3.1, tính sai số chuẩn của các kết quả tính khoảng lệch
quân phơng của mô hình hồi quy cho thành phố Austin và hệ số tơng quan giữa sử dụng nớc và dân
số.

Lời giải Bảng 6.3.2 là các kết quả tính toán cho ví dụ này. Cột (2) chứa các giá trị quan trắc của sử dụng
nớc hàng năm. Dựa trên mô hình hồi quy xây dựng trong ví dụ 6.3.1, sử dụng nớc trong những năm
khác nhau đợc dự báo và kết quả ở cột (3) bảng 6.3.2. Sự khác nhau giữa các giá trị quan trắc và các
giá trị dự báo là các sai số đợc liệt kê trong cột (4).
Sử dụng các giá trị sai số trong cột (4), phơng trình (6.3.21) đợc sử dụng để tính phơng sai
2 2
/( 2) 43.374.300,2 /(21 2) 22.842.664,4
i
s e n


Khi đó, độ lệch quân phơng là
22.842.664,4 4.779, 4 AF
s

Hệ số tơng quan đợc tính toán bằng phơng trình (6.3.22)
2
2
434.019.040
1 1 0,9329
21.170.978.816
i
yy
e
r
S



Kết quả cho thấy 93.3% tính biến thiên giữa sử dụng nớc-số liệu dân số của Austin từ 1965-1985

đợc giải thích bởi phơng trình hồi quy của ví dụ 6.3.1.
Bảng 6.3.2
Các kết quả tính toán của ví dụ 6.3.2
i
(1)
i
y

(2)
$
i
y

(3)
i
e

(4)
1

39.606,0 38.949,7 656,3

2

40,131,0 40,832,4 -701,4

3

45.667,0 42.772,1 2.894,9


4

40,780,0 44.771,2 -3.991,2

5

45.330,0 46.831,0 -1.501,0

6

50,680,0 48.953,6 1.726,4

7

56.600,0 51.261,6 5.338,4

8

57.157,0 53.643,7 3.513,3

9

57.466,0 56.102,5 1.363,5

10

63.263,0 58.640,4 4.622,6

11


57.357,0 61.259,8 -3.902,8

12

51.163,0 63.963,4 -12.800,4

13

68.413,0 66.753,6 1.659,4

14

69.994,0 69.633,7 360,3

15

65.204,0 82.606,5 -7.402,5

16

78.564,0 75.674,9 2.889,1

17

76.339,0 78.214,7 -1.875,7

18

87.309,0 82.131,9 5.177,1


19

82.120,0 86.464,6 -4.344,6

20

97.687,0 90,977,0 6.710,0

21

97.708,0 98.009,7 -391,7

Một ứng dụng quan trọng của mô hình hồi quy là để dự báo một sự quan
trắc mới tơng ứng với một mức độ cho trớc của các biến hồi quy độc lập x.
Chú ý rằng trong phơng trình (6.3.15) là các ớc tính của các hệ số hồi quy
cha biết, vì thế thực chất chúng là các biến ngẫu nhiên. Hệ quả là, với một
biến hồi quy độc lập
0 01 02 0
( , , , )
k
x x x x

cho trớc, kết quả dự báo tơng lai
tơng ứng cho bởi
$
à à à
0 1
01 0
0


k
k
y x x


cũng khó tránh khỏi số. Thêm vào
đó, ngoài việc ớc tính các giá trị trong tơng lai của biến phụ thuộc,
$
0
,
y
cũng
cần thiết phải xác định khoảng dự báo. Khoảng này chứa giá trị thực tế trong
tơng lai với một xác suất lớn.


250
6.3.4. Những nhận xét chung về phân tích hồi quy
Các giả thiết liên quan đến phân tích hồi quy bình phơng nhỏ nhất đã
đợc thảo luận từ trớc. Sau khi một mô hình hồi quy đợc phát triển, một
điều quan trọng là cần phải kiểm tra sự phù hợp của nó với các giả thiết này.
Trong trờng hợp các giả thiết này bị vi phạm, tính hợp lệ của mô hình sẽ
không chắc chắn. Nhìn chung, mức độ phù hợp của một mô hình hồi quy
không thể đợc biểu lộ bởi các con số thống kê đơn giản nh là r
2
. Mặc dù
vậy kiểm tra sự phù hợp của mô hình bởi các kiểm tra thống kê là đúng, nó
thờng cung cấp thêm thông tin để thực hiện các nhiệm vụ minh họa bằng các
biểu đồ phần d.
Bớc đầu tiên là kiểm tra xem các giá trị thực đo của biến phụ thuộc y có

tuân theo một quy luật phân phối chuẩn . Bởi vì sự phù hợp theo quy luật này
bảo đảm độ chính xác của các kết luận thống kê, bao gồm nguồn gốc của độ
tin cậy và các khoảng dự báo. Bớc kiểm tra thứ hai là kiểm tra sự phù hợp
của mô hình bằng cách kiểm tra sự phù hợp của giả thiết phơng sai đồng
nhất. Điều này đợc thực hiện bằng cách vẽ đồ thị của các phần d của mô
hình theo biến phụ thuộc y và từng biến độc lập x.
Một vài kiểu sai số trong mô hình hồi quy thờng gặp đợc trình bày
trong hình 6.3.3. Nói đúng ra, phơng pháp bình phơng nhỏ nhất miêu tả ở
trên đợc gọi là phơng pháp bình phơng nhỏ nhất thông thờng (OLS) nó
vẫn cần điều kiện phơng sai đồng nhất (xem hình 6.3.3a) trong việc ớc tính
các thông số của mô hình. Một trờng hợp khác có thể gặp phải là các sai số
phơng sai giảm dần khi mức độ biến phụ thuộc hoặc biến độc lập tăng. Có
thể áp dụng phơng pháp bình phơng nhỏ nhất tổng quát hoặc trọng số
(Montgomery và Peck, 1982; Neter, Wasserman và Kutner, 1983) để giải
thích rõ ràng nguyên nhân của trờng hợp phơng sai không đồng nhất nh
trong hình 6.3.3c.
Vì giá thành và khả năng thu thập số liệu các biến hồi quy độc lập và biến
phụ thuộc, nên chúng ta thờng mong muốn số biến hồi quy độc lập cần sử
dụng để xây dựng một mô hình hồi quy điển hình là ít nhất có thể. Một vấn đề
quan trọng trong phân tích hồi quy là tìm ra nhóm biến hồi quy độc lập tốt
nhất. Nói chung, ảnh hởng của các biến độc lập này là hàm của nhiều biến
khác trong mô hình và vì thế không thể đánh giá trớc đợc. Có rất nhiều
phơng pháp thống kê đã đợc phát triển để lựa chọn nhóm biến hồi quy độc
lập tốt nhất, ví dụ nh hồi quy từng bớc. Các thảo luận toàn diện hơn của
nhiều chủ đề khác nhau thuộc phân tích hồi quy có thể tham khảo Draper and
Smith (1981), Montgomery and Peck (1982) và Neter, Wasserman, Kutner
(1983).
Có rất nhiều chơng trình phần mềm máy tính có thể sử dụng để thực hiện
một phân tích hồi quy khá toàn diện. Một số các phần mềm tốt là SAS
(Statistical Analysis System Hệ thống phân tích thống kê, 1988) và SPSS



251
(Statistical Packages for Social Sciences Các chơng trình thống kê cho khoa
học xã hội, 1986).
Các chơng trình thống kê này có khả năng xử lý các bộ số liệu lớn, ớc
tính các thông số hồi quy, tính các khoảng tin cậy/khoảng dự báo, thực hiện
nhiều kiểm nghiệm khác nhau, và lựa chọn các biến độc lập tốt nhất, vân vân.
Cuối cùng, chúng tôi giải thích ngắn gọn về các tiêu chuẩn của đờng
cong phù hợp khác với tiêu chuẩn bình phơng nhỏ nhất. Khi sử dụng tiêu
chuẩn bình phơng nhỏ nhất, những ngời phân tích thờng quan tâm nhiều
hơn tới những độ lệch lớn so với những độ lệch nhỏ. Để giảm tầm quan trọng
của các độ lệch lớn trong đờng cong phù hợp, tiêu chuẩn cực tiểu hóa tổng
của các độ lệch tuyệt đối đợc sử dụng. Nhìn chung, kết quả ớc tính các
thông số dựa trên tiêu chuẩn cực tiểu hóa tổng của các độ lệch tuyệt đối là ít
nhạy hơn với các quan trắc quá lớn hoặc quá nhỏ (các điểm nằm ngoài) của bộ
số liệu so với kết quả ớc tính các thông số dựa trên tiêu chuẩn bình phơng
nhỏ nhất. Tiêu chuẩn đờng cong phù hợp thứ ba chỉ quan tâm đến các ớc
tính kém nhất. Các hàm mục tiêu đợc sử dụng để làm giảm độ lệch lớn nhất.
Chú ý rằng việc ớc tính các thông số hồi quy sử dụng tiêu chuẩn bình
phơng nhỏ nhất là một quá trình cực tiểu hóa phi tuyến không ràng buộc. Vì
thế nên các hệ số hồi quy cần tìm có thể là bất kì số thực nào. Trong một vài
tình huống, các quá trình vật lý cho ta dấu hiệu và khoảng giá trị của các hệ số
hồi quy cần tìm. Điều này có thể khiến cho phơng trình thờng (6.3.14) vô
nghiệm. Khi các khoảng giá trị của các hệ số hồi quy tồn tại, thì bài toán có
thể đợc giải quyết bởi kĩ thuật qui hoạch toàn phơng. Sử dụng tiêu chuẩn
cực tiểu hóa tổng các độ lệch tuyệt đối hoặc tiêu chuẩn làm giảm độ lệch lớn
nhất, các hệ số hồi quy trong phơng trình (6.3.3) có thể tính đợc bằng quy
hoạch tuyến tính. Tiêu chuẩn bình phơng nhỏ nhất đợc sử dụng nhiều nhất
trong thực tế là do khoa học thống kê đã phát triển rộng rãi. Và còn thiếu các

nghiên cứu tỉ mỉ về các đặc tính thống kê của các phơng pháp ớc tính hệ số
hồi quy dựa trên hai tiêu chuẩn còn lại.


252

Hình 6.3.3
Nguyên mẫu của các biểu đồ phần d (after Neter, Wasserman, và Kutner, 1983). Nếu giả thiết phơng sai
đồng nhất đúng, biểu đồ phân d sẽ có dạng nh hình 6.3.3a. Trong trờng hợp biểu đồ phần d có hình dạng
khác, hình 6.3.3b hoặc c, mô hình hồi quy nên đợc sửa đổi. Hình 6.3.3c cho thấy một khuynh hớng thay đổi
lớn dần của phần d tỉ lệ thuận với sự tăng lên của biến phụ thuộc hoặc biến độc lập.
6.4. Các mô hình bậc thang để dự báo sử dụng
nớc
Chuỗi thời gian của sử dụng nớc đô thị tháng có thể chứa một xu thế
biến đổi lịch sử. Nó có thể đợc chia thành các thành phần hạn dài và các
thành phần hạn ngắn (Maidment and Parzen, 1984a, b). Các thành phần hạn
dài là (1) một xu thế phản ánh sự thay đổi dân số, giá nớc, và thu nhập gia
đình một cách chậm rãi từ năm này qua năm khác, và (2) xu thế phản ánh sự
thay đổi tuần hoàn theo mùa trong năm của sử dụng nớc. Các thành phần
hạn ngắn có thể là (1) tự tơng quan, phản ánh sự tồn tại các độ lệch của sử
dụng nớc từ các dạng biến đổi hạn dài, và (2) tơng quan thời tiết, phản ánh
các tác động lên sử dụng nớc của các hiện tợng thời tiết khác thờng nh
không có ma hoặc có quá nhiều ma. Cái tên mô hình bậc thang (cascade)
bắt nguồn từ sự thật là, trong quá trình phát triển mô hình, bốn bớc liên tiếp
đợc sử dụng trong sự biến đổi chuỗi thời gian của nhu cầu nớc tháng. Các


253
mô tả đầy đủ của các thành phần trong sự phát triển của một mô hình bậc
thang đợc trình bày trong hình 6.4.1.

Một chuỗi thời gian của sử dụng nớc đô thị tháng nguyên gốc có thể
đợc biểu diễn nh sau, Q(t) với t = 1, , T hoặc Q
a
(m,y) với m = 1, , 12 và y
= 1, , Y, Trong đó t là chỉ số tháng, bắt đầu từ tháng đầu chuỗi thời gian đến
tháng cuối T; m là chỉ số tháng của từng năm; và y là chỉ số năm với Y là tổng
số năm. Một chuỗi thời gian nh trên có thể đợc biểu diễn nh là tổng của
một thành phần hạn dài,
( )
L
Q t
hoặc
( , ),
L
Q m y
và một thành phần hạn ngắn,
( )
S
Q t
hoặc
( ),
S
Q m
nh sau

( ) ( ) ( )
L S
Q t Q t Q t

(6.4.1a)

hoặc

( , ) ( , ) ( )
a L S
Q m y Q m y Q m

(6.4.1b)
với

( ) ( , ), 12( 1)
a
Q t Q m y t y m

(6.4.1c)

Hình 6.4.2 minh họa cho sự phân chia chuỗi thời gian của sử dụng nớc
tháng cho Canyon City, Texas thành một thành phần hạn dài và một thành
phần hạn ngắn.
6.4.1. Loại bỏ xu thế năm
Bớc đầu tiên để phát triển mô hình bậc thang là xác định xu thế sử dụng
nớc năm trong chuỗi số liệu lịch sử và loại bỏ nó. Xu thế sử dụng nớc năm
có trong Q
a
(y) tơng ứng với trung bình năm của sử dụng nớc tháng trong
năm y. Vì thế, nhiệm vụ chính trong bớc này là xác định dạng hàm của
Q
a
(y). Từ số liệu lịch sử trung bình năm của sử dụng nớc tháng trong năm y
có thể đợc tính bằng


12
1
1
( ) ( , ) 1, ,
12
a a
m
Q y Q m y y Y



(6.4.2)
Mặt khác, tác động của các yếu tố kinh tế xã hội nh là giá nớc, dân số,
số kết nối nớc, và thu nhập của hộ gia đình có thể giải thích cho trung bình
năm của sử dụng nớc tháng nếu gắn nó với các yếu tố kinh tế xã hội thích
hợp nh là
0 1 1 2 2
( ) ( ) ( ) ( ), 1, 2, ,
a q q
Q y Z y Z y Z y y Y


(6.4.3)
trong đó

tơng ứng với các hệ số, Z
j
(y) (j = 1, , q) yếu tố kinh tế xã hội.
Các hệ số


trong phơng trình (6.4.3) có thể đợc ớc tính bởi phân tích hồi
quy sử dụng số liệu lịch sử của Q
a
(y) và Z
j
(y). Sử dụng phơng trình (6.4.3)
xác định xu thế sử dụng nớc hàng năm là đặc biệt hợp lý để dự báo sử dụng
nớc và nó liên quan đến các điều kiện kinh tế xã hội của tơng lai.

×