Tải bản đầy đủ (.pdf) (71 trang)

lập mô hình, dự báo chất lượng nước sông đồng nai đoạn chảy qua làng cá bè tân mai– thành phố biên hòa – tỉnh đồng nai

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (921.92 KB, 71 trang )



LỜI CAM ĐOAN
Tôi tên: Lê Đức Anh
Là học viên lớp 11HMT01 khóa 2011 - 2013, chuyên ngành Kỹ thuật Môi Trường,
Tr ường Đại học Kỹ thuật Công nghệ TP. HCM.
Tôi xin cam đoan đề tài luận văn: “Lập mô hình, dự báo chất lượng nước sông
Đồng Nai đoạn chảy qua làng cá bè Tân Mai – Thành phố Biên Hòa – Tỉnh
Đồng Nai” là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả nêu trong
luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nghiên
cứu nào khác.
Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm
ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc.
Sinh viên thực hiện


Lê Đức Anh



LỜI CÁM ƠN
Luận văn được hoàn thành dưới sự giúp đỡ và động viên của các thầy, đồng nghiệp
và bạn bè. Tôi xin bày tỏ lòng biết ơn sâu sắc đến thầy Lâm Vĩnh Sơn, người đã
định hướng và chỉ dẫn, tận tình giúp đỡ tôi trong suốt quá trình thực hiện.
Xin chân thành cảm:
• Các anh, chị, em đồng nghiệp tại phòng PT-TN, Tung tâm Quan Trắc và
KTM T Đồng Nai đã nhiệt tình giúp đỡ và động viên tôi trong quá trình làm
luận văn.
• Thầy cô Khoa Môi Trường và Công Nghệ Sinh Học; Học viên lớp
11HMT12 đã quan tâm giúp đỡ để tôi hoàn tất bài luận văn.
Sau cùng, tôi xin bày tỏ lòng biết ơn sâu sắc đến cha, mẹ, anh, chị và gia đình tôi đã


luôn hỗ trợ giúp đỡ trong suốt quá trình học tập, thực hiện luận văn.
Sinh viên thực hiện

Lê Đức Anh




Đồ án tốt nghiệp
i

MỤC LỤC
LỜI CAM ĐOAN i
LỜI CÁM ƠN ii
DANH MỤC CÁC TỪ VIẾT TẮT iii
DANH MỤC BẢNG iv
DANH MỤC HÌNH v
MỞ ĐẦU 1
CHƯƠNG 1. TỔNG QUAN 5
1.2 Hiện trạng các khu công nhiệp trên địa bàn tỉnh Đồng Nai 6
1.3. Điều kiện địa lý tự nhiên TP. Biên Hòa 6
1.4. Thực trạng môi trường nước sông Đồng Nai 7
1.4.1. Các nguồn gây ô nhiễm nước 8
1.4.2. Các khu vực bị ô nhiễm trên sông Đồng Nai 9
1.5.1. Giới thiệu chung 9
1.5.2 Chuỗi thời gian 12
1.5.3. Mô hình ARIMA 13
CHƯƠNG 2: PHƯƠNG PHÁP THỰC HIỆN 21
2.1. Mục tiêu – phạm vi nghiên cứu 21
2.1.3. Thời gian khảo sát 22

2.1.4. Các yếu tố môi trường nghiên cứu, đánh giá 23
2.2. Phương pháp thực hiện 23
2.2.1. Thu thập số liệu quan trắc 23

2.2.2. Tóm t ắt các thống kê cơ bản 23
Đồ án tốt nghiệp
ii

2.2.3. Kiểm định tính dừng 24
2.2.4. Kiểm định đồng liên kết Johansen 26
2.2.5. Phương pháp lập mô hình ARIMA 27
2.2.6. Phương pháp luận Box-Jenkins. 29
2.2.7. Các công cụ chính để đánh giá mô hình 31
CHƯƠNG 3: KẾT QUẢ - THẢO LUẬN 33
3.1.Đánh giá chất lượng môi trường nước sông Đồng Nai đoạn chảy qua làng
cá bè Tân Mai. 33
3.1.1. Tiêu chí đánh giá 33
3.1.2. Quy trình đánh giá và sử dụng WQI trong đánh giá chất lượng nước lục địa
33
3.2. Kết quả đánh giá 37
3.2.1. Đánh giá chất lượng nước sông Đồng Nai đoạn chảy qua làng cá bè Tân
Mai tháng 01/2013 37
3.2.2. Đánh giá chất lượng nước sông Đồng Nai đoạn chảy qua làng cá bè Tân
Mai từ năm 2008 đến năm 2012 39
3.2.3. Lập mô hình ARIMA 47
KẾT LUẬN, KIẾN NGHỊ 55
TÀI LIỆU THAM KHẢO 57
PHỤ LỤC 1



Đồ án tốt nghiệp
iii

DANH MỤC CÁC TỪ VIẾT TẮT
ACF (Autocorrelation Function): tự tương quan.
ADF: Augumented Dickey – Fuller
ARIMA (AutoRegressive Intergate Moving Avarage): Trung bình trượt kết hợp tự
hồi quy.
KCN: Khu công nghiệp
KDD (Knowledge Discovery and Data Mining): Kỹ thuật phát hiện tri thức và khai
phá dữ liệu.
N-SĐN: Nước Sông Đồng Nai
PACF (Partial Autocorrelation Function) Tự tương quan từng phần.
TCMT: Tổng cục môi trường
WQI (The Water Quality Index): Chỉ số chất lượng nước

Đồ án tốt nghiệp
iv

DANH MỤC BẢNG
Bảng 2.1. Vị trí khảo sát 21
Bảng 2.2. Các dạng hàm lý thuyết ACF và PACF 30
Bảng 3.1. Bảng quy định các giá trị q
i
, BP
i
34
Bảng 3.2. Bảng quy định các giá trị BP
i
và qi đối với DO

% bão hòa
35
Bảng 3.3. Bảng quy định các giá trị BP
i
và q
i
đối với thông số pH 36
Bảng 3.4. Bảng đánh giá chất lượng nước 36
Bảng 3.5 Số liệu thu được qua 2 đợt thu và phân tích mẫu tại vị trí Làng cá bè Tân
Mai 37
Bảng 3.6. Giá trị WQI thông số tháng 02/2013 38
Bảng 3.7. Số liệu chất lượng nước sông Đồng Nai đoạn chảy quan làng cá bè Tân
Mai (WQI) từ năm 2008 đến năm 2012 40
Bảng 3.8. Tóm tắt các thống kê mô tả của giá trị WQI 41
Bảng 3.9. Tóm tắt các thống kê mô tả của r
WQI
42
Bảng 3.10. Kết quả kiểm định ADF chuỗi WQI theo tính chặn 44
Bảng 3.11. Kết quả kiểm định ADF chuỗi WQI theo xu thế và tính chặn 45
Bảng 3.12. Kiểm định đồng liên kết Johansen 46
Bảng 3.13. Tự tương quan (ACF) và tự tương quan riêng phần (PACF) của WQI
47
Bảng 3.14. Kết quả MSE cho các mô hình ARIMA tốt nhất 49
Bảng 3.15. Ước lượng các hệ số trong mô hình ARIMA (1,0,1) 50
Bảng 3.16. Tự tương quan phần dư (ACF) và tự tương quan riêng phần phần dư
(PACF) 51
Bảng 3.17. Các giá trị dự báo WQI từ mô hình ARIMA(1,0,1) 53

Đồ án tốt nghiệp
v


DANH MỤC HÌNH
Hình 1.1. Ví dụ về chiều hướng giảm đều khác nhau 17
Hình 2.1. Bản đồ vị trí thu mẫu 22
Hình 3.2. Biểu đồ thống kê mô tả WQI 41
Hình 3.3. Biểu đồ thống kê mô tả r
WQI
42
Hình 3.4. Diễn biến chỉ số WQI từ tháng 01/2008 đến tháng 12/2012 43
Hình 3.6. Tự tương quan riêng phần của WQI 49
Hình 3.7. Tự tương quan phần dư của WQI 52
Hình 3.8. Tự tương quan riêng phần phần dư của WQI 53


Đồ án tốt nghiệp
1

MỞ ĐẦU
1. Tính cấp thiết của đề tài
Trong giai đoạn hiện nay, tình hình kinh tế của đất nước đang từng bước phát
triển. Kéo theo đó là sự phát triển của các khu công nghiệp, khu đô thị mới, các khu
du lịch ven sông… Tuy nhiên, bên cạnh việc phát triển kinh tế lại phát sinh vấn đề ô
nhiễm môi trường, sự cố môi trường, khai thác các nguồn khoáng sản tự nhiên, khai
thác thủy sản cạn kiệt…kéo theo việc biến đổi khí hậu toàn cầu. Tất cả những vấn
đề đó đã và đang để lại cho chúng ta những hậu quả hết sức nặng nề, tác động đến
cuộc sống, sự tồn tại của chúng ta và cả thế hệ mai sau.
Và Tỉnh Đồng Nai cũng không nằm ngoài xu thế đó. Tỉnh Đồng Nai với vị trí
địa lý thuận lợi, với số lượng lớn các sông suối, đặc biệt là hệ thống sông hồ với trữ
lượng nước dồi dào. Vì thế, Đồng Nai rất thuận lợi để phát triển mọi mặt về kinh tế
- xã hội. Trong số các sông lớn chảy qua địa bản Tỉnh thì sông Đồng Nai là con

sông lớn thứ hai của các tỉnh Nam Bộ chảy qua, trải dài từ cực Bắc huyện Tân Phú,
Định Quán về đến cửa biển Xoài Rạp. Dọc theo tuyến sông chính của sông Đồng
Nai còn có một số khu công nghiệp đang hoạt động và một số làng cá bè truyền
thống, chính điều này đã làm cho vấn đề ô nhiễm môi trường đang dần trở nên
nghiêm trọng, ảnh hưởng tiêu cực đến việc khai thác các nguồn thủy sản, đồng thời
cũng rất nguy hiểm khi nguồn nước được sử
dụng để làm nguồn nước cấp cho sinh
hoạt và các hoạt động sản xuất khác.
Đặc biệt đáng lưu ý là khu vực làng cá bè Tân Mai lại nằm trong đoạn sông
Đồng Nai mà nhà máy nước Biên Hòa sử dụng nguồn nước mặt để xử lý và cấp
nước sinh hoạt cho người dân.
Vì vậy, việc quan tâm đến vấn đề chất lượng môi trường nước sông Đồng Nai
nói chung và đoạn sông chảy qua làng cá bè Tân Mai nói riêng, là điều hết sức cần
thiết nhằm phát hiện ra những diễn biến bất thường, từ đó có biện pháp xử lý kịp
thời để ngăn chặn ô nhiễm, góp phần bảo vệ và cải thiện môi trường nước sông.
Đồng thời việc dự báo diễn biến chất lượng nước sông là điều hết sức cần thiết để
Đồ án tốt nghiệp
2

cơ quan quản lý có thể lấy đó làm căn cứ mà đề ra các giải pháp nhằm ngăn chặn
kịp thời trước khi chất lượng môi trường nước xấu đi.
2. Tình hình nghiên cứu
Trên thế giới, kỹ thuật dự báo đã hình thành từ thế kỉ thứ 19, tuy nhiên dự báo
có ảnh hưởng mạnh mẽ khi công nghệ thông tin phát triển vì bản chất mô phỏng của
các phương pháp dự báo rất cần thiết sự hỗ trợ của máy tính. Đến năm những 1950,
các lý thuyết về dự báo cùng với các phương pháp luận được xây dựng và phát triển
có hệ thống.
Trong bối cảnh bùng nổ công nghệ thông tin, dự báo đã trở thành một nhu cầu
không thể thiếu cho những hoạt động của con người. Dự báo sẽ cung cấp những cơ
sở cần thiết cho các hoạch định, và có thể nói rằng nếu không có khoa học dự báo

thì những dự định tương lai của con người vạch ra sẽ không có sự thuyết phục đáng
kể. Trong công tác phân tích dự báo, vấn đề quan trọng hàng đầu cần đặt ra là việc
nắm bắt tối đa thông tin về lĩnh vực dự báo. Thông tin ở đây có thể hiểu một cách
cụ thể gồm: các số liệu quá khứ của lĩnh vực dự báo, diễn biến tình hình hiện trạng
cũng như động thái phát triển của lĩnh vực dự báo và đánh giá một cách đầy đủ nhất
các nhân tố ảnh hưởng cả về định lượng lẫn định tính.
Ở Việt Nam, kỹ thuật này tương đối còn mới mẻ tuy nhiên cũng đang được
nghiên cứu và dần đưa vào ứng dụng.
Hiện nay, có nhiều mô hình dự báo ô nhiễm nguồn nước đang được sử dụng
tại Việt Nam như IPC, QUAL, Q2K, MIKE11. Điển hình như:
- Nghiên cứu áp dụng mô hình tính toán MIKE 11 tính toán dự báo chất lượng
nước lưu vực sông Cầu của các tác giả Trần Hồng Thái, Phạm Văn Hải, Trần Thị
Diệu Hằng thuộc Viện Khoa học Khí tượng Thủy văn và Môi trường được công bố
vào năm 2007. Đề tài sử dụng mô hình tính toán MIKE 11 để tính toán, đánh giá dự
báo biến đổi chất lượng nước sông Cầu.
- Đề tài: “Áp dụng mô hình QUAL2K đánh giá diễn biến chất lượng nước
dòng chính sông Hương” cùa tác giả Nguyễn Bắc Giang, trường Đại học Khoa học,
Đại học Huế được đăng trên tạp chí khoa học, Đại học Huế, số 65 năm 2011
Đồ án tốt nghiệp
3

3. Mục đích nghiên cứu
Sử dụng các dữ liệu chất lượng nước sông Đồng Nai đoạn chảy quan làng cá
bè Tân Mai đã được quan trắc, lập mô hình dự báo bằng mô hình ARIMA. Từ đó
đưa ra những dự báo diễn biến chất lượng nước sông.
4. Nhiệm vụ nghiên cứu
- Thu thập số liệu quan trắc chất lượng nước sông Đồng Nai đoạn chảy qua
làng cá bè Tân Mai. Tính toán chỉ số chất lượng nước (WQI).
- Sử dụng mô hình ARIMA để dự báo chất lượng nước thông qua chỉ số chất
lượng nước.

- Dự báo, đánh giá kết quả đạt được.
5. Phương pháp nghiên cứu
- Thu thập thông tin: hiện trạng môi trường, kết quả quan trắc nước sông Đồng
Nai đoạn chảy qua làng cá bè Tân Mai từ nguồn quan trắc hàng năm của Trung tâm
Quan trắc và Kỹ thuật Môi trường Đồng Nai.
- Khảo sát, thu mẫu thực địa tại làng cá bè trong 2 đợt ( tháng 2 và tháng
3/2013)
- Phân tích mẫu: phân tích 10 thông số nhiệt độ, độ đục, pH, BOD
5
, COD,
DO, TSS, N-NH
4
, P-PO
4
, Coliform.
- Xử lý, phân tích số liệu: từ các giá trị của các thông số, tính toán ra chỉ số
chất lượng nước.
- Sử dụng phần mềm EVIEW 5.0 để tính toán.
6. Kết quả đạt được của đề tài
- Xác định được các giá trị của chỉ số chất lượng nước.
- Lập được mô hình ARIMA cho chỉ số chất lượng nước.
Đồ án tốt nghiệp
4

- Đánh giá, dự báo chất lượng nước sông Đồng Nai đoạn chảy qua làng cá bè
Tân Mai.
7. Kết cấu của đề tài
Đề tài tốt nghiệp gồm có 3 chương:
* Chương 1: Tổng Quan
- Giới thiệu về hiện trạng môi trường sông Đồng Nai

- Giới thiệu về mô hình ARIMA
* Chương 2: Phương pháp thực hiện
- Các phương pháp thực hiện lập mô hình ARIMA
* Chương 3: Nội dung kết quả
- Kết quả tính toán chỉ số chất lượng nước
- Kết quả tính toán mô hình ARIMA.
- Kết quả dự báo của mô hình ARIMA.


Đồ án tốt nghiệp
5

CHƯƠNG 1. TỔNG QUAN
1.1 Hệ thống sông Đồng Nai
Tỉnh Đồng Nai có tổng diện tích các lưu vực sông suối là 22.000km
2
với mật
độ sông suối khoảng 0,5km/km
2
, song phân phối không đều. Phần lớn sông suối tập
trung ở phía Bắc và dọc theo sông Đồng Nai về hướng Tây Nam. Tổng lượng nuớc
dồi dào 16,82 x 10
9
m
3
/năm, trong đó mùa mưa chiếm 80%, mùa khô 20%. Một số
sông, hồ trong hệ thống sông ngòi này như sông Đồ
sông Bé, sông La Ngà, sông Thị Vải và hồ Trị An có vai trò đặc biệt quan trọng đối
với quá trình phát triển Kinh tế - Xã hội của cả vùng Đông Nam Bộ.
Hệ thống sông Đồng Nai bao gồm dòng chính sông Đồng Nai và 4 chi lưu lớn

là: Sông La Ngà, sông Bé, sông Sài Gòn và sông Vàm Cỏ (tên gọi chung cho hai
nhánh sông lớn Vàm Cỏ Đông và sông Vàm Cỏ Tây).
Dòng sông chính Đồng Nai chảy qua 5/8 tỉnh thuộc vùng Kinh tế trọng điểm
phía Nam với tổng chiều dài 513/628km. Trong đó, đoạn chảy qua Đồng Nai là dài
nhất khoảng 294/628km, khoảng 46% tổng chiều dài dòng chính. Từ huyện Cát
Tiên tỉnh Lâm Đồng, sông Đồng Nai chảy vào tỉnh Đồng Nai và kéo dài theo ranh
giới của hai tỉnh đến vị trí hợp lưu với sông Đạ Oai, sông đổi hướng chảy qua địa
bàn hai huyện Tân Phú và Định Quán đổ vào hồ Trị An. Từ đập Trị An tính đến hợp
lưu của sông Bé, sông chảy qua địa bàn huyện Vĩnh Cửu, sau đó đổi hướng theo
ranh giới của huyện Vỉnh Cửu tỉnh Đồng Nai với huyện Tân Uyên tỉnh Bình Dương
rồi chảy qua TP. Biên Hòa, từ đó sông chảy theo ranh giới hai huyện Long Thành
và Nhơn Trạch với Quận 9, Quận 2 và Quận 7 của TP. Hồ Chí Minh. Hợp lưu dòng
sông chính của Đồng Nai với sông Sài Gòn tại vị trí cách biển khoảng 58km, sông
Vàm Cỏ tại vị trí 17km và đổ ra biển Đông tại cửa Soài Rạp.
Đồ án tốt nghiệp
6

1.2 Hiện trạng các khu công nhiệp trên địa bàn tỉnh Đồng Nai
Tí nh đến tháng 09/2010, tỉnh Đồng Nai có 30 KCN được cấp giấy chứng nhận
đầu tư, trong đó: 21 KCN đã có dự án đang hoạt động (1.123 dự án) và 9 KCN chưa
thu hút dự án đầu tư.
Nhóm KCN thuộc địa bàn Biên Hoà - Vĩnh Cửu: Hiện có 5 KCN đang hoạt
động là KCN Biên Hoà I, Biên Hoà II, Amata, Loteco, KCN Agtex Long Bình có
chủ trương đầu tư của Thủ tướng Chính phủ thuộc TP. Biên Hòa và KCN Thạnh
Phú với tổng diện tích các KCN 1.337ha.
Tổng diện tích đất KCN là 9.573 ha gấp 1,61 lần năm 2006. Diện tích đất cho
thuê từng năm giảm dần, năm 2006 là 266,77ha đến năm 2010 khoảng 66,48ha
giảm hơn 4 lần. Tổng diện tích đất đã cho thuê năm 2010 là 3.720,08 ha chiếm
58,69% tổng diện tích đất dành cho thuê.
Nhóm KCN thuộc địa bàn Biên Hoà - Vĩnh Cửu: Từng bước chuyển đổi cơ

cấu sản phẩm trong các KCN hiện nay theo hướng phát triển các sản phẩm kỹ thuật
cao như cơ khí chính xác, điện tử, thiết bị viễn thông, dụng cụ y tế, và những
ngành nghề sử dụng ít lao động.
1.3. Điều kiện địa lý tự nhiên TP. Biên Hòa
Nằm ở phía Tây của tỉnh Đồng Nai, Bắc giáp huyện Vĩnh Cửu, Nam giáp
huyện Long Thành, Đông giáp huyện Trảng Bom, Tây giáp huyện Dĩ An, Tân Uyên
tỉnh Bình Dương và Quận 9 - TP. Hồ Chí Minh. Nằm 2 bên bờ sông Đồng Nai, cách
trung tâm TP. Hồ Chí Minh 30 km (theo Xa lộ Hà Nội và Quốc lộ 1A),
cách TP . Vũng Tàu 90 Km (theo Quốc lộ 51).
TP. Biên Hòa có diện tích tự nhiên: 154,67 km
2
, chiếm 2,62% diện tích tự nhiên
toàn tỉnh. Dân số năm 2005: 541.495 người, chiếm 24,4% dân số toàn tỉnh, mật độ
3.500 người/km
2
.
Các cơ quan chuyên môn: phòng Nội Vụ; phòng Tư pháp; phòng Tài chính -
Kế hoạch; phòng Tài nguyên và Môi trường; phòng Lao động - Thương binh và Xã
Đồ án tốt nghiệp
7

hội; phòng Văn hóa và thông Tin; phòng Giáo dục và Đào tạo; phòng Y tế; Thanh
tra; phòng Kinh tế; phòng Quản lý Đô thị; văn phòng Hội đồng nhân dân và Ủy ban
nhân dân.
TP. Biên Hòa có vai trò và vị trí quan trọng:
- Là trung tâm chính trị - kinh tế - xã hội của tỉnh Đồng Nai, có 23 đơn vị hành
chính gồm các phường: Trung Dũng, Thanh Bình, Hòa Bình, Tam Hòa, Tân
Mai, Tam Hiệp, Quang Vinh, Quyết Thắng, Bình Đa, Tân Tiến, Tân Hòa, Hố
Nai, Thống Nhất, Tân Biên, Tân Hiệp, Bửu Hòa, Tân Vạn, An Bình, Bửu
Long, Long Bình Tân, Tân Phong, Trảng Dài, Long Bình; và 3 xã: Tân Hạnh,

Hóa An, Hiệp Hoà.
- Là đô thị loại II, là thành phố lớn, là trung tâm công nghiệp quan trọng của cả
nước, có tiềm năng to lớn để phát triển công nghiệp với nền đất lý tưởng,
thuận lợi cho việc xây dựng kết cấu hạ tầng khu công nghiệp, có nguồn tài
nguyên khoáng sản với trữ lượng khai thác đáng kể, nhất là tài nguyên khoáng
sản về vật liệu xây dựng, thuận lợi về nguồn cung cấp điện, có nguồn nước dồi
dào đủ cung cấp nhu cầu sản xuất và sinh hoạt (sông Đồng Nai), ngoài ra
nguồn nhân lực với trình độ cao đã tăng cường nguồn lực con người cho yêu
cầu phát triển công nghiệp hóa - hiện đại hóa.
- Là đầu mối giao thông quan trọng của quốc gia (đường sắt Thống Nhất, Quốc
lộ 1, Quốc lộ 51). Dòng sông Đồng Nai cũng đã tạo cho TP. một thuận lợi khá
lớn trong việc phát triển giao thông đường sông với các tỉnh lân cận.
1.4. Thực trạng môi trường nước sông Đồng Nai
Sông Đồng Nai bắt nguồn từ các vùng núi tỉnh Lâm Đồng (cao nguyên Lâm
Viên), chảy qua địa phận tỉnh từ Tân Phú đến Nhơn Trạch với chiều dài khoảng
290km, trong đó dòng chảy sông Đồng Nai được khống chế bởi chế độ mưa, vì vậy
thay đổi nhiều theo thời gian và không gian. Sông La Ngà chảy từ vùng núi tỉnh
Bình Thuận và Lâm Đồng đổ về hồ Trị An. Nhánh Tây Bắc là sông Bé, chảy từ
Bình Phước và góp nước cho sông Đồng Nai ở phía Tây huyện Vĩnh Cửu.
Đồ án tốt nghiệp
8

Tại hạ lưu là các nhánh nối với hệ thống sông Sài Gòn - Đồng Nai (sông Đồng
Tranh, Nhà Bè và Thị Vải), có lòng sông rộng và sâu chịu ảnh hưởng của thuỷ triều.
Sông Thị Vải bắt nguồn từ Long Thành chảy qua huyện Tân Thành và đổ ra Biển
Đông tại Vịnh Gành Rái. Sông có chiều dài khoảng 76km, rộng từ 400 - 600m và
sâu từ 12 - 15m, nơi sâu nhất đến 60m. Đây là con sông có nguồn nước ngọt rất ít
và chịu sự chi phối khá sâu sắc của hoạt động thủy triều biển.
Mạng lưới sông Đồng Nai khá phát triển với tổng số trên 60 sông suối. Vùng
phía Nam tỉnh (khoảng 500km

2
) có mật độ sông suối cao là 1 - 2km/km
2
và các
sông rạch này chịu ảnh hưởng trực tiếp của hoạt động thủy triều. Vùng phía Bắc
tỉnh (khoảng 4.200km
2
) có mật độ sông suối thấp là 0,5 - 1km/km
2
và các sông suối
này có dòng chảy phụ thuộc theo mùa. Đặc biệt, hồ Trị An trên sông Đồng Nai với
lưu lượng dự trữ nước lớn nhất, khi xả xuống hệ thống các sông lớn nhất trong các
năm gần đây là 780m
3
/s, nhỏ nhất 253m
3
/s và trung bình là 478m
3
/s.
1.4.1. Các nguồn gây ô nhiễm nước
Ô nhiễm chủ yếu hoạt động sản xuất công nghiệp, từ hoạt động chăn nuôi gia
súc, gia cầm, từ khu đô thị tập trung, từ các bệnh viện, trung tâm y tế cấp huyện, các
phòng khám tư nhân. Tổng lượng nước thải (công nghiệp, sinh hoạt) phát sinh hiện
nay khoảng 306.487 m
3
/ngày, tăng 1,3 lần so với năm 2005 (khoảng 240.000
m
3
/ngày), trong đó nước thải chưa được thu gom và xử lý chủ yếu là nước thải sinh
hoạt khoảng 190.000 m

3
/ngày.
Tính đến tháng 9 năm 2010, tỉnh Đồng Nai đã có 30 KCN được thành lập,
trong đó có 21 KCN đã đi vào hoạt động. Tổng lượng nước thải tại 21 KCN đang
hoạt động là 69.085 m
3
/ngày.
Trong 21 KCN đang hoạt động hiện nay, 19 KCN đã có hệ thống xử lý nước
thải tập trung có khối lượng nước thải phát sinh khoảng 66.634 m
3
/ngày và 02 KCN
chưa có hệ thống xử lý nước thải tập trung có khối lượng nước thải phát sinh
khoảng 2.451 m
3
/ngày.
Đồ án tốt nghiệp
9

Tổng lượng nước thải của các doanh nghiệp ngoài KCN có lưu lượng thải vừa
và lớn khoảng 44.845 m
3
/ngày; trong đó, 34 doanh nghiệp có hệ thống xử lý nước
thải với tổng công suất 27.200 m
3
/ngày.
1.4.2. Các khu vực bị ô nhiễm trên sông Đồng Nai
Khu vực hợp lưu sông Bé - sông Đồng Nai: Chất lượng nước chưa đạt yêu cầu
cho mục đích cấp nước sinh hoạt, ảnh hưởng một phần đến chất lượng nước đoạn hạ
lưu. Ô nhiễm chủ yếu là do các chất hữu cơ ở mức nhẹ, chất rắn lơ lửng, dầu mỡ và
vi sinh. Nguyên nhân là do các chất thải của các công ty, nhà máy và một phần

nước thải sinh hoạt của người dân địa phương thuộc địa phận tỉnh Bình Dương đổ
vào. Cụ thể: nước mặt tại vị trí thuộc đoạn sông Bé có màu vàng đục, nhiều chất
thải, dầu mỡ trên bề mặt, trong khi đó, nước mặt phía bờ tỉnh Đồng Nai sau cửa đập
hồ Trị An đổ về, chất lượng nước tốt, đạt yêu cầu cho mục đích sử dụng.
Sông Đồng Nai đoạn chảy qua TP. Biên Hòa là đoạn sông chịu tác động khá
nhiều nguồn thải có nồng độ và tải lượng ô nhiễm rất cao gồm: nguồn thải công
nghiệp của KCN Biên Hòa 1, Biên Hòa 2, Amata, Loteco và các cơ sở sản xuất kinh
doanh đan xen khu vực dân cư kế cận lưu vực sông thông qua chất lượng nước suối
Linh, suối Săn Máu, suối Bà Lúa và suối Chùa.
Ngoài ra còn một số nguồn thải xuất phát từ địa phận tỉnh Bình Dương thông
qua suối Siệp (KCN Tân Đông Hiệp A/B). Chính vì thế mà chất lượng nước thường
xuyên mất ổn định; khả năng tiếp nhận chất thải theo thời gian tỷ lệ thuận với yếu tố
tự làm sạch nguồn nước. Khu vực gần Cty Ajinomoto là khu vực tiếp nhận nguồn
nước từ suối Linh đổ vào. Bên cạnh đó, về phía thượng lưu là nơi tiếp nhận nước
thải từ các cống thải tập trung của các nhà máy thuộc KCN Biên Hoà 1.
1.5. Giới thiệu về mô hình ARIMA
1.5.1. Giới thiệu chung
Sự phát triển của công nghệ thông tin và việc ứng dụng công nghệ thông tin
trong nhiều lĩnh vực của đời số, kinh tế, xã hội trong nhiều năm qua cũng đồng
Đồ án tốt nghiệp
10

nghĩa với lượng dữ liệu đã được các cơ quan thu thập và lưu trữ ngày một tích lũy
nhiều lên. Họ lưu trữ các dữ liệu này vì cho rằng trong nó ẩn chứa những giá trị
nhất định nào đó. Tuy nhiên, theo thống kê thì chỉ có một lượng nhỏ của những dữ
liệu này( khoảng 5% đến 10%) là được sử dụng để phân tích, số còn lại họ không
biết sẽ phải làm gì hoặc có thể làm gì với chúng. Với lý do như vậy, các phương
pháp quản trị và khai thác cơ sở dữ liệu truyền thống ngày càng không đáp ứng
được thực tế đã làm phát triển một khuynh hướng kỹ thuật mới đó là kỹ thuật phát
hiện tri thức và khai phá dữ liệu (KDD – Knowledge Discovery and Data Mining).

Kỹ thuật KDD đã và đang được nghiên cứu, ứng dụng trong nhiều lĩnh vực
khác nhau ở các nước trên thế giới. Tại Việt Nam kỹ thuật này còn tương đối mới
mẻ tuy nhiên cũng đang được nghiên cứu và dần đưa vào ứng dụng.
Kỹ thuật dự báo đã hình thành từ thế kỉ 19, tuy nhiên dự báo có ảnh hưởng
mạnh mẽ khi công nghệ thông tin phát triển vì bản chất mô phỏng của các phương
pháp dự báo rất cần thiết sự hỗ trợ của máy vi tính. Đến những năm 1950, các lý
thuyết về dự báo cùng với các phương pháp luận được xây dựng và phát triển có hệ
thống.
Dự báo là một nhu cầu không thể thiếu cho những hoạt động của con người
trong bối cảnh bùng nổ thông tin. Dự báo sẽ cung cấp những cơ sở cần thiết cho các
hoạch định và có thể nói rằng nếu không có khoa học dự báo thì những dự định
tương lai c
ủa con người vạch ra sẽ không có sự thuyết phục đáng kể.
Trong công tác phân tích dự báo, vấn đề quan trọng hàng đầu cần đặt ra là việc
nắm bắt tối đa thông tin về lĩnh vực dự báo. Thông tin ở đây có thể hiểu một cách
cụ thể gồm: (1) các số liệu quá khứ của lĩnh vực dự báo. (2) biểu diễn tình hình hiện
trạng cũng như động thái phát triển của lĩnh vực dự báo và (3) đánh giá một cách
đầy đủ nhất các nhân tố ảnh hưởng cả về định lượng lẫn định tính.
Căn cứ vào nội dung phương pháp và mục đích của dự báo, người ta chia dự
báo thành hai loại: phương pháp định tính và phương pháp định lượng.
Đồ án tốt nghiệp
11

- Phương pháp định tính thường phụ thuộc rất nhiều vào kinh nghiệm của một
hay nhiều chuyên gia trong lĩnh vực liên quan. Phương pháp này thường được áp
dụng, kết quả dự báo sẽ được các chuyên gia trong lĩnh vực liên quan nhận xét,
đánh giá và đưa ra kết luận cuối.
- Phương pháp định lượng sử dụng những dữ liệu quá khứ theo thời gian, dựa
trên dữ liệu lịch sử để phát hiện chiều hướng vận động của đối tượng phù hợp với
một mô hình toán học nào đó và đồng thời sử dụng mô hình đó làm mô hình ước

lượng. Tiếp cận định lượng dựa trên giả định giá trị tương lai của biến số dự báo sẽ
phụ thuộc vào xu thế vận động của đối tượng đó trong quá khứ.
Phương pháp dự báo chất lượng nước sông theo chuỗi thời gian là một phương
pháp định lượng. Phương pháp chuỗi thời gian sẽ dựa trên việc phân tích chuỗi
quan sát của một biến duy nhất theo biến số độc lập là thời gian. Giả định chủ yếu là
biến số dự báo sẽ giữ nguyên chiều hướng phát triển đã xảy ra trong quá khứ và
hiện tại.
Một cách tổng quát, có bốn phương pháp dự báo chất lượng nước sông dựa
vào chuỗi thời gian: (1) mô hình hồi quy đơn phương trình, (2) mô hình hồi quy
phương trình đồng thời, (3) mô hình tự hồi quy vectơ (VAR) và mô hình trung bình
trượt kết hợp tự hồi quy (ARIMA).
Đề tài tập trung nghiên cứu mô hình ARIMA để thực hiện phân tích dữ liệu
chất lượng nước sông Đồng Nai đoạn chảy qua làng cá bè Tân Mai và hướng tới dự
báo chất lượng nước theo chỉ số WQI.
Mô hình ARIMA (AutoRegressive Intergrate Moving Avarage) do Box –
Jenkins đề nghị vào năm 1976, dựa trên mô hình tự hồi quy AR và mô hình trung
bình động MA. ARIMA là mô hình dự báo định lượng theo thời gian, giá trị tương
lai của biến số dự báo sẽ phụ thuộc vào xu thế vận động của đối tượng trong quá
khứ. Mô hình ARIMA phân tích tính tương quan giữa các dữ liệu quan sát để đưa ra
mô hình dự báo thông qua các giai đoạn nhận dạng mô hình, ước lượng các tham số
từ dữ liệu quan sát và kiểm tra các tham số ước lượng để tìm ra mô hình thích hợp.
mô hình kết quả của quá trình trên gồm các tham số thể hiện mức độ tương quan
Đồ án tốt nghiệp
12

trên dữ liệu và được chọn để dự báo giá trị tương lai. Giới hạn độ tin cậy của dự báo
được tính dựa trên phương sai của sai số dự báo.
1.5.2 Chuỗi thời gian
Trong thống kê, xử lý tín hiệu, kinh tế lượng và toán tài chính, chuỗi thời gian
là một chuỗi các điểm dữ liệu, được đo theo từng khoảng khắc thời gian liền nhau

theo một tần suất thời gian thống nhất.
Các nhà thống kê thường chia chuỗi theo thời gian thành 4 thành phần: thành
phần xu hướng dài hạn (long –term trend component), thành phần mùa (seasional
component), thành phần chu kỳ (cyclical component) và thành phần bất thường
(irregular component).
- Thành phần xu hướng dài hạn
Thành phần này dùng để chỉ xu hướng tăng hay giảm của đại lượng X trong thời
gian dài. Về mặt đồ thị thành phần này có thể biểu diễn bởi một đường thẳng hay
một đường cong trơn.
- Thành phần mùa
Thành phần này dùng để chỉ xu hướng tăng hay giảm của đại lượng X tính theo mùa
trong năm (có thể tính theo tháng trong năm). Ví dụ: Lượng tiêu thụ chất đốt sẽ tăng
vào mùa đông và giảm vào mùa hè, ngược lại, lượng tiêu thụ xăng sẽ tăng vào mùa
hè và giảm vào mùa đông.
- Thành phần chu kỳ
- Thành phần này chỉ sự thay đổi của đại lượng X theo chu kỳ. Thành phần này
khác thành phần mùa ở chỗ chu kỳ của đại lượng X kéo dài hơn 1 năm. Để đánh
giá thành phần này các giá trị của chuỗi thời gian được quan sát hàng năm.
- Thành phần bất thường
Đồ án tốt nghiệp
13

Thành phần này dùng để chỉ sự thay đổi bất thường của các giá trị trong chuỗi thời
gian. Sự thay đổi này không thể dự đoán bằng các số liệu kinh nghiệm trong quá
khứ, về mặt bản chất thành phần này không có tính chu kỳ.
1.5.3. Mô hình ARIMA
1.5.3.1. Hàm tự tương quan ACF
Hàm tự tương quan đo lường phụ thuộc tuyến tính giữa các cặp quan sát y(t)
và y(t+k), ứng với thời đoạn k = 1, 2, …(k còn gọi là độ trễ). Với mỗi độ trễ k, hàm
tự tương quan tại độ trễ k được xác định qua độ lệch giữa các biến ngẫu nhiên Y

t
.
Y
t+k
so với các giá trị trung bình, và được chuẩn hóa qua phương sai.
Dưới đây, giả thiết rằng các biến ngẫu nhiên trong chuỗi dừng thay đổi quanh
giá trị trung bình µ với phương sai hằng số δ
2
. Hàm tự tương quan tại các độ trễ
khác nhau sẽ có giá trị khác nhau.
Trong thực tế, ta có thể ước lượng hàm tự tương quan tại độ trễ thứ k qua
phép biến đổi trung bình của tất cả các cặp quan sát, phân biệt bằng các độ trễ k,
với giá trị trung bình mẫu là µ, được chuẩn hóa bởi phương sai σ
2
.Chẳng hạn, cho
mỗi chuỗi N điểm, giá trị r
k
của hàm tự tương quan tại độ trễ thứ k được tính như
sau :
r
k
=
2
1
))((
1
δ
µµ



=
+
−−
kN
t
ktt
yy
N
(1.1)
với µ=

=
N
t
t
y
N
1
)(
1
δ
2
=
2
1
)(
1

=


N
t
t
y
N
µ
(1.2)

y
t

: chuỗi thời gian dừng tại thời điểm t
y
t+k

: chuỗi thời gian dừng tại thời điểm t +k
µ: giá trị trung bình của chuỗi dừng
r
k

: giá trị tương quan giữa y
t
và y
t+k

tại độ trễ k
r
k

= 0 thì không có hiện tượng tự tương quan

Về mặt lý thuyết, chuỗi dừng khi tất cả các r
k

= 0 hay chỉ vài r
k

khác không.
Đồ án tốt nghiệp
14

Do chúng ta xem xét hàm tự tương quan mẫu, do đó sai số mẫu sẽ xuất hiện vì vậy,
hiện tượng tự tương quan khi r
k

= 0 theo ý nghĩa thống kê.
Khi hàm tự tương quan ACF giảm đột ngột, có nghĩa r
k

rất lớn ở độ trễ 1, 2
và có ý nghĩa thống kê (|t| >2). Những r
k

này được xem là những “đỉnh” và ta nói
rằng hàm tự tương quan ACF giảm đột ngột sau độ trễ k nếu không có những
“đỉnh” ở độ trễ k lớn hơn k. Hầu hết hàm tự tương quan ACF sẽ giảm đột ngột sau
độ trễ 1, 2.
Nếu hàm tự tương quan ACF của chuỗi thời gian không dừng không giảm đột
ngột mà trái lại giảm nhanh nhưng đều: không có đỉnh, ta gọi chiều hướng này là
“tắt dần”. Xem minh họa trong hình 4, hàm tự tương quan ACF có thể “tắt dần”
trong vài dạng sau :

Dạng phân phối mẫu
Dạng sóng sin
Kế
t hợp cả hai dạng 1 và 2.
Sự khác nhau giữa hiện tượng “tắt dần” nhanh và “tắt dần” chậm đều được
phân biệt khá tùy tiện.
1.5.3.2. Hàm tự tương quan từng phần PACF
Song song với việc xác định hàm tự tương quan giữa các cặp y(t) và y(t+k), ta
xác định hàm tự tương quan từng phần cũng có hiệu lực trong việc can thiệp đến
các quan sát y(t+1), , y(t+k-1). Hàm tự tương quan từng phần tại độ trễ k C
kk

được ước lượng bằng hệ số liên hệ y(t) trong mối kết hợp tuyến tính bên dưới. Sự
kết hợp được tính dựa trên tầm ảnh hưởng của y(t) và các giá trị trung gian y(t+k).
y(t+k) = C
k1
y(t+k-1) + C
k2
y(t+k-2) + + C
kk-1
y(t + 1) + C
kk
y(t) + e(t) (1.3)
Giải phương trình hồi quy dựa trên bình phương tối thiểu vì hệ số hồi quy C
kj

phải được tính ở mỗi độ trễ k, với j chạy từ 1 đến k.
Giải pháp ít tốn kém hơn do Durbin phát triển dùng để xấp xỉ đệ quy hệ số hồi
quy cho mô hình ARIMA chuỗi dừng, sử dụng giá trị hàm tự tương quan tại độ trễ
k r

k
và hệ số hồi quy của độ trễ trước. Dưới đây là phương pháp Durbin sử dụng
Đồ án tốt nghiệp
15

cho 3 độ trễ đầu tiên.
Độ trễ 1: Khởi tạo, giá trị của hàm tự tương quan từng phần tại độ trễ 1 có
cùng giá trị với hàm tự tương quan tại độ trễ 1 vì không có trung gian giữa các
quan sát kết tiếp : C11 = r
1

Độ trễ 2: Hai giá trị C
22
và C
21
được tính dựa vào hàm tự tương quan r
2

r
1
, cùng với hàm tự tương quan từng phần trước đó
C
22
=
111
11122
1 rC
rCr




C
21
=C
11
-C
22
C
11
Độ trễ 3: Tương tự, ba giá trị C
33
,C
32
, C
31
được tính dựa vào các hàm tự
tương quan trước r
3
, r
2
, r
1
cùng với các hệ số được tính ở độ trễ thứ 2: C
22
và C
21
.
C
33
=

121222
1222213
1 rCrC
rCrCr
−−
−−

C
32
=C
21
-C
33
C
22
C
31
=C
22
-C
33
C
21
Tổng quan, hàm tự tương quan từng phần được tính theo Durbin:
C
kk
=




−−


jjk
jkjkk
rC
rCr
),1(
),1(
1
(1.4)
Trong đó:
r
k
: Hàm tự tương quan tại độ trễ k
v: Phương sai
C
kj
: Hàm tự tương quan từng phần cho độ trễ k, loại bỏ những ảnh hưởng của
các độ trễ can thiệp.
C
kj
= C
k-1
,
j

– (C
kk
).C

(
k-1
,
k-j
)
k = 2,…, j = 1,2,…, k-1
C
22
= (r
2
-r
1
2
)/(1-r
1
2
)

C
11
= r
1

Khi độ trễ tăng, số các hệ số tăng theo. Phương pháp của Durbin cho phép
việc tính đệ quy dựa vào việc sử dụng kết quả trước đó.
Đồ án tốt nghiệp
16






Hình 4 a) dao động mũ tắt dần


Hình 4 b) Dao động mũ tắt dần theo
lu
Tó m lại, hàm tự tương quan ACF và hàm tự tương quan từng phần PACF của
chuỗi thời gian có các đặc tính khác nhau. Hàm tự tương quan ACF đo mức độ phụ
thuộc tuyến tính giữa các cặp quan sát. Hàm tự tương quan từng phần PACF đo
mức độ phụ thuộc tuyến tính từng phần. ARIMA khai thác những điểm khác biệt
này để xác định cấu trúc mô hình cho chuỗi thời gian.
Xu hướng vận động của hàm tự tương quan từng phần PACF có thể giảm đột
ngột (thường sau độ trễ 1 hoặc 2) hay có thể giảm đều. Cũng như hàm tự tương
quan ACF, xu hướng giảm đều của hàm tự tương quan từng phần PACF cũng có
các dạng phân phối mũ, dạng sóng hình sin hoặc kết hợp cả 2 dạng này (xem hình
1.1)


(a)

(b)
Đồ án tốt nghiệp
17





Hình 4 c) Dao động song tắt dần theo

hình sin

(c)
Hình 1.1. Ví dụ về chiều hướng giảm đều khác nhau
a) Dao động hàm mũ tắt dần (Damped Exponential)
b) Dao động tắt dần theo quy luật số mũ (Damped exponential oscillation)
c) Dao động sóng tắt dần theo quy luật hình sin (Damped sine wave)
1.5.3.3. Mô hình AR(p)
Theo [6, 11, 16], ý tưởng chính của mô hình AR(p) là hồi quy trên chính
số liệu quá khứ ở những chu kì trước.
Y(t) = a
0
+ a
1
y(t-1) + a
2
y(t-2) +…a
p
y(t-p) + e(t) (1.5)
Trong đó:
y(t): quan sát dừng hiện tại
y(t-1), y(t-2), : quan sát dừng quá khứ (thường sử dụng không quá 2 biến
này)
a
0
, a
1
, a
2
, … : các tham số phân tích hồi quy.

e
t
: sai số dự báo ngẫu nhiên của giai đoạn hiện tại. Giá trị trung bình được
mong đợi bằng 0.
Y(t) là một hàm tuyến tính của những quan sát dừng quá khứ y(t-1),y(t-2),
… Nói cách khác khi sử dụng
phân tích hồi quy y(t) theo các giá trị chuỗi thời
gian dừng có độ trễ, chúng ta sẽ được mô hình AR (yếu tố xu thế đã được tách
khỏi yếu tố thời gian, chúng ta sẽ mô hình hóa những yếu tố còn lại – đó là sai số).
Số quan sát dừng quá khứ sử dụng trong mô hình hàm tự tương quan là bậc
Đồ án tốt nghiệp
18

p của mô hình AR. Nếu ta sử dụng hai quan sát dừng quá khứ, ta có mô hình
tương quan bậc hai AR(2).
Điều kiện dừng là tổng các tham số phân tích hồi quy nhỏ hơn 1 :
a
1
+ a
2
+ … + a
p
< 1
Mô hình AR(1) : y(t) = a
0
+ a
1
y(t-1) + e(t)
Mô hình AR(2) : y(t) = a
0

+ a
1
y(t-1) + a
2
y(t-2) +e(t)

1.5.3.4. Mô hình MA(q)
Quan sát dừng hiện tại y(t) là một hàm tuyến tính phụ thuộc các biến sai số dự
báo quá khứ và hiện tại. Mô hình bình quân di động là một trung bình trọng số của
những sai số mới nhất.
y(t) = b
0
+ e(t) +b
1
e(t-1) + b
2
e(t-2) + +b
q
e(t-q) (1.6)
Trong đó :
y(t) : quan sát dừng hiện tại
e(t) : sai số dự báo ngẫu nhiên, giá trị của nó không được biết và giá trị
trung bình của nó là 0.
e(t-1), e(t-2), : sai số dự báo quá khứ (thông thường mô hình sẽ sử dụng
không quá 2 biến này)
b
0
, b
1
, b

2
, : giá trị trung
bình của y(t) và các hệ số bình quân di động.
q : sai số quá khứ được dùng trong mô hình bình quân di động, nếu ta sử
dụng hai sai số quá khứ thì sẽ có mô hình bình quân di động bậc 2 là MA(2).
Điều kiện cần là tổng các hệ số bình quân di động phải nhỏ hơn 1 :
b
1
+ b
2
+ + b
q
< 1
Mô hình MA(1): y(t) = b
0
+ e(t) + b
1
e(t-1)
Mô hình MA(2) : y(t) = b
0
+ e(t) + b
1
e(t-1) + b
2
e(t-2)
1.5.3.5. Sai phân I(d)
Chuỗi dừng: Chuỗi thời gian được coi là dừng nếu như trung bình và
phương sai của nó không đổi theo thời gian và giá trị của đồng phương sai giữa

×