Tải bản đầy đủ (.pdf) (66 trang)

Xây dựng mô hình dự báo chất lượng không khí

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.21 MB, 66 trang )

ĐẠI HỌC QUỐC GIA TP.HCM
TRƢỜNG ĐẠI HỌC BÁCH KHOA
KHOA KHOA HỌC & KỸ THUẬT MÁY TÍNH

LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC

XÂY DỰNG MƠ HÌNH
DỰ BÁO CHẤT LƢỢNG KHƠNG KHÍ
Ngành: KHOA HỌC MÁY TÍNH

HỘI ĐỒNG : KHOA HỌC MÁY TÍNH 2
GVHD
: TS. LÊ THANH VÂN
GVPB
: TS. LÊ TRỌNG NHÂN
---o0o--SVTH
: NGUYỄN HỮU NGHĨA - 1927027

TP. HỒ CHÍ MINH, THÁNG 02/2022
0





LỜI CAM ĐOAN

Em xin cam đoan đây là cơng trình nghiên cứu dƣới sự hƣớng dẫn của cô Lê
Thanh Vân. Các số liệu đƣợc sử dụng cho phân tích, nhận xét đƣợc thu thập từ nhiều
nguồn khác nhau và đƣợc ghi rõ tại phần tài liệu tham khảo. Kết quả nghiên cứu đƣợc
trình bày trong luận văn là do chính em thực hiện và hoàn toàn trung thực.


Nếu phát hiện có bất kỳ sự gian lận nào, em xin hồn toàn chịu trách nhiệm về nội
dung luận văn trƣớc Ban chủ nhiệm Khoa và Ban giám hiệu nhà trƣờng.

TP. Hồ Chí Minh, tháng 02 năm 2022
Sinh viên thực hiện

Nguyễn Hữu Nghĩa

1


LỜI CẢM ƠN

Em xin gửi lời cảm ơn chân thành đến cô Lê Thanh Vân, khoa Khoa học và Kỹ
thuật máy tính – Trƣờng Đại học Bách Khoa thành phố Hồ Chí Minh. Cơ đã trực tiếp chỉ
bảo và hƣớng dẫn em trong suốt quá trình thực hiện luận văn. Sự giúp đỡ tận tình của cơ
là động lực to lớn để em hoàn thiện đề tài này.
Em xin cảm ơn đến các thầy, cô công tác tại Khoa Khoa Học và Kỹ Thuật Máy
Tính – Trƣờng Đại học Bách Khoa thành phố Hồ Chí Minh, những ngƣời đã hết lòng
truyền đạt kiến thức, kỹ năng quý báu trong suốt thời gian vừa qua. Đó là những kiến thức
nền tảng vơ cùng quan trọng, khơng chỉ trong q trình thực hiện luận văn mà cịn là hành
trang khơng thể thiếu để tiếp tục sự nghiệp sau này.
TP. Hồ Chí Minh, tháng 02 năm 2022
Sinh viên thực hiện

Nguyễn Hữu Nghĩa

2



TĨM TẮT ĐỀ TÀI
Ơ nhiễm mơi trƣờng ln là vấn đề đáng quan tâm đến sức khỏe con ngƣời. Quá
trình phát triển đơ thị và cơng nghiệp hóa ở các quốc gia đều kéo theo các vấn đề về ô
nhiễm mơi trƣờng, trong đó có ơ nhiễm khơng khí. Các phƣơng tiện giao thơng cơ giới sử
dụng nhiên liệu hóa thạch nhƣ xăng, dầu diesel sản sinh nhiều loại khí thải SO2, NO2, CO,
PM10/PM2.5 trong quá trình đốt nhiên liệu. Các chất ơ nhiễm trong khơng khí có thể xâm
nhập sâu vào phổi, hệ thống tim mạch và gây ra nhiều căn bệnh từ nhẹ nhƣ ho, kích ứng
hơ hấp đến những căn bệnh thậm chí rất nặng nhƣ đột quỵ, ung thƣ phổi.
Tại Việt Nam, việc tiếp cận các chỉ số đánh giá chất lƣợng khơng khí cịn nhiều
hạn chế nên việc sử dụng các dữ liệu hiện có để đánh giá tác động đến sức khỏe trong
tƣơng lai gần luôn là cần thiết. Trong khuôn khổ luận văn này, nhiều phƣơng pháp đánh
giá chất lƣợng môi trƣờng khác nhau đƣợc đề cập đến. Mặc khác các dữ liệu thực tế cũng
đƣợc truy vấn, đánh giá và sử dụng để hiện thực một số mơ hình đánh giá chất lƣợng
khơng khí ở mức độ đánh giá ảnh hƣởng đến sức khỏe của con ngƣời.
Các mơ hình khác nhau đƣợc khảo sát trong luận văn bao gồm: các mơ hình dự
báo truyền thống (Tự hồi quy, ARIMA, Holt-Winters) và các mơ hình mạng nhân tạo
(mạng nơ ron ANN, mạng nơ ron RNN, mạng nơ ron LSTM). Kết quả thử nghiệm của
luận văn cho thấy các mơ hình nơ ron nhân tạo có khả năng dự báo chỉ số chất lƣợng
khơng khí với sai lệch thấp và tốt hơn nhiều so với các mơ hình dự báo truyền thống.
Ngồi ra, các mơ hình mạng nhân tạo trong luận văn cũng có thể đƣợc cải tiến để sử dụng
nhiều bộ dữ liệu khác nhau cho phù hợp với thực tiễn. Kết quả có thể đƣợc áp dụng để cải
tiến các mơ hình dự báo chất lƣợng khơng khí.
Từ khóa: Dự báo chất lƣợng khơng khí, Air Quality Index, Học máy, Mơ hình
mạng nơ ron nhân tạo

3


MỤC LỤC
TÓM TẮT ĐỀ TÀI ................................................................................................... 3

DANH MỤC CÁC BẢNG ........................................................................................ 7
DANH MỤC CÁC HÌNH ẢNH ............................................................................... 8
CHƢƠNG 1 - GIỚI THIỆU ĐỀ TÀI ........................................................................ 9
1.1.

Đặt vấn đề .................................................................................................. 9

1.2.

Mục tiêu, đối tƣợng và phạm vi nghiên cứu ........................................... 11

1.2.1. Mục tiêu nghiên cứu ............................................................................... 11
1.2.2. Đối tƣợng và phạm vi nghiên cứu .......................................................... 11
1.3.

Ý nghĩa thực tiễn của đề tài ..................................................................... 11

1.4.

Cấu trúc luận văn ..................................................................................... 12

CHƢƠNG 2 - CƠ SỞ LÝ THUYẾT ...................................................................... 13
2.1.

Các chỉ tiêu chất lƣợng khơng khí và phƣơng thức tính ......................... 13

2.1.1. Các chỉ tiêu chất lƣợng khơng khí .......................................................... 13
2.1.2. Tiêu chí đánh giá chất lƣợng khơng khí ................................................. 15
2.2.


Chuỗi thời gian và một số tính chất của chuỗi thời gian ......................... 19

2.2.1. Khái niệm................................................................................................ 19
2.2.2. Tính chất của chuỗi thời gian ................................................................. 19
2.2.3. Chuỗi dừng ............................................................................................. 20
2.2.4. Tự tƣơng quan và tự tƣơng quan bán phần............................................. 20
2.2.5. Nhiễu trắng và bƣớc ngẫu nhiên ............................................................. 20
2.3.

Đánh giá chất lƣợng khơng khí bằng phƣơng pháp thống kê ................. 21

2.3.1. Mơ hình tự hồi quy ................................................................................. 21
2.3.2. Mơ hình ARIMA .................................................................................... 21
2.3.3. Mơ hình làm mƣợt lũy thừa .................................................................... 22
2.4.

Đánh giá chất lƣợng khơng khí bằng học máy ........................................ 24

2.4.1. Mạng nơ ron nhân tạo (Artificial Neural Network - ANN): .................. 24
2.4.2. Mạng nơ ron hồi quy (Recurrent Neural Network - RNN) .................... 26
2.4.3. Mạng nơ ron LSTM (Long Short Term Memory) ................................. 26
2.4.4. Một số hàm tối ƣu trong học máy........................................................... 27
4


2.5.

Các cơng trình liên quan .......................................................................... 29

CHƢƠNG 3 – MƠ HÌNH DỰ BÁO CHẤT LƢỢNG KHƠNG KHÍ .................... 34

3.1.

Lƣợc đồ nghiên cứu ................................................................................. 34

3.2.

Thu thập dữ liệu....................................................................................... 35

3.3.

Chuẩn bị dữ liệu đầu vào ......................................................................... 36

3.4.

Kiểm định dữ liệu .................................................................................... 37

3.5.

Tạo tập huấn luyện .................................................................................. 38

3.6.

Xây dựng mơ hình ................................................................................... 39

3.6.1. Mơ hình tự hồi quy ................................................................................. 39
3.6.2. Mơ hình ARIMA .................................................................................... 40
3.6.3. Mơ hình Holt-Winters ............................................................................ 41
3.6.4. Mơ hình Mạng nhân tạo.......................................................................... 41
3.7.


Xây dựng thí nghiệm và đánh giá mơ hình ............................................. 42

3.7.1. Xây dựng thí nghiệm .............................................................................. 42
3.7.2. Đánh giá mơ hình ................................................................................... 43
3.8.

Tối ƣu và mở rộng mơ hình ..................................................................... 43

3.8.1. Xác định các thơng số tối ƣu .................................................................. 43
3.8.2. Mở rộng mơ hình với tập đầu vào là dữ liệu thơ .................................... 44
3.8.3. Mở rộng mơ hình với tập đầu vào là dữ liệu trạm lân cận ..................... 45
CHƢƠNG 4 – KẾT QUẢ VÀ THẢO LUẬN ........................................................ 46
4.1.

Đánh giá dữ liệu ...................................................................................... 46

4.2.

Xây dựng và đánh giá mơ hình ............................................................... 48

4.2.1. Thí nghiệm 1 ........................................................................................... 48
4.2.2. Thí nghiệm 2 ........................................................................................... 50
4.2.3. Thí nghiệm 3 ........................................................................................... 51
4.3.

Xác định các thông số tối ƣu ................................................................... 51

4.4.

Mở rộng với tập đầu vào là dữ liệu thô ................................................... 52


4.5.

Mở rộng với tập đầu vào là dữ liệu trạm lân cận .................................... 54

4.6.

Thảo luận chung ...................................................................................... 55

CHƢƠNG 5 - TỔNG KẾT ..................................................................................... 57
5


5.1.

Đánh giá kết quả đạt đƣợc ....................................................................... 57

5.2.

Hƣớng phát triển tƣơng lai ...................................................................... 58

TÀI LIỆU THAM KHẢO ....................................................................................... 59
PHỤ LỤC ................................................................................................................ 61

6


DANH MỤC CÁC BẢNG
Bảng 2.1 Giá trị giới hạn các thơng số cơ bản trong khơng khí (μg/m3) ................ 13
Bảng 2.2 Khoảng giá trị VN_AQI và đánh giá chất lƣợng khơng khí .................... 15

Bảng 2.3 Các mức VN_AQI tƣơng ứng ảnh hƣởng đến sức khỏe và khuyến nghị 15
Bảng 2.4 Các giá trị BPi và Ii của các chất ô nhiễm khơng khí ............................... 17
Bảng 2.5 Một số hàm kích hoạt phi tuyến thƣờng dùng ......................................... 24
Bảng 3.1 Các tham số cho mơ hình mạng nhân tạo ................................................ 41
Bảng 3.2 Các tham số mơ hình trong thí nghiệm tối ƣu ......................................... 44
Bảng 3.3 Ma trận khoảng cách của các trạm trong đề tài ....................................... 45
Bảng 4.1 Thống kê các chỉ số tại trạm s1090.......................................................... 46
Bảng 4.2 Sai số dự báo trung bình các mơ hình - Thí nghiệm 1 ............................. 48
Bảng 4.3 Sai số dự báo trung bình các mơ hình - Thí nghiệm 2 ............................. 50
Bảng 4.4 Sai số dự báo trung bình các mơ hình - Thí nghiệm 3 ............................. 51
Bảng 4.5 Sai số dự báo trung bình các mơ hình sử dụng đầu vào là dữ liệu thơ .... 52
Bảng 4.6 Sai số dự báo trung bình khi dùng dữ liệu trạm lân cận .......................... 54

7


DANH MỤC CÁC HÌNH ẢNH
Hình 1.1 Phân bố dân cƣ tiếp xúc với PM2.5 khu vực miền Bắc Việt Nam (2015). 10
Hình 2.1 Mơ hình tự hồi quy ................................................................................... 21
Hình 2.2 Mơ hình ARIMA ...................................................................................... 22
Hình 2.3 Mạng nơ ron truyền thẳng nhiều lớp ........................................................ 25
Hình 2.4 Mạng RNN và mạng LSTM một lớp ....................................................... 26
Hình 2.5 Các phƣơng pháp đánh giá chất lƣợng khơng khí .................................... 29
Hình 2.6 Phân bố không gian nồng độ chất ô nhiễm xây dựng từ mơ hình WRF .. 31
Hình 2.7 Tần suất các mạng nơ ron sử dụng trong dự báo chất lƣợng khơng khí .. 33
Hình 3.1 Lƣợc đồ nghiên cứu .................................................................................. 34
Hình 3.2 Các trạm quan trắc trong hệ thống AirNet. .............................................. 35
Hình 3.3 Truy vấn thu thập dữ liệu với socket server ............................................. 36
Hình 3.4 Biểu đồ của nhiễu trắng. ........................................................................... 37
Hình 3.5 Minh họa quá trình tạo tập huấn luyện cho mạng nhân tạo ..................... 38

Hình 3.6 Kỹ thuật tính tốn sử dụng cửa sổ trƣợt ................................................... 40
Hình 3.7 Q trình tái sử dụng mơ hình ARIMA trong thực nghiệm ..................... 41
Hình 4.1 Biểu đồ chỉ số chất lƣợng khơng khí tại trạm s1090 ................................ 47
Hình 4.2 Các biểu đồ kiểm tra nhiễu trắng và bƣớc ngẫu nhiên giá trị main AQI . 47
Hình 4.3 Biểu đồ phân rã chu kỳ của giá trị main AQI........................................... 48
Hình 4.4 Biểu đồ dự báo giá trị main AQI của các mô hình – Thí nghiệm 1 ......... 49
Hình 4.5 Biểu đồ so sánh các chỉ số đo sai lệch ở các kiến trúc khác nhau............ 52
Hình 4.6 Biểu đồ dự báo giá trị main AQI của các mơ hình – Thí nghiệm 5 ......... 53
Hình 4.7 Biểu đồ giá trị main AQI của 4 trạm quan sát .......................................... 54
Hình 4.8 Biểu đồ dự báo giá trị main AQI dùng dữ liệu trạm s1046 ...................... 55

8


CHƢƠNG 1 - GIỚI THIỆU ĐỀ TÀI
1.1.

Đặt vấn đề

Ô nhiễm khơng khí hiện nay khơng chỉ là vấn đề của một quốc gia riêng lẻ mà là
vấn đề đáng báo động toàn cầu. Dữ liệu của Tổ chức Y tế thế giới (WHO – World Health
Organization) cho thấy cứ mỗi 10 ngƣời thì có 9 ngƣời đang hít phải khơng khí bị ơ
nhiễm nặng. Theo ƣớc tính, mỗi năm ơ nhiễm khơng khí lấy đi tính mạng của gần bảy
triệu ngƣời. Các chất ơ nhiễm trong khơng khí có thể xâm nhập sâu vào phổi, hệ thống
tim mạch và gây ra nhiều căn bệnh từ nhẹ nhƣ ho, kích ứng hơ hấp đến những căn bệnh
thậm chí rất nặng nhƣ đột quỵ, ung thƣ phổi [1].
Q trình phát triển đơ thị và cơng nghiệp hóa ở các quốc gia đều kéo theo các vấn
đề về ô nhiễm môi trƣờng, trong đó có ơ nhiễm khơng khí. Theo kết quả báo cáo năm
2019 của Cơ quan năng lƣợng quốc tế (IEA - International Energy Agency), lƣợng khí
CO2 phát thải từ các hoạt động sản xuất công nghiệp và hoạt động giao thông vận tải

chiếm lần lƣợt 39.3% và 27.0% tổng lƣợng khí CO2 phát thải tồn cầu [2]. Các phƣơng
tiện giao thơng cơ giới sử dụng nhiên liệu hóa thạch nhƣ xăng, dầu diesel sản sinh nhiều
loại khí thải SO2, NO2, CO, PM10/PM2.5 trong q trình đốt nhiên liệu, thậm chí rò rỉ
nhiên liệu trong khi vận hành gây phát sinh Benzen, Toluen và các hợp chất dễ bay hơi
khác nhƣ ethylbenzene, xylenes ... [3].
Tại Việt Nam, ơ nhiễm khơng khí tại các đô thị lớn ngày càng gia tăng do chịu
nhiều ảnh hƣởng từ các hoạt động giao thông vận tải cũng nhƣ các hoạt động phát triển
kinh tế xã hội. Khí thải từ các phƣơng tiện giao thơng đƣờng bộ nhƣ xe ô tô và xe gắn
máy luôn chiếm tỷ trọng lớn trong tổng lƣợng khí thải gây ơ nhiễm. Tính đến đầu năm
2020, tồn quốc có khoảng 45 triệu xe máy và gần 4 triệu xe ô tô đang lƣu hành. Trong
đó, Hà Nội có 6 triệu xe máy, thành phố Hồ Chí Minh có 8 triệu xe máy [4]. Trong số các
phƣơng tiện giao thông đang lƣu hành, nhiều phƣơng tiện đã cũ, quá hạn sử dụng và
không đƣợc bảo dƣỡng định kỳ nên hiệu suất đốt cháy nhiên liệu thấp gây phát thải các
chất ô nhiễm khơng khí ngày càng nhiều. Trong khoảng thời gian thực hiện cách ly xã hội
để phòng dịch bệnh COVID-19, giá trị các thông số PM2.5 và CO giảm rõ rệt so với
khoảng thời gian cùng kỳ các năm trƣớc càng cho thấy sự ảnh hƣởng của các nguồn phát
thải từ giao thơng có ảnh hƣởng lớn đến chất lƣợng chung của khu vực [4].
Theo thống kê của Bộ Tài nguyên và Môi trƣờng Việt Nam, giai đoạn từ năm 2018
đến năm 2019 nhìn chung có nồng độ bụi PM2.5 cao hơn so với giai đoạn từ 2010-2017.
Chỉ số chất lƣợng khơng khí tại hai thành phố lớn nhất cả nƣớc là Hà Nội và Thành phố
Hồ Chí Minh có nhiều địa điểm nằm ở mức xấu, với chỉ số AQI nằm trong khoảng 150200, thậm chí đơi lúc cao hơn 200 (mức rất xấu) [4]. Các hạt bụi mịn kích thƣớc nhỏ nhƣ
9


PM2.5 lơ lửng trong khơng khí nếu thẩm thấu vào đƣờng hô hấp sẽ gây ảnh hƣởng xấu đến
sức khỏe con ngƣời [5].
Trong một nghiên cứu kết hợp giữa Viện Phân tích Hệ thống Ứng dụng Quốc tế
(Cộng hịa Áo) và Viện Hàn lâm Khoa học và Công nghệ (Việt Nam) về quản lý chất
lƣợng khơng khí tại miền Bắc Việt Nam (năm 2015) cho thấy: giao thông đƣờng bộ là
nguồn phát thải PM2.5 lớn tại khu vực Hà Nội khi đóng góp đến gần 25% lƣợng khí ơ

nhiễm. Nồng độ PM2.5 cao nhất (lên đến 55 μg/m3) tập trung tại khu vực đô thị Hà Nội và
giảm dần ở các khu vực lân cận. Nghiên cứu trên cũng cho thấy có đến 20 triệu ngƣời tiếp
xúc với nồng độ PM2.5 cao hơn tiêu chuẩn ban hành, đặc biệt là ở thành phố Hà Nội, tỉnh
Bắc Ninh và tỉnh Hƣng Yên (Hình 1.1) [6].

Hình 1.1 Phân bố dân cƣ tiếp xúc với PM2.5 khu vực miền Bắc Việt Nam (2015)
Trƣớc thực trạng chất lƣợng khơng khí ln ở ngƣỡng đáng lo ngại, nhu cầu thông
tin về chỉ tiêu chất lƣợng khơng khí ln là vấn đề đáng quan tâm với ngƣời dân, đặc biệt
với những ngƣời có thể trạng yếu. Nắm bắt đƣợc thơng tin chất lƣợng khơng khí sẽ giúp
chủ động hơn cho các hoạt động ngoài trời và các sinh hoạt nói chung khác. Các nguồn
thơng tin chất lƣợng khơng khí hiện nay đang ở mức ghi nhận kết quả hiện tại. Để giúp
chủ động hơn nữa trong việc lên kế hoạch cho các hoạt động và sinh hoạt hằng ngày,
thơng tin dự báo chất lƣợng khơng khí cho tƣơng lai là rất cần thiết.
Trƣớc nhu cầu cấp thiết nhƣ trên, đề tài “Xây dựng mơ hình dự báo chất lƣợng
khơng khí” đƣợc tiến hành, với mục đích bƣớc đầu xây dựng mơ hình đánh giá chất
lƣợng khơng khí ở mức chấp nhận đƣợc, tiến tới xây dựng hệ thống dự báo thơng tin chất
lƣợng khơng khí hồn chỉnh trong tƣơng lai.

10


1.2.

Mục tiêu, đối tƣợng và phạm vi nghiên cứu

1.2.1. Mục tiêu nghiên cứu
Mục tiêu nghiên cứu của đề tài là tìm hiểu về bài tốn dự báo chất lƣợng khơng
khí, xây dựng và đánh giá khả năng dự báo chất lƣợng khơng khí sử dụng các mơ hình
tốn học truyền thống cũng nhƣ các mơ hình dự báo sử dụng mạng nơ ron nhân tạo. Từ
đó chọn lựa mơ hình phù hợp để dự báo chất lƣợng khơng khí trong tƣơng lai gần. Ngoài

ra, nghiên cứu cũng thực hiện cải tiến mơ hình hiện có để có thể sử dụng nhiều loại dữ
liệu đầu vào khác nhau phục vụ cho nhu cầu dự báo chất lƣợng khơng khí.
Để đạt đƣợc mục tiêu trên, luận văn thu thập dữ liệu từ nguồn thông tin khách
quan, tiến hành các bƣớc làm sạch dữ liệu (loại bỏ dữ liệu dƣ thừa, xử lý dữ liệu thiếu ...)
và thực hiện các kiểm định cần thiết. Các mơ hình dự đốn khác nhau đƣợc tìm hiểu và đề
xuất bao gồm mơ hình tự hồi quy, ARIMA, Holt-Winters cùng nhiều mơ hình học máy
khác nhau (mạng nhân tạo nhiều lớp ANN, mạng hồi quy RNN và mạng LSTM). Từ đó
đề xuất mơ hình phù hợp nhất trong dự báo chất lƣợng khơng khí.
1.2.2. Đối tƣợng và phạm vi nghiên cứu
Chỉ số AQI chính theo giờ (main AQI) là đối tƣợng đƣợc tập trung khảo sát trong
luận văn này. Đây là chỉ số cơ bản và chủ yếu của tồn bộ các đánh giá chất lƣợng khơng
khí tại Việt Nam và tại nhiều quốc gia khác. Chỉ số này có cách tính tốn khác biệt tùy
thuộc vào quy chuẩn của từng quốc gia, nên để phù hợp với thực tiễn đề tài, toàn bộ các
chỉ số AQI xem xét trong luận văn đều sử dụng chung theo quy chuẩn của Việt Nam (theo
quyết định 1459/QĐ-TCMT).
Nghiên cứu đƣợc thực hiện với tập dữ liệu đầu vào thu thập tại các trạm quan trắc
có phân bố vị trí địa lý tại khu vực Hà Nội, trong khoảng thời gian khảo sát từ ngày
19/11/2021 đến ngày 19/12/2021. Đây là một trong hai thành phố có mật độ dân số cao
nhất cả nƣớc với lƣu lƣợng xe cộ dày đặc, thích hợp cho việc đánh giá các mơ hình chất
lƣợng khơng khí thuộc khu vực đơ thị.
1.3.

Ý nghĩa thực tiễn của đề tài

Trong quá trình thực hiện nghiên cứu, đề tài sẽ thu thập và tổng hợp một bộ dữ liệu
về nồng độ chất gây ô nhiễm tại địa phƣơng. Đây là nguồn tham khảo hữu ích cho các
nghiên cứu sau này trong lĩnh vực môi trƣờng cũng nhƣ các đề tài xây dựng mơ hình tốn
học khác.

11



Với nguồn dữ liệu đầu vào thu thập từ thực tiễn và đáng tin cậy, các mơ hình có
đƣợc từ đề tài sẽ cho kết quả khách quan và góp phần hỗ trợ cho các công tác quản lý môi
trƣờng tại khu vực nghiên cứu, cung cấp phƣơng pháp tính tốn chỉ số chất lƣợng khơng
khí có độ chính xác tốt, góp phần hỗ trợ việc đánh giá chất lƣợng khơng khí cho hiện tại
và tƣơng lai gần.
Góp phần cung cấp thêm thông tin về hiện trạng chất lƣợng không khí tại Việt
Nam, phục vụ cho các nhà quản lý đƣa ra các định hƣớng hạn chế tác động của ô nhiễm
không khí đến sức khỏe con ngƣời
Cấu trúc luận văn

1.4.

Cấu trúc luận văn đƣợc chia thành 5 chƣơng, bao gồm:
Chƣơng

Nội dung

1

Giới thiệu tổng quan về đề tài, mục tiêu và phạm vi nghiên cứu

2

Cơ sở lý luận

3

Lƣợc đồ nghiên cứu, phƣơng pháp thực hiện và xây dựng mơ hình


4

Kết quả, nhận xét kết quả trên tập huấn luyện – tập kiểm tra và kết luận

5

Đánh giá kết quả đạt đƣợc và hƣớng phát triển tƣơng lai

12


CHƢƠNG 2 - CƠ SỞ LÝ THUYẾT
2.1.

Các chỉ tiêu chất lƣợng khơng khí và phƣơng thức tính

2.1.1. Các chỉ tiêu chất lƣợng khơng khí
Tại Việt Nam, căn cứ vào quy chuẩn quốc gia hiện đang có hiệu lực (QCVN
05:2013/BTNMT) [7], các thông số đƣợc quy định để đánh giá chất lƣợng khơng khí
xung quanh bao gồm:
 Sulfur dioxide (SO2),
 Carbon monoxide (CO),
 Nitrogen dioxide (NO2),
 Ozone (O3),
 Tổng bụi lơ lửng (TSP - total suspended particulates - tổng các hạt bụi có đƣờng
kính khí động học nhỏ hơn hoặc bằng 100 μm),
 Bụi PM10 (particulate matter – tổng các hạt bụi lơ lửng có đƣờng kính khí động học
nhỏ hơn hoặc bằng 10 μm),
 Bụi PM2,5 (tổng các hạt bụi lơ lửng có đƣờng kính khí động học nhỏ hơn hoặc bằng

2,5 μm),
 Chì (Pb) – Khơng dùng để tính AQI trong 1459/QĐ-TCMT
Bảng 2.1 Giá trị giới hạn các thông số cơ bản trong khơng khí (μg/m3)
STT
Thơng số
Trung
Trung
Trung
Trung
bình 1 giờ bình 8 giờ bình 24 giờ bình năm
1
SO2
350
125
50
2
CO
30 000
10 000
3
NO2
200
100
40
4
O3
200
120
5
Tổng bụi lơ

300
200
100
lửng (TSP)
6
Bụi PM10
150
50
7
Bụi PM2,5
50
25
8
Pb
1,5
0,5
Dấu (-): Khơng quy định.
Trung bình x giờ: giá trị trung bình của các giá trị đo đƣợc trong khoảng thời gian x giờ liên tục.

2.1.1.1. Sulfur Dioxide (SO2)
Sulfur dioxide là một loại khí độc hại phát sinh chủ yếu do tiêu thụ nhiên liệu hóa
thạch hoặc bởi các hoạt động công nghiệp. Bệnh nhân với các vấn đề về phổi, ngƣời già
và trẻ nhỏ có nguy cơ bị tổn thƣơng cao hơn khi tiếp xúc với loại khí này. Các tác hại về
13


sức khỏe khi tiếp xúc có thể kể đến bao gồm viêm phổi , gây kích ứng đƣờng hơ hấp, tăng
tiết dịch nhầy, co thắt phế quản. Ngoài ra các trƣờng hợp bỏng rát da, tổn thƣơng mắt
cũng đƣợc ghi nhận [8]. Các hiện tƣợng thiên nhiên bất lợi nhƣ mƣa axit, giảm độ pH của
đất cũng có mối liên hệ với loại khí này [9].

2.1.1.2. Carbon Monoxide (CO)
Carbon monoxide là loại khí khơng màu, khơng vị phát sinh do sự đốt cháy khơng
hồn tồn các nhiên liệu hóa thạch. Các triệu chứng khi bị nhiễm độc do hít phải carbon
monoxide thƣờng gặp là đau đầu, chóng mặt, buồn nơn và nặng hơn là mất ý thức, hôn
mê. Ái lực của hemoglobin trong máu với carbon monoxide cao hơn so với ái lực với
oxygen, dẫn đến việc thiếu oxygen trong máu. Tình trạng nhiễm độc có thể diễn tiến nặng
khi tiếp xúc với khí này ở nồng độ cao trong thời gian dài [10]. Carbon monoxide cũng là
loại khí góp phần gây hiệu ứng nhà kính, hiện tƣợng nóng lên của trái đất và biến đổi khí
hậu [9].
2.1.1.3. Nitrogen Oxide (NO2)
Nitrogen oxide là loại khí phát sinh do việc đốt cháy các nhiên liệu hóa thạch và
thƣờng có mối liên hệ với các hoạt động giao thông [11]. Chúng gây kích ứng đƣờng hơ
hấp, ho, khó thở và đau rát mắt. Nitrogen oxide cũng gây ảnh hƣởng đến khứu giác và
thậm chí gây các bệnh lý cấp tính ở phổi nếu tiếp xúc ở thời gian dài. Năng suất và sản
lƣợng cây trồng cũng đƣợc ghi nhận giảm sút khi nitrogen oxide hiện diện ở nồng độ cao
trong khơng khí [8].
2.1.1.4. Ozone (O3)
Khí ozone đƣợc tạo thành từ các khí oxygen dƣới xúc tác của sự phóng điện trong
bầu khí quyển trái đất. Nó là một chất oxy hóa cực mạnh và do đó có khả năng kích thích
q trình oxy hóa gây tổn thƣơng tế bào. Tiếp xúc với khí ozone có thể gây khó thở, viêm
đƣờng hơ hấp, làm tình trạng của bệnh nhân hen suyễn thêm trầm trọng . Vì ozone ít tan
trong nƣớc nên chúng có thể đi sâu vào trong phổi và gây hại cho sức khỏe. Khí ozone
cũng là một trong những khí gây hiệu ứng nhà kính và góp phần vào sự ấm lên toàn cầu
của trái đất [12].
2.1.1.5. Bụi lơ lửng (PM)
Bụi lơ lửng là hỗn hợp các hạt lỏng hoặc rắn có kích thƣớc nhỏ có nguồn phát sinh
tự nhiên (cháy rừng, núi lửa, ...) hoặc các hoạt động của con ngƣời (tiêu thụ ngun liệu
hóa thạch, các hoạt động cơng nghiệp và nơng nghiệp ...). Chúng cũng có thể hình thành
do các phản ứng hóa học của các chất ơ nhiễm dạng khí. Một số loại bụi lơ lửng có thể kể
đến nhƣ: khói nhà máy, khói thuốc, bụi xi măng, bụi đƣờng, vi khuẩn, bào tử nấm mốc,...

Các hạt có đƣờng kính 10 μm hoặc nhỏ hơn đƣợc gọi là PM10, trong khi các hạt có đƣờng
kính 5 μm hoặc nhỏ hơn đƣợc gọi là PM5. Các hạt bụi lơ lửng có kích thƣớc càng nhỏ
14


càng dễ đi sâu vào đƣờng hơ hấp thậm chí hệ tuần hoàn và gây các ảnh hƣởng lâu dài đến
sức khỏe [5].
2.1.1.6. Chì (Pb)
Chì là một loại kim loại nặng có sẵn trong tự nhiên. Chúng đƣợc sử dụng trong pin,
xăng động cơ, mỹ phẩm hay trong nhiều vật dụng khác nhƣ bột màu, sơn, men gốm...
Nguồn gây ô nhiễm chì trong khơng khí chủ yếu đến từ sử dụng các nhiên liệu đốt cháy
có pha chì. Phơi nhiễm với chì có thể xảy ra do hít, nuốt phải hoặc hấp thu qua da, với trẻ
em là đối tƣợng rất dễ bị tổn thƣơng sức khỏe bởi chất này. Ngộ độc chì gây ảnh hƣởng
đến hệ thần kinh, giảm thơng minh, trí nhớ giảm sút, thậm chí gây hơn mê, co giật [13].
2.1.2. Tiêu chí đánh giá chất lƣợng khơng khí
Chỉ số chất lƣợng khơng khí Việt Nam (VN_AQI – Vietnam Air quality index) là
chỉ số đƣợc tính tốn từ các thông số quan trắc các chất ô nhiễm trong khơng khí ở Việt
Nam. Chúng cho biết tình trạng chất lƣợng khơng khí, mức độ ảnh hƣởng đến sức khỏe
con ngƣời và đƣợc tính theo thang điểm tƣơng ứng dựa theo Quyết định 1459 của Tổng
cục môi trƣờng Việt Nam [14]. Chỉ số VN_AQI đƣợc biểu diễn với các màu sắc để cảnh
báo chất lƣợng khơng khí nhƣ trình bày ở Bảng 1.2. Mức độ ảnh hƣởng tới sức khỏe con
ngƣời và các khuyến nghị tƣơng ứng đƣợc trình bày ở Bảng 1.3.
Bảng 2.2 Khoảng giá trị VN_AQI và đánh giá chất lƣợng khơng khí
Khoảng giá trị AQI Chất lƣợng khơng khí
Màu sắc
Mã màu RBG
0 – 50
Tốt
Xanh
0;228;0

51 – 100
Trung bình
Vàng
255;255;0
101 – 150
Kém
Da cam
255;126;0
151 – 200
Xấu
Đỏ
255;0;0
201 – 300
Rất xấu
Tím
143;63;151
301 - 500
Nguy hại
Nâu
126;0;35
Bảng 2.3 Các mức VN_AQI tƣơng ứng ảnh hƣởng đến sức khỏe và khuyến nghị
Ảnh hƣởng và khuyến nghị
Khoảng
Ngƣời nhạy cảm

AQI

Ngƣời bình thƣờng

0 – 50


- Khơng ảnh hƣởng sức khỏe
- Tự do thực hiện hoạt động ngoài trời

51– 100

- Chất lƣợng khơng khí chấp nhận
đƣợc
- Tự do thực hiện hoạt động ngồi trời

15

- Khơng ảnh hƣởng sức khỏe
- Tự do thực hiện hoạt động ngoài
trời
- Chịu tác động nhất định
- Có thể hoạt động ngồi trời
nhƣng nên theo dõi các triệu chứng
ho, khó thở ...


- Ít ảnh hƣởng
101– 150 - Cân nhắc giảm hoạt động ngồi trời
nếu có dấu hiệu đau mắt, ho, đau họng
- Bắt đầu có ảnh hƣởng đến sức khỏe
151 – 200 - Nên giảm các hoạt động mạnh khi ở
ngoài trời
- Ảnh hƣởng đến sức khỏe nghiêm
trọng hơn
201 – 300

-Hạn chế tối đa các hoạt động ngoài
trời
- Cảnh báo khẩn cấp, ảnh hƣởng sức
khỏe nghiêm trọng
301 - 500
- Nên ở trong nhà, đóng cửa ra vào và
cửa sổ

- Gặp phải vấn đề về sức khỏe
- Nên giảm các hoạt động mạnh và
giảm thời gian hoạt động ngoài trời
- Gặp phải vấn đề về sức khỏe
nghiêm trọng hơn
- Nên ở trong nhà và giảm hoạt
động mạnh
- Ảnh hƣởng đến sức khỏe nghiêm
trọng hơn
- Nên ở trong nhà và giảm hoạt
động mạnh
- Cảnh báo khẩn cấp, ảnh hƣởng
sức khỏe nghiêm trọng
- Nên ở trong nhà, đóng cửa ra vào
và cửa sổ

2.1.2.1. Giá trị
- với thông số PM2,5 và PM10
h
AQI là giá trị AQI đại diện cho chất lƣợng khơng khí trong 1 giờ. Giá trị Nowcast
là giá trị trung bình có trọng số đƣợc tính tốn từ 12 giá trị trung bình 1 giờ gần nhất so
với thời điểm tính tốn, dùng cho thông số PM2,5 và PM10.


tại,

Gọi ci là giá trị quan trắc trung bình một giờ tại thời điểm cách i-1 giờ so với hiện

Ta tính giá trị trọng số:
(
Với

thì

Với

thì

)




Nếu chỉ có một trong ba giá trị (c1, c2, c3) có dữ liệu thì xem nhƣ khơng có dữ liệu
và khơng tính đƣợc giá trị Nowcast. Nếu ci khơng có giá trị thì lấy wi-1 = 0.
2.1.2.2. Giá trị
– với thông số quan trắc khác
Với các thông số SO2, CO, NO2, O3 thì đƣợc tính nhƣ sau:

Với các thơng số PM2,5, PM10 thì đƣợc tính nhƣ sau:
16



Với giá trị
tổng hợp (là giá trị lớn nhất của các AQI trung bình theo giờ của
các thơng số, đƣợc làm trịn thành số ngun) thì đƣợc tính nhƣ sau:

Trong đó:

BPi
BPi+1
Ii
Ii+1
Cx
Nowcastx

: Giá trị AQI đại diện cho chất lƣợng khơng khí của thơng số x trong
1 giờ
: Nồng độ giới hạn dƣới của giá trị thông số quan trắc đƣợc quy định
tại Bảng 2.4 tƣơng ứng với mức i
: Nồng độ giới hạn trên của giá trị thông số quan trắc đƣợc quy định
tại Bảng 2.4 tƣơng ứng với mức i+1
: Giá trị AQI ở mức i đã cho trong bảng tƣơng ứng với giá trị BPi
: Giá trị AQI ở mức i đã cho trong bảng tƣơng ứng với giá trị BPi+1
: Giá trị quan trắc trung bình 1 giờ của thông số x
: Giá trị Nowcast

Bảng 2.4 Các giá trị BPi và Ii của các chất ô nhiễm khơng khí
Giá trị BPi quy định đối với từng thơng số (μg/m3)
i
Ii
O3(1h) O3(8h)
CO

SO2
NO2
PM10 PM2,5
1
0
0
0
0
0
0
0
0
2
50
160
100
10.000
125
100
50
25
3
100
200
120
30.000
350
200
150
50

4
150
300
170
45.000
550
700
250
80
5
200
400
210
60.000
800
1.200
350
150
6
300
800
400
90.000
1.600 2.350
420
250
7
400 1.000
120.000 2.100 3.100
500

350
8
500 ≥1.200
≥150.000 ≥2.630 ≥3.850 ≥600
≥500
Ghi chú: Tính tốn AQIh của O3 sử dụng giá trị BPi cho O3(1h). Tính tốn AQId
của O3 sử dụng giá trị BPi cho O3(1h) và O3(8h).
2.1.2.3. Giá trị
ngày
a) Một số khái niệm:
AQId là giá trị AQI đại diện cho chất lƣợng khơng khí trong 1 ngày. Giá trị AQI
lớn nhất của các thông số đƣợc sử dụng làm giá trị AQI ngày tổng hợp. Giá trị AQI ngày
đƣợc tính tốn dựa trên các giá trị nhƣ sau:
 Thơng số PM2.5 và PM10: giá trị trung bình 24 giờ.
17


 Thông số SO2, NO2 và CO: giá trị trung bình 1 giờ lớn nhất trong ngày.
 Thơng số O3: giá trị trung bình 1 giờ lớn nhất trong ngày và giá trị trung bình 8
giờ lớn nhất trong ngày.
Trong đó:
 Giá trị trung bình 1 giờ lớn nhất trong ngày: là giá trị lớn nhất trong số các giá
trị quan trắc trung bình 1 giờ.
 Giá trị quan trắc trung bình 8 giờ lớn nhất trong ngày: là giá trị lớn nhất trong
số các giá trị trung bình 8 giờ.
 Giá trị trung bình 8 giờ là trung bình cộng các giá trị trung bình 1 giờ trong 8
giờ liên tiếp.
 Giá trị trung bình 24 giờ: trung bình cộng các giá trị quan trắc trung bình 1 giờ
trong 1 ngày (từ 01:00 giờ đến 00:00 hơm sau)
b) Tính giá trị

(giá trị AQI theo ngày cho từng thông số quan trắc):
Với các thông số SO2, CO, NO2, O3, PM10, PM2,5 thì đƣợc tính nhƣ sau:

Với giá trị
tổng hợp (là giá trị lớn nhất của các AQI trung bình theo
ngày của các thơng số, đƣợc làm trịn thành số ngun) thì đƣợc tính nhƣ sau:

Trong đó:
: Giá trị AQI đại diện cho chất lƣợng khơng khí của thơng số x theo ngày
BPi

: Nồng độ giới hạn dƣới của giá trị thông số quan trắc đƣợc quy định tại
Bảng 2.4 tƣơng ứng với mức i

BPi+1

: Nồng độ giới hạn trên của giá trị thông số quan trắc đƣợc quy định tại
Bảng 2.4 tƣơng ứng với mức i+1

Ii

: Giá trị AQI ở mức i đã cho trong bảng tƣơng ứng với giá trị BPi

Ii+1

: Giá trị AQI ở mức i đã cho trong bảng tƣơng ứng với giá trị BPi+1

Cx

: Đƣợc quy định theo từng loại thông số quan trắc nhƣ sau:

PM2.5, PM10

: Cx là giá trị trung bình 24 giờ,

SO2, NO2, CO

: Cx là giá trị trung bình 1 giờ lớn nhất trong ngày.

O3

: Cx là giá trị lớn nhất trong giá trị trung bình 1 giờ lớn
nhất trong ngày và giá trị trung bình 8 giờ lớn nhất trong
ngày.
18


Ghi chú: Khơng tính tốn AQI thơng số O3 khi giá trị trung bình 8 giờ lớn nhất
trong ngày cao hơn 400 µg/m3 (lúc này chỉ tính tốn AQI đối với trung bình 1 giờ lớn
nhất trong ngày).
2.2.

Chuỗi thời gian và một số tính chất của chuỗi thời gian

2.2.1. Khái niệm
Chuỗi thời gian là chuỗi các điểm dữ liệu đƣợc đo theo từng khoảng thời gian liền
nhau và có khoảng cách điều nhau giữa những quan sát liên tiếp. Nhiều dữ liệu là dạng
chuỗi thời gian thƣờng bắt gặp trong cuộc sống nhƣ giá chứng khoán hàng ngày, tiền điện
phải trả hàng tháng, mực nƣớc thủy triều theo phút, giá trị chỉ số chất lƣợng khơng khí
theo giờ ...
Chuỗi thời gian có ƣu điểm lớn khi có thể lƣu trữ đƣợc giá trị của các quan sát theo

thời gian. Thế giới xung quanh luôn vận động, các sự vật, hiện tƣợng thƣờng không ở
trạng thái tĩnh mà thƣờng xuyên thay đổi theo thời gian, vì vậy dữ liệu chuỗi thời gian có
thể đƣợc áp dụng trong rất nhiều lĩnh vực. Một số lĩnh vực dùng chuỗi thời gian để lƣu trữ
và xử lý có thể kể đến nhƣ: lĩnh vực thống kê, kinh tế lƣợng, dự báo động đất, dự báo tài
chính, kỹ thuật điều khiển, kỹ thuật truyền thơng, xử lý tín hiệu... Chính vì vậy, phân tích
và tìm hiểu đƣợc các đặc tính của dữ liệu chuỗi thời gian đóng một vai trị rất quan trọng
trong cuộc sống.
2.2.2. Tính chất của chuỗi thời gian
Giống nhƣ nhiều loại dữ liệu khác, dữ liệu chuỗi thời gian cũng có những tính chất
đặc trƣng riêng biệt. Một số khái niệm liên quan đến chuỗi thời gian có thể kể đến đƣợc
liệt kê lần lƣợt bên dƣới.
- Lag: lag-n của chuỗi thời gian là chuỗi thời gian quá khứ cách thời điểm đang xét
n đơn vị thời gian hay nói cách khác, lag-n thu đƣợc bằng cách dịch chuyển n đơn vị thời
gian về quá khứ.
- Tính xu hƣớng: là yếu tố thể hiện xu hƣớng thay đổi của dữ liệu theo thời gian,
đó có thể là xu hƣớng tăng dần hay giảm dần. Xu hƣớng của chuỗi dữ liệu có thể là tuyến
tính hay phi tuyến. Đây là đặc điểm thƣờng thấy trong rất nhiều dữ liệu chuỗi thời gian.
Tính xu hƣớng ảnh hƣởng đáng kể tới việc đƣa ra nhận định về mối quan hệ tƣơng quan
giữa các chuỗi số. Do đó khi xây dựng các mơ hình chuỗi thời gian chúng ta cần xem xét
yếu tố xu hƣớng ở các giá trị để có đƣợc các dự báo hợp lý.
- Tính chu kỳ: là quy luật có tính chất lặp lại của dữ liệu theo thời gian. Giá trị chu
kỳ luôn là một giá trị cố định. Sự thay đổi của nhiệt độ theo giờ trong ngày, sự thay đổi
của mực nƣớc thủy triều theo ngày trong tháng ... là các ví dụ cho tính chu kỳ của chuỗi
dữ liệu. Việc tìm ra đƣợc tính chu kỳ trong là một công việc quan trọng và cho phép dự
báo các giá trị tƣơng lai chính xác hơn.
19


2.2.3. Chuỗi dừng
Một chuỗi thời gian dừng là chuỗi thời gian có trung bình và phƣơng sai của nó

khơng đổi qua thời gian, giá trị hiệp phƣơng sai (covariance) giữa hai giai đoạn chỉ phụ
thuộc vào khoảng cách giữa hai giai đoạn ấy chứ không phụ thuộc vào thời gian thực sự
tại đó hiệp phƣơng sai đƣợc tính.
Do vậy, chuỗi thời gian dừng không bao gồm các yếu tố xu thế và có các giá trị
xoay quanh giá trị trung bình của chuỗi. Có 2 cách để kiểm tra tính dừng của chuỗi là lấy
sai phân (bậc 1 hoặc bậc 2) hoặc kiểm định nghiệm đơn vị (unit root test). Việc xác định
chuỗi đang xét có là chuỗi dừng hay khơng khá quan trọng. Phân tích với dữ liệu là chuỗi
dừng giúp khái qt hóa kết quả phân tích cho các giai đoạn khác.
Chuỗi thời gian không dừng là chuỗi dữ liệu thời gian vi phạm một hoặc một số
các nguyên tắc trên. Trong thực tế, có rất nhiều chuỗi thời gian là chuỗi không dừng. Để
chuyển đổi chuỗi không dừng thành chuỗi dừng, ta có thể lấy sai phân một hoặc nhiều lần
giá trị chuỗi thời gian gốc.
2.2.4. Tự tƣơng quan và tự tƣơng quan bán phần
Tự tƣơng quan là sự tƣơng quan giữa các thành phần của chuỗi các quan sát đƣợc
sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian (trong số
liệu chéo). Hay nói cách khác, sự tự tƣơng quan xảy ra khi giá trị tại thời điểm yt có sự
tƣơng quan với giá trị tại các lag trƣớc đó của chính nó.

Hiện tƣợng tự tƣơng quan thƣờng xảy ra ở các chuỗi thời gian. Để xác định bậc tự
tƣơng quan, ta có thể sử dụng biểu đồ ACF (autocorrelation function).
Tự tƣơng quan bán phần giống nhƣ tự tƣơng quan nhƣng chỉ xét hai biến số (yt và
ylag) trong khi ảnh hƣởng của các biến số khác không thay đổi (không xét mức độ ảnh
hƣởng của các biến số nằm giữa yt và ylag):
yt ~ ylag
2.2.5. Nhiễu trắng và bƣớc ngẫu nhiên
Một chuỗi thời gian Y đƣợc gọi là nhiễu trắng nếu nó thỏa mãn: trung bình bằng 0,
các giá trị với các độ trễ khác nhau khơng có hiện tƣợng tự tƣơng quan và có sai số
phƣơng sai khơng đổi. Do trung bình và phƣơng sai khơng đổi nên chúng ta gọi phân phối
của nhiễu trắng là phân phối xác định và có dạng:
Y ~ N(0, σ2)

20


Nhiễu trắng là một thành phần ngẫu nhiên thể hiện cho yếu tố khơng thể dự báo
của mơ hình do nó khơng có tính quy luật.
Bƣớc ngẫu nhiên là chuỗi thời gian có giá trị phía sau bằng chính giá trị phía trƣớc
cộng với nhiễu trắng. hay nói cách khác, chuỗi bƣớc ngẫu nhiên là chuỗi thỏa mãn công
thức:
yt = yt-1 + noise
Nếu chuỗi thời gian đang xét là chuỗi bƣớc ngẫu nhiên, chúng ta cũng không thể
xây dựng đƣợc mơ hình dự đốn [15].
2.3.

Đánh giá chất lƣợng khơng khí bằng phƣơng pháp thống kê

2.3.1. Mơ hình tự hồi quy
Mơ hình tự hồi quy AR(p) (autoregressive): là một mơ hình dự báo giá trị bằng
cách hồi quy trên chính số liệu ở những chu kỳ trƣớc. Mơ hình đƣợc biểu diễn qua cơng
thức:
Trong đó:
y(t): quan sát dừng hiện tại
y(t-1), y(t-2), ..., y(t-p): quan sát dừng tại các thời điểm (t-1), (t-2), ..., (t-p)
a0, a1, ..., ap: các tham số phân tích hồi quy
e(t): sai số dự báo ngẫu nhiên của giai đoạn hiện tại, với giá trị trung bình đƣợc
mong đợi bằng 0.
3.5
3
2.5
2
1.5

1
0.5
0

Giá trị thực
Giá trị dự
đốn
0

5

10

15

20

Hình 2.1 Mơ hình tự hồi quy
2.3.2. Mơ hình ARIMA
Mơ hình ARIMA (Tự hồi quy tích hợp trung bình trƣợt - Autoregressive Integrated
Moving Average) đƣợc 2 hai nhà thống kê Box và Jenkins giới thiệu vào năm 1974. Đây
là mơ hình tích hợp các quá trình: quá trình tự hồi quy bậc p – AR(p) và quá trình trung
bình trƣợt bậc q – MA(q), thể hiện trên chuỗi dữ liệu không dừng, đã đƣợc lấy sai phân
(với d chỉ mức độ sai phân)

21


×