Tải bản đầy đủ (.pdf) (150 trang)

Nghiên cứu quy luật diễn biến chất lượng không khí từ số liệu quan trắc tại 9 trạm quan trắc không khí tự động và xây dựng bản đồ phân bố ô nhiễm không khí cho tp hcm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (13.35 MB, 150 trang )

TRƯỜNG CAO ðẲNG TÀI NGUYÊN
VÀ MÔI TRƯỜNG TPHCM

ỦY BAN NHÂN DÂN TP.HCM
SỞ KHOA HỌC VÀ CÔNG NGHỆ

BÁO CÁO NGHIỆM THU

ðỀ TÀI NGHIÊN CỨU KHOA HỌC

Nghiên cứu quy luật diễn biến chất
lượng khơng khí từ số liệu quan trắc tại
9 trạm quan trắc khơng khí tự động và
xây dựng bản đồ phân bố ơ nhiễm cho
thành phố Hồ Chí Minh
Chủ nhiệm ñề tài: PGS.TS. Nguyễn ðinh Tuấn
TS. Lê Hoàng Nghiêm

THÀNH PHỐ HỒ CHÍ MINH
THÁNG 11/ 2010

1


TÓM TẮT NỘI DUNG NGHIÊN CỨU
Từ nhiều năm nay thành phố Hồ Chí Minh (TPHCM) có 9 trạm quan trắc tự động
chất lượng khơng khí (CLKK) hoạt động khá tốt, tích lũy hàng triệu số liệu quan trắc.
Tuy nhiên các số liệu quan trắc này chỉ mới ñược xử lý sơ bộ ñể báo cáo ñịnh kỳ mà chưa
ñược phân tích kiểm tra chất lượng và đánh giá độ tin cậy (QA/QC) của số liệu quan trắc.
Các số liệu quan trắc này chưa được nghiên cứu phân tích một cách tồn diện để tìm ra
quy luật diễn biến của các chất ơ nhiễm khơng khí trong ngày, trong tuần, theo mùa, xu


hướng trong nhiều năm, những trường hợp ô nhiễm cực đoan, cũng như chưa được sử
dụng để phân tích nhận diện các khu vực bị ơ nhiễm khơng khí nặng trên địa bàn
TPHCM. Ngồi ra các số liệu quan trắc này cũng chưa ñược sử dụng kết hợp với các
cơng cụ mơ hình chất lượng khơng khí để hiệu chỉnh, đánh giá mơ hình cũng như xây
dựng mơ hình dự báo chất lượng khơng khí cho TPHCM. Do đó việc phân tích đánh giá
độ tin cậy số liệu quan trắc từ đó tạo ra bộ số liệu tin cậy nhằm phục vụ cho việc phân
tích quy luật diễn biến các chất ơ nhiễm khơng khí, phân tích nhận diện các khu vực bị ơ
nhiễm khơng khí nặng trên địa bàn TPHCM đồng thời sử dụng kết hợp với cơng cụ mơ
hình, xây dựng mơ hình dự báo chất lượng khơng khí cho TPHCM là rất cần thiết. Thực
hiện tốt các cơng việc này sẽ đáp ứng và góp phần vào chiến lược bảo vệ mơi trường
khơng khí cho TPHCM.
Những kết quả đạt được từ đề tài chắc chắn có ý nghĩa rất lớn trong công tác bảo
vệ môi trường và ñịnh hướng quy hoạch phát triển kinh tế - xã hội của TP.HCM.

3


SUMMARY OF RESEARCH CONTENT

For many years, Ho Chi Minh City has been operating 9 automatic air quality
monitoring stations which have produced millions of data. Unfortunately, these data were
processed quite preliminarily for periodic reports without data quality and reliability
analysis. Besides, they have not yet been studied and analyzed comprehensively in order
to explore variation patterns of air pollutants during a day, a week, a season or years, and
in extreme pollution cases and to identify heavy air pollution areas in the city. In
additions, these data have neither been used in air quality modeling tools for adjusting
and assessing the models as well as for developing a specific air quality forecast model
for HCMC. Therefore, it is very necessary to analyze liability of monitoring data,
creating reliable database for exploring patterns of air pollutants, identifying heavy air
pollution areas and developing a specific air quality forecast model for HCMC. Good

implementation of this work will meet and contribute to air quality management.

The results obtained from the study is certainly of great significance in the
environmental protection planning and economic development of HCMC.

4


MỤC LỤC
CHƯƠNG 1. TỔNG QUAN ........................................................................................15
1.1. Các kỹ thuật thống kê ñược sử dụng trong nghiên cứu quy luật diễn biến chất
lượng khơng khí .........................................................................................................15

1.1.1. Cơ sở lý thuyết ..............................................................................................15
1.1.2. Ứng dụng phương pháp dữ liệu khí tượng để dự đốn nguồn ơ nhiễm...........37
1.1.3. Các ứng dụng nghiên cứu quy luật diễn biến chất lượng khơng khí...............37
1.2. Mơ hình chất lượng khơng khí.............................................................................39
1.3. Hệ thống các trạm quan trắc chất lượng khơng khí tại TPHCM ...........................43

1.3.1. Hệ thống quan trắc khơng khí tự động liên tục ..............................................43
1.3.2. Hệ thống quan trắc khơng khí bán tự động....................................................45
1.3.3. Hệ thống quan trắc Benzen – Toluen – Xylen (BTX)......................................47
CHƯƠNG 2. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU..............................50
2.1. Nội dung 1...........................................................................................................50
2.2. Nội dung 2...........................................................................................................50
2.3. Nội dung 3...........................................................................................................53
CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN ...............................................................63
3.1. Nội dung 1...........................................................................................................63
3.2. Nội dung 2...........................................................................................................70
3.3. Nội dung 3......................................................................................................... 131


3.3.1. Xây dựng các dữ liệu ñầu vào ..................................................................... 131
3.3.2. Bản ñồ phân bố nồng ñộ ô nhiễm O3 ........................................................... 136
CHƯƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ ............................................................. 146
4.1. Kết luận............................................................................................................. 146
4.2. Kiến nghị........................................................................................................... 147

5


DANH SÁCH CHỮ VIẾT TẮT
TCVN

: Tiêu chuẩn Việt Nam

TP.HCM

: Thành phố Hồ Chí Minh

TN & MT

: Tài ngun và Mơi trường

QLMT

: Quản lý môi trường

UBND

: Ủy ban nhân dân


US EPA

: Cục bảo vệ môi trường Hoa Kỳ

WHO

: Tổ chức y tế Thế giới

QT

: Trạm quan trắc ở công viên phần mềm Quang Trung

DOST

: Trạm Quan trắc ở Sở Khoa học công nghệ TpHCM

D2

: Trạm quan trắc ở Ủy Ban Nhân Dân quận 2

Zoo

: Trạm quan trắc ở Sở Thú

TD

: Trạm quan trắc ở phịng tài ngun Mơi trường quận
Thủ ðức


TN

: Trạm quan trắc ở bệnh viện Thống Nhất

BC

: Trạm quan trắc ở phịng giáo dục huyện Bình Chánh

HB

: Trạm quan trắc ở trường phổ thông Hồng Bàng

TSH

: Trạm quan trắc ở Viện Kỹ thuật Nhiệt ñới

6


DANH SÁCH BẢNG
Bảng 1.1. Nội dung cơng việc đã thực hiện..................................................................12
Bảng 1.2. Sản phẩm ñạt ñược của ñề tài.......................................................................14
Bảng 2.1. Một số đặc trưng thống kê mơ tả của thành phần bụi khí..............................16
Bảng 2.2. ðịnh nghĩa lại để xác định số lượng mẫu với hướng gió cho trước...............35
Bảng 2.3. Các mơ hình 3-D đã và đang áp dụng trên thế giới và ñặc ñiểm của chúng ..40
Bảng 2.4. Các trạm quan trắc chất lượng khơng khí tự động tại TPHCM. ....................43
Bảng 2.5. Tọa độ GPS của vị trí đo..............................................................................46
Bảng 2.6. Bản đồ vị trí trạm quan trắc chất lượng khơng khí Bán tự động tại TPHCM.47
Bảng 2.7. Vị trí các ñiểm ño BTX................................................................................47
Bảng 2.8. Tọa ñộ GPS của các vị trí đo BTX ...............................................................48

Bảng 3.1. Thơng số những nguồn điểm cao ở TP.HCM ...............................................58
Bảng 3.2. Hệ số phát thải của một số chất ñốt..............................................................58
Bảng 3.3. Hệ số phát thải của các vùng cơng nghiệp đặc trưng ....................................59
Bảng 3.4. Hệ số phát thải cho nguồn di ñộng ...............................................................60
Bảng 3.5. Hệ số phát thải cho loại nhiên liệu dung ñốt cháy trong gia đình..................60
Bảng 3.6. Hệ số phát thải VOC....................................................................................61
Bảng 4.1. Bảng tổng hợp các số liệu quan trắc tự ñộng thu thập ñược qua các năm .....68
Bảng 4.2. Liệt kê số liệu các thời điểm ơ nhiễm khơng khí nặng tại các trạm dân cư
Quận 2 (D2) và Tân Sơn Hòa (TSH) .......................................................................... 115
Bảng 4.3. Liệt kê số liệu các thời điểm ơ nhiễm khơng khí nặng tại các trạm nền Quang
Trung (QT) và Thảo Cần Viên (ZOO)........................................................................ 116
Bảng 4.4. Liệt kê số liệu các thời điểm ơ nhiễm khơng khí nặng tại trạm công
nghiệpThủ ðức (TD).................................................................................................. 117
Bảng 4.5. Liệt kê số liệu các thời điểm ơ nhiễm khơng khí nặng tại các trạm giao thơng
Bình Chánh, DOSTE, Hồng Bàng, Thống Nhất ......................................................... 117
Bảng 4.6. Bảng giá trị nồng ñộ PM10 từ 1 tuần trước và 1 tuần sau ngày ñạt cực đại
11/1/2006 tại 2 trạm Sở Thú và Bình chánh. .............................................................. 126
Bảng 4.7. Kết quả phân tích quan hệ giữa NO2 và các yếu tố khí tượng. ................... 128
Bảng 4.8. Kết quả phân tích quan hệ giữa PM10 và các yếu tố khí tượng.................... 130
Bảng 4.9. Tỷ lệ của các nguồn thải chất ơ nhiễu khơng khí (tấn/giờ) tại TPHCM (trong
khu vực nghiên cứu)................................................................................................... 131
Bảng 4.10. Phát thải từ các loại xe khác nhau (kg/giờ)............................................... 132
Bảng 4.11. Giá trị của các chỉ số thống kê đánh giá kết quả mơ hình CMAQ theo
USEPA ...................................................................................................................... 142
7


DANH SÁCH HÌNH
Hình 2.1. Biểu diễn Box- Whisker của Al, Ca2+, Cl- và K theo SPSS 7.0.....................17
Hình 2.2. Phân bố ñều của biến liên tục giữa 0 và 1.....................................................20

Hình 2.3. Phân bố trị trung bình trong 50 lần lấy mẫu ngẫu nhiên 50 biến liên tục phân
bố ñều giữa 0 và 1. .......................................................................................................21
Hình 2.4. Hàm phân bố mật độ χ2 ................................................................................22
Hình 2.5. Vùng từ chối và chấp nhận H0 trong phép thử giả thiết đi bên trái, mức độ
có ý nghĩa α = 0.05. .....................................................................................................24
Hình 2.6. Hìmh 6. Vùng chấp nhận và từ chối trong phép thử giả thiết hai đi, mức độ
có ý nghĩa α = 0.05. .....................................................................................................24
Hình 2.7. Mơ hình khơng gian của dữ liệu ...................................................................28
Hình 2.8. Mơ hình khơng gian của dữ liệu, góc nhìn từ trên xuống của hình 7.............28
Hình 2.9. Dữ liệu dưới dạng nhiều nguồn ....................................................................30
Hình 2.10. Ví dụ sản phẩm của mơ hình CPF sử dụng mơ hình mạng nhện trong Excel
.....................................................................................................................................36
Hình 2.11. Bản đồ vị trí trạm quan trắc chất lượng khơng khí tại TPHCM...................44
Hình 2.12. Bản đồ vị trí trạm quan trắc chất lượng BTX tại TP.HCM..........................49
Hình 3.1. Ví dụ bản đồ synoptic map...........................................................................53
Hình 3.2. Ví dụ mơ hình quỹ đạo HYSPLIT................................................................53
Hình 3.3. Sơ đồ phương pháp luận nghiên cứu cho nội dung 3 ....................................54
Hình 3.4. Khu vực dự kiến mơ hình hóa chất lượng khơng khí cho TPHCM ...............55
Hình 4.1. Phần mềm Enviman Comvisioner ................................................................63
Hình 4.2. Phần mềm Comvisioner – Reporter..............................................................64
Hình 4.3. AirQUIS – Quản lý, phân tích và thống kê số liệu........................................65
Hình 4.4. AirQUIS – Mơ hình tính tốn và dự báo chất lượng khơng khí ....................65
Hình 4.5. Kiểm tra chuỗi dữ liệu..................................................................................66
Hình 4.6. Kết quả giá trị 5 phút của NO2 và CO tại trạm Bình Chánh. .........................67
Hình 4.7. Sơ đồ tóm tắt q trình thu thập và cập nhật dữ liệu. ....................................67
Hình 4.8. Diễn biến nồng độ PM10 trong ngày tại các trạm quan trắc chất lượng khơng
khí tự động tại TPHCM (giai đoạn 2003-2007). ...........................................................72
Hình 4.9. Diễn biến nồng ñộ PM10 trong ngày theo mùa mưa và mùa khô tại các trạm
quan trắc chất lượng không khí tự động tại TPHCM. ...................................................72
Hình 4.10. Diễn biến nồng ñộ PM10 trong ngày tại trạm Bình Chánh (giai ñoạn tháng 3

và tháng 8 năm 2003) ...................................................................................................73
Hình 4.11. Diễn biến nồng ñộ O3 trong ngày tại các trạm quan trắc chất lượng khơng
khí tự động tại TPHCM................................................................................................75
Hình 4.12. Diễn biến nồng ñộ O3 trong ngày theo mùa mưa và mùa khơ tại các trạm
quan trắc chất lượng khơng khí tự ñộng tại TPHCM ....................................................76
Hình 4.13. Diễn biến nồng ñộ O3 trong ngày tại TSH (tháng 3 và tháng 8-2003) .........77
Hình 4.14. Diễn biến nồng ñộ CO trong ngày tại các trạm quan trắc chất lượng khơng
khí tự động tại TPHCM................................................................................................79
Hình 4.15. Diễn biến nồng ñộ CO trong ngày theo mùa khơ và mùa mưa tại trạm Bình
Chánh (tháng 3 và 8 năm 2003)....................................................................................79
8


Hình 4.16. Diễn biến nồng độ NO trong ngày tại các trạm quan trắc chất lượng khơng
khí tự động tại TPHCM................................................................................................81
Hình 4.17. Diễn biến nồng độ NO2 trong ngày tại các trạm quan trắc chất lượng khơng
khí tự động tại TPHCM................................................................................................83
Hình 4.18. Diễn biến nồng độ NO2 trong ngày theo mùa mưa và mùa khô tại các trạm
quan trắc chất lượng khơng khí tự động tại TPHCM. ...................................................85
Hình 4.19. Diễn biến nồng ñộ NO2 trong ngày tại các trạm (tháng 3 và 8 năm 2003 ñối
với trạm Quận 2 và tháng 3 và 8 năm 2002 đối với trạm DOSTE)................................86
Hình 4.20. Diễn biến nồng ñộ SO2 trong ngày tại các trạm quan trắc chất lượng khơng
khí tự động tại TPHCM................................................................................................88
Hình 4.21. Diễn biến nồng ñộ PM10 theo tháng trong năm tại các trạm quan trắc chất
lượng khơng khí tự động tại TPHCM. ..........................................................................90
Hình 4.22. Diễn biến nồng độ O3 theo tháng trong năm tại các trạm quan trắc chất
lượng không khí tự động tại TPHCM. ..........................................................................93
Hình 4.23. Diễn biến nồng ñộ O3 theo tháng trong năm 2003 tại trạm Quận 2 và TSH.94
Hình 4.24. Diễn biến nồng độ CO theo tháng trong năm tại các trạm quan trắc chất
lượng không khí tự động tại TPHCM. ..........................................................................95

Hình 4.25. Diễn biến nồng ñộ CO theo tháng trong năm 2002 tại trạm DOSTE...........96
Hình 4.26. Diễn biến nồng ñộ NO theo tháng trong năm tại các trạm quan trắc chất
lượng khơng khí tự động tại TPHCM. ..........................................................................98
Hình 4.27. Diễn biến nồng độ NO2 theo tháng trong năm tại các trạm quan trắc chất
lượng không khí tự động tại TPHCM. ........................................................................ 100
Hình 4.28. Diễn biến nồng ñộ NO2 theo tháng trong năm 2003 tại trạm DOSTE. ...... 101
Hình 4.29. Diễn biến nồng độ SO2 theo tháng trong năm tại các trạm quan trắc chất
lượng không khí tự động tại TPHCM. ........................................................................ 103
Hình 4.30. Diễn biến nồng ñộ SO2 theo tháng trong năm 2003 tại trạm Quận 2 (D2). 103
Hình 4.31. Diễn biến nồng độ PM10 qua các năm tại các trạm quan trắc chất lượng
không khí tự động tại TPHCM. .................................................................................. 104
Hình 4.32. Diễn biến PM10 tại các năm có số liệu tin cậy >70% ................................ 105
Hình 4.33. Diễn biến nồng độ O3 qua các năm tại các trạm quan trắc chất lượng khơng
khí tự ñộng tại TPHCM.............................................................................................. 106
Hình 4.34. Diễn biến nồng ñộ CO qua các năm tại các trạm quan trắc chất lượng khơng
khí tự động tại TPHCM.............................................................................................. 107
Hình 4.35. Diễn biến nồng ñộ CO qua các năm tại các trạm BC và TN ..................... 108
Hình 4.36. Diễn biến nồng độ NO qua các năm tại các trạm quan trắc chất lượng khơng
khí tự động tại TPHCM.............................................................................................. 109
Hình 4.37. Diễn biến nồng độ NO2 qua các năm tại các trạm quan trắc chất lượng khơng
khí tự động tại TPHCM.............................................................................................. 111
Hình 4.38. Diễn biến năm của NO2 tại một số trạm ................................................... 111
Hình 4.39. Diễn biến nồng ñộ SO2 qua các năm tại các trạm quan trắc chất lượng khơng
khí tự động tại TPHCM.............................................................................................. 112
Hình 4.40. Diễn biến năm của SO2 tại trạm Thống Nhất............................................ 113
Hình 4.41. Các hình thái synop gây ơ nhiễm khơng khí nặng tại TPHCM đợt tháng
1/2003. ....................................................................................................................... 114
Hình 4.42. Các hình thái synop gây ơ nhiễm khơng khí nặng tại TPHCM đợt tháng
1/2003. ....................................................................................................................... 120
Hình 4.43. Các hình thái synop gây ơ nhiễm khơng khí nặng tại TPHCM đợt tháng

1,2/2004. .................................................................................................................... 122
9


Hình 4.44. Các hình thái synop gây ơ nhiễm khơng khí nặng tại TPHCM đợt tháng
1/2005. ....................................................................................................................... 124
Hình 4.45. Các hình thái synop gây ơ nhiễm khơng khí nặng tại TPHCM đợt tháng
3/2005. ....................................................................................................................... 126
Hình 4.46. Biểu đồ diễn biến các ngày trước và sau ngày cực đoan ........................... 127
Hình 4.47. Tỷ lệ của các nguồn thải chất ô nhiễu khơng khí khác nhau tại TPHCM
(trong khu vực nghiên cứu) ........................................................................................ 132
Hình 4.48. Phân bố khơng gian của cường độ phát thải trung bình giờ từ nguồn đốt
nhiên liệu hóa thạch (anthropogenic) và Isoprenes từ nguồn sinh học (biogenic source) ở
thời ñiểm 12:00 giờ ñịa phương (kg/2.8 x 2.8 km2.giờ) .............................................. 133
Hình 4.49. So sánh số liệu kết quả mơ hình và số liệu đo đạc tại trạm Tân Sơn Hịa của
nhiệt độ, vận tốc gió và hướng gió theo chuỗi thời gian.............................................. 135
Hình 4.50. Trường gió mơ hình và hướng gió quan sát đo đạt tại trạm tân Sơn Hịa
(vịng trịn nhỏ) ở thời điểm 13:00 giờ địa phương ngày 10 tháng 3 năm 2005 ........... 136
Hình 4.51. So sánh số liệu nồng độ O3 từ kết quả mơ hình và số liệu quan trắc theo
chuỗi thời gian tại trạm QT và ZOO từ ngày 1 ñến 13 tháng 3 năm 2005 ................... 139
Hình 4.52. So sánh số liệu nồng độ O3 từ kết quả mơ hình và số liệu quan trắc theo
chuỗi thời gian tại trạm D2 (a) và nồng ñộ CO tại trạm DOSTE từ ngày 1 ñến 13 tháng 3
năm 2005 ................................................................................................................... 140
Hình 4.53. b: So sánh sự phân tán giữa số liệu O3 mô phỏng và số liệu quan trắc. a) Tất
cả các ngày trong thời đoạn mơ phỏng; b) Trừ các ngày có vận tốc gió mơ phỏng vượt
giá trị đo đạc. ............................................................................................................. 141
Hình 4.54. Bản đồ phân bố nồng độ ozơn tại mặt ñất cho khu vực TPHCM tại thời ñiểm
13:00 giờ ñịa phương từ ngày 1 ñến 6 tháng 3 năm 2005. .......................................... 144
Hình 4.55. Bản đồ phân bố nồng độ ozơn tại mặt ñất cho khu vực TPHCM tại thời ñiểm
13:00 giờ ñịa phương từ ngày 7 ñến 12 tháng 3 năm 2005.......................................... 145


10


PHẦN MỞ ðẦU
1. Tên ñề tài
Nghiên cứu quy luật diễn biến chất lượng khơng khí từ số liệu quan trắc tại 9 trạm
quan trắc khơng khí tự động và xây dựng bản đồ phân bố ơ nhiễm cho thành phố Hồ
Chí Minh.
Chủ nhiệm đề tài: PGS.TS. Nguyễn ðinh Tuấn
ðồng chủ nhiệm đề tài: TS. Lê Hồng Nghiêm
Tên cơ quan chủ trì: Trường Cao đẳng Tài ngun và Mơi trường TP.HCM
ðịa chỉ cơ quan: 236 B Lê Văn Sỹ – Quận Tân Bình – Thành phố Hồ Chí Minh
ðiện thoại : (08) 38443006
Fax: (08) 38449474
Cơ quan quản lý ñề tài: Sở Khoa học và Cơng nghệ thành phố Hồ Chí Minh
Thời gian thực hiện: 12/2008 – 09/2010
Kinh phí được duyệt: 500.000.000 ñồng
Kinh phí ñã cấp: theo TB số: TB-SKHCN ngày /
2. Mục tiêu của ñề tài
Nghiên cứu quy luật diễn biến chất lượng khơng khí và xây dựng bản đồ phân bố ơ
nhiễm cho thành phố Hồ Chí Minh
3. Nội dung nghiên cứu
Nội dung 1: Biên hội và xử lý số liệu quan trắc trung bình 5 phút từ 9 trạm quan trắc chất
lượng khơng khí (CLKK) tự động và một trạm khí tượng đại diện trên địa bàn TPHCM.
 ND 1.1. Thu thập các số liệu quan trắc (SLQT) trung bình 5 phút từ 9 trạm quan
trắc chất lượng khơng khí (CLKK) tự động trên địa bàn TPHCM. Mỗi trạm trung
bình khoảng 2,5 triệu số liệu.
 ND 1.2. Thu thập các số liệu đo đạc khí tượng từ trạm khí tượng đại diện (Tân Sơn
Hịa) trên địa bàn TPHCM.

 ND 1.3. Xử lý và phân tích số liệu 1h (từ số liệu 5 phút) từ 9 trạm quan trắc theo ñịnh
dạng (format) sẵn sàng dùng làm cơ sở ñể phân tích quy luật diễn biến.
Nội dung 2: Nghiên cứu quy luật diễn biến chất lượng khơng khí ở thành phố Hồ Chí
Minh qua phân tích bộ số liệu quan trắc CLKK tin cậy xây dựng trong nội dung 1.
 ND 2.1. Xác ñịnh quy luật diễn biến theo thời gian của các chất ơ nhiễm khơng khí
như: PM10, CO, NO, NO2, O3 trong ngày, trong tuần, theo mùa, theo năm tại từng
trạm và cả ñiạ bàn TPHCM.
 ND 2.2. Xác ñịnh quy luật diễn biến (mối tương quan) theo không gian của các
chất ơ nhiễm giữa các trạm, từ đó có kết luận liên quan đến nguồn phát và quy luật
lan truyền.
 ND 2.3. Nghiên cứu xem xét mối tương quan giữa ơ nhiễm khơng khí với các yếu
tố khí tượng (synoptic map), quỹ đạo các khối khí lan truyền (backward trajectory)
ñến ñịa bàn TPHCM.
 ND 2.4. Nghiên cứu ñánh giá những trường hợp ơ nhiễm cực đoan hay ơ nhiễm
nặng (air pollution episodes).
11


Nội dung 3: Áp dụng cơng cụ mơ hình chất lượng khơng khí để xây dựng bản đồ phân
bố ơ nhiễm khơng khí trên địa bàn TPHCM.
• ND 3.1. Xây dựng các dữ liệu đầu vào cho hệ thống mơ hình chất lượng khơng khí bao
gồm: cơ sở dữ liệu phát thải (emission database), dữ liệu khí tượng,… cho khu vực
TPHCM theo ñịnh dạng (format) sẵn sàng sử dụng cho các mơ hình chất lượng khơng
khí AirQUIS và mơ hình 3-D CMAQ.
• ND 3.2. Cài đặt và chạy mơ hình khí tượng MM5 trên máy tính để tạo cơ sở dữ liệu khí
tượng cho mơ hình chất lượng khơng khí.
• ND 3.3. Cài đặt và chạy mơ hình chất lượng khơng khí AIRQUIS và mơ hình CMAQ
cho các chất ơ nhiễm CO, bụi, SO2, và O3 cho thành phố Hồ Chí Minh.
• ND 3.4. So sánh đánh giá kết quả hai mơ hình trên.
• ND 3.5 Xây dựng bản đồ phân bố nồng độ ơ nhiễm cho các chất ơ nhiễm CO, bụi, NOx,

và O3.
• ND 3.6. ðào tạo và chuyển giao hệ thống mơ hình cho cơ quản quản lý.
Bảng 1.1. Nội dung cơng việc đã thực hiện
Cơng việc dự kiến
Nội dung 1: Biên hội và xử lý số liệu quan trắc trung
bình 5 phút từ 9 trạm quan trắc chất lượng khơng khí
(CLKK) tự động và một trạm khí tượng đại diện trên địa
bàn TPHCM
- ND 1.1. Thu thập các số liệu quan trắc (SLQT)
trung bình 5 phút từ 9 trạm quan trắc chất lượng
khơng khí (CLKK) tự ñộng trên ñịa bàn TPHCM.
Mỗi trạm trung bình khoảng 2,5 triệu số liệu.
- ND 1.2. Thu thập các số liệu ño ñạc khí tượng từ
trạm khí tượng ñại diện (Tân Sơn Hịa) trên địa
bàn TPHCM.
- ND 1.3. Xử lý và phân tích số liệu 1h (từ số liệu 5
phút) từ 9 trạm quan trắc theo ñịnh dạng (format)
sẵn sàng dùng làm cơ sở để phân tích quy luật diễn
biến.
Nội dung 2: Nghiên cứu quy luật diễn biến chất lượng
khơng khí ở thành phố Hồ Chí Minh qua phân tích bộ số
liệu quan trắc CLKK tin cậy xây dựng trong nội dung 1
- ND 2.1. Xác ñịnh quy luật diễn biến theo thời gian
của các chất ơ nhiễm khơng khí như: PM10, CO,
NO, NO2, O3 trong ngày, trong tuần, theo mùa,
theo năm tại từng trạm và cả ñiạ bàn TPHCM.
- ND 2.2. Xác ñịnh quy luật diễn biến (mối tương
quan) theo không gian của các chất ô nhiễm giữa
các trạm, từ ñó có kết luận liên quan ñến nguồn
phát và quy luật lan truyền.

- ND 2.3. Nghiên cứu xem xét mối tương quan giữa
ơ nhiễm khơng khí với các yếu tố khí tượng
(synoptic map), quỹ đạo các khối khí lan truyền
(backward trajectory) ñến ñịa bàn TPHCM.
- ND 2.4. Nghiên cứu ñánh giá những trường hợp ơ
12

Cơng việc đã thực hiện
ðã thực hiện theo các nội
dung trong ñề cương

ðã thực hiện theo các nội
dung trong ñề cương


nhiễm cực đoan hay ơ nhiễm nặng (air pollution
episodes).
Nội dung 3: Áp dụng cơng cụ mơ hình chất lượng khơng
khí ñể xây dựng bản ñồ phân bố ô nhiễm không khí trên
địa bàn TPHCM
- ND 3.1. Xây dựng các dữ liệu đầu vào cho hệ thống
mơ hình chất lượng khơng khí bao gồm: cơ sở dữ
liệu phát thải (emission database), dữ liệu khí
tượng,… cho khu vực TPHCM theo định dạng
(format) sẵn sàng sử dụng cho các mơ hình chất
lượng khơng khí AirQUIS và mơ hình 3-D CMAQ.
- ND 3.2. Cài đặt và chạy mơ hình khí tượng MM5 trên
máy tính để tạo cơ sở dữ liệu khí tượng cho mơ hình
chất lượng khơng khí.
- ND 3.3. Cài đặt và chạy mơ hình chất lượng khơng

khí AIRQUIS và mơ hình CMAQ cho các chất ô
nhiễm CO, bụi, SO2, và O3 cho thành phố Hồ Chí
Minh.
- ND 3.4. So sánh đánh giá kết quả hai mơ hình trên.
- ND 3.5 Xây dựng bản đồ phân bố nồng độ ơ nhiễm
cho các chất ô nhiễm CO, bụi, NOx, và O3.
- ND 3.6. ðào tạo và chuyển giao hệ thống mơ hình cho
cơ quản quản lý

13

ðã thực hiện nội dung 3.1,
3.2, 3.3, 3.5 và 3.6 trong đề
cương (khơng thực hiện nội
dung 3.4 vì khơng sử dụng
mơ hình AirQUIS, do máy
chủ chứa mơ hình này bị
hỏng, hiện khơng sữa chữa
được)


4. Sản phẩm của ñề tài
Bảng 1.2. Sản phẩm ñạt ñược của ñề tài
TT

Tên sản phẩm

Nội dung/ yêu cầu

Ghi chú


1

Báo cáo tổng hợp đề tài

Phân tích được quy luật diễn
biến CLKK trong ngày,
tuần, năm dựa trên số liệu
quan trắc thực tế.

2

Bản đồ phân bố ơ nhiễm

Bản đồ tỷ lệ 1:300.000

3

Mơ hình chất lượng khơng khí

4

Bài báo 1: STUDY OF AIR
QUALITY VARIATION IN HO
CHI MINH

5

Bài báo 2: PHOTOCHEMICAL
SMOG MODELING FOR OZONE

AIR QUALITY MANAGEMENT
IN HOCHIMINH CITY, VIETNAM

6

Hướng dẫn 1 luận văn Cao học:
Nghiên cứu quy luật diễn biến chất
lượng khơng khí cho PM10, Ozone,
NOx từ số liệu 9 trạm quan trắc
khơng khí tự động và xây dựng bản
đồ ơ nhiễm khơng khí cho thành phố
Hồ Chí Minh

Có thể áp dụng để xây dựng
bản đồ phân bố nồng độ ơ
nhiễm khơng khí cho
TPHCM
5th International symposium Phụ lục
for Institute of Advances in
Science and Technology
6 July 2010, VITEP, HCMC
AUN/SEED-Net
2nd Phụ lục
Regional Conference on
Global Environment
10 March 2010, Polytechnic
University, HCMC
Sinh Viên Nguyễn Viết Vũ,
khoa Môi trường - ðHBK,
khóa 2007


14


CHƯƠNG 1. TỔNG QUAN

Nhiều thành phố trên thế giới và khu vực ñã trang bị các trạm quan trắc tự động để
đánh giá tồn diện chất lượng khơng khí (CLKK) do có số liệu quan trắc chi tiết và đầy
đủ trong thời gian dài. Tại một số nước tiên tiến cịn có các supersite tích hợp nhiều trạm
và kỹ thuật quan trắc với nhau trong cùng một nơi tạo nên hiệu suất cộng năng trong
nghiên cứu CLKK. Với những cơ sở dữ liệu cực lớn, chỉ có các kỹ thuật thống kê cao cấp
mới cho phép rút ra các quy luật diễn biến CLKK ñáng tin cậy, là cơ sở ñể ra các quyết
ñịnh cải thiện CLKK và giảm thiểu các nguồn gây ơ nhiễm. Bên cạnh đó các mơ hình
chất lượng khơng khí cũng được nghiên cứu áp dụng để đánh giá và dự báo chất lượng
khơng khí cho các đơ thị và khu cơng nghiệp.
1.1. Các kỹ thuật thống kê ñược sử dụng trong nghiên cứu quy luật diễn biến chất
lượng khơng khí

1.1.1. Cơ sở lý thuyết
a. Thống kê mô tả (descriptive statistics)
+ Các khái niệm tập hợp tồn thể, mẫu đại diện và lấy mẫu
Một đối tượng nghiên cứu nào đó thường có rất nhiều, thậm chí vơ hạn, các cá thể
mà ta khơng thể đo đạc hoặc tiếp cận ñược chúng. Người ta gọi tập hợp tồn thể là tồn
bộ các cá thể trong đối tượng nghiên cứu đó. ðể nghiên cứu đối tượng đó hoặc ñể ước
lượng những ñặc trưng của ñối tượng, người ta có thể nhặt ra một nhóm hữu hạn các cá
thể và nghiên cứu, đo đạc chúng. Người ta gọi đó là mẫu ñại diện (sample) và việc làm
này gọi là lấy mẫu (sampling). Ví dụ, hàm lượng bụi khí PM10 trong tồn bộ 365 ngày
của năm 2004 tại một địa ñiểm nào ñó có thể xem như một tập hợp tồn thể. Vì khơng thể
quan trắc tồn bộ cả năm nên có thể thiết kế thí nghiệm quan trắc mỗi tuần hai lần, chẳng
hạn vào thứ tư và chủ nhật. Khi ấy ta sẽ có mẫu đại diện gồm 104 ngày trong năm. Theo

cách này sẽ bảo đảm tính đại diện cao vì mùa nào, tháng nào, tuần nào cũng quan trắc,
ngày thường và ngày nghỉ cuối tuần đều có số liệu.
Cả tập hợp tồn thể và mẫu đại diện ñều có những ñặc trưng: số lượng cá thể, trị
trung bình, độ lệch chuẩn v.v. ðể phân biệt người ta thường gọi các đặc trưng của tập
hợp tồn thể là thơng số (parameter), được ký hiệu bằng chữ Hy lạp, cịn các đặc trưng
của mẫu đại diện là thống kê (statistic), ñược ñặc trưng bằng chữ la tinh. Một trong
những mục tiêu của ta là dựa trên những ước lượng từ thống kê của mẫu đại diện (như trị
trung bình, sai phương, phân bố xác suất v.v...) ñể biết những thơng số của tập hợp tồn
thể mà ta muốn nghiên cứu (inference). ðộ tin cậy của thống kê cao hay thấp, hay tính
đại diện của mẫu nhiều hay ít tuỳ thuộc vào việc thiết kế quá trình lấy mẫu.
15


+ Một số đặc trưng thống kê mơ tả (descriptive statistics)
Sử dụng phương pháp thống kê mô tả bằng công cụ Excel (lệnh Descriptive
Statistics trong menu Tools – Data Analysis) giúp ta tính được các giá trị mean, stdev,
max, skewness … Cách xử lý trên giúp ta nhanh chóng có cái nhìn tổng qt về độ tin
cậy của bộ số liệu quan trắc. Ví dụ, hàm lượng trung bình của các ion bao giờ cũng phải
bé hơn hàm lượng trung bình của nguyên tố tương ứng: ([Ca2+] < [Ca] v.v...) Nếu ngược
lại, có nghĩa là phân tích sai. Tương tự, SO42- chỉ có thể là một dạng tồn tại của S trong
bụi khí, nên hàm lượng SO42- khơng thể vượt quá 3 lần hàm lượng S.
Bảng 1.1. Một số ñặc trưng thống kê mơ tả của thành phần bụi khí
mean

stdev

max

skewness


PM

17844

14235

73540

1.69

Al

778

600

2494

1.19

Ca

601

492

2229

1.28


Ca2+

477

403

1991

1.64

Cl

205

252

1390

3.19

Cl-

160

227

1274

3.40


Fe

403

355

1593

1.47

K

283

187

821

0.96

K+

138

83

411

1.19


Mg

362

324

1686

2.25

Mg2+

54

47

234

1.78

Mn

12

11

44

1.21


Na+

171

214

1056

2.76

NH4+

258

418

2438

3.88

NO3-

102

148

609

2.19


Pb

13

16

83

2.39

S

667

678

3534

2.44

Si

1677

1387

6006

1.37


SO4--

1669

1986

10985

3.02

Ti

38

34

141

1.45

V

4

4

15

1.35


16


20

Zn

21

84

1.63

+ Cách biểu diễn Box- Whisker
Cách biểu diễn này cho phép tóm lược các nét chính của mẫu đại diện và thường
được dùng trong các cơng trình nghiên cứu. Hộp (box) biểu diễn bách phần (percentile)
thứ 25, 50 và 75. Hai cái vặn nút chai (whisker) biểu diễn bách phần thứ 10 và 90. Các
giá trị quan trắc nằm trên bách phần 90 ñược ñánh dấu riêng. Dấu sao chỉ những giá trị
ngoại
2500

2000

ng m-3

1500

1000

500


0
N=

47

47

47

47

AL

CAION

CLION

K

Hình 1.1. Biểu diễn Box- Whisker của Al, Ca2+, Cl- và K theo SPSS 7.0
b. Phân bố tần xuất và mật ñộ xác suất
+ Biến ngẫu nhiên, xác suất và phân bố mật ñộ xác suất
Trong quan trắc thực nghiệm liên quan ñến các sự kiện ngẫu nhiên (random event) ta
không thể biết trước chắc chắn kết cục nào sẽ xảy ra nhưng có thể tính được xác suất của
chúng. Ví dụ, xác suất để xuất hiện mặt 1, 2,…, 6 khi tung con súc sắc là 1/6, nhưng
trước khi tung ta không thể biết chắc mặt nào sẽ xuất hiện.
Tập hợp các kết cục ngẫu nhiên ñó gọi là biến ngẫu nhiên. 1, 2, …., 6 lập thành biến
ngẫu nhiên mơ tả các kết cục có thể xảy ra khi ta tung con xúc xắc. Số đếm của một
nguồn phóng xạ mà đầu dị ghi được lập thành biến ngẫu nhiên (tuân theo phân bố

Poisson). ðó là những biến ngẫu nhiên gián ñoạn. Chiều cao, khối lượng v.v… của
người dân Việt nam có thể xem là những biến ngẫu nhiên liên tục.
Ngược lại, khi thay ñổi điện trở trong mạch điện đơn giản thì dịng điện I sẽ thay ñổi
theo ñúng ñịnh luật Ohm. Biến I khơng phải là biến ngẫu nhiên, nó tn theo một quy
luật nhất ñịnh.
Biến ngẫu nhiên thường ñược ký hiệu bằng chữ X

17


Mỗi biến ngẫu nhiên có một hàm mật độ xác suất tương ứng thường ñược ký hiệu
bằng chữ f
với 0 ≤ f(a) ≤ 1

f(a) = Pr (X = a),

(1)

Pr: Xác suất (probability) để có X = a. Các hàm mật ñộ xác suất có thể biểu diễn
dưới dạng các gỉản ñồ, thường ñược gọi là gỉản ñồ phân bố mật ñộ xác suất (xem mục
sau).
Trong nhiều trường hợp ta cần biết xác suất ñể biến ngẫu nhiên X nhận ñược bất cứ
một giá trị nào đó bé hơn aj. ðại lượng này ñược gọi là xác suất chồng chất (cumulative
probability) và ñược ký hiệu là F(aj)
F(aj) = Pr(X ≤ aj) = f(a1) + f(a2) + … f(aj)

(2)

Khi tiến hành quan trắc biến ngẫu nhiên rất nhiều lần ta sẽ ñược một trị trung bình
nào đó có tên gọi là kỳ vọng, ñược ký hiệu bằng E(X)

E(X) = f(a1)a1 + f(a2)a2 + … +f(an)an = ∑i f(ai)ai

(3)

Trong đó a1, a2, …, an là mọi giá trị khả dĩ của biến X.
Phương sai: (variance) của một biến ngẫu nhiên dặc trưng cho mức ñộ phân tán của
các kết quả quan trắc quanh giá trị kỳ vọng và ñược ñịnh nghĩa như sau:
Var (X) = f(a1)[a1 – E(X)]2 + f(a2)[a2 – E(X)]2 + … + f(an)[an – E(X)]2

(4)

= E[(X) - E(X))2]
Var càng lớn càng có nhiều khả năng xuất hiện những giá trị quan trắc ở xa trung
tâm của biến ngẫu nhiên.
+ Giá trị ngoại lai (outlier)
Nếu khoảng cách giữa số liệu quan trắc và trị trung bình khác nhau bốn năm lần ñộ
lệch chuẩn, người ta có thể “ngờ” rằng kết quả ñó là ngoại lai, hoặc là những episode như
vừa nói trên, nhưng cũng có khi do những sự cố khơng kiểm sốt được hoặc có thể do
máy móc quan trắc có vấn đề. Trong mọi trường hợp các outliers thường gây rắc rối
trong xử lý thống kê, do đó phải tìm mọi cách để tìm hiểu ngun nhân. Nếu biết chắc là
do máy móc thì cần phải loại bỏ số liệu quan trắc đó đi.
+ Thứ hạng (rank) và bách phần (percentile), hàm phân bố tích luỹ
Các kết quả quan trắc một chỉ tiêu nào đó có thể sắp xếp lại theo trình tự giảm dần
rồi từ đó có thể hàm phân bố tích luỹ (cumulative distribution function). Hàm phân bố
tích luỹ cho ta xác suất để một số ngẫu nhiên x bé hơn hoặc bằng một trị x(a) nào ñó P(x
< = x(a)). (ðể vẽ hàm này ta có thể dùng các lệnh như trên, hoặc có thể dùng lệnh Tool
→ Data analysis → Rank & Percentile trong Excel.
18



c. Phân bố Normal
Phân bố normal chiếm vị trí quan trọng các phép thử nghiệm các giả thiết
(hypothesis test). ðặc biệt, phân bố normal cịn liên quan đến một định luật rất quan
trọng về trị trung bình của các mẫu ñại diện gọi là ñịnh lý giới hạn trung tâm (central
limit theorem). Ngoài ra, rất nhiều loại phân bố khác như Poisson, Student, phân bố χ2 ...
cũng hội tụ về phân bố normal khi các thơng số của chúng đủ lớn.
+ Hàm phân bố mật ñộ xác suất normal (biến liên tục)
ðây là hàm Gauss có dạng:

(5)
f(x)

: Xác suất để có biến x

Pi

: Biến trung bình

σ

: ðộ lệch chuẩn của tập hợp

σ2

: Phương sai

Phân bố này hình chng và đối xứng quanh trị trung bình
Xác suất cực đại tại trị trung bình
µ và σ là trị trung bình và độ lệch chuẩn của tập hợp. Phân bố normal ñối xứng
quanh trị trung bình µ. Có một số đặc trưng rất thường gặp của phân bố normal như sau:

Xác suất ñể tìm thấy x
Nằm trong khoảng µ ± σ
Nằm trong khoảng µ ± 1.96σ
Nằm trong khoảng µ ± 2σ
Nằm trong khoảng µ ± 2.58σ
Nằm trong khoảng µ ± 3σ







68.27%
95%
95.4%
99%
99.7%

Ta có thể xem gần đúng rằng nếu có phân bố normal thì xác suất tìm thấy giá trị nằm
trong khoảng trung bình ± một độ lệch chuẩn là 2/3 và trung bình ± hai độ lệch chuẩn là
95%. Chỉ có 0.3% xác suất tìm thấy các giá trị nằm ngồi khoảng µ ± 3σ. Xác suất theo
phân bố normal giảm rất nhanh khi ra xa giá trị trung bình.
+ Phân bố normal chuẩn
Phân bố normal với µ = 0 và σ = 1 được gọi là phân bố normal chuẩn hay cịn gọi là
phân bố Z. Ta có thể chuyển phân bố normal bất kỳ về phân bố chuẩn bằng cách ñặt: Z =
(X-µ)/σ. Phân bố này thường cho dưới dạng các bảng tra cứu. (Phần mềm Excel có cho
xác suất tích luỹ theo Z dùng lệnh Function ⇒ Statistical ⇒ Normsdist).
19



+ ðịnh lý giới hạn trung tâm.
Xét một tập hợp tồn thể kích thước N, trong đó X là biến ngẫu nhiên có phân bố tần
suất bất kỳ với trung bình là µ và độ lệch chuẩn σ. Trong thực nghiệm để xác định trị
trung bình của tập hợp ta thường lấy mẫu đại diện ngẫu nhiên kích thước n (X1, X2, ...,Xn)
rồi lấy trị trung bình của chúng. Nhưng nếu lấy mẫu lần thứ hai ta sẽ ñược một trị trung
bình khác với trước.
ðịnh lý giới hạn trung tâm phát biểu rằng khi kích thước của mẫu đại diện n đủ lớn,
các trị trung bình của chúng sẽ phân bố normal quanh giá trị µ với độ lech chuẩn

(6)
f(X)

-0.5

0

0.5

1

1.5

X

Hình 1.2. Phân bố ñều của biến liên tục giữa 0 và 1
Với N >> n, biểu thức trên chỉ còn lại σ/√n, và thường ñược gọi là sai số chuẩn của
trị trung bình (standard error of the mean).
+ Khoảng tin cậy của trị trung bình của tập hợp tồn thể
Từ những điều trình bày ở trên ta có thể đi ñến giải quyết một vấn ñề khá thiết thực.

Giả xử ta đo một chỉ tiêu nào đó n lần có ñược trị trung bìnhx . ðịnh lý giới hạn trung
tâm nói rằng nếu n đủ lớnx sẽ phân bố normal quanh µ với độ lệch chuẩn σ/√n, µ và σ
là trị trung bình và độ lêch chuẩn của tập hợp tồn thể. Nói cách khác,x sẽ tn theo
phân bố Z với

(7)
Ta khơng thể nói chính xácx sẽ sai khác trị trung bình của tập hợp tồn thể µ là bao
nhiêu, mà chỉ có thể nói đến độ tin cậy (confidence level) bao nhiêu khi µ nằm trong
khoảng nào (confidence interval). Ví dụ, với độ tin cậy 95% thì µ sẽ nằm trong khoảng:

20


Frequency

Histogram
15
10
5
0.62

0.6

0.58

0.56

Bin

0.54


0.52

0.5

0.48

0.46

0.44

0.42

0.4

0

Hình 1.3. Phân bố trị trung bình trong 50 lần lấy mẫu ngẫu nhiên 50 biến liên tục
phân bố ñều giữa 0 và 1.
(8)
Tương tự nếu muốn có độ tin cậy 99% thì trong bất đẳng thức trên ta phải thay 1.96
bằng 2.54 theo như Pannel ở bảng tóm tắt trên. Cơng thức trên có thể khái qt cho độ tin
cậy A bất kỳ, bằng cách thay 1.96 cho biến Z tương ứng, cụ thể là Z(1-A)/2.
+ Phân bố Student
Trong thực tế số đo n thường khơng đủ lớn, mặt khác chúng ta lại khơng biết trước
độ lêch chuẩn σ của tập hợp tồn thể. Khi đó người ta có thể chứng minh rằng nếu tập
hợp toàn thể tuân theo phân bố normal thì trị trung bìnhx sẽ có phân bố Student quanh
µ với độ lệch chuẩn s/√n. Biến t (student) sẽ thay cho biến Z ở trên và ñược ñịnh nghĩa
như sau:


(9)
Có thể nói t là ñộ lệch của trung bình mẫu với trung bình của tập hợp tồn thể tính
theo đơn vị s/√n, đại lượng này thường được xem là sai số chuẩn của trung bình mẫu
(standard error of the sample mean). Phân bố Student có dạng gần giống như phân bố
normal chuẩn, nhưng có đi dày hơn, nghĩa là biến t có nhiều khả năng tìm thấy ở cách
xa tâm hơn là Z. Tuy nhiên, phân bố t sẽ tiến gần ñến phân bố Z khi số bậc tự do (n-1) đủ
lớn, n là kích thước mẫu ñại diện. như sau:
Khoảng tin cậy của µ = x ± tαs/√n

(10)

Các giá trị của t có thể tìm trong các bảng thống kê hoặc lấy từ Excel khi dùng lệnh
Function ⇒ Statistical ⇒ Tdist//Tinv.
(11)
+ Phân bố χ2
Gọi Z là biến ngẫu nhiên normal chuẩn (có trung bình 0 và phương sai 1) thì Z2 cũng
sẽ là biến ngẫu nhiên có trung bình 1 và phương sai 2. Ta lập biến Yn
Yn = Z12 + Z22 + … + Zn2

(12)
21


Yn cũng sẽ là biến ngẫu nhiên liên tục có tên gọi là χ2 với n bậc tự do ñược dùng rất
nhiều trong thống kê học, nhất là trong làm khớp các kết quả quan trắc. Hàm phân bố mật
ñộ χ2 với n bậc tự do ñược viết dưới dạng:
f(y) = 1/c yn/2-1e-y/2 với y ≥ 0

(13)


c là một hằng số chuẩn hố sao cho tích phân của làm phân bố mật độ xác suất f(y)
bằng 1. Vì Yn là tổng của n biến ngẫu nhiên Z2 có trị trung bình 1 và phương sai 2 nên
trung bình và phương sai của Yn sẽ là n và 2n. Các giá trị của hàm χ2 có thể tra theo
Function ⇒ Statistical ⇒ Chidist//Chiinv Excel. Hình bên dưới minh hoạ trường hợp n =
2 và 4.
f(y)
0.25
0.2
n=2

0.15
0.1

n=4

0.05
0
0

2

4

6

8

10

12


y

Hình 1.4. Hàm phân bố mật độ χ2
+ Phân bố F
Liên quan đến phân bố χ2 cịn có phân bố F rất hay dùng trong phân tích thống kê.
Giả thử có hai biến ngẫu nhiên χ2 X và Y với mức tự do m và n thì biến ngẫu nhiên sẽ
tuân theo phân bố F với m và n mức tự do. Hàm F có thể tra theo Function ⇒ Statistical
⇒ Fdist//Finv trong EXCEL.

(14)
d. Phép thử các giả thiết
+ Quy trình chung
Kiểm tra sự đúng đắn của một giả thiết nào đó về các mẫu đại diện là việc thường
gặp trong các bài tốn thống kê để từ đó có thể đưa ra những nhận định, tun bố hoặc
quyết định về tập hợp tồn thể. Phép thử các giả thiết thường có các bước sau:
Phát biểu giả thiết số không (null hypothesis, H0) là một giả thiết về tập hợp toàn
thể mà ta muốn kiểm tra. Nếu kết quả kiểm tra từ chối giả thiết số không, hay nói cách
khác, giả thiết số khơng là sai (false), thì điều này có nghĩa là một giả thiết thay thế
(alternative hypothesis, Ha) sẽ có lý (true). Ví dụ, để kiểm tra giả thiết rằng trị trung bình
của một tập hợp tồn thể nào đó bằng 100, ta có thể viết giả thiết số không dưới dạng:
22


Ho: µ = 100

(15)

Nếu giả thiết này bị từ chối, có thể có ba giả thiết thay thế:
Ha: µ ≠ 100

Ha: µ > 100

(16)
(17)

Ha: µ < 100

(18)

Nếu kết quả kiểm tra cho thấy có thể chấp nhận H0, thì điều này hồn tồn khơng có
nghĩa rằng H0 là đúng, mà chỉ nói lên rằng H0 khơng sai. Do đó, thơng thường khi ta nghi
ngờ một điều nào đó là sai thì ta nên kiểm tra điều đó bằng giả thiết số khơng.
Xác định biến thống kê của phép thử (test statistic), tức là biến ngẫu nhiên có phân
bố mật độ xác suất phù hợp với Ho và Ha. Ví dụ, như phân bố của biến thống kê Z hay t
mà ta đã thấy trên đây có thể dùng để thử các trị trung bình.
Quy định mức độ có ý nghĩa (level of significance) α, hay mức ñộ tin cậy (level of
confidence) 1- α của phép thử. Thường thường người ta lấy α = 0.05 để có độ tin cậy là
95%. Giá trị α cịn được gọi là giá trị tới hạn của biến thống kê thử, nó chia đường phân
bố xác suất của biến này ra hai vùng – vùng từ chối và vùng chấp nhận.
Kiểu thử hai đi (one tail) như (16) hay một đi như (17) hoặc (18).
Phát biểu quyết ñịnh (decision rule) về Ho. Nếu biến thống kê thử rơi vào vùng từ
chối thì Ho bị từ chối và Ha ñược chấp nhận. Ngược lại, nếu biến thống kê rơi vào vùng
chấp nhận thì Ho được chấp nhận và Ha bọ từ chối. Khi phát biểu quyết ñịnh như thế hai
loại sai lầm có thể xảy ra:
1. Ta từ chối Ho nhưng thực tế là nó đúng. ðộ rủi ro ñể mắc sai lầm loại một này
là bé hơn α,
2. Ta quyết ñịnh chấp nhận Ho nhưng trên thực tế nó sai, đó là sai lầm loại hai.
ðộ rủi ro mắc phải sai lầm này là β (β thường ít khi được tính).
Chúng ta sẽ minh hoạ những điều vừa nói trên qua hai hình vẽ dưới ñây cho trường
hợp biến thống kê là normal (Z).


23


Hình 1.5. Vùng từ chối và chấp nhận H0 trong phép thử giả thiết đi bên trái, mức độ
có ý nghĩa α = 0.05.

Hình 1.6. Hìmh 6. Vùng chấp nhận và từ chối trong phép thử giả thiết hai đi, mức
độ có ý nghĩa α = 0.05.
+ So sánh hai mẫu đại diện
Giả thử ta có hai tập hợp phân bố normal với trị trung bình µa, µb và sai phương σa2,
σb2, và ta muốn so sánh hai trị trung bình đó với nhau. Ta lấy hai mẫu đại diện kích thước
na, nb từ hai tập hợp đó và thu ñược các trị trung bình và phương sai xa , xb và sa2, sb2.
Ta có thể căn cứ trên các giá trị ước lượng từ hai mẫu đại diện đó và dùng phép thử giả
thiết để xem trị trung bình của hai tập hợp tồn thể có bằng nhau hay khơng. Giả thiết số
khơng sẽ là:
Ho: µa - µb = 0

(19)

Mở rộng những khái niệm ở mục trên, người ta có thể chứng minh rằng nếu Ho là
đúng và giả thử σa2 = σb2, thì hiệu số xa -xb sẽ tuân theo phân bố Student với na + nb -2
mưc tụ do và biến T ñược ñịnh nghĩa như sau:

(20)
trong ñó
24


(21)

gọi là phương sai trộn chung (pooled variance). Mẫu số của (20) là ước lượng của sai số
chuẩn của hiệu hai trung bình xa -xb .
Các bước tiếp theo của phép thử sau khi có H0 bao gồm:
Tính xa vàxb,
Tính sa2 và sb2 và sp2 theo (21),
Tính T theo (20),
Quy định phép thử một đi µa > µb hoặc µa < µb hay hai đi µa ≠ µb,
Với mức độ có ý nghĩa α nào đó (thường là 0.05), xác ñịnh xem biến T rơi
vào vùng từ chối hay vùng chấp nhận dùng lệnh Function ⇒ Statistical ⇒
Tdist//Tinv và kết luận.
+ Phép thử giả thiết dựa trên phân tích các phương sai (ANOVA)
Phương pháp
Trên ñây chúng ta mới chỉ quan tâm so sánh trung bình của hai tập hợp. Trong
trường hợp cần so sánh ñồng thời nhiều tập hợp với nhau ta phải dùng phép thử dựa trên
phân tích các phương sai (Analysis Of Variance, ANOVA). Phép thử này khái quát hoá
phép thử Student nên hai phương pháp sẽ cho cùng kết quả trong trường hợp so sánh
trung bình của hai tập hợp. ANOVA ñược áp dụng rộng rãi trong nhiều nghiên cứu khoa
học, nó cũng chính là phép thử quan trọng trong kỹ thuật hồi quy sẽ được trình bày trong
phần II.
Giả thử có m mẫu đại diện độc lập kích thước n khác nhau được rút ra ngẫu nhiên từ
m tập hợp khác nhau có phân bố normal với cùng một phương sai chung σ2. Các giả thiết
Ho và Ha của phép thử sẽ ñược phát biểu như sau:
Ho: µ1 = µ2 = ... µm,
Ha: khơng phải tất cả các trung bình là bằng nhau.
Trước hết ta hãy trộn chung các mẫu đại diện lại và tính phương sai. Nhớ lại rằng
phương sai bằng tổng các bình phương ñộ lệch khỏi trung bình chia cho số mức tự do.
Tổng tồn bộ các bình phương (total sum of squares, TSS) được tính như sau:
TSS = ∑∑(xij - ←)2

25


(22)


Trong đó ← là trị trung bình của tồn bộ các yếu tố trong tất cả các mẫu ñại diện.
TSS có thể phân ra hai thành phần gồm có: 1) tổng các bình phương trong từng mẫu đại
diện (Sum of Squares within samples), SS within
SSwithin = ∑i∑j(xịj - xj)2,

(23)

và 2) tổng các bình phương giữa các mẫu đại diện (Sum of Squares between samples,
SSbetween,
SSbetween = n ∑j(xj - )2,

(24)

xj là trị trung bình của mẫu thứ j.
Bây giờ ta hãy tính số mức tự do liên quan đến các phương sai. Ta có nm –1 mức tự
do cho TSS, m – 1 mức tự do cho SSbetween và nm – m = m(n-1) cho SSwithin. Chia cho số
mức tự do tương ứng ta sẽ ñược các phương sai. Người ta gọi chúng là trung bình bình
phương giữa các mẫu (Mean Square between, MSbetween)
MSbetween = SSbetween/(m-1),

(25)

và trung bình bình phương trong từng mẫu (Mean Square Within, MSwithin)
MSwithin = SSwithin/m(n-1)

(25)


MSwithin có thể xem là phương sai trung bình của m mẫu, nghĩa là một ước lượng nào
đó của phương sai của chúng σ2 mà ta đã nói từ đầu mục. Mặt khác, MSbetween là n lần
phương sai trong phân bố trung bình mẫu quanh trung bình tồn bộ, lại cũng chính là σ2
nếu giả thiết số khơng là đúng (trung bình của mọi tập hợp ñều bằng nhau). Nếu MSwithin
và MSbetween khác nhau thì đó là do có sự khác nhau giữa trị trung bình các tập hợp, đIều
mà ta muốn phát hiện trong phép thử giả thiết.
Như vậy trong phép thử ta có thể dùng biến thống kê F được định nghĩa như ở công
thức (14) mà trong trường hợp này là
F = MSbetween/ MSwithin

(26)

Căn cứ theo giá trị F tính ñược và so với Fcritical mà ta sẽ quyết ñịnh liệu H0 bị từ chối
hay ñược chấp nhận giống như các phép thử ở trên.
e. Ma trận thừa số (Matrix Factorization)
+ Giới thiệu
Cơ sở chủ yếu của mối quan hệ nguồn/nhận là bảo tồn khối lượng và phân tích cân
bằng ñể xác ñịnh nguồn phân tử bụi phát tán trong khí quyển. Phương pháp này nói
chung đã được phổ biến trong giới nghiên cứu về ơ nhiễm khơng khí, được gọi là mơ
hình thụ quan (receptor modeling). u cầu tập dữ liệu đầu vào là thành phần hố học
của một số lượng mẫu. Sử dụng kính hiển vi điện tử tự động để phân loại thành phần cấu
tạo và hình dạng của các phân tử trong tập hợp những phân tử trong mẫu. Viết phương

26


×