Tải bản đầy đủ (.pdf) (316 trang)

Giáo Trình Thống Kê Ứng Dụng Trong Môi Trường.pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (17.47 MB, 316 trang )

PGS.TS. NGUYỄN MẠNH KHẢI (Chủ biên)
TS. TẠ NGỌC ÁNH TS. Đỗ MINH HÀ
TS. TRẦN VĂN S0N ■ PGS.TS. NGUYỄN HẢI THANH

GIAO TR IN H

THỐNG KỆ ÚNG DỤNG
TRONG MOl TRUÔNG

TỦ SÁCH KHOA HỌC
MS: 398-KHTN

NHÀ XUẤT BẢN ĐẠI HỌC QUỐC GIA HÀ NỘI


PGS.TS. NGUYỄN MẠNH KHẢI (Chủ biên)
TS. TẠ NGỌC ÁNH - TS. ĐỒ MINH HÀ
TS. TRÀN VÀN SƠN - PGS.TS. NGUYỄN HẢI THANH

GIÁO TRÌNH

THỐNG KÊ ỨNG DỤNG
TRONG MƠI TRƯỜNG

NHÀ XUẤT BẢN ĐẠI HỌC QUỐC GIA HÀ NỘI


MỤC LỤC
Trang

LỜI NÓI ĐẦU......................................................................................... 13


Chương 1. MỘT SỐ KHÁI NIỆM MỞ ĐẦU VÀ VAI TRỎ
CỦA THỐNG KÊ TRONG KHOA HỌC MƠI TRUỜNG
1.1. Giới thiệu về khoa học mơi trường................................................... 15
1.2. Dữ liệu môi trường........................................................................... 16
1.3. Tổng thể và m ẫu............................................................................... 17
1.4. Thí nghiệm ngẫu nhiên, sự kiện và xác suất..................................... 19
1.4.1. Thí nghiệm ngẫu nhiên........................................................... 19
1.4.2. Sự kiện....................................................................................21
1.4.3. Xác suất..................................................................................23
1.5. Các loại thang đ o ..............................................................................28
1.6. Quan sát và biến số trong mơi trường...............................................32
1.7. Độ đúng và độ chính xác của dữ liệu...............................................35
1.8. Sai số.................................................................................................37
1.9. Quản lý dữ liệu.................................................................................38
1.10. Bảng tính.........................................................................................39
1.10.1. Bảng mơ tả đặc tính định tính..............................................39
1.10.2. Bảng mơ tả đặc tính định lượng...........................................41
1.11. Chuyển đổi dữ liệu...................................................................

45

1.12. Vai ừị của thống kê ưong khoa học mơi trường........................... 45
1.13. Giới thiệu về phần mềm thống kê.................................................. 48
1.13.1. Giới thiệu Minitab................................................................48
1.13.2. Giới thiệu Excel....................................................................51
Câu hỏi và bài tập ....................................................................................55


4


GIÁO TRÌNH THỐNG KÊ ỨNG DỤNG TRONG MƠI TRƯỜNG

Chương 2. THỐNG KÊ MƠ TẢ
2.1. Giới thiệu..........................................................................................57
2.2. Mơ tả đặc trưng đại lượng...........................

58

2.2.1. Kích thước m ẫu......................................................................58
2.2.2. Đại lượng trung bình tổng lượng........................................... 59
2.2.3. Đại lượng trung bình kết cấu................................................. 65
2.2.4. Đại lượng đặc trưng tính biến thiên của số liệu..................... 73
2.2.5. Tần suất...................................................................................79
2.3. Mơ tả và trình bày dữ liệu bằng biểu đồ......................

80

2.3.1. Biểu đồ hình quạt trịn........................................................... 80
2.3.2. Biểu đồ cột..............................................................................84
2.3.3. Biểu đồ chuỗi thời gian.......................................................... 84
2.3.4. Biểu đồ đoạn thẳng.................................................................85
2.3.5. Biểu đồ tán xạ.........................................................................86
2.3.6. Biểu đồ khoảng xác định....................................................... 87
2.3.7. Tổ chức đ ồ ..............................................................................87
2.3.8. Biểu đồ thân - lá.................................................................... 90
2.3.9. Biểu đồ chấm điểm.................................................................92
2.3.10. Biểu đồ hộp...........................................................................92
2.3.11. Biểu đồ mạng nhện...............................................................94
Câu hỏi và bài tập....................................................................................94
Chương 3. MỘT SỐ PHÂN PHỐI XÁC SUẤT THƯỜNG GẶP

3.1. Phân phối không - một.....................................................................97
3.1.1. Định nghĩa..............................................................................97
3.1.2. Kì vọng và phưomg s a i...........................................................98
3.2. Phân phối nhị thức............................................................................98
3.2.1. Định nghĩa........................................................................... 98


Mục l



c

__________________________________________ 5

3.2.2. Kì vọng và phương sai......................................................... 99
3.3. Phân phối Poisson........................................................................... 102
3.3.1. Định nghĩa............................................................................ 102
3.3.2. Kì vọng và phương sai..........................................................103
3.4. Phân phối đều................................................................................. 106
3.4.1. Định nghĩa............................................................................ 106
3.4.2. Kì vọng và phương sai.......................................................... 107
3.5. Phân phối chuẩn.............................................................................. 111
3.5.1. Định nghĩa............................................................................ 111
3.5.2. Ki vọng và phương sai.......................................................... 112
3.5.3. Phân phối chuẩn tắc.............................................................. 116
3.5.4. Các định lí về phân phối chuẩn............................................ 120
3.6. Phân phối khi bình phương %2....................................................... 121
3.6.1. Định nghĩa............................................................................ 121
3.6.2. Kì vọng và phương sai.......................................................... 122

3.6.3. Định lí về phân phối khi bình phương................................. 123
3.7. Phân phổi Student........................................................................... 123
3.7.1. Định nghĩa............................................................................ 123
3.7.2. Các định lí về phân phối Student.......................................... 123
3.8. Phân phối Fisher....................................................

125

3.8.1. Định nghĩa............................................................................ 125
3.8.2. Các định lí về phân phối Fisher..................................... ......125
Câu hỏi và bài tập.................................................................................. 127
Chương 4. ƯỚC LƯỢNG CÁC THAM SỐ THỐNG KÊ
4.1. Ước lượng kì vọng........................................................................ 130
4.1.1. Ước lượng điểm.................................................................... 130
4.1.2. Ước lượng khoảng của kì vọng trong phân phối chuẩn....... 131


6

4.2.

GIÁO TRÌNH THỐNG KÊ ỨNG DỤNG TRONG MƠI TRƯỜNG

ƯỚC

lượng phương sai.................................................................... 137

4.2.1. Ước lượng điểm.................................................................... 137
4.2.2. Ước lượng khoảng của phương sai ứong phân phối chuẩn.. 138
4.3. Ước lượng xác suất......................................................................... 139

4.3.1. Ước lượng điểm.................................................................... 139
4.3.2. Ước lượng khoảng của xác suất............................................ 140
4.4. Xác định kích thước mẫu cần thiết khi ước lượng kì vọng
và xác suất......................................................................................143
4.4.1. Xác định kích thước mẫu cần thiết khi ước lượng kì vọng.. 143
4.4.2. Xác định kích thước mẫu cần thiết khi ước lượng xác suất.. 143
Câu hỏi và bài tập.................................................................................. 144
Chương 5. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
5.1. Kiểm định giả thuyết về kì vọng................................................... 147
5.1.1. Kiểm định kì vọng trong phân phối chuẩn.......................... 147
5.1.2. Kiểm định sự bằng nhau giữa các kì vọng của hai biến
ngẫu nhiên có phân phối chuẩn........................................... 163
5.1.3. Kiểm định sự bằng nhau giữa các kì vọng của hai biển
ngẫu nhiên có phân phối chuẩn trong thí nghiệm ghép cặp. 174
5.1.4. Kiểm định sự bằng nhau giữa các kì vọng của nhiều biến
ngẫu nhiên có phân phối chuẩn........................................... 177
5.2. Kiểm định giả thuyết về phương sai.............................................. 182
5.2.1. Kiểm định phương sai trong phân phối chuẩn..................... 182
5.2.2. Kiểm định sự bằng nhau giữa các phương sai
trong hai phân phối chuẩn................................................... 184
5.3. Kiểm định giả thuyết về xác suất................................................... 185
5.3.1. Kiểm định xác suất.............................................................. 185
5.3.2. Kiểm định sự bằng nhau giữa hai xác suất.......................... 187
5.3.3. Kiểm định sự bằng nhau giữa nhiều xác suất...................... 191


Mục lục

__________ 7


5.4. Kiểm định sự phù hợp giữa phân phối xác suất lí thuyết
và số liệu thực nghiệm................................................................... 193
5.4.1. Sự phù hợp giữa phân phối xác suất lí thuyết
và số liệu thực nghiệm........................................................ 193
5.4.2. Bài toán kiểm định phân phối chuẩn của một biến
ngẫu nhiên............................................................................ 196
5.4.3. Bài toán kiểm định sự phù hợp của số liệu thực nghiệm
với phân phối nhị thức và phân phối Poisson..................... 199
5.5. Kiếm định tinh độc lập của hai đặc tính.........................................202
5.5.1. Tính độc lập của hai đặc tính................................................202
5.5.2. Bài tốn kiểm định tính độc lập............................................203
5.6. Kiểm định tham số cho phân phối nhị thức và phân phối Poisson.206
5.6.1. Kiểm định tham số p cho phân phối nhị thức.......................206
5.6.2. Kiểm định tham số Ằ cho phân phối Poisson........................208
Câu hỏi và bài tập ..................................................................................210
Chương 6. BÔ TRÍ THÍ NGHIỆM VÀ PHẦN TÍCH PHƯƠNG SAI
6.1. Giới thiệu........................................................................................215
6.2. Ước tính cỡ mẫu và bố trí thí nghiệm.............................................218
6.2.1. Xác định cỡ mẫu cần thiết trong nghiên cửu tại một thời điểm
(cross-sectional study)..........................................................219
6.2.2. Xác định cỡ mẫu cần thiết trong nghiên cứu đối chứng
(case-control study)......................................................

222

6.2.3. Xác định cỡ mẫu cần thiết khi so sánh hai dãy số liệu định
lượng từng cặp - Thí nghiệm cặp đơi hay so sánh
trước sau..............................................................
224
6.3. Các kiểu bố trí thí nghiệm theo khối............................................. 226

6.3.1. Các nguyên tắc cơ bản về bố trí thí nghiệm theo khối........ 226
6.3.2. Kỹ thuật ngẫu nhiên hoá.......................................................227


8

GIÁO TRÌNH t h ố n g Kê ứ n g d ụ n g t r o n g m ô i t r ư ờ n g

6.4. Phân tích phương sai một yếu t ố ................................................... 232
6.4.1. Các bước tổng quát.............................................................. 232
6.4.2. So sánh các nghiệm thức trong phân tích ANOVA
một yếu tố.............................................................................234
6.5. Phân tích phương sai hai nhân tố....................................................247
Câu hỏi và bài tập..................................................................................258
Chương 7. PHÂN TÍCH TƯƠNG QUAN
7.1. Mối tương quan..............................................................................261
7.2. Hệ số tương quan............................................................................262
7.2.1. Hệ số tương quan lí thuyết................................................... 262
7.2.2. Hệ số tương quan mẫu..........................................................263
7.3. Kiểm định sự tồn tại của hệ số tương quan....................................264
7.4. Tỷ số tương quan............................................................................266
7.5. Thiết lập biểu đồ tương quan..........................................................266
Câu hỏi và bài tập..................................................................................268
Chương 8. HỒI QUY
8.1. Phân tích hồi quy............................................................................272
8.2. Hồi quy đơn....................................................................................272
8.2.1. Mơ hình.................................................................................272
8.2.2. Ước lượng các hệ số trong mơ hình..................................... 273
8.2.3. Đường hồi quy tuyến tính thực nghiệm............................... 274
8.2.4. Kiểm định sự tồn tại của phương trình và các hệ số

trong phương trình hồi quy .............................................. ...276
8.2.5. Kiểm định sự khác biệt của các độ dốc trong hai mơ hình
hồi quy tuyến tính.................................................................277
8.2.6. Ước lượng giá trị quan sát dựa vào mơ hình hồi qui........... 278


Mục lục_______________________________________________________ 9

8.3. Hồi quy bội.....................................................................................278
8.3.1. Mơ hình.................................................................................280
8.3.2. ước lượng các hệ số trong mơ hình......................................281
8.3.3. Kiểm định sự tồn tại của hệ số trong phương trình hồi quy .281
8.3.4. Ước lượng giá trị quan sát dựa vào mơ hình hồi quy..........282
8.4. Hồi quy đa thức..............................................................................287
8.4.1. Mơ hình.................................................................................287
8.4.2. Ước lượng các hệ số trong mơ hình......................................288
8.4.3. Ước lượng giá trị quan sát dựa vào mơ hình hồi quy...........289
Câu hỏi và bài tập..................................................................................291
TÀI LIỆU THAM KHẢO.....................................................................297
DANH MỤC T Ừ ...................................................................................299
PHỤ LỤC..............................................................................................305


10

GIÁO TRÌNH THỐNG KÊ ỨNG DỤNG TRONG MƠI TRƯỜNG

DANH MUC CHỮ VIÉT TẮT
K ý hiệu


T iế n g A n h

T iế n g V iệ t

n

M ean

T rung b ìn h tổng thể

ANOVA

A nalysis o f V ariances

Phân tích phưomg sai

C ov

C ovariance

H iệp phư ơng sai

CR D

C om pletely random ized design

T hiết k ể h oàn toàn n gẫu nhiên

C SD L


C ơ sở dữ liệu

Cv , C V

C oefficient o f variation

H ệ số b iến dị (hệ số biến thiên)

df

D egree o f freedom

B ậc tự do

E (X )

E xpected value o f X

K ì vọng của X

i.e.

id est = that is

T ương đương

IQ R

Inter quarter range


Đ ộ trải giữa h ay P hạm vi liên p h ần tử

F ish er’s L east Significant

K iểm đ ịnh giá trị khác n hau nhỏ nhất

L SD

D ifference
M SB

M ean o f squares for betw een

T ương tự như M SF

group
M SE

M ean o f square o f the error

Phương sai ngẫu nhiên

M SF

M ean o f Square o f factor

P hương sai do yếu tố

M SI


M ean o f square o f Interactions

P hương sai do tương tác giữ a các yếu
tố

M SW

M ean o f squares fo r w ithin

T ương tự như M SE

group
p -v alue

p value

G iá trị p

R

Pearson correlation coefficient

H ệ số tương quan tuyến tính theo
Pearson

s

2

Phương sai



11

Mọc lục
P hư ơng sai hiệu chỉnh cho m ẫu nhỏ

S2
SD-Ơ

Standard deviation

Đ ộ lệch chuẩn

SE

Standard error

Sai số chuẩn

Sum o f squares for betw een

T ương tự như SSF

SSB

group
SSE

Sum o f squares o f error


B iến sai ngẫu nhiên

SSF

Sum o f squares o f factor

B iến sai giữ a các m ẫu

SSI

Sum o f squares o f Interactions

B iến sai tương tác giữa các y ếu tố

SST

Sum o f squares o f total

B iến sai toàn bộ

Sum o f squares fo r w ithin

T ương tự n h ư SSE

SSW

group

TT-BTNMT


T hông tư - B ộ Tài nguyên
v à M ôi trường

V(X)
X

V ariance o f X

Phương sai của

X

Số trung b ìn h m ẫu


LỜI NÓI ĐẰU
Việc áp dụng phương pháp thống kê vào khoa học môi trường đã và
lang trở nên phổ biến trong nhiều năm trở lại đây. Khi các quốc gia,
vùng lãnh thổ và các địa phương cũng như người dân ngày càng quan
tâm đến các vấn đề môi trường, hoạt động bảo vệ mơi trường thì dữ liệu
về mơi trường ngày càng được tăng trưởng một cách nhanh chóng.
Thống kê ứng dụng trong môi trường là môn học vận dụng các kết
quả và phương pháp nghiên cứu của thống kê tốn học vào khoa học mơi
trường. Nó bao gồm các quy trình, phương thức xử lí các nghi vấn liên
quan đến môi trường tự nhiên ở trạng thái ổn định, lịch sử tiến hóa, sự tác
động của con người tới mơi trường, xử lí mơi trường, cải thiện mơi
trường cũng như dự báo. Phạm vi của thống kê môi trường bao gồm các
khía cạnh về đặc tính của mơi trường và các khía cạnh của hệ thống kinh
tế -x ã hội có ảnh hưởng trực tiếp, tương tác với mơi trường và ngược lại.

Giáo trình Thong kê ứng dụng trong môi trường được biên soạn với
nhiệm vụ cung cấp cho sinh viên các cơng cụ thống kê, máy tính để xử lí
và trình bày các số liệu thu được từ nghiên cứu về môi trường và đưa ra
được các nhận định, dự đốn, mơ phỏng đối với bài tốn về quan trắc,
đảnh giá môi trường cũng như thực nghiệm khoa học, cơng nghệ, kỹ
thuật mơi trường. Từ đó giúp cho việc định lượng hóa, mơ phỏng hóa các
q trình biến đổi khí hậu hay biến động của các yếu tố vô sinh, hữu sinh
trong môi trường sống, trong hệ sinh thái. Cùng với đó, bước đầu cũng
giúp cho sinh viên có những mẫu thiết kế, triển khai nghiên cứu trong
phịng thí nghiệm hay ngồi thực địa để có đủ dữ liệu trong xử lí thống
kê. Các nội dung trên được phân bổ trong các chương với tập thể tác giả
biên soạn như sau:
Chương 1. Một số khái niệm mở đầu và vai trị của thống kê trong
khoa học mơi trường: do Nguyễn Mạnh Khải biên soạn;
Chương 2. Thống kê mô tả: do Nguyễn Mạnh Khải và Trần Văn Sơn
biên soạn;


14

GIÁO TRÌNH THỐNG KÊ ỨNG DỤNG TRONG MƠI TRƯỜNG

Chương 3. Một số phân phối xác suất thường gặp: do Nguyễn Hải
Thanh và Nguyễn Mạnh Khải biên soạn;
Chương 4. Ước lượng các tham số thống kê: do Nguyễn Hải Thanh
và Nguyễn Mạnh Khải biên soạn;
Chương 5. Kiểm định giả thuyết thống kê: do Nguyễn Hải Thanh và
Nguyễn Mạnh Khải biên soạn;
Chương 6. Bố trí thí nghiệm và phân tích phương sai: do Đỗ Minh
Hà và Nguyễn Mạnh Khải biên soạn;

Chương 7. Phân tích tương quan: do Tạ Ngọc Ánh và Đỗ Minh Hà
biên soạn;
Chương 8. Hồi quy: do Tạ Ngọc Ảnh và Nguyễn Mạnh Khải biên
soạn.
Giáo trình này được biên soạn dành cho sinh viên thuộc khối ngành
môi trường. Trước khi học học phần này, sinh viên khối ngành này đã
được trang bị các kiến thức toán cao cấp trong các học phần đại cương
bao gồm cả các kiến thức cơ bản của lí thuyết xác suất. Ngồi ra, các sinh
viên, học viên cao học trong lĩnh vực sinh học, y sinh, nơng nghiệp, lâm
nghiệp, thủy sản, thực phẩm... cũng có thể tham khảo giáo trình này để
vận dụng vào cơng việc nghiên cứu, ứng dụng và quản lí của mình.
Đe hồn thiện giáo trình này, chúng tơi xin trân trọng cám ơn
PGS.TS. Nguyễn Văn Hoàng, TS. Trần Mạnh Cường đã phản biện cho
giáo trình. Các ý kiến phản biện cũng như các góp ý của thành viên hội
đồng nghiệm thu các cấp góp phần nâng cao chất lượng của giáo trình.
Với kinh nghiệm và hiểu biết có hạn, thời gian biên soạn tương đối
gấp, giáo trình khó tránh khỏi những sai sót, các tác giả mong nhận được
ý kiến đóng góp xây dựng và lượng thử. Mọi ý kiến góp ý xin gửi về
Khoa Môi trường, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia
Hà Nội.
Các tác giả


Chương 1

MỘT SĨ KHÁI NIỆM MỞ ĐẦU
VA VAI TRỊ CỦA THĨNG KÊ
TRONG KHOA HỌC MƠI TRƯỜNG
1.1. Giói thiệu về khoa học môi trường
Môi trường là một tổ hợp các yểu tố tự nhiên và xã hội bao quanh

bên ngoài của một hệ thống hoặc một cá thể, sự vật nào đó. Chúng tác
động lên hệ thống này, xác định xu hướng và tình trạng tồn tại của nó.
Một định nghĩa rõ ràng hom là: Môi trường là tập họp tất cả các yếu
«ổ tự nhiên và nhân tạo bao quanh con người và sinh vật, ảnh hưởng tới
con người và tác động qua lại với các hoạt động sống của con người như
khơng khí, nước, độ ẩm, sinh vật, xã hội lồi người và các thể chế.
Khoa học mơi trường (tiếng Anh là Environmental Science) là
ngành nghiên cứu mối quan hệ và tương tác qua lại giữa con người và
môi trường nhằm duy trì cuộc sống lâu dài của lồi người. Khoa học
môi trường bao gồm một loạt các lĩnh vực như kỹ thuật, quản lí, nghiên
cứu thơng tin và nghiên cứu các vấn đề môi trường để đạt mục đích
Kều mơi trường xung quanh chúng ta một cách tốt hơn bằng cách sử
4nng các lĩnh vực khác nhau một cách đơn lẻ cũng như kết hợp nhằm
phát hiện các vấn đề, tạo ra một bức tranh hoàn chinh về mơi trường.
Do đó, đối tượng nghiên cứu cụ thể của khoa học mơi trường là mơi
m ịng tự nhiên, mơi trường xã hội cũng như môi trường nhân tạo trong
■ổi quan hệ tương hỗ giữa môi trường và con người. Từ những điều
■ày. chúng ta sẽ có những hành động cụ thể để giúp môi trường trở nên
toi hơn, tư vấn chính sách cho các nhà hoạch định xem xét thay đổi.
Mục đích cuối cùng của ngành này là bảo vệ và cải thiện môi trường
song của con người, sinh vật trên Trái Đất.


16

1.2.

GIÁO TRÌNH t h ố n g Kê ứ n g d ụ n g t r o n g m ô i t r ư ờ n g

Dữ liệu môi trường


Dữ liệu môi trường là dữ liệu thu được dựa trên việc đo lường thơng
số mơi trường, đặc tính, trạng thái của môi trường và các tác động đến hệ
sinh thái. Dữ liệu môi trường thường được tạo ra bởi các nhà nghiên cứu
môi trường, các tổ chức, cơ quan quản lí, thực thi pháp luật mơi trường.
Số liệu thống kê của cơ quan thống kê về môi trường cũng được coi là dữ
liệu môi trường. Dữ liệu môi trường có thể phân chia theo nhiều loại,
dạng khác nhau để tổng hợp, khai thác và quản 11 tùy theo mục đích của
người sử dụng.
Theo quy định tại Khoản 1 Điều 3, Thông tư 34/2013/TT-BTNMT
của Bộ Tài nguyên và Môi trường, dữ liệu môi trường bao gồm:
- Ket quả điều tra, khảo sát, thanh tra, kiểm tra về môi trường;
- Ket quả của các chương trình, dự án, nhiệm vụ, đề tài nghiên cứu
khoa học công nghệ về môi trường;
- Kết quả của các chương trình mục tiêu quốc gia; sử dụng bền vững
tài nguyên và bảo vệ môi trường;
- Kết quả hoạt động của các dự án hợp tác quốc tế về môi trường;
- Báo cáo hiện trạng môi trường các cấp (quốc gia, ngành, lĩnh vực,
địa phương);
- Danh sách các cơ sở bảo tồn đa dạng sinh học, các khu bảo tồn
thiên nhiên; danh mục các loài hoang dã, loài bị đe dọa tuyệt chủng, loài
bị tuyệt chủng trong tự nhiên, loài đặc hữu, loài di cư, loài ngoại lai, loài
ngoại lai xâm hại, loài nguy cấp, quý hiếm được ưu tiên bảo vệ, các loài
trong Sách đỏ Việt Nam;
- Báo cáo quy hoạch tổng thể bảo tồn đa dạng sinh học, các hệ sinh
thái (trên cạn, dưới nước) và an toàn sinh học;
- Báo cáo đánh giá môi trường chiến lược, đánh giá tác động môi
trường, đề án bảo vệ môi trường, cam kết bảo vệ môi trường;
- Báo cáo về nguồn thải, lượng chất thải, nguồn gây ô nhiễm, chất
thải thông thường, chất thải nguy hại có nguy cơ gây ơ nhiễm mơi



Chương 1. Một sổ khái niệm mở đầu...

17

trường; kết quả cải tạo, phục hồi môi trường trong các hoạt động khai
thác khống sản: hiện trạng mơi trường tại các mỏ khai thác khống sản;
hiện trạng mơi trường các điểm ơ nhiễm hóa chất bảo vệ thực vật tồn lưu;
dự án xử lí và phục hồi mơi trường các điểm ơ nhiễm hóa chất bảo vệ
thực vật tồn lưu;
- Báo cáo về tình hình nhập khẩu phế liệu làm nguyên liệu sản xuất,
nộp phí bảo vệ mơi trường; kết quả giải quyết bồi thường thiệt hại, tranh
chấp, khiếu nại, tố cáo về mơi trường đã được cơ quan nhà nước có thẩm
quyền giải quyết;
- Báo cáo về khu vực bị ô nhiễm, nhạy cảm, suy thoải, sự cố môi
trường; khu vực có nguy cơ xảy ra sự cổ mơi trường; bản đồ ơ nhiễm mơi
trường và các biện pháp kiểm sốt, phịng ngừa, giảm thiểu ơ nhiễm mơi
trường;
- Danh mục về các cơ sở gây ô nhiễm môi trường nghiêm trọng;
Danh mục và tình hình bảo vệ mơi trường làng nghề, khu kinh tế, khu
công nghiệp, khu chế xuất, cụm công nghiệp;
- Kết quả về quản lí mơi trường lưu vực sông, ven biển và biển; ô
nhiễm môi trường xuyên biên giới;
- Ket quả về xử lí chất thải, khí thải, nước thải, tiếng ồn, độ rung và
các công nghệ môi trường khác;
- Ket quả về đào tạo và truyền thông nâng cao nhận thức cộng đồng
bảo vệ môi trường.
Điều 1 Thơng tư 34/2013/TT-BTNMT cịn nêu về dữ liệu mơi
trường thuộc loại dữ liệu đối với sinh vật biến đổi gen và dữ liệu quan

trãc môi trường, dữ liệu môi trường thuộc danh mục bí mật nhà nước.
1-3. Tổng thể và mẫu
Trong thống kê môi trường các nghiên cứu thường dựa ừên quan sát
riêng rẽ (individual observation), là những quan sát hoặc đo đạc tiến hành
trẽn đơn vị mẫu nhỏ nhất (smallest sampling unit). Trong nghiên cứu
môi trường, đơn vị mẫu nhỏ nhất thường là mẫu đơn lẻ, vị trí quan trắc,
cả thể sinh vật... Neu ta đo hàm lượng rắn lơ lửng trong n điểm quan trắc


18

GIÁO TRÌNH THỐNG KẾ ỨNG DỤNG TRONG MƠI TRƯỜNG

của thủy vực thì hàm lượng rắn lơ lửng tại mỗi điểm quan trắc chính là
một quan sát, n giá trị hàm lượng rắn lơ lửng đo được đại diện cho một
mẫu quan sát (sample of obsservation). Nếu chúng ta nghiên cứu sự thay
đổi hàm lượng rắn lơ lửng của một điểm quan trắc trong một thời kỳ xác
định thì mẫu sẽ là tất cả các số giá trị đo được của hàm lượng rắn lơ lửng
tại điểm quan trắc đó trong suốt q trình nghiên cứu.
Thơng thường, với mẫu ngẫu nhiên, việc lựa chọn một đơn vị mẫu
như vậy không cần thay thế để các đơn vị mẫu không được sử dụng hơn
một lần. Điều này làm giảm đi các sai số so với lấy mẫu bằng việc thay
thế, theo đó các đơn vị riêng lẻ có thể xuất hiện hai hoặc nhiều lần ừong
một mẫu. Tuy nhiên, đối với các mẫu nhỏ so với quy mô tổng thể, sự
khác biệt về độ chính xác thu được là khơng lớn. Lấy mẫu ngẫu nhiên
đơn giản là dễ nhất khi có khung lấy mẫu, trong đó đây chỉ là danh sách
tất cả các đơn vị ừong quần thể mà mẫu sẽ được rút ra. Nếu khung lấy
mẫu chứa các đơn vị được đánh số từ 1 đến N, thì sẽ lấy được mẫu ngẫu
nhiên đơn giản có kích thước n với thay thế bằng cách vẽ n số một theo
một cách sao cho mỗi lựa chọn có khả năng tương đương với bất kì sổ

nào chưa được sử dụng. Để lấy mẫu với sự thay thế, mỗi số từ 1 đến N
được đưa ra cùng cơ hội xuất hiện ở mỗi lần tương đương...
Tổng thể: Tập hợp các phần tử mang dấu hiệu mơi trường được quan
tâm gọi là tổng thể (có tài liệu gọi là quần thể). Ví dụ: tập họp dữ liệu
chất lượng nước, chất lượng khơng khí, yếu tố khí tượng, chất lượng đất
trong một quốc gia, vùng lãnh thổ, khu vực...
Mầu: Mầu là một bộ phận hay một phần tử rút ra từ tổng thể. Các
đặc trưng thống kê của mẫu thay đổi tùy thuộc vào độ lớn của mẫu và
cách thức chọn mẫu.
Sự khác biệt chính giữa tổng thể (quẩn thể) và mẫu là cách quan sát
(observation) được gán vào tập dữ liệu thế nào.
- Một tổng thể bao gồm tất cả các phần từ từ một tập dữ liệu.
- Một mẫu bao gồm một hay nhiều quan sát được rút ra từ tổng thể.
Ví dụ 1.1: Neu ta chọn 5 địa phương để nghiên cứu đặc điểm ơ
nhiễm bụi trong khơng khí của địa phương đó và từ đó rút ra kết luận về


Chương 1. Một số khái niệm mở đầu...

19

hàm lượng bụi trong khơng khí của cả nước thì tổng thể (quần thể) chính
là tồn bộ địa phương của quốc gia, mẫu chính là 5 địa phương được
chọn ra để nghiên cứu.
Thuật ngữ “quan sát riêng rẽ” và “mẫu của quan sát” chỉ nêu được
cấu trúc mà không nêu được bản chất của dữ liệu nghiên cứu.
Tùy thuộc vào phương pháp lấy mẫu, một mẫu có thể có ít, bằng,
hoặc nhiều quan sát. Tír tổng thể, ta có thể lấy ra nhiều mẫu khác nhau.
Ngồi ra, cịn có thể kể đến sự khác biệt giữa tổng thể và mẫu như sau:
- Các đặc tính có thể đo đạc được của một tổng thể như giá trị trung

bình, độ lệch chuẩn được gọi là các thơng số (parameters), nhưng
đối với một mẫu thì chỉ được gọi là một thống kê (statistic).
- Thông thường kích thước của tổng thể (N) rất lớn, thậm chí là vơ
hạn. Tổng thể/quần thể có thể được mơ tả bởi các thông số
(parameters) nhưng thường các giá trị của các thơng số này khơng
thể xác định chính xác được.
- Các đặc tính của tổng thể và mẫu được ký hiệu khác nhau. Ví dụ,
trung bình của tổng thể được ký hiệu là p (mean), nhưng trung
bình của mẫu được ký hiệu là X (average).
- Một số công thức sẽ khác nhau khi áp dụng cho tổng thể và mẫu.
Chẳng hạn, có sự khác nhau giữa cơng thức tính độ lệch chuẩn.
Ví dụ này sẽ được đề cập đến ở các phần sau.
Mau ngẫu nhiên đơn giản (simple random sampling) là một mẫu có
dược bởi một quy trình cung cấp cho mỗi đơn vị có cùng xác suất được
lựa chọn. Hay nói cách khác là mẫu mà tất cả các cá thể trong quần thể
có cùng cơ hội (cùng xác suất) để được chọn vào mẫu.
1.4. Thỉ nghiệm ngẫu nhiên, sự kiện và xác suất
1.4.1. Thínghiệm ngẫu nhiên
Thí nghiệm ngẫu nhiên là những thí nghiệm, quan sát, hành động, ...
mà kết quả xảy ra một cách ngẫu nhiên, không biết trước được. Thí
nghiệm ngẫu nhiên có đặc tính:


20

GIÁO TRÌNH t h ố n g Kê ứ n g d ụ n g t r o n g m ô i t r ư ờ n g

- Không biết chắc kết quả nào sẽ xảy ra;
- Biết được các kết quả có thể xảy ra (khơng gian mẫu).
Ví dụ 1.2: Tung một đồng tiền là một thí nghiệm ngẫu nhiên vì ta

khơng biết chắc chắn mặt nào sẽ xuất hiện, nhưng ta biết được có 2
trường hợp xảy ra (đồng tiền có 2 mặt sấp và ngửa) với giả định đồng
tiền đồng chất và 2 mặt có thể xuất hiện như nhau, đồng thời cách tung
đồng tiền không cố ý thiên vị cho mặt nào hiện ra.
Tập hợp các kết quả có thể xảy ra trong thí nghiệm ngẫu nhiên gọi là
khơng gian mẫu của thí nghiệm đó.
Trong thí dụ ừên, khơng gian mẫu của thí nghiệm tung đồng xu là
A = (5, N}. Trường hợp sử dụng 2 đồng xu thì khơng gian mẫu của thí
nghiệm tung 1 lúc cả 2 đồng xu là A = {s s , SN, NS, NN} với ký hiệu
S: Sấp, N: Ngửa.
Vỉ dụ 1.3: Cơ quan kiểm soát lắp cảm biến đo độ đục của nước tại
cửa ra của trạm xử lí nước thải, ghi kết quả và báo cáo về trung tâm kiểm
soát. Neu cảm biến phát hiện độ đục của nước nhỏ hơn ngưỡng tối đa cho
phép, nước thải được chấp nhận thải vào nguồn tiếp nhận (D), trường
hợp độ đục cao hơn hoặc bằng ngưỡng tối đa cho phép, nước thải phải
quay trở lại hệ thống để tiếp tục xử lí (R). Trường họp này, khơng gian
mẫulài4 = {£>,#}.
Vỉ dụ 1.4: Tương tự như trên, cơ quan kiểm soát lắp cảm biến đo độ
đục và cảm biến đo pH của nước thải sau khi qua ứạm xử lí. Với độ đục,
cảm biến phát hiện độ đục của nước nhỏ hơn ngưỡng tối đa cho phép,
nước thải được chấp nhận thải vào nguồn tiếp nhận (D), trường họp độ
đục cao hơn hoặc bằng ngưỡng tối đa cho phép, nước thải phải quay ữở
lại hệ thống để tiếp tục xử lí (R); Với pH, giá trị pH cao hơn ngưỡng giới
hạn cao (H) hoặc thấp hơn ngưỡng giới hạn thấp (L) thì nước thải phải
quay lại hệ thống để xử lí, trường hợp nước thải nằm trong khoảng
giới hạn cho phép (cao hơn hoặc bằng ngưỡng thấp và nhỏ hơn hoặc
bằng ngưỡng cao) thì nước thải được phép xả thải vào nguồn (M).
Khi giám sát đồng thời 2 thông số nêu trên, không gian mẫu là
A = {DL,DM,DH,RL,RM,RH}.



Chương 1. Một số khái niệm mở đầu...

21

1.4.2. S ư kiên


0

Mỗi tập họp con của khơng gian mẫu là một sự kiện (biến cổ). Sự
kiện chứa một phần tử gọi là sự kiện sơ đẳng.
Ví dụ 1.5: Trong thí nghiệm tung con xúc xắc đồng chất khách quan,
sự kiện xuất hiện mặt chẵn là {2,4,6}. Sự kiện các mặt lẻ: {1, 3,5}. Sự
kiện sơ đẳng là {1}, {2}, {3}, {4}, {5}, {6}.
Sự kiện xảy ra: gọi X là một kểt quả xảy ra và E là một sự kiện. Nếu
X thuộc E thì ta nói sự kiện E xảy ra; nếu X khơng thuộc E thì ta nói sự
kiện E không xảy ra.
Sự kiện tất yếu (ký hiệu là đầy đủ): sự kiện nhất định xảy ra khi tiến
hành phép thử.
Sự kiện không thể (ký hiệu là trống): sự kiện không thể xảy ra khi
tiến hành phép thử.
Sự kiện họp (Union):
Sự kiện họp của 2 sự kiện A v k B được ký hiệu là AUB:
AUB xảy ra khi A xảy ra hay B xảy ra

Hình 1.1. Vỉ dụ về sự kiện hợp


22


GIÁO TRÌNH THỐNG KÊ ỨNG DỤNG TRONG MƠI TRƯỜNG

Sự kiện giao (Intersection):
AAB xảy ra khi A xảy ra và B xảy ra.

Hình 1.2. Vỉ dụ về sự kiện giao

Sự kiện đối (sự kiện đối A, Component of A)
A xảy ra khi à không xảy ra, đồng thời A u à là sự kiện chắc chắn

Hình 1.3. Ví dụ về sự kiện đối


Chương 1. Một số khái niệm mở đầu...

23

Ví dụ 1.6: Khi thả con xúc xắc đồng chất, không gian mẫu là {1,2,
3, 4, 5, 6}. Kết quả thả thu được là mặt {6} là một kết quả/sự kiện sơ
đăng.
A là sự kiện xuất hiện các mặt chẵn A = {2,4,6), A đối (A) là sự
kiện xuất hiện các mặt lẻ A ={ 1, 3, 5}
Sự kiện cách biệt (biến cố xung khắc, mutually exclusive event)
A cách biệt với ổ khi A giao B thành trống rồng
ÌB = (p

Hình 1.3. Ví dụ về sự kiện cách biệt

1.4.3. Xác suất

Lí thuyết xác suất định lượng để tính tốn và phán xử xác suất một
'ự kiện nào đó xảy ra. Lí thuyết xác suất rất có ý nghĩa cho nhà khoa học
mơi trường, ví dụ đối với các thí nghiệm ngẫu nhiên. Đó cũng là các
“hương pháp đưa ra các kết luận từ số liệu, thống kê suy luận. Một số ví
;ụ dưới đây để có thể cho thấy ý nghĩa của lí thuyết xác suất trong khoa
học mơi trường:
Ví dụ 1.7: Kết quả khảo sát cho thấy khả năng phát sinh chất thai
neuy hại theo ngày của các hộ gia đình là 5%. Nếu trong 10 gia đình
:ược lựa chọn, thì xác suất xảy ra để 10 hộ gia đình này phát sinh chât
'.hái nguy hại hàng ngày là bao nhiêu?


24

GIÁO TRÌNH THỐNG KÊ ỨNG DỤNG TRONG MƠI TRƯỜNG

Ví dụ 1.8: Một yếu tố mơi trường tác động trung bình đến 1000
người. Một cuộc khảo sát cho thấy sự kiện trên diễn ra với kết quả dương
(dấu hiệu nhận biết tác động) với xác suất 0,99 cho những người bị ảnh
hưởng bời yếu tố môi trường và xác suất 0,05 cho người không bị tác
động bời yếu tố môi trường nêu trên. Xác suất là bao nhiêu đối với người
có kết quả dương tính thực sự bị tác động bởi yếu tố môi trường.
Xác suất định lượng sẽ giải quyết được các câu hỏi trên.
Lí thuyết xác suất có nguồn gốc từ cờ bạc, các ví dụ từ hoạt động cờ
bạc này thỉnh thoảng được sử dụng để dẫn làm ví dụ nhưng khơng đồng
nghĩa với việc hoạt động này được khuyến khích.
Neu khơng gian mẫu E có N biến sự kiện sơ đẳng và sự kiện A có a
sự kiện sơ đẳng thì xác suất của sự kiện A trong khơng gian mẫu E là:

FWm$

Hay nói cách khác xác suất của A trong không gian mẫu là số trường
hợp A xảy ra trong tổng thể số trường hợp có thể xảy ra.
P(A) = Số trường hợp A xảy ra/số trường hợp có thể xảy ra
Ví dụ 1.9: Tổng số có 100 vé số. Người mua mua 05 vé trong tổng
số vé trên. Xác suất để trúng thưởng sẽ là 5/100 = 0,05 với giả thuyết là
tất cả các vé số có cơ hội trúng thưởng như nhau.
Tính chất:
Gọi A là sự kiện bất kì trong khơng gian mầu E
0 < P(A) < 1
p (0 ) = 0 => 0 là Sự kiện trống rỗng
p (£■) = 1 => E là sự kiện chắc chắn
Công thức xác suất:
Công thức xác suất của sự kiện họp:
p 04 u ổ) = p 04) + P(B) - P(A n ổ)
Nêu A và B là 2 sự kiện cách biệt (xung khắc), ta có:


Chương 1. Một sổ khái niệm mở đầu...

25

A n B = ự) => P(/4 n 5) = P(0) = 0 => p 04 u B)
= P(A) + P(B)
Công thức xác suất của sự kiện phụ:
Sự kiện phụ của sự kiện A ừong không gian mẫu E là A:
P(A) + p (Ã) = 1
Cơng thức nhân xác suất:
Xác suất có điều kiện
Gọi P(B/A) là xác suất có điều kiện của sự kiện B sau khi sự kiện A
đã xảy ra.

PQB/A) = P(A n B ) / P ( A )

với P(A) > 0 ; P(B) > 0

Cho hai sự kiện A và B trong không gian mẫu E, xác suất của sự
kiện giao được tính:
P(Ạ n 5) = P(B/A)P(j4) hay P(A n ổ ) = P(A/B)P(B)
Sự kiện độc lập: Hai sự kiện được gọi là độc lập với nhau nếu việc
xảy ra hay không xảy ra sự kiện này không làm ảnh hưởng đến việc xảy
ra hay không xảy ra sự kiện kia.
Nói cách khác, sự kiện gọi là độc lập với sự kiện A về phương diện
xác suất nếu xác suất của sự kiện B không thay đổi cho dù sự kiện A đã
xây ra, nghĩa là: Pị B/ A) = P(B), ngược lại: PÇA/B) = P(A)
Trong trường hợp hai sự kiện độc lập, công thức nhân ừở thành:
P ( A n B ) = P(A)P(B)
Với 2 sự kiện A, B, ta có:
P(B/A) = P(A/B)P(B)/P(A)
Ví dụ 1.10: Trong nhà máy có 4 phân xưởng sản xuất, tỉ lệ số
■guồn thải khí thải xả thải vào mơi trường của phân xưởng 1 chiếm 1/3
•õng lượng nguồn thải khói thải của nhà máy; phân xưởng 2 chiếm 1/4;
phản xưởng 3 chiếm 1/4; phân xưởng 4 chiếm 1/6. Tỉ lệ số lần quan trắc
xwợt quy chuẩn cho phép của khí thải đối với các ống khói từ các phân
m ỏng trên của nhà máy là 0,015; 0,008; 0,005; 0,006. Tìm xác suất để
■lột mẫu được lấy ngẫu nhiên từ ống khói vượt quy chuẩn cho phép.


26

GIÁO TRÌNH THỐNG KÊ ỨNG DỤNG TRONG MƠI TRƯỜNG


Lời giải
Cách 1:
Gọi
A: sự kiện vượt chuẩn của nhà máy từ phân xưởng 1
B : sự kiện vượt chuẩn của nhà máy từ phân xưởng 2
C: sự kiện vượt chuẩn của nhà máy từ phân xưởng 3
D : sự kiện vượt chuẩn của nhà máy từ phân xưởng 4
P(A) = 1/3 * 0,015 = 0,005
P (5 ) = 1/4 * 0,008 = 0,002
P(C) = 1/4 * 0,005 = 0,00125
P (ữ ) = 1/6 * 0,006 = 0,001
PC4UPUCUD) = P(Ấ) + P(B) + P(C) + P(D)
= 0,005 + 0,002 + 0,00125 + 0,001 = 0,00925
Kết luận: Trong kiểm tra giám sát môi trường, nếu khơng có dữ liệu
về lịch sử bảo dưỡng và sử dụng thiết bị, khả năng phát hiện ra ống khói
khơng đạt quy chuẩn xả thải về chất lượng khí thải là 9,25%0 (tỉ lệ rất
nhỏ). Vì vậy cần biết trước lịch sử hoạt động của hệ thống thiết bị, từ đó
tập trung nguồn lực kiểm tra, giám sát sự hoạt động nhằm vào phân
xưởng 1.
Cách 2: Gọi
Aí: sự kiện vượt chuẩn từ hoạt động xả thải của nhà máy
A, B, c, D lần lượt là sự kiện vượt chuẩn của phân xưởng 1, 2, 3, 4
Có P{A) = 0,015, P (5 ) = 0,008, P(C) = 0,005, P(D) = 0,006
P{M/A) = 1/3, P(M /fi) = 1/4, P(M/C) = 1/4, P(M/Ỡ) = 1/6
M = M(AUB\ỈCỈJD) = (M n A)

u (M n B) u (M n C) u (M n D)

P(M) = P(A')P(M/A)+P(B)P(MÍB)+P(C)P(M/C)+ P(Ơ)P(M /Ỡ)
= 0,015.1/3 + 0,008.1/4+ 0,005.1/4+ 0,006.1/6 = 0,00925



×