Tải bản đầy đủ (.pdf) (21 trang)

CHƯƠNG 9 - ĐÁNH GIÁ SỐ LIỆU PHÂN TÍCH pot

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (475 KB, 21 trang )

Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

77
CHƯƠNG 9
ĐÁNH GIÁ SỐ LIỆU PHÂN TÍCH
Khi thiết kế và đánh giá một phương pháp phân tích, thường ta xem xét riêng lẻ 3 sai số thí
nghiệm. Đầu tiên, trước khi phân tích, những sai số liên quan đến mỗi phép đo được đo lường
để chắc rằng những lỗi này không ảnh hưởng đến quá trình phân tích. Thứ hai, trong quá trình
phân tích, mọi thứ được kiểm soát chặt chẻ để chắc rằng số liệu đạt được là tin cậy. Sau cùng
khi kết thúc phép đo, ch
ất lượng quá quá trình đo và kết quả được đánh giá và so với với tiêu
chuNn phân tích để chắc chắn số liệu. Chương này sẽ giới thiệu về nguồn, đánh giá các sai số
trong quá trình phân tích, ảnh hưởng của những sai số trong quá trình đo lên kết quả và phân
tích thống kê dữ liệu đạt được. Điều này rất quan trọng nhằm mục đích kiểm tra độ tin cậy
trong phép đo, từ đó có nhữ
ng điều chỉnh phù hợp trong các quá trình đo tiếp theo.
9.1 Đo giá trị trung tâm
9.1.1 Giá trị trung bình (
X
)
Là số giá trị đạt được từ tổng các giá trị đạt được từ phép đo riêng lẻ chia cho số lần lần đo
n
X
X
n
i
i



1



Trong đó: n là số lần đo
i là giá trị đo thứ i (i = 1, 2, 3, 4…)
Ví dụ 9.1:
Hàm lượng N-NO
3
-
trong nước được xác định trong 7 lần lặp lại với nồng độ như sau:
3,080/ 3,094/ 3,107/ 3,056/ 3,112/ 3,174/ 3,198 mg/L
Như vậy n = 7
X
= (3,080 + 3,094 + 3,107 + 3,056 + 3,112 + 3,174 + 3,198)/ 7 = 3,117 mg/L
9.1.2 Giá trị giữa
Là giá trị ở giữa khi số liệu của các lần phân tích được sắp xếp từ nhỏ nhất đến lớn nhất.
Trong ví dụ 9.1 các giá trị được sắp xếp như sau:
3,056 3,080 3,094 3,107 3,112 3,174 3,198
Như vậy, 3,107 là giá trị giữa. Giá trị giữa (median) và giá trị trung bình (mean) cho biết ước
lượng giống nhau về xu hướng trung tâm đối với tất cả các số liệu giống nhau về độ lớn. Đối
với những dãy số liệu biến động lớn giữa số lần đo (quan sát) thì giá trị giữa và giá trị trung
bình khác xa nhau.
9.2 Đo lường độ biến động của dãy kết quả
9.2.1 Độ bi
ến động (range)
Độ rộng của dãy số liệu w là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất của dãy số liệu.
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

78
Độ rộng dãy = w = X
nhỏ nhất
– X

lớn nhất

Độ rộng dãy cung cấp thông tin về tổng của sự thay đổi trong dãy số liệu nhưng không cung
cung câp thông tin về sự phân bố của từng số liệu đơn lẻ.
Ví dụ 9.2
Trong Ví dụ 9.1 hàm lượng N-NO
3
-
trong nước được xác định trong 7 lần lặp lại với nồng độ
như sau: 3,080/ 3,094/ 3,107/ 3,056/ 3,112/ 3,174/ 3,198 mg/L
Như vậy: w = 3,198 mg – 3,056 mg = 0.142 mg
9.2.2 Độ lệch chuẩn tuyệt đối (s) (absolute standard deviation) và tương đối (s
r
) (relative
standard deviation)
Độ lệch chuẩn tuyệt đối s độ biến động của một giá trị đo đạt so với giá trị trung bình
1
)(
1
2





n
XX
s
n
i

i

Trong đó: i là số thứ i trong tổng số n giá trị,
X
là giá trị trung bình. Thông thường độ lệch
chuẩn tương đối s
r
cũng được sử dụng/
X
s
s
r


Độ lệch chuNn tương đối thường được hiển thị bởi nhân với 100%.
Ví dụ 9.3:
Ở ví dụ 9.1 hàm lượng N-NO
3
-
trong nước được xác định trong 7 lần lặp lại với nồng độ như
sau: 3,080/ 3,094/ 3,107/ 3,056/ 3,112/ 3,174/ 3,198 mg/L. Tính độ lệch chuNn tuyệt đối và độ
lệch chuNn tương đối?
Giá trị trung bình
X
= 3,117 mg/L
(3,080 – 3,117)
2
= (-0,037)
2
= 0,00137

(3,094 – 3,117)
2
= (-0,037)
2
= 0,00053
(3,107 – 3,117)
2
= (-0,010)
2
= 0,00010
(3,056 – 3,117)
2
= (-0,061)
2
= 0,00372
(3,112 – 3,117)
2
= (-0,005)
2
= 0,00003
(3,174 – 3,117)
2
= (+0,057)
2
= 0,00325
(3,198 – 3,117)
2
= (+0,081)
2
= 0,00656

0,01556


Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

79
Độ lệch chuNn tuyệt đối:
051,0
17
01556,0


s

Độ lệch chuNn tương đối:
016,0
117,3
051,0

r
s
s
r
(%) = 0,016 × 100 = 1,6%
9.2.3 Phương sai (variance)
Một giá trị khác để đo độ biến động của số liệu là phương sai. Phương sai bằng bình phương
của độ lệch chuNn tuyệt đối.
Trong Ví dụ 9.3 thì phương sai sẽ là:
Phương sai = s
2

= (0,051)
2
= 0,0026
9.3 Tính chất của sai số phân tích
9.3.1 Độ đúng
Độ đúng trong phân tích là sự đo lường mức độ gần của giá trị đo với nồng độ thực tế của một
chất là đúng hoặc giá trị đó được chấp nhận
µ. Độ đúng thường được hiển thị bằng sai số
tuyệt đối (absolute error) E.
E =
X
- µ
hoặc phần trăm sai số tương đối (percent relative error) E
r

100




X
E
r

Những sai số ảnh hưởng lên độ đúng trong phân tích được dọi là xác định (determinate)
thường được mô tả như là một
sai số hệ thống (systematic error). Sai số xác định dương xãy
ra khi giá trị trung tâm lớn hơn giá trị (nồng độ) thực tế của mẫu. Sai số xác định âm xãy ra
khi hía trị trung tâm nhỏ hơn giá trị thực tế của mẫu.
Sai số xác định được chia thành 4 loại: sai số do lấy mẫu (sampling error), sai số do phương

pháp (method error), sai số đo lường (measurement error), sai số do cá nhân người phân tích
(personal error).
9.3.2 Sai số xác định (determinate error)
Sai số thu mẫu (sampling error):
Sai số trong thu mẫu là lỗi thường hay gặp nhất và ảnh hưởng lớn nhất đến kết quả đánh giá
một chỉ tiêu môi trường. Ví dụ như thu mẫu để đánh giá chất lượng nước ở một lưu vực sông,
nhưng điểm thu mẫu lại gần các nguồn gây ô nhiễm như điểm thải ra của nhà máy công
nghiệp, cống thoát ở khu dân cư.
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

80
Sai số do phương pháp (method error):
Đây là sai số khi chọn lựa phương pháp phân tích mẫu. Ví dụ đối với một chỉ tiêu thì sai số
của mỗi phương pháp sẽ khác nhau như phương pháp so màu, phương pháp chuNn độ, phương
pháp hấp thụ huỳnh quang… Hơn nửa trong mỗi phương pháp thì thuốc thử, độ tinh khiết của
hoá chất cũng dẫn đến sai số trong phương pháp. Sai số phương pháp có thể được hạn chế

bằng cách tiêu chuNn hoá phương pháp, sử dụng hoá chất có độ tinh khiết cao. Tuy nhiên, sai
số phương pháp do sự “nhiểm bNn” (interference) thì không thể kiểm soát được, và để hạn chế
điều này có thể xác định bằng cách làm mẫu trắng (nước cất) sau đó trừ ra.
Lỗi đo lường (measurement error):
Đây là lỗi do thiết bị như dụng cụ thuỷ tinh, cân, các thiết bị đo pH, nhiệt độ, EC… Ví dụ một
bình
định mức 25 mL có thể có sai số tối đa là 0,03 mL (được cung cấp bởi nhà sản xuất).
Như vậy thể tích thực và khoảng sai số chấp nhận khi dùng bình này để phân tích sẽ là 24,97
– 25,03 mL.
Bảng 9.1 Sai số của dụng cụ thuỷ tinh
Dụng cụ Thể tích (mL)
Sai số đo lường
Loại A (± mL) Loai B (± mL)

Pipette
1 0,006 0,012
2 0,006 0,012
5 0,01 0,02
10 0,02 0,04
20 0,03 0,06
25 0,03 0,06
50 0,05 0,01
Bình định mức
5 0,02 0,04
10 0,02 0,04
25 0,03 0,06
50 0,05 0,10
100 0,08 0,16
250 0,12 0,24
500 0,20 0,40
1000 0,30 0,60
2000 0,50 1,00
Burette
10 0,02 0,04
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

81
25 0,03 0,06
50 0,05 0,10

Bảng 9.2 Sai số đo lường của cân
Cân Tải trọng (g) Sai số đo lường
Precisa 160 M
160 ± 1 mg

A & D ER 120 M
120 ± 0,1 mg
Metler H54
160 ± 0,01 mg

Bảng 9.3 Sai số đo lường của micropipette
Loại micropipette Thể tích (mL hoặc µL) Sai số đo lường (± %)
10 – 100 µL
10 1,0
50 0,6
100 0,6
200 – 1000 µL
200 1,5
1000 0,8
1 – 10 mL
1 0,6
5 0,4
10 0,3

Sai số cá nhân phân tích (personal error):
Kết quả phân tích cũng tuỳ thuộc vào người phân tích và sai số trong phân tích tuỳ theo kỷ
năng người phân tích trong sự nhật biết màu, xác định điểm dừng chuNn độ. Sai số này có thể
được hạn chế là cNn thận trong phân tích.
9.3.2 Nhận biết sai số xác định
Sai số xác định có thể khó để xác định vì chúng ta không biết được giá trị thực của mẫu phân
tích. Tuy nhiên, một vào sai số xác định có thể được nhận biết thông quan việc phân tích mẫu
lặp lại với thể tích mẫu khác nhau để xem mức độ tương quan. Độ lớn của hằng số sai số xác
định thì giống nhau đối với tất cả các mẫu vì vậy rất có ý nghĩa khi phân tích mẫu với thể tích
phân tích nhỏ
. Hằng số sai số xác định (contanst determinate error) có thể được phát hiện

thông qua việc chạy mẫu với các thể tích mẫu khác nhau để phát hiện sự sai số hệ thồng trong
quá trình phân tích.
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

82
Hằng số sai số xác định có thể là sai số xác định âm (negative determinate error) và cũng
có thể
sai số xác định dương (negative determinate error), được thể hiện ở Hình 4.1.
Nồngđộ mẫu
% w/w thực ph ân tích củamẫu
Hằng số sai số dương
Hằngsố sai số âm
% w/w phân tích

Hình 9.1: Ảnh hưởng của hằng số sai số lên nồng độ báo cáo của một hợp chất
Ngoài các sai số trên, trong phân tích còn có sai số tiềm năng (potential error), đây là một sai
số khi pha chất chuNn (standard sample). Đây là sai số cũng khá nguy hiểm dẫn là nguyên
nhân dẫn đên sai số xác định dương (positive) hoặc âm (negative).
9.4 Độ chính xác
Độ chính xác thường được dùng để chỉ độ biến động của các giá trị phân tích trong cùng một
mẫu so với giá trị thực của mẫu đó. Độ chính xác thường liên quan đến độ biến động (range),
độ lệch chuNn (standard deviation), phương sai (variance). Độ chính xác thường được chia
thanh 2 loại:
khả năng lặp lại (repeatability) và khả năng ổn định (reproducibility).
Khả năng lặp lại là độ chính xác đạt được khi phân tích lập lại một chất nào đó trong cùng
điều kiện phòng thí nghiệm, môi trường hoá chất trong một khoảng thời gian phân tích nào đó
(ví dụ như phân tích lặp lại 10 lần/ mẫu để đánh giá số liệu). Khả năng ổn định là độ chính
xác đạt được khi phân tích một chất được thực hiện ở các điều kiện khác nhau như
phòng thí
nghiệm khác nhau, khoảng thời gian khác nhau (ví dụ hôm nay nay phân tích 3 lần lặp lại,

ngày mai phân tích cũng cùng mẫu đó ở cùng phòng hay khác phòng thí nghiệm cũng với 3
lần lặp lại…) để đánh giá
reproducibility.
Sai số bất định:
Sai số bất định không ảnh hưởng đến độ đúng (
accuracy) vì sai số bất định phân tán ngNu
nhiên xung quanh giá trị trung tâm (
central value), nhưng chúng ảnh hưởng đến độ chính xác
(
precision).
Nguồn của sai số bất định:
Sai số bât định là do sai số do mẫu và sai số do thao tác khi lấy mẫu, do thiết bị đo:
Sai số do mẫu: sai số này với sai số xác định trong thu mẫu (sampling error) trong
phần 9.3.2. Đây là loại sai số trong lấy mẫu để phân tích chứ không phải là sai số
trong quá trình lấy mẫu ngoài hiện trường. Sai số này gặp khi lắc mẫu không đều,
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

83
mẫu không đồng nhất khi pipet mẫu vào ống nghiệm để phân tích. Sai số này cũng
do dụng cụ thu mẫu gây ra. Ví dụ khi thu mẫu, chai lọ không được rữa sạch, dính bụi
dơ, ảnh hưởng đến mẫu.
Sai số do thao tác xử lý mẫu: đây là loại sai số khi lấy mẫu dùng quá nhiều loại pipet
khác nhau dẫn đến sự không đồng nhất giữa các mẫu. Mặt khác một số loại mẫu cần
phả
i xử lý trước khi phân tích, do đó sai số này không thể xác định được.
Sai số do thiết bị/ dụng cụ: đây là sai số liên quan đến thiết bị khi phân tích và thang
đọc của nó. Hình 9.2 thể hiện rõ nhất sai số bất định do thiết bị/ dụng cụ gây nên vì
nhiều giá trị ta không thể đọc chính xác.

Hình 9.2. Sai số bất định trong phân tích

Đánh giá sai số bất định:
Sai số bất định là không thể loại trừ, ảnh hưởng của nó có thể được giới hạn ở mức thấp nhất
nếu nguồn, và mức độ tương đối của nó được biết. Sai số bất định cũng có thể được ước
lượng thông qua việc đo lường sự biến động của như sử dụng độ l
ệch chuNn, trong vài trường
hợp thì sai số bất định cũng được ước lượng.
9.5 Sai số (error) và sự không chắc chắn (uncertainty)
9.5.1 Phân biệt sai số và sự không chắc chắn
Trong phân tích cần phải phân biệt rõ ràng 2 khái niệm sự sai số và sự không chắc chắn.
Sai số: là sự khác khác nhau giữa các lần đo riêng lẻ với nhau, hoặc kết quả và giá trị thực của
nó. Hay nói cách khác
sai số là một quá trình đo sự sai lệch (“error is a measure of bias”).
Mặc dù ta có thể hạn chế, triệt tiêu sai số xác định nhưng sai số bất định vẫn tồn tại.
Sự không chắc chắn (uncertainty): thể hiện thang mà số liệu có thể phân bố, khi đó các quá
trình đo đạc hoặc kết quả có thể như mong đợi. Lưu ý rằng định nghĩa độ không chắc chắn
(uncertainty) không giống như độ chính xác (precision). Sự không chắc chắn thể hiện tấ
t cả
các sai số, kể cả sai số xác định và bất định mặc dù trong phân tích ta luôn có gắng để giảm
sai số xác đinh, còn sai số bất định xảy ra ngẫu nhiên.
Để minh chứng sự khác nhau giữa sự không chắc chắn và độ chính xác, ta cùng xem ví dụ:
?
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

84
Ví dụ 9.4:
Ta sử dụng 1 pipet 10 mL để hút hoá chất, sự không chắc chắn của pipet là thang thể tích của
pipet này. Cụ thể là bạn mua pipet này từ một công ty không có sự điều chỉnh thể tích
(volume calibration) của pipet, dẫn đến thang chia trên pippet không đúng với thể tích thực.
Còn độ chính xác (precision) là bạn sử dụng cây pippet này hút hoá chất và đo lượng thể tích
của dung dịch hoá chất một số lần để độ chính xác của pippet này và thường thể hiện ở

độ
lệch chuNn (standard deviation).
Quá trình lan truyền của sự không chắc chắn (propagation of uncertainty)
Ví dụ 9.5:
Chúng ta có một cây pippet 10 ml, sau 10 lần đo kiểm tra, ta được thể tích trung trình của
pipette này là
X
= 9,992 mL với độ lệch chuNn s = 0,006 mL.
Sự không chắc sẽ như thế nào nếu ta hút mẫu 2 lần? Kết quả là:
(9,992 mL + 9,992 mL) ± (0,006 mL + 0,006 mL) = 19,984 ± 0,012 mL
9.5.2 Sự không chắc chắn đối với các chức năng toán học khác
Ta cần biết qua hai khái niệm sự không chắc tương đối S
R
(relative uncertainty) và sự
không chắc tuyệt đối R (absolute uncertainty).
Nhiều khía cạnh của toán học được áp dụng trong hoá học phân tích như luỹ thừa, căn,
logarithms… Theo từng chức năng mà sự không chắc mà sự không chắc tương đối S
R
được
tính dựa vào
Bảng 9.4 dưới đây:
Bảng 9.4 Bảng chức năng độ không chắc chắn tương đối
Chức năng S
R

R = kA SR = ks
A

R = A + B
22

BAR
SSS 
R = A – B
22
BAR
SSS 
R = A × B
22














B
S
A
S
R
S
BAR


R =
B
A

22














B
S
A
S
R
S
BAR

R = ln(A)
A
S

S
A
R

R = log(A)
A
S
S
A
R
 4343,0
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

85
R = e
A

A
R
S
R
S


R = 10
A

A
R
S

R
S
 303,2
R = 10
k








A
S
k
R
S
AR

Ví dụ 9.6:
Một dung dịch HCl có pH đo đạt được là 3,72 ± 0,03 (S
A
= ± 0,03). Hãy tính nồng độ [H
+
] và
độ không chắc chắn tuyệt đối S
A
của nó.
Giải quyết vấn đề:

Nồng độ mol của ion H
+
là: [H
+
]=10
–pH
=10
–3,72
= 1,91 × 10
–4
M
Từ Bảng 9.4, sự không chắc tương đối trong nồng độ ion [H
+
] là:
R
S
R
= 2,303 × S
A
= 2,303 × 0,03 = 0,069
và độ không chắc tuyệt đối là:
R = (1,91 × 10
–4
M) × (0.069) = 1,3 × 10
–5
M  0,13 × 10
–4
M
Chúng ta báo cáo nồng độ ion [H
+

] và độ không chắc tuyệt đối là: 1,9 (± 0.1) × 10
–4
M.
4.5.3 Lợi ích của việc tính toán độ không chắc chắn tương đối (relative uncertainty)?
Để dễ hiểu ta xem Ví dụ 9.7 dưới đây:
Ví dụ 9.7:
Sử dụng cách nào khi chuNn bị một dung dịch Na
2
S
2
O
3
có nồng độ 0,001N từ một dung dịch
mẹ 0,1N để có độ không chắc chắn tương đối là thấp nhất?
a)
Cách a: Làm 1 bước: lấy pippet 1 mL hút 1 mL dung dịch 0,1 N cho vào bình định mức
1.000 mL. Định mức lại thành 1.000 mL.
b)
Cách b: Làm 2 bước: hút 20 mL dung dịch mẹ 0,1 N pha thành 1,000 mL. Sau đó, hút 25
mL dung dịch mới pha, tiếp tục pha với nước cất thành 500 mL.
Cho biết độ sai số ghi trên các dụng cụ trên là:
Pipet 1ml: ± 0,006 mL
Pipet 25 mL: ± 0,03 mL
Bình định mức 500 mL: ± 0,2 mL
Bình định mức 1000 mL: ± 0,3 mL
Giải quyết vấn đề:
Nồng độ N của dung dịch Na
2
S
2

O
3
0,001 N có thể được hiển thị theo 2 cách bằng công thức:
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

86
N
a
= (0,1 N × 1 mL)/1000 mL
N
b
= (0,1 N × 20 mL × 25 mL)/(1000 mL × 500 mL)
Sử dụng độ sai số của pippet và độ không chắc chắn S
R
ở Bảng 9.4 ta được:
006,0
1000
3,0
1000
006,0
22






















a
N
R
R
S

002,0
1000
3,0
500
2,0
25
03,0
20
03,0
2222





































b
N
R
R
S

Kết luận: Bởi vì độ không chắc chắn tương đối của cách 2 nhỏ hơn cách 1, nên phương pháp
pha loãng 2 bước như cách 2 sẽ có độ chính xác cao hơn.

4.6 Sự phân bố của kết quả phân tích
Trong phân tích ta thường phân tích lập lại một vào lần, và chúng ta sẽ báo cáo số liệu như thế
nào khi số liệu phân tích của các các lần lạp lại quá phân tán so với giá trị trung tâm (central
value) vì khi phân tích không phải số liệu nào ta cũng lấy. Như vậy ta phải tính toán để xem
các giá trị có gần với giá trị trung tâm không, và giá trị nào nằm ngoài sự phân bố của dãy dữ
liệu đạt được.
Tổng thể (population) và mẫu (sample)
Tổng thể là toàn bộ nh
ững chỉ tiêu, mẫu nước mà chúng ta cần phân tích để đánh giá chất
lượng môi trường ở một vùng nào đó. Trong tổng thể này ta một số chỉ tiêu, những điểm thu
mẫu đại diện nào đó thì gọi là mẫu vì ta không thể lấy hết tổng thể để phân tích.
Ví dụ 9.8:
Để so sánh chiều cao và trọng lượng của sinh viên ở 2 khoa Thuỷ sản và Công nghệ, Trường
Đại học Cần Thơ. Thì số lượng sinh viên của mỗi khoa được gọi là
tổng thể (population).
Tuy nhiên, do số lượng sinh viên quá đông nên không thể đo hết. Do đó chọn ngẫu nhiên 100
SV ở mỗi khoa để đo chiều cao và trọng lượng, như vậy 100 sinh viên ở mỗi khoa được gọi là
mẫu (samples).

Ví dụ 9.9:
Để đánh giá chất lượng nước của tuyến sông Hậu, phục vụ cho công tác qui hoạch nuôi cá Tra
bè đến năm 2015 của tỉnh Vinh Long. Chất lượng nước sông Hậu thay đổi theo triều cường
(nước ròng, nước lớn) hoặc theo mùa lũ. Toàn bộ lưu vực nước ở tất cả các thời điểm trên
được gọi là tổng thể. Tuy nhiên, do không có thời gian và kinh phí, ta chỉ quan trắc môi
trường vào các thời điểm trên và chỉ thu m
ẫu ở một số điểm được xem là đại diện và đặc
trưng của lưu vực nước, như vậy ta gọi là lấy mẫu (sample).
Phân phối chuẩn (normal distribution):
Phân phối chuNn (normal distribution) được nêu ra bởi một người Anh gốc Pháp tên là
Abraham de Moivre (1733). Sau đó Gauss, một nhà toán học ngưới Đức, đã dùng luật phân
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

87
phối chuNn để nghiên cứu các dữ liệu về thiên văn học (1809) và do vậy cũng được gọi là
phân phối Gauss.
Hai thông số quan trọng trong một phân phối là giá trị trung tâm hay gọi là trung bình µ và
phương sai σ
2
(hoặc độ lệch chuNn σ) và thường biểu thị bằng X ~ N (µ, σ
2
) (N viết tắt từ
normal).












2
2
2
2
1



X
eXf

Độ tự do df (degree of freedom):
Ở đây ta cần phân biệt 2 trường hợp rất dễ nhầm lẫn đó là phương sai của tổng thể và phương
sai của mẫu.
Phương sai của tổng thể (population’s variance):


n
X
n
i
i





1
2
2



Trong đó:
n là số mẫu, µ là giá trị trung bình, X
i
là giá trị mẫu thứ i
Phương sai của mẫu (sample’s variance):


1
1
2
2





n
XX
s
n
i
i

Một thông số hiện thân cho phương sai của mẫu và tổng thể gọi là độ tự do df được sử dụng.

df = n – 1
Đối với tổng thể (population) thì độ tự do df luôn luôn bằng số mẫu n (tức là không trừ đi 1).
9.7 Phân tích thống kê số liệu
Kiểm tra sự khác biệt:
Trong phân tích, làm sao so sánh mức độ tin cậy của 2 phương pháp, kiểm tra đánh giá nồng
độ dung dịch, kiểm tra độ tin cậy của một số liệu trong quá trình phân tích. Trong trường hợp
này ta phải dùng đến phương pháp thống kê trong phân tích mơi đánh giá được. Đối với kết
quả phân tích được ta có các dạng phân bố của 2 dãy số liệu (2 nghiệm thức khác nhau, 2
phương pháp khác nhau…) như sau:

Khác bi

t có
ý
n
g
hĩa Khác bi

t khôn
g

ý

Khác bi

t
ý
n
g
hĩa?

Giá trị
Giá trị Giá trị
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

88
Hình 9.3. Mối qua hệ giữa 2 tổng thể
Hình 9.3a cho thấy 2 giá trị trung bình hoàn toàn tách biệt nhau nên ta dễ dàng kết luận trung
bình 2 nghiệm thức khác biệt nhau có ý nghĩa thống kê. Tương tự vậy Hình 9.3b cho thấy 2
trung bình gần trung với nhau nên ta dễ dàng kết luận. Tuy nhiên Hình 9.3c sẽ làm cho ta
phân vân, và nếu chúng khác biệt thì ở độ tin cậy 95 hay 99%?.
Xây dựng một phép kiểm tra trong phân tích:
Một kiểm tra khác biệt trong phân tích được thiết kế nhằm để xác định có hay không sự khác
biệt giữa 2 hay nhiều giá trị mà nguyên nhân do các sai số không xác đị
nh gây nên
(undeterminate error).
Như vậy để thực hiện ta có 2 giả thuyết:
H
o
(null hypothesis): là giả thuyết mà những sai số không xác định đủ để làm cho hai nghiệm
thức khác biệt không ý nghĩa
H
A
(alternative hypothesis): là giả thuyết đưa ra để chúng minh sự khác biệt giữa 2 giá trị
trung bình của tổng thể là quá lớn, và những sai số không khác định trong phân tích là khác
nhau.
Mức ý nghĩa và độ tin cậy:
Mức ý nghĩa (significance level) (α) là một đại lượng thể hiện mức độ tin cậy (confidence
level) khi ta chấp nhận một giả thuyết H
o
hoặc H

A
.

100
1
levelConfidence



Ví dụ 9.8:
Sau khi phân tích thông kê ta kết luận hai nghiệm thức khác biệt ở mức ý nghĩa α = 0,05. Có
nghĩa là 95% ta tin tưởng vào kết luận này.
4.8 Phương pháp thống kê đối với phân phối chuẩn:
4.8.1 So sánh trung bình (
X
) với một giá trị biết trước (µ)
Phương pháp cho sự đánh giá một phương pháp phân tích mới là phương pháp một môt chuNn
biết trước nồng độ µ, bằng cách phân tích để xác định nồng độ mẫu chuNn này một số lần.
Công thức quá trình kiểm tra:
s
nX
t



exp

Ví dụ 9.9:
Trước phi phân tích hàm lượng CO
3

2-
trong nước. Một sinh viên phân tích một mẫu chuNn có
chứa hàm lượng CO
3
2-
có nồng độ 98,76%.
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

89
Các giá trị đạt được của 5 lần phân tích lặp lại như sau:
98,71% 98,59% 98,62% 98,44% 98,58%
Với α = 0,05 (độ tin cậy 95%), hãy cho biết kết quả của sinh viên chấp nhận hay không?
Giải quyết vấn đề:
Ta có:
Trung bình (
X
) = 98,59.
Độ lệch chuNn (
s) = 0,0973.
Độ tự do
df = n – 1 = 5 – 1 = 4
Như vậy ta có 2 giả thuyết:
Giả thuyết 1: H
o
:
X
= µ Giả thuyết 2: H
A
:
X

 µ
(
Khác biệt không ý nghĩa) (Khác biệt có ý nghĩa)
Ta áp dụng công thức trên:

91,3
0973,0
559,9876,98
exp





s
nX
t


Ta tìm giá trị t
(0,05, 4)
trong Bảng 4.8 bên dưới ta có: t(0,05, 4) = 2,78.
Như vậy ta có t
exp
>
t(0,05, 4)
, ta loại bỏ giả thuyết H
o
và chấp nhận giả thuyết H
A

.
Ta có kết luận: sai số không xác định trong phân tích đã ảnh hưởng đến quá trình phân tích
của sinh viên này.
Bảng 4.8 Bảng giá trị chuẩn Student t
Độ tự do
90%
0.10
95%
0.05
98%
0.02
99%
0.01
1 6.31 12.71 31.82 63.66
2 2.92 4.30 6.96 9.92
3 2.35 3.18 4.54 5.84
4 2.13 2.78 3.75 4.60
5 2.02 2.57 3.36 4.03
6 1.94 2.45 3.14 3.71
7 1.89 2.36 3.00 3.50
8 1.86 2.31 2.90 3.36
9 1.83 2.26 2.82 3.25
10 1.81 2.23 2.76 3.17
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

90
12 1.78 2.18 2.68 3.05
14 1.76 2.14 2.62 2.98
16 1.75 2.12 2.58 2.92
18 1.73 2.10 2.55 2.88

20 1.72 2.09 2.53 2.85
30 1.70 2.04 2.46 2.75
50 1.68 2.01 2.40 2.68

1.64 1.96 2.33 2.58

9.8.2 So sánh 2 giá trị trung bình:
Trong phần sai số ta đã biết kết quả phân tích bị ảnh hưởng bởi nhiều nguyên nhân: sai số do
thu mẫu, do phương pháp, do dụng cụ, hoá chất và kể cả sai số của từng cá nhân phân tích
(kiểm nghiệm viên).
Đối với dạng so sánh này ta có công thức:

2
11
22



BA
BBAA
pool
nn
snsn
s
và




















BA
pool
BA
nn
s
XX
t
11
exp

Độ tự do df = (n
A
+ n
B
) – 2
Ví dụ sau đây thể hiện rõ nhất về so sánh 2 giá trị trung bình:

Ví dụ 9.10:
Hàm lượng NO
3
-
trong nước được xác định bằng 2 phương pháp khác nhau (A và B) trong
cùng một mẫu nước thu. Và đạt được kết quả như sau:
Phương pháp A Phương pháp B
3,080 3,052
3,094 3,141
3,107 3,083
3,056 3,083
3,112 3,046
3,174
3,198
Trung bình
X

3,117 3,081
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

91
Độ lệch chuNn s 0,00259 0,00138
Số quan sát n 7 5
Với độ tinh cậy 95%, hãy xác định 2 phương pháp phân tích khác nhau có ý nghĩa hay không?
Giải quyết vấn đề:
Tính trung bình, độ lệch chuNn được tính và thể hiện ở bảng trên.
Độ tự do df = (7 + 5) – 2 = 10
Ta có 2 giả thuyết:
Giả thuyết 1: H
o

:
A
X =
B
X Giả thuyết 2: H
A
:
A
X 
B
X
(
Khác biệt không ý nghĩa) (Khác biệt có ý nghĩa)
Áp dụng công thức ta có:





0459,0
257
00138,01500259,017
2
11
22








BA
BBAA
pool
nn
snsn
s

và:
34,1
5
1
7
1
0459,0
081,3117,3
11
exp




































BA
pool
BA
nn
s
XX

t

Ta tìm giá trị t
(0,05, 10)
trong Bảng 9.8 ta có: t
(0,05, 10)
= 2,23.
Như vậy ta có t
exp
< t
(0,05, 10)
, ta chấp nhận giả thuyết H
o
. Nghĩa là 2 phương pháp này phân
tích cho kết quả không khác biệt nhau.
9.8.3 Số liệu cặp đôi (pair data):
Trong một số trường hợp sự biến động số liệu trong cùng một phương pháp hoặc một nghiệm
thức biến động hơn sự khác biệt giữa hai giá trị trung bình của 2 dãy số liệu. Lúc này nến ta
xử lý thống kê để so sánh sự khác biệt sẽ không đúng. Ví dụ so sánh 2 phương pháp khi thu
mẫu ở các thuỷ vực khác nhau. Hàm lượng chất nào đó trong các thuỷ vực biến động quá lớn,
từ
đó sẽ không đánh giá được phương pháp.
Hãy xem ví dụ dưới đây:
Ví dụ 9.11:
Để đánh giá của một hợp chất hoá học lên hàm lượng chất rắn hoà tan (TDS) trong môi
trường nước nước thải từ ao nuôi cá Tra bằng cách sử dụng 2 phương pháp (phương pháp
trọng lượng và đo bằng điện cực). Mẫu được thu ở nhiều lần ở thời gian khác nhau và đạt
được kết quả sau:
Mẫu PP trọng lượng (ms/cm
2

) PP điện cực (ms/cm
2
)
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

92
1 129,5 132,3
2 89,6 91,0
3 76,6 73,6
4 52,2 58,2
5 110,8 104,2
6 50,4 49,9
7 72,4 82,1
8 141,4 154,1
9 75,0 73,4
10 34,1 38,1
11 63,3 60,1
Hãy xác định xem 2 phương pháp trên có khác biệt nhau về kết quả phân tích hay không?
Giải quyết vấn đề:
Đây là một ví dụ điển hình của số liệu cặp đôi. Trong trường hợp này ta không thể cộng và
tính trung bình (
X
) để so sánh thống kê trung bình như Ví dụ 9.10 được vì theo thời gian
TDS sẽ biến động do ảnh hưởng của hoá chất xử lý. Trong trường hợp này ta phải tính độ
chên lệch giữa 2 phương pháp, kí hiệu là
d.
d = X
PP trọng lượng
– X
PP điện cực


Ta có thể tính
d cho mỗi mẫu:
Mẫu PP trọng lượng
(ms/cm
2
)
PP điện cực (ms/cm
2
) Khác biệt (d)
1 129,5 132,3 2,8
2 89,6 91,0 1,4
3 76,6 73,6 -3,0
4 52,2 58,2 6,0
5 110,8 104,2 -6,6
6 50,4 49,9 -0,5
7 72,4 82,1 9,7
8 141,4 154,1 12,7
9 75,0 73,4 -1,6
10 34,1 38,1 4,0
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

93
11 63,3 60,1 -0,2
Trung bình 2,25
Độ lệch chuNn
s 5,63
Độ tự do df = n – 1 = 11 – 1 = 10
Ta có 2 giả thuyết:
H

o
: d
tb
= 0 H
A
: d
tb
 0

Ta có:
   33,1
63,5
1125,2
exp

d
s
nd
t

Dò vào
Bảng 9.8 ta có t
(0,05, 10)
= 2,23 > t
exp
= 1,33, do đó chấp nhận giả thuyết H
o
. Nghĩa là:
hai phương pháp này khác nhau có không ý nghĩa.
9.8.4 Số liệu “out” (outliers)

Trong phân tích lặp lại trong cùng một mẫu hoặc giữa các lần lặp lại trong cùng một nghiệm
thức ta thu được nhưng nhiều số liệu với giá trị khác nhau. Đôi khi ta thu được 1 số liệu quá
cao, hoặc quá thấp so với dãy số liệu đạt được. Đôi khi ta không biết có nên loại bỏ (reject) số
liệu này hay không. Vì vậy ta phải tính toán để đi đến kết luận một cách khoa học.
Một phương pháp thông thường
để chứng minh một giá trị gọi là “out” là Dixon’s Q-Test.
Ta có công thức:
-
Đối với số nhỏ nhất:
1
12
exp
XX
XX
Q
n



-
Đối với số cao nhất:
1
1
exp
XX
XX
Q
n
nn






Trong đó n là số lần lặp lại của một phép phân tích hay một nghiệm thức nào đó.
Nếu Q
exp
> Q
lý thuyết
trong Bảng 9.9 thì chấp nhận giả thuyết H
A
, và số liệu cần được loại bỏ.
Bảng 9.9: Bảng giá trị Q-Test
N/α 0.1 0.05 0.04 0.02 0.01
3
0.941 0.970 0.976 0.988 0.994
4
0.765 0.829 0.846 0.889 0.926
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

94
5
0.642 0.710 0.729 0.780 0.821
6
0.560 0.625 0.644 0.698 0.740
7
0.507 0.568 0.586 0.637 0.680
8
0.468 0.526 0.543 0.590 0.634
9

0.437 0.493 0.510 0.555 0.598
10
0.412 0.466 0.483 0.527 0.568
Xem ví dụ sau:
Ví dụ 9.12:
Một sinh viên phân tích hàm lượng NO
3
-
trong nước 9 lần lặp lại, với số liệu như sau:
3,067 3,049 3,039 2,514 3,048 3,079 3,094 3,109 3,102
Bằng Dixon’s Q-Test, hãy tìm xem số liệu 2,514 có nằm ngoài (outlier) và cần phải loại bỏ?
Giải quyết vấn đề:
Trước tiên, ta cần sắp xếp dãy số liệu trên theo thứ tự từ nhỏ đến lớn:
1 2 3 4 5 6 7 8 9
2,514 3,039 3,048 3,049 3,067 3,079 3,094 3,102 3,109
Áp dụng công thức đối với số nhỏ nhất, ta có:
882,0
514,2109,3
514,2039,3
19
12
exp







XX

XX
Q
Dò tìm giá trị Q
(0,05, 9)
trong Bảng 9.9 ta được Q
(0,05, 9)
= 0,493 < 0,882. Do đó ta chấp nhận
giả thuyết H
A
. N ghĩa là số 2,514 đã “out” so với dãy số liệu đạt được, vì vậy có thể loại bỏ số
liệu này.
4.9 Giới hạn phát hiện (Detection Limits)
Phần cuối của chương này là đánh giá khả năng của một phương pháp trong việc phát hiện
một chất ở nồng độ cực thất (hàm lượng vết – trace amount).
Giới hạn phát hiện của một phương pháp (method’s detection limit) là một lượng hoặc
một nồng độ nhỏ nhất mà phương pháp có thể phát hiện đáng tin cậy. Theo định nghĩa của
International Union of Pure and Applied Chemistry (IUPAC) thì
giới hạn phát hiện (Limit
of Detection - LOD)
là nồng độ nhỏ nhất của chất tan có tín hiệu (signal) cao hơn có ý nghĩa
so với mẫu trắng có thêm thuốc thử (reagent blank).
Về mặt toán học, tín hiệu của một chất tại giới hạn phát hiện S
A(DL)
là:
S
A(DL)
= A
reagent
+ zσ
reagent


Trong đó: A
reagent
là tín hiệu của mẫu trắng có thêm thuốc thử
σ
reagent
là độ lệch chuNn của mẫu trắng có thêm thuốc thử (thường đo 30 lần lặp lại)
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

95
z là một nhân tố ở mức ý nghĩa nhất định theo mong muốn
Nồng độ tại giới hạn phát hiện có thể được xác định thông qua tính hiệu (độ hấp thụ quang)
tại giới hạn phát hiện.



k
S
C
DL
A
DL
A
 và 



k
S
n

DL
A
DL
A

Giá trị z phụ thuộc vào mức ý nghĩa mong muốn cho báo cáo một giá trị giới hạn phát hiện
(LOD). Điển hình là giá trị z là 3,0 từ
Bảng 9.10 tương ứng với mức ý nghĩa α = 0,00135. Do
đó chỉ 0,135% quá trình đo đạt mẫu trắng mang lại tính hiệu nằm ngoài giới hạn đo
Hình 9.8.
Khả năng
phân bố của
mẫutrắng
S
thuốcthử
S
A(DL)

Hình 9.4. Khả năng phâ bố của mẫu trắng
Bảng 9.10: Giá trị z ở các mức ý nghĩa
u 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4365 0.4325 0.4286 0.4347
0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
0.4 0.3446 0.3409 0.3372 0.3326 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867

0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

96
1.7 0.0446 0.0436 0.0427 0.0416 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0253
2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
2.3 0.0107 0.0104 0.0102 0.00964 0.00914 0.00866
2.4 0.00820 0.00776 0.00734 0.00695 0.00657
2.5 0.00621 0.00587 0.00554 0.00523 0.00494
2.6 0.00466 0.00440 0.00415 0.00391 0.00368
2.7 0.00347 0.00326 0.00307 0.00298 0.00272
2.8 0.00256 0.00240 0.00226 0.00212 0.00199
2.9 0.00187 0.00175 0.00164 0.00154 0.00144
3.0 0.00135
3.1 0.00968
3.2 0.000687
3.3 0.000483
3.4 0.000337
3.5 0.0002233

3.6 0.000159
3.7 0.000108
3.8 0.0000723
3.9 0.0000481
4.0 0.0000317
4.1 0.0000207
4.2 0.0000133
4.3 0.00000854
4.4 0.00000541
4.5 0.00000340
4.6 0.00000211
4.7 0.00000130
4.8 0.000000793
4.9 0.000000479
5.0 0.000000287
Khoa Thuỷ sản - Đai học Cần Thơ|Huỳnh Trường Giang

97

The American Chemical Society’s Committee on Environmental Analytical Chemistry đã đề
nghị một khái niệm là
giới hạn định lượng (Limit of Quantitation) - LOQ, và được tính như
sau:
LOQ = S
reag
+ 10σ
reag

Giới hạn định lượng LOQ là nồng độ hoặc một lượng chất nhỏ nhất có thể xác định ở mức độ
tin cậy nhất định

Giới hạn phát hiện LOD thường được báo cáo trong phân tích môi trường hoặc sản phNm thuỷ
sản để nói lên khả năng phát hiện của phương pháp tiến hành phân tích một chất tôn tại trong
mẫu. Qua Hình 9.5 ta có thể thấy rằng giới hạ
n phát hiện LOD được thể hiện trong vùng màu
xám nơi mà chất cần phân tích thỉnh thoảng được phát hiện hoặc không thể phát hiện. Tín
hiệu thu được từ chất cần xác định lớn hơn giới hạn trên của độ tin cậy thì chất cần phân tích
luôn luôn được phát hiện.
S
thuốcthử
S
mẫu
Không bao
giờ phát hiện
Luôn luôn
phát hiện
Khoảng dưới
độ tin cậy
Khoảng trên
độ tin cậy
???

Hình 9.5 Khả năng phát hiện của một chất

TÀI LIỆU THAM KHẢO
Efstathiou, C., 1992. Stochastic calculation of critical Q-Test values for the detection of
outliers in measurements. Journal of Chemistry Educcation 69, 773-736.
Harvey, D., 2000. Modern analytical chemistry. McGraw-Hill Higher Education. The
International Edition. 816 pp.
Miller, J.C., Miller, J.N., 1993. Statistics for analytical chemistry, 3
rd

edition. Ellis Horwood
PTR Prentice-Hall: New York, 1993.
Taylor, B.N., Kuyatt, C.E., 1994. Guidelines for evaluating and expressing the uncertainty of
nist measurement results. NIST Technical Note 1297.

×