Tải bản đầy đủ (.doc) (131 trang)

PHÂN TÍCH KẾT QUẢ THỰC NGHIỆM TRONG HÓA HỌC

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.33 MB, 131 trang )

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA HÓA HỌC

PHÂN TÍCH KẾT QUẢ THỰC NGHIỆM
TRONG HÓA HỌC

HÀ NỘI- 2007
1


Lời mở đầu
Mục tiêu để chúng tôi thực hiện cuốn sách này bắt nguồn từ một số nguyên nhân.
Đầu tiên, đó chính là các sinh viên mà chúng tôi dạy hóa phân tích và họ vẫn đang
tiếp tục vật lộn với các dữ liệu phân tích.
Cũng nh các nhà khoa học khác trên thế giới, chúng tôi cũng nhấn mạnh với các
sinh viên về tầm quan trọng của các số liệu không hợp lí, nhng ít nhất chúng tôi
cũng đã nhấn mạnh đợc điểm này mà không
Thảo luận với nhiều giáo viên dạy các môn khoa học khác, họ cũng cho rằng JJG
không chỉ là ngoại lệ mà còn giống nh một qui luật. Các giảng viên cũng hiểu đợc
tầm quan trọng của các dữ liệu phân tích nhng không phải lúc nào họ cũng biết
cách tốt nhất để giảng dạy về nó. Trong trờng học của chúng tôi, cũng giống nh các
trờng khác, các giáo viên lâu năm có sự hiểu biết rất sâu sắc về môn học, nhng
phần còn lại những ngời dạy các phần khác của hóa học, và thực sự chỉ sử dụng dữ
liệu thực nghiệm nh một công cụ đơn thuần trong các lớp học thực nghiệm, có thể
hiểu nó chỉ đơn thuần là công cụ so sánh giữa lí thuyết và thực nghiệm. Đây chính
là một vài điều mà chúng tôi cảm thấy cần phải chỉnh sửa lại trong giảng dạy, đó
chính là động lực thứ hai để chúng tôi hoàn thành cuốn sách. Trong các cuộc thảo
luận từng cặp, chúng tôi đã rút ra kết luận vấn đề là một phần của ngôn ngữ. Trong
quá trình viết cuốn sách này chúng tôi cũng rút ra kết luận về một khía cạnh khác
của vấn đề là sự không chắc chắn mà phát sinh từ phơng pháp xử lí mà vẫn đang đợc thực hiện. Phân tích dữ liệu hóa học cùng với các phép đo lờng khác trong hóa
học tất nhiên là một môn học mới và tốt hơn đang rất phát triển. Vì vậy cuốn sách


này cố gắng đa ra các dữ liệu phân tích một cách đơn giản, coi nh một cách hớng
dẫn nhằm làm sáng tỏ ngôn ngữ và ở mọi nơi đều có thể đa ra cách giải quyết rõ
ràng nhất. Để làm điều này chúng tôi đã nhờ đến một chuyên gia có kinh nghiệm
và một ngời không có kinh nghiệm (JJG) và ở mọi nơi DHB đều có thể làm cho
JJG nói rõ cách làm của anh ta với các câu hỏi kiểu nh: Anh làm điều này có
nghĩa là gì?, Làm thế nào để biết cách làm đó là chính xác, Có phải là anh
không thể xác định việc đó, Cái gì là qui tắc để chúng ra có thể đa ra cho ngời
đọc?. Kết quả cuối cùng là sự thỏa thuận giữa 1 ngời muốn sử dụng các công thức
cơ bản để thể hiện các dữ liệu phân tích khác nhau và một ngời muốn đa ra một số
thông tin cơ bản dựa trên các nguyên tắc cần thiết trớc khi các công thức đợc thực
hiện. Cuối cùng chúng tôi đều nhất trí rằng với các dữ liệu phân tích phải đợc thực
hiện một cách hợp lí, nh một số môn khoa học khác, nó không thể đợc xử lí nh 1
chiếc hộp đen nhng với ngời cha có kinh nghiệm thì thật là khó để hiểu và thực
hiện nó một cách rõ ràng.
Nh vậy những ai nên sử dụng cuốn sách này? Những ngời mà cho rằng họ không
thực sự hiểu về các dữ liệu phân tích và không biết cách ứng dụng nó vào hóa học.
Nếu bạn thực sự làm và hiểu rõ các dữ liệu phân tích, thì sau đó bạn có thể tìm ra
cách giải thích trong cuốn sách này rất đơn giản mà chỉ cần vốn kiến thức giới hạn.
Chúng tôi nhận thấy điều này là một mức độ rất tốt của cuốn sách mà mục tiêu của
việc học và dạy về các dữ liệu phân tích cho các sinh viên cha tốt nghiệp. Chúng tôi
đã cố làm cho nó dễ hiểu đối với ngời đọc và tìm ra cách để mà họ đang cố tìm
kiếm để thực hiện các dữ liệu phân tích cần thiết. Để thực hiện đợc điều này chúng
tôi đa ra các thuật ngữ ở đầu cuốn sách với các chỉ dẫn để xác định vị trí của các
2


khái niệm trong cuốn sách này. Chúng tôi cũng đa vào các câu hỏi thờng gặp ngắn
gọn (FAQs) với các câu trả lời ngắn gọn và những chỉ dẫn để xác định các câu trả
lời chi tiết hơn, và hớng dẫn các chức năng của Excel. Hi vọng rằng với sự kết hợp
của 3 phần này sẽ giúp bạn tìm ra cách thực hiện khi mà giảng viên của bạn yêu

cầu đo kích thớc của một cuvet và sau đó xác định sai số trong phép đo của bạn.
Nếu sau khi đọc hết cuốn sách này và nghiên cứu các ví dụ mẫu mà bạn vẫn phải
nói Làm thế nào? thì chúng tôi đã không đạt đợc mục tiêu của mình ở cuốn sách
này.
Lời cảm ơn
Đầu tiên chúng tôi muốn gửi lời cảm ơn đến gia đình, họ đã động viên và giúp đỡ
chúng tôi rất nhiều trong thời gian hoàn thành cuốn sách. Đặc biệt là Marian,
Hannah và Edward cùng với Katharina của JJG.
Chúng tôi cũng muốn gửi lời cảm ơn đến các thành viên của nhóm nghiên cứu, họ
đã giúp đỡ chúng tôi rất nhiều để đạt đợc kết quả tốt nhất. Nhiều ngời trong số họ
đã sửa giúp chúng tôi bản thảo và đóng góp rất nhiều ý kiến quí báu cho chúng tôi,
xin chân thành cảm ơn Dr. Till, Dr. Florian Bender và Dr Edith Chow và Elicia
Wong.
Chúng tôi cũng xin gửi lời cảm ơn đến các đồng nghiệp khoa hóa trờng đại học
New South Wales đã giúp đỡ chúng tôi rất nhiều.
Cuối cùng chúng tôi xin gửi lời cảm ơn đến các sinh viên những ngời đã sử dụng
cuốn sách này nh một sự chỉ dẫn để trả lời các câu hỏi của họ

Contents
Readers Guide: Definitions, Questions, and Useful Functions:
Where to Find Things and What to Do 1
1. Introduction 21
1.1. What This Chapter Should Teach You 21
1.2. Measurement 21
1.3. Why Measure? 21
1.4. Definitions 22
1.5. Calibration and Traceability 23
1.6. So Why Do We Need to Do Data Analysis at All? 23
1.7. Three Types of Error 24
1.8. Accuracy and Precision 31

1.9. Significant Figures 35
1.10. Fit for Purpose 37
2. Describing Data: Means and Confidence Intervals 39
2.1. What This Chapter Should Teach You 39
2.2. The Analytical Result 39
2.3. Population and Sample 40
2.4. Mean, Variance, and Standard Deviation 41
2.5. So How Do I Quote My Uncertainty? 49
3


2.6. Robust Estimators 61
2.7. Repeatability and Reproducibility of Measurements 64
3. Hypothesis Testing 67
3.1. What This Chapter Should Teach You 67
3.2. Why Perform Hypothesis Tests? 67
3.3. Levels of Confidence and Significance 68
3.4. How to Test If Your Data Are Normally Distributed 72
3.5. Test for an Outlier 77
3.6. Determining Significant Systematic Error 82
3.7. Testing Variances: Are Two Variances Equivalent? 87
3.8. Testing Two Means (Means t-Test) 90
3.9. Paired t-Test 94
3.10. Hypothesis Testing in Excel 97
4. Analysis of Variance 99
4.1. What This Chapter Should Teach You 99
4.2. What Is Analysis of Variance (ANOVA)? 99
4.3. Jargon 101
4.4. One-Way ANOVA 101
4.5. Least Significant Difference 105

4.6. ANOVA in Excel 106
4.7. Sampling 112
4.8. Multiway ANOVA 115
4.9. Two-Way ANOVA in Excel 116
4.10. Calculations of Multiway ANOVA 125
4.11. Variances in Multiway ANOVA 125
5. Calibration 127
5.1. What This Chapter Should Teach You 127
5.2. Introduction 127
5.3. Linear Calibration Models 129
5.4. Calibration in Excel 147
5.5. r2: A Much Abused Statistic 153
5.6. The Well-Tempered Calibration 154
5.7. Standard Addition 155
5.8. Limits of Detection and Determination 160
Appendix 165

4


Hớng dẫn ngời đọc: Các định nghĩa, câu hỏi và công dụng của các chức năng.
Tìm ở đâu và sử dụng nh thế nào?
.......................................
Chơng này có tên là hớng dẫn ngời đọc vì chơng 1 là phần bắt đầu của cuốn sách,
với các lời giới thiệu và thảo luận về phép đo lờng, v..vChơng này đợc biên soạn
lần cuối và cố gắng giúp ngời đọc những ngời muốn hiểu điểm chính của phép đo lờng, nhng lại không có cách nào thực hiện 1 bài T-test. Trong bảng chú giải thuật
ngữ, chúng tôi để các định nghĩa và các khái niệm sử dụng trong cuốn sách nh là
một phần tham khảo nơi mà ngời đọc có thể xác định các khái niệm hoặc định
nghĩa chính xác và chi tiết hơn. Các chỉ dẫn đó thờng đặt các câu hỏi mà thờng là
các câu hỏi sinh viên và đồng nghiệp hay thắc mắc với chúng tôi. Thứ tự các chỉ

dẫn đó đợc trình bày trong cuốn sách, nhng trớc khi bạn có thể đặt ra những thắc
mắc đó thì bạn đã thực hiện một vài thực nghiệm lặp đi lặp lại.
Cuối cùng chúng tôi đã đa ra các chức năng của một bảng số liệu Excel mà rất hữu
dụng đối với các nhà hóa học để xử lí số liệu thực nghiệm. Danh sách đợc đa ra
cùng với các chức năng đó mà rõ ràng các chỗ khác không nhắc đến, và cũng cha
bao giờ công bố là hoàn thành. Nhng bạn có thể tìm thấy ở đây nếu bạn không thể
tìm thấy 1 chức năng này ở chỗ khác.
Bảng chú giải thuật ngữ
Các khái niệm đa ra dới đây không phải luôn luôn là định nghĩa hệ thống chính
xác. Chúng đợc đa ra trong hóa phân tích và các tác giả đã cố gắng đa ra những chỉ
dẫn dễ hiểu nhất đối với ngời đọc.
Tỉ số sự phân phối bên ngoài và giá trị đợc chọn. (Mục 2.5.2)
Accuracy Formerly: kết quả của phép đo gần với giá trị thực nhất; chất lợng của
kết quả trong các điều kiện thực và độ chính xác liên hệ với các yêu cầu của việc sử
dụng nó. (Mục 1.8; hình 1.6)
Analytical sensitivity: Hệ số đờng thẳng biểu diễn độ dốc của mối liên hệ giữa sự
đáp ứng của dụng cụ và nồng độ chuẩn. Trong một số từ khác có nghĩa là độ dốc
của đồ thị. (Mục 5.3)
ANOVA (analysis of variance): Phơng pháp thống kê để so sánh giá trị trung bình
của các số liệu dới ảnh hởng của một hoặc nhiều nhân tố. Phơng sai của các dữ liệu
này có thể thay đổi khi thay đổi các nhân tố khác nhau. (Chơng 4)
Arithmetic mean x Giá trị trung bình của các số liệu. Là kết quả của tổng các dữ
liệu chia cho số các dữ liệu (n) (Mục 2.4.1)
Bias: Sai số hệ thống trong phép đo hệ thống (Mục 1.7)
Calibration: Sự thiết lập mối liên hệ giữa sự đáp ứng của dụng cụ và giá trị của
phép đo. (Mục 5.2)
Calibration curve: một biểu đồ chia độ. (Mục 5.2)
Central limit theorem: Sự phân phối của giá trị trung bình của n số liệu sẽ đạt đến
phân phối chuẩn khi n tăng, bất kể lúc đầu số liệu phân phối nh thế nào?


5


Certified reference material (CRM): Chuẩn với một số giá trị đợc thiết lập ở bậc
cao, kèm theo sự thiết lập bảng số liệu chi tiết. Sử dụng để đánh giá các ảnh hởng
hệ thống. (Mục 3.3)
Confidence interval: Một khoảng giá trị của mẫu đợc tin tởng là bao gồm các giá
trị trung bình có xác suất 95% hoặc 99%. Khoảng tin cậy 95% với giá trị trung
bình ( x ) của n mẫu với độ lệch chuẩn s là: x t 0,05,n 1 (s / n ).t 0,05,n 1 là 95%, phân phối
Student với bậc tự do là n-1. (Mục 2.5.1)
Confidence limit Các giá trị vô cùng giới hạn bởi khoảng tin cậy. (Mục 2.5.1)
Correction for the mean Phép trừ giá trị trung bình chung từ mỗi kết quả của phép
đo trong ANOVA. Số liệu này cũng đợc coi là giá trị trung bình chính xác. (Mục
4.4)
Corrected sum of squares Xem phần tổng các bình phơng. (Mục 4.4)
Cross-classified system Trong bài toán ANOVA khi mà các phép đo đợc thực hiện
từ ảnh hởng của sự kết hợp nhiều nhân tố. (Mục 4.8)
Degrees of freedom Số các dữ liệu trừ đi số các tham số tính toán từ chúng. Số bậc
tự do của một mẫu có độ lệch chuẩn của n dữ liệu là n-1. (Mục 2.4.5, 5.3.1)
Dependent variable Sự phụ thuộc của sai số dụng cụ vào giá trị của các biến
không độc lập (nồng độ phân tích) (Mục 5.2)
Detection limit Xem giới hạn của sự phát hiện (Mục 5.8)
Effect of a factor Các phép đo thay đổi nh thế nào khi có một nhân tố tham gia.
(Mục 4.3)
Error : Kết quả của phép đo trừ đi giá trị thực tính theo lý thuyết. (Mục 1.7)
Factor: Trong ANOVA một số lợng đang đợc nghiên cứu. (Mục 4.2; 4.3)
Fisher F-test: Một ý nghĩa kiểm tra thống kê để xác định sự khác nhau giữa hai
phơng sai (và vì thế có 2 mẫu độ lệch chuẩn). Chuẩn này đợc sử dụng trong
s12
ANOVA. Với 2 độ lệch chuẩn là s1 và s2, F = 2 khi s1 > s2 (Mục 3.7, 4.4)

s2

Fit for purpose Các qui định để thừa nhận kết quả của phép đo đáp ứng đợc độ
chính xác để tạo đợc kết quả hợp lí. (Mục 1.10)
Grand mean Giá trị trung bình của tất cả các dữ liệu (sử dụng trong ANOVA).
(Mục 4.2)
Gross error Một kết quả khác xa so với giá trị thực đến nỗi mà nó không thể miêu
tả với các điều kiện của phép đo không chắc chắn và đã biết sai số hệ thống. (Mục
1.7)
Grubbs s test Một loại chuẩn thống kê để xác định số liệu có bị vợt ra ngoài hay
không. Giá trị G bị nghi ngờ là có thể vợt quá giới hạn có thể tính toán sử dụng
G = ( x suspect x / s) . Nếu G lớn hơn giá trị giới hạn thì có thể có xác suất xảy ra
G0,05,n, giả thuyết là bằng 0, nếu số liệu không vợt quá giới hạn và phân phối giống
nh các dữ liệu khác thì loại bỏ giả thuyết đó. (Mục 3.5)
Heteroscedastic data Phơng sai của dữ liệu trong một phép đo không độc lập với
độ lớn của nó. Thờng thì điều này dờng nh là khi nồng độ tăng thì phơng sai cũng
tăng (ví dụ có mối liên hệ giữa độ lệch chuẩn và hằng số của kích cỡ). (Mục 5.3.1)
Homoscedastic data Phơng sai của dữ liệu trong một phép đo độc lập với độ lớn
của nó. (ví dụ độ lệch chuẩn là hằng số). (Mục 5.3.1)
6


Hypothesis test Câu hỏi về dữ liệu đợc xác định dựa trên khả năng của dữ liệu ở
dạng giả thuyết. (Mục 3.1)
Independent measurements Các phép đo thực hiện dựa trên một số mẫu rieeng.
(Mục 2.7)
Independent variable Một số lợng dới sự điều chỉnh của phép phân tích. Trong
thang chia độ một số lợng khác nhau để xác định mối liên hệ giữa số lợng này và
sai số của dụng cụ. Kiểu này trong thang chia độ phơng sai độc lập là nồng độ.
(Mục 5.2)

Indication of a measuring instrument: (Mục 5.3)
Indication of the blank: Sự đáp ứng của dụng cụ để kiểm tra dung dịch bao gồm
mọi thứ ngoại trừ phân tích. Nếu nó không thể để đo đạc thì nó có thể tham gia vào
đờng cong của thang chia độ. (Mục 5.3)
Influence factor (quantity) Một vài yếu tố có thể ảnh hởng đến kết quả của phép
đo đạc. Ví dụ: nhiệt độ, áp suất, dung môi. Trong thang chia độ, ảnh hởng của số lợng không thể là phơng sai độc lập nhng có thể ảnh hởng đến phép đo. (Mục 4.2,
4.3, 5.3)
Instance of factor Mẫu thực tế của một nhân tố trong ANOVA. Ví dụ trong quá
trình tiến hành thực nghiệm ở 20, 30, và 400C, 3 nhiệt độ đó là các trờng hợp của
nhân tố nhiệt độ. (Mục 4.2)
Interaction Trong ANOVA, ảnh hởng của 1 nhân tố đến các nhân tố khác cũng đợc xét đến. Ví dụ nếu tốc độ phản ứng tăng lên khi nhiệt độ tăng thì ở phản ứng
ngắn sẽ cao hơn phản ứng dài nhiều lần, và có thể nói rằng nhiệt độ tăng theo thời
gian ở các phản ứng. (Mục 4.8)
Intercept: Điều kiện không đổi trong thang chia độ. (Mục 5.3)
Interquartile range Khoảng giữa 50% tập hợp các dữ liệu liên quan đến bậc. Giới
hạn thờng coi nh là một phép ớc lợng thô của độ lệch chuẩn. (Mục 2.6.2)
Intralaboratory standard deviation Độ lệch chuẩn của các kết quả phép đo thu
đợc cùng trong một phòng thí nghiệm nhng với các điều kiện không lặp lại, ví dụ
các phép phân tích khác nhau sử dụng các dụng cụ khác nhau trong những ngày
khác nhau. (Mục 2.7)
Leverage Hớng của một điểm đơn giản ảnh hởng đến thang chia độ hớng về phía
nó và vì thế làm tăng giá trị sai số của phép hồi qui. (sy/x). (Mục 5.3.1)
Limit of detection Nồng độ nhỏ nhất của phép phân tích đa ra ý nghĩa của sự đáp
ứng các dụng cụ mà có thể nhận ra ở phía trên hoặc phần cơ bản. (Mục 5.8)
Limit of determination Giá trị nhỏ nhất của phép đo mà có thể đo đợc ở điều kiện
chính xác. (Mục 5.8)
Linear calibration model Phơng trình biểu diễn mối liên hệ giữa sự đáp ứng của
dụng cụ tỉ lệ với nồng độ (dạng y = ax +b) (Mục 5.3)
Linear range Vùng nằm dới đờng cong nơi có mối liên hệ giữa sự đáp ứng của
dụng cụ và nồng độ phù hợp với đờng cong. (Mục 5.3.2)

Mean (population mean) à Giá trị trung bình của tập số liệu mà xác định bởi một
hàm số tỉ lệ. Phân phối trung bình là giá trị thực không có sai số hệ thống. (Mục
1.8.2)
Mean (sample mean) x = (1i==1n x1 / n) Giá trị trung bình của tập số liệu. Tổng các
kết quả chia cho n số liệu. (Mục 2.4.1)
7


Mean square Tổng các bình phơng chia cho số bậc tự do.
Means t-test t-test để xác định nếu 2 tập số liệu có giá trị trung bình giống nhau.
Với mỗi tập số liệu tính toán ra giá trị trung bình của mẫu và độ lệch chuẩn
(x1 , s1 , x 2 , s 2 ) . Kiểm tra độ lệch chuẩn với giả thiết 1 = 2 . Nếu chuẩn thống kê bằng
phơng sai t = ( x1 x 2 / sp 1 / n1 + 1 / n2 ) với sp2 = ((n1 1)s12 + (n2 1)s22 ) / (n1 + n2 2) và bậc
tự do là n1 + n2 2. Nếu chuẩn thống kê không bằng phơng sai thì
t = ( x1 x 2 / s12 / n1 + s22 / n2 ) với bậc tự do (Mục 3.8)
Measurand Số lợng dùng để đo đạc (Mục 1.7)
Measurement Tập hợp các hoạt động để xác định giá trị của số lợng. (Mục 1.2)
Measurement uncertainty Một tính chất của kết quả phép đo mà đợc miêu tả
bằng sự phân tán của các kết quả có thể qui vào phép đo. Nó xác định độ tin cậy
trong kết quả của phép đo. (Mục 1.7.3)
Median Giá trị giữa của tập hợp các số liệu về độ lớn. (Mục 2.6.1)
Multivariate calibration Sự xác định kích cỡ trong các biến độc lập đợc sử dụng
để thiết lập kiểu kích cỡ. (Mục 5.2)
Nested factor Trong bài toán ANOVA một nhân tố có thể không liên quan đến
mức độ của các nhân tố khác. (Mục 4.8)
Normal (Gaussian) distribution Sự phân phối ngẫu nhiên miêu tả bằng hàm mật
độ tạo ra hình dạng của đờng cong. Nó đợc miêu tả bởi giá trị trung bình à và độ
lệch chuẩn (Mục 1.8.2)
Null hypothesis (Ho) Giả thuyết mà sự phân bố của các tham số có thể đợc so
sánh (ví dụ: giá trị trung bình và phơng sai) dựa trên các số liệu nh nhau, và các đối

tợng quan sát khác nhau từ sự thay đổi ngẫu nhiên. Đây là loại giả thuyết sử dụng
trong nhiều loại thống kê không có sự khác nhau giữa các nhân tố đợc so sánh.
(Mục 3.2)
One-way ANOVA Trong một bài toán ANOVA một nhân tố đơn giản là thay đổi.
(Mục 4.4)
Outlier Một tập số liệu từ một mẫu giả thiết là phân phối thờng, nó nằm tại giá trị
trung bình ở một trạng thái hợp lí. Vì vậy một số liệu bên ngoài đó dựa theo sự
kiểm tra thống kê, không thuộc về phân phối của phần còn lại của dữ liệu. (Mục
3.5)
Paired t-test ý nghĩa của kiểm tra thống kê để so sánh 2 tập số liệu mà không có
sự lặp lại các phép đo của nguyên liệu đơn giản nhng có các phép đo đơn giản của
một số mẫu kiểm tra khác nhau. Để thực hiện đợc phép kiểm tra này bạn sử dụng
t = (x d n / s d ) khi x d , sd là giá trị trung bình và độ lệch chuẩn của n khác nhau. (Mục
3.9)
Population Số các kết quả vô hạn có thể thu đợc trong một thực nghiệm có thể đợc
miêu tả bằng hàm mật độ. (Mục 2.3)
Precision Độ lệch chuẩn của kết quả phép đo thu đợc dới các điều kiện đặc biệt.
(Mục 1.8; hình 1.6)
Probability density function (pdf ) Hàm số toán học miêu tả sự phân phối trong
các điều kiện để tìm ra kết quả. Với phân phối thờng thì hàm mật độ (Mục 1.8.2;
phơng trình 1.1)
Quantity Thuộc tính của hiện tợng hoặc vật liệu có thể phát hiện định tính và xác
định chất lợng. (Mục 1.4)
8


Q-test (Dixon s Q-test) (Mục 3.5)
Random error Sự thay đổi số liệu các phép đo với sự lặp lại các phép đo tập trung
xung quanh giá trị thực. Nó đợc miêu tả bằng phân phối thờng. (Mục 1.7)
Regression Quá trình xác định điều kiện tốt nhất của tham số của một kiểu phù

hợp với các dữ liệu. Ví dụ, đa ra một cặp dữ liệu (x, y) một kiểu đờng thẳng để tìm
ra giá trị phù hợp của mặt phẳng (a) và có độ dốc (b) trong phơng trình y = ax + b.
Giá trị bình phơng nhỏ nhất là tổng của các bình phơng còn lại. (Mục 5.3.1)
Relative standard deviation (RSD) Độ lệch chuẩn của mẫu biểu diễn dới dạng
s
x

phần trăm của giá trị trung bình, RSD = 100. . Nó còn gọi là hệ số biến đổi (CV).
(Mục 2.4.3)
Repeatability Sự chính xác của phơng pháp phân tích, thờng biểu diễn bằng độ
lệch chuẩn của sự xác định độc lập thực hiện bằng phép phân tích đơn giản trong
cùng ngày, dụng cụ và phơng pháp. (Mục 2.7)
Reproducibility Sự chính xác của phơng pháp phân tích, thờng biểu diễn bằng độ
lệch chuẩn của sự xác định độc lập thực hiện trong các phòng thí nghiệm khác
nhau (và vì thế trong các phép phân tích khác nhau sử dụng các dụng cụ khác nhau
và thực hiện trong những ngày khác nhau). (Mục 2.7)
: sự khác nhau giữa yi và sự ớc lợng từ phơng trình hồi qui đối với
Residual (yi y)
đờng cong chuẩn độ ( yi ) (Mục 5.3.1)
Residual sum of squares, SSr Cũng gọi là cùng với các biến đổi của tổng các
bình phơng , là sự khác nhau giữa tổng các bình phơng và tổng các bình phơng khi
có sự tham gia của các nhân tố. Số liệu này đợc sử dụng trong việc các định ý nghĩa
sự khác nhau của 2 giá trị trung bình khi sử dụng ANOVA. (Mục 4.4)
Robust estimator Sự đánh giá của các tham số của phân phối các số liệu có thể có
giá trị vô cùng (Mục 2.7)
Sample Statistically đây là tập hợp n dữ liệu đợc nghiên cứu. (Mục 2.3)
Significance test Kiểm tra thống kê để xác định có sự khác nhau giữa ý nghĩa
thống kê của 2 tập số liệu ở cùng một mức độ xác định. (Mục 3.2)
Slope Xem mục 5.3.
Standard addition Một phơng pháp phân tích trong một phép đo đợc thực hiện

trên một mẫu dựa theo một phép đo thứ hai sau khi đã biết số lợng lớn của vật liệu
đã đợc thêm vào mẫu. (Mục 5.7)
Standard deviation (population standard deviation), Bình phơng của phơng
sai, độ lệch chuẩn biểu diễn sự phân phối của hàm mật độ. Trong phân phối chuẩn
68% nằm ở trong vùng giá trị trung bình à 1 (Mục 1.8.2)
Standard deviation (sample standard deviation), s sự ớc lợng của n dữ liệu tính toán
i=n
bằng biểu thức ( i =1 (x i x) 2 ) /(n 1) (Mục 2.4.2)

Standard deviation of the mean ( n ) Độ lệch chuẩn của giá trị trung bình của n dữ
liệu. Nó liên hệ với độ lệch chuẩn của hàm phân phối ( ) bởi biểu thức n = / n .
Độ lệch chuẩn của giá trị trung bình đợc ớc lợng từ s / n (Mục 2.4.6)
Standard error of the regression (s y / x ) một số lợng các phép đo tinh chất phù
hợp với phơng trình hồi qui dành cho đờng cong s y / x = ( i =1 (yi y i ) 2 ) / df khi
i =n

9


(yi y i ) là phần còn lại của điểm I và df là bậc tự do. Tối hơn sự phù hợp nhỏ hơn
(s y / x ) (Mục 5.3.1)

Student s t-test, Student t-value Xem t-test.
Sum of squares due to the factor studied, SSc cũng đợc biết đến nh là tổng các
bình phơng, hỗn hợp tổng các bình phơng hoặc giữa tổng bình phơng các cột. Đó là
một số lợng trong ANOVA cso mối liên hệ với phơng sai giữa các nhân tố. (Mục
4.4)
Systematic error Độ lệch với giá trị thực mà luôn luôn có cùng độ lớn và độ chính
xác với giá trị trung bình. Nó có thể ớc lợng từ phép đo của các vật liệu tham gia và
phép phân tích trong hóa học. ý nghĩa của sai số hệ thống có thể kiểm tra

t = ( x assigned -x n / s) với n phép đo độc lập, giá trị trung bình x và độ lệch chuẩn s.
(Mục 1.7, 3.3, 3.6)
Tails Trong phân phối chuẩn đờng cong đối xứng qua giá trị trung bình. Các giá trị
khác nằm bên cạnh giá trị trung bình, đó là một phần của đờng cong cao hơn và
thấp hơn giá trị trung bình của hàm phân phối. (Mục 2.5.4)
Test material Nguyên liệu thực tế đang nghiên cứu. Ví dụ, nếu nồng độ của dung
dịch đang phân tích thì đợc gọi là kiểm tra nồng độ
The actual material being studied. For example, if nếu là chính xác thì gọi là
kiểm tra chính xác. Sử dụng từ mẫu không thể chính xác vì lần lộn với với khái
niệm thống kê của mẫu. (Mục 2.3)
Total sum of squares, SST (also corrected sum of squares) Trong ANOVA số xuất
hiện từ tổng các bình phơng của giá trị trung bình là giá trị chính xác. (Mục 4.4)
t-test (Students t-test) Một loại kiểm tra thống kê với các giả thiết liên quan đến
giá trị trung bình của mẫu nhỏ. Một giá trị t đợc tính toán và xác suất đó là có thể
vợt quá một số lớn các phép đo lặp lại thu đợc. Kiểm tra thống kê sau đó đợc chấp
nhận hoặc loại bỏ dựa trên cơ sở xác suất. Xem phần giá trị trung bình của t-test.
(Mục 3.8)
Type I error (false positive) Loại bỏ giả thiết nếu nó đúng. Trong điều kiện giả
thiết 0 các giá trị trung bình này có sự khác nhau giữa 2 tập số liệu nhng thực tế
không có sự khác nhau. (Mục 3.3)
Type II error (false negative) Chấp nhận giả thiết nếu nó sai. Các giá trị trung
bình chỉ ra không có sự khác nhau giữa các tập số liệu khi so sánh, nhng thực tế là
có. Một cách khác có thể nói đây là giả định giả thiết là đúng nhng thực tế lại
không đúng. (Mục 3.3)
Univariate calibration Khi chỉ có một biến độc lập đợc sử dụng để thiết lập mối
liên hệ giữa sự đáp ứng của dụng cụ với giá trị của phép đo. (Mục 5.2)
Value Số liệu biểu diễn độ lớn của phép đo. (Mục 1.4)
Variance (sample), s2 Bình phơng của độ lệch chuẩn của mẫu. (Mục 2.4.2)
x Ước lợng nồng độ cha biết xác định bằng cách sử dụng (Mục 5.3)
z / 2 Số của độ lệch chuẩn nằm ngoài vùng giá trị trung bình bao gồm tỉ lệ phân số 1

của sự phân phối. (Mục 2.5.2)
z-score Số của độ lệch chuẩn một dữ liệu điểm từ giá trị trung bình. Nó thờng sử
dụng trong ý nghĩa kiểm tra kì vọng. (Mục 2.5.2)

10


Các câu hỏi thờng gặp?
1. Tại sao chúng ta lại phải quan tâm đến các dữ liệu phân tích?
Trừ khi bạn chỉ đang sắp xếp các kết quả mà bạn thu đợc và không xử lí chút nào,
còn sau đó bạn cần phải bằng cách nào đó xử lý kết quả để thu đợc các thông tin thì
đó là lúc bạn quan tâm đến công việc thực nghiệm của bạn lần đầu tiên. (Chơng 1)
2. Tại sao lại phải quan tâm đến độ không chắc chắn?
Bởi vì một kết quả phân tích mà không có thông tin liên quan đến độ không chắc
chắn của giá trị thì không thể sử dụng. (Mục 1.6)
3. Sự khác nhau giữa phép đo đạc và chất phân tích?
Ví dụ nồng độ của đioxin trong nớc là kết quả của phép đo. Chất phân tích là
đioxin. (Mục 1.4)
4. Điều gì khác nhau giữa độ chính xác, độ lệch chuẩn và độ không chắc chắn?
Độ chính xác là một phép đo của các kết quả khác nhau thu đợc dới các điều kiện
khác nhau (ví dụ sự lặp lại). Nó thờng đợc biểu diễn bằng độ lệch chuẩn.
Sự không chắc chắn là một khái niệm thông thờng mà nó bao phủ tất cả các khía
cạnh của các mặt về giá trị thực và cũng có thể biểu diễn bằng độ lệch chuẩn. (Mục
1.7, 1.8)
5. Làm thế nào để tôi thu làm đợc các phép đo có thể đạt chuẩn quốc tế nh là SI?
Bằng thang chia độ sử dụng các chuẩn có thể nh là vật liệu chuẩn. (Mục 1.5)
5. How do I make my measurements traceable to an
international standard such as the SI?
6. Tôi có thể sử dụng dữ liệu phân tích để trả lời tại sao sai số lại xảy ra không?
Không. Nó có thể, tuy nhiên, cho phép bạn có thể nhận ra sai số hệ thống và xác

định sự không chắc chắn nh là hệ quả của sai số ngẫu nhiên. (Mục 1.7, 3.6)
7. Khi viết về độ không chắc chắn, có bao nhiêu cách biểu diễn mà tôi có thể sử
dụng?
Nếu độ lệch chuẩn hoặc 95% khoảng tin cậy đã biết sau đó giá trị này có 2 cách
biểu diễn. Kết quả phép đo có thể viết dới các dạng khác nhau của dạng số thập
phân. (Mục 1.9.2)
8. Độ không chắc chắn có thể chấp nhận kết quả nh thế nào?
Không thể có câu trả lời cho vấn đề này. Nó phụ thuộc tất cả vào câu trả lời sẽ đ ợc
sử dụng và mất bao nhiêu thời gian để thực hiện.
9. fit for purpose? có nghĩa là gì?
Thực hiện một phép đo với độ chính xác thích hợp để chấp nhận giá trị gần đúng.
(mục 1.10)
10. Tại sao lại cần thực hiện lặp đi lặp lại các phép đo?
Chúng ta càng thực hiện lặp lại các phép đo nhiều lần thì sự không chắc chắn trong
trung bình mẫu càng nhỏ và vì thế độ tin cậy của nó càng tốt. (Mục 2.4)
11. Khi nào tính toán độ lệch chuẩn bằng máy tính cá nhân?
Luôn luôn sử dụng s(xn 1 ) khi đa ra giá trị độ lệch chuẩn mẫu. (Ví dụ 2.1a)
12. Khi nào sử dụng phơng sai và khi nào sử dụng độ lệch chuẩn?
Vì phơng sai là bình phơng của độ lệch chuẩn, nên là tơng đơng. Tuy nhiên độ lệch
chuẩn có cùng thứ nguyên với kết quả phép đo, nên có thể sử dụng để giải thích rõ
ràng hơn. (Mục 2.4.2)
13. Cái gì là viết tắt của độ lệch chuẩn (s, sd, SD, )
11


Độ lệch chuẩn của mẫu là s. Độ lệch chuẩn của phân phối là . (Mục 2.4.2)
14. Đơn vị của độ lệch chuẩn là gì?
Cùng đơn vị với giá trị trung bình. (Mục 2.4.4)
15. Tại sao lại phải đa ra mối liện hệ giữa độ lệch chuẩn RSD với một độ lệch
chuẩn?

Vì nó đa ra một số liệu trực tiếp của độ chính xác của phép đo mà không cần biết
giá trị của số lợng. (Mục 2.4.3)
16. Dữ liệu phân tích dờng nh là cơ sở của một số lợng lớn các điểm của dữ liệu và
phân phối chuẩn. Cái gì nếu tôi chỉ có một vài dữ liệu?
Bạn vẫn có thể sử dụng nguyên tắc của thống kê gần đúng trong cuốn sách này
bằng cách giả thiết dữ liệu là phân phối chuẩn. Tuy nhiên độ không chắc chắn của ớc lợng giá trị trung bình và độ lệch chuẩn sẽ tăng lên và có trở thành 1 điểm mà có
thể thu đợc từ tính toán các tham số. (Mục 1.8.2)
17. Điều gì xảy ra với độ lệch chuẩn và độ lệch chuẩn của giá trị trung bình khi số
lợng dữ liệu tăng lên?
Độ lệch chuẩn của mẫu (s) tiến đến độ lệch chuẩn phân phối ( ). Độ lệch chuẩn
của giá trị trung bình tiến đến 0. (Mục 2.4.2, 2.4.6)
18. Một lần tôi xác định giá trị trung bình và độ lệch chuẩn, tôi có thể biểu diễn kết
quả dới dạng x s đợc không?
Không có thể biểu diễn giới hạn của khoảng tin cậy với mức độ (ví dụ 95%).
Nếu bạn muốn biểu diễn giá trị trung bình với độ lệch chuẩn thì có thể viết x (s =
độ lệch chuẩn, n = số dữ liệu). (Mục 2.5)
19. Sau đó có bao nhiêu phép đo mà tôi có thể giả thiết s = ?
Khoảng 30 phép đo có sai số gữa s và là khoảng 4%. (Mục 2.5.3)
20. Khi nào thì tôi nên sử dụng ớc lợng thô?
Nếu bạn quan tâm đến các số liệu không phân phối chuẩn hoặc có giá trị vô cùng
lớn vợt ra ngoài, coi ớc lợng thô nh là điểm chính giữa của dãy giá trị mà bạn có
thể sử dụng. (Mục 2.6)
21. Phân phối chuẩn là đối xứng ở giá trị trung bình. Khi chúng ta nói về tỷ lệ phân
phối chúng ta có thể chọn một khu vực cho đến vô hạn còn lại các khu vực khác ở
một điểm cuối cùng, hoặc một khu vực khác nằm ngoài giá trị trung bình. (Mục
2.5.4)
22. Làm thế nào để tôi có thể kiểm tra xem dữ liệu của tôi có thuộc phân phối
chuẩn hay không?
Nếu bạn có đủ dữ liệu bạn có thể vẽ đồ thị và xác định nếu nó xuất hiện để tạo đồ
thị hợp lí. Một đồ thị cũng có công dụng kiểm tra sự chuẩn và có thể sử dụng với

một ít số liệu. (Mục 1.7.2, 3.4)
23. Nếu dữ liệu của tôi không phải là phân phối chuẩn thì làm thế nào tôi xác định
đợc giá trị trung bình và độ không chắc chắn?
Xem FAQ 20.
24. Khi nào thực hiện t-test mức độ xác suất nào tôi có thể đặt giả thiết không để
loại bỏ?
Nó phụ thuộc tất cả vào các dữ liệu đã đợc sử dụng. Thông thờng 95% hoặc 99% đợc sử dụng coi nh có thể có sai số loại I và loại II. (Mục 3.2)
25. How do I determine whether a datum is an outlier?
Perform a Grubbss test. (Section 3.5)
12


26. Có bao nhiêu dữ liệu mà tôi có thể sử dụng kiểm tra Grubbs đợc đa ra trong chơng 3?
Chỉ có 1. Và bạn có thể hỏi chính mình liệu dữ liệu đó có phải là phân phối chuẩn
hay không. (Mục 3.4, 3.5)
27. Khi nào tôi có thể vứt bỏ các dữ liệu?
Không bao giờ. Bạn có thể quyết định không sử dụng 1 giá trị trong tính toán giá trị
trung bình và độ lệch chuẩn sau khi thực hiện kiểm tra Grubbs đối với dữ liệu bên
ngoài. (Mục 3.5)
28. Kiểm tra một điều kiện và kiểm tra 2 điều kiện là gì?
Kiểm tra ý nghĩa loại bỏ giả thiết không khi xác suất của thống kê thấp dới giá trị
đa ra (ví dụ < 0, 05 hoặc 95% kiểm tra). Một điều kiện kiểm tra có tất cả xác suất
này tại điểm cuối của phân phối. (Mục 3.6)
30. là gì?
là xác xuất, nằm giữa 0 và 1 của một phép kiểm tra thống kê thực tế đa ra giả
thiết kiểm tra, tại giả thiết bị loại bỏ. Ví dụ, = 0, 05 có nghĩa là chúng ta loại bỏ giả
thiết khi xác suất tìm thấy giá trị đa ra trong giả thiết thấp hơn 5% và cũng đợc gọi
là kiểm tra 95%. (Mục 2.5.2, 3.6)
32. Làm thế nào để tôi xác định đợc phơng pháp phân tích nào tốt hơn?
Tốt hơn là câu hỏi có liên quan đến kết quả của phép đo sẽ đợc sử dụng. Tuy nhiên

xác định độ chính xác của mỗi phơng pháp và sai số hệ thống là quan trọng. (Mục
3.6, 3.7)
33. Khi nào tôi có thể thu đợc giá trị trung bình t-test và khi nào so sánh đợc t-test?
Khi mà có một số phép phân tích lặp đi lặp lại trên cùng một nguyên liệu và xác
định đợc giá trị trung bình t-test. Khi mà có nhiều nguyên liệu khác nhau cùng trên
một phép đo đơn giản thì sẽ thu đợc sự so sánh t-test. (Mục 3.8, 3.9)
34. Tôi có thể kiểm tra độ dốc mà không cần biết giá trị của mẫu không?
Không, nếu bạn chỉ thực hiện phơng pháp phân tích. (Mục 3.6)
35. Cái gì khác nhau giữa độ dốc và sự phục hồi?
Đó đều là sai số hệ thống. Độ dốc thờng cho là sai số hệ thống trong một công cụ
và khác nhau tuyệt đối. Sự phục hồi là một phần của phân tích mà đợc biểu diễn với
công cụ đo đạc. Nó thờng < 100% bởi vì sự hao hụt trong suốt quá trình tiến hành
kiểm tra vật liệu trớc khi đo đạc. Cả hai đều có thể xác định và chính xác. (Mục
1.7, 3.6)
36. Làm thế nào để tránh mắc phải sai số loại I (loại bỏ H0 khi nó đúng)?
Giảm . Đó là, kiểm tra ở mức độ xác suất cao hơn (95, 99, 99.9%...). (Mục 3.3)
37. Làm thế nào để loại bỏ sai số loại II (chấp nhận H0 khi nó sai)?
Tăng . Đó là kiểm tra ở mức độ xác suất thấp hơn (95, 90, 80). (Mục 3.3)
38. Làm thế nào để chọn đợc xác suất hợp lí để sử dụng?
Xét mối liên hệ giữa sai số loại I và sai số loại II. (Mục 3.3)
39. Làm thế nào để biết đợc hai phép phân tích có cho kết quả nh nhau hay không?
Kiểm tra kết quả các giá trị trung bình của mỗi phép phân tích bằng t-test. (Mục
3.8)
40. Khi nào nên sử dụng ANOVA và khi nào sử dụng t-test?
Sử dụng ANOVA nếu bạn muốn biết ý nghĩa sự khác nhau trong số các nhân tố
ảnh hởng. Dữ liệu ANOVA cần phải có phân phối chuẩn. Sử dụng t-test để kiểm tra
từng cặp. Dữ liệu cũng phân phối chuẩn. (Mục 3.8, 4.2)
13



41. Khi đánh giá một phơng pháp phân tích làm thế nào để xác định đợc nguyên
nhân biến thiên và sự thay đổi trong cách thực hiện phơng pháp?
Thực hiện ANOVA mà cho phép bạn có thể thấy phơng sai của dữ liệu, sử dụng giá
trị p từ bảng kết quả ANOVA để xác định nếu có ảnh hởng của 1 nhân tố. (Mục
4.2)
42. Có thể thực hiện ANOVA với sự lặp lại khác nhau của trờng hợp 1 nhân tố
trong Excel không?
Có, với một nhân tốt đơn giản ANOVA. Không với 2 nhân tốt ANOVA (Mục 4.6,
4.9)
43. Nhân tố là gì và trờng hợp của nhân tố là gì?
Nhân tố là bất cứ cái gì chúng ta cũng kiểm tra trong ANOVA, ví dụ một phép
phân tích, mẫu đặt trong silo, một loại giống của phân tích. Trờng hợp của nhân tố
là các mẫu thực của nó mà nhân tố chọn để nghiên cứu, ví dụ phơng pháp quang
phổ và phơng pháp điện hóa để đo đỉnh, giữa và đáy của silo. (Mục 4.3)
44. Nếu tôi tìm thấy ý nghĩa sự khác nhau giữa các nhân tố thì làm thế nào để xác
định đợc nhân tố hoặc các nhân tố đó có độ tin cậy?
Thực hiện phép tính với ý nghĩa nhỏ nhất. (Mục 4.5)
45. Tại sao lại phải giữ sai số khi thực hiện 2 cách ANOVA với bản sao trong
Excel?
Bạn nên chọn tất cả các dữ liệu cột và hàng. Chắc chắn bạn sẽ thu đợc kết quả nh
nhau đối với mỗi trờng hợp của nhân tố. (Mục 4.9)
46. Tại sao lại phải quan tâm đến việc biểu diễn đồ thị trong khi có thể sử dụng phơng trình hồi qui một cách đơn giản?
Đồ thị có thể dễ dàng quan sát kiểm tra độ cong mà vẫn có thể đa ra r2 cao hoặc sy/x
thấp. Và cũng luôn luôn vẽ đồ thị với phần còn lại. (Mục 5.2, 5.3.2)
47. Có thể thu đợc bao nhiêu điểm trong thang chia độ?
ít nhất là 6. (Mục 5.6)
48. Trong biểu thức thang chia độ đôi khi các kí hiệu X và Y là chữ viết hoa và đôi
khi là dạng chữ thờng (x và y). Khi nào sử dụng chữ viết hoa và khi nào sử dụng
chữ viết thờng?
Kí hiệu chữ viết hoa sử dụng cho số lợng, ví dụ Y có thể là dòng ở điện cực

glucose. Kí hiệu thờng để chỉ số liệu thực, ví dụ y = 10 nA. Ví dục một trạng thái
chính xác của t-test là p(T > t) = 0,05 thì đợc đọc là xác suất tìm thấy của giá trị T
trong chuẩn Student bằng hoặc lớn hơn giá trị t tính toán từ dữ liệu là 0,05.
49. Trong biểu thức y = ax + b cái gì là đơn vị của a và b?
A có cùng thứ nguyên với y/x trong khi b có thứ nguyên của x. (Mục 5.3.1)
50. Khi nào sử dụng mũ (^) trên kí hiệu và khi nào dùng gạch ngang (-)
Mũ để chỉ số lợng ớc lợng đợc. Ví dụ, trong phân tích cái này có thể là kết quả thu
đợc từ chơng trình kiểm tra kích cỡ. Dấu gạch biểu diễn giá trị trung bình ví dụ x
(Mục 5.3, 2.4.1)
51. Tôi sử dụng LINEST trong Excel, nhng chỉ thu đợc một giá trị. Bn phải ấn
đồng thời Control-Shift Enter. Nếu bạn bất ngờ ấn Enter và thoát ra khỏi dãy số
thì không lâu để lựa chọn, để đơn giản lựa chọn lại dãy số và vị trí của con trỏ trong
dòng lặp lại ấn Ctrl-Shift-Enter. Để chắc chắn thu đợc điểm nổi bật nhất tạo 1 bảng
5 dòng 2 cột và 4 tham số. (Mục 5.4)

14


52. Tôi có dữ liệu chơng trình xác định nhng làm thế nào để xác định đợc độ không
chắc chắn trong sự đánh giá của tôi?
Xem biểu thức 5.15 và các giá trị liên quan từ LINEST. (Xem mục 5.3.1, 5.4.3)
53. Chức năng Excel nào tốt nhất để đánh giá phơng trình hồi qui và độ không chắc
chắn liên quan?
Chúng ta nên xem lại LINEST. (Xem mục 5.4.3)
54. Khi cố gắng để xác định giới hạn, làm thế nào nếu không thu đợc giới hạn phát
hiện của phép đo?
Thực hiện một loạt các phép đo gần với giới hạn phát hiện mong đợi và sử dụng phơng pháp xác định kích cỡ (công thức 5.28). (Mục 5.8)
55. Nên sử dụng r hay r2 để chỉ giá trị gần nhất của phép xác định kích cỡ?
(Thông thờng: Mọi ngời thờng biết sử dụng R2 nh là sự đánh giá chất lợng của biểu
thức xác định kích cỡ. Điều này có đúng không?)

Không phải. Điều này nói lên mối liện hệ giữa y và x, nhng trong phân tích hóa
học, bạn thờng rất ít khi kiểm tra kiểu đờng. Sai số chuẩn của phơng trình hồi qui là
một con số để ghi lại hoặc tính toán theo khoảng tin cậy là 95% bằng các tham số
và đánh giá nồng độ dung dịch kiểm tra. Biểu diễn đồ thị các nồng độ còn lại.
(Xem mục 5.3.2, 5.5)

Chơng 1. Giới thiệu
1.1 Chơng này sẽ giúp bạn điều gì?
- Hiểu đợc các phơng pháp đo lờng trong hóa học đợc đa ra với mục đích gì, thờng
trả lời một câu hỏi không liên quan gì đến hóa.
15


- Định nghĩa các phép đo lờng và mối liên hệ giữa các điều kiện.
- Hiểu đợc các loại sai số và làm biết cách đánh giá chúng.
- Điều gì làm cho các phép đo phân tích hợp lý.
1.2 Sự đo lờng
Hóa học, cũng nh các môn khoa học khác, đều dựa vào kết quả thực nghiệm, cho
đến nay các cuộc thăm dò ý kiến của các sinh viên và đồng nghiệp đều cho ra rằng
rất ít ngời có thể chắc chắn đa ra sự giải thích hợp lý cho các phép đo. Đọc trong
các sách giáo khoa về phần dữ liệu phân tích đợc đánh giá mà phần lớn các nghiên
cứu cơ bản hiếm khi đợc xác định. Có rất nhiều ngời chuyên về khoa học thực
nghiệm đo lờng: nh là một lĩnh vực nghiên cứu gọi là hệ thống đo lờng. Định nghĩa
sử dụng trong cuốn sách này về đo lờng là một hệ thống đợc tổng hợp có giá trị và
số lợng lớn. Tuy nhiên chúng ta sẽ quay trở lại vấn đề này sau, nhng trớc tiên
1.3 Tại sao lại phải đo đạc, phân tích?
Năm 1998, thế giới đã sử dụng khoảng 3,1 tỉ USD trong các phân tích hóa học để
chẩn đoán y học, hầu hết các thực nghiệm này đều đợc thực hiện ở Mỹ và châu Âu.
Những phân tích này đợc thực hiện để tìm ra một số bệnh của các bệnh nhân. Một
quá trình đánh giá phân tích hóa học bao gồm các giai đoạn sau: (1) tình trạng của

thực tế của căn bệnh; (2) quyết định phơng pháp phân tích hóa học để có thể giúp
giải quyết đợc căn bệnh đó; (3) tìm ra phơng pháp có thể thực hiện phân tích hóa
học đó một cách thích hợp; (4) thực hiện phép phân tich đo đạc đó và thu hoặch số
liệu (những kết quả có giá trị và không chắc chắn; bao gồm cả các số liệu gần
đúng); và (5) cuối cùng đa ra hớng chữa trị căn bệnh đó dựa trên kết quả phân tích
thực nghiệm. Vấn đề quan trọng là xác định đợc mối liên hệ giữa tình trạng thực tế
của căn bệnh và phơng pháp phân tích đề xuất. Phơng pháp phân tích hóa học có
thể chỉ đa ra một phần cách chữa trị, và câu trả lời cũng có thể không rõ ràng lắm.
Trong các vụ án, có sự nghi ngờ mẫu DNA thu đợc là của tội phạm, mà cha thực
hiện phân tích liên tục nhiều lần thì không thể kết luận đó là kẻ phạm tội. Trong
chăm sóc sức khỏe, một phép đo hàm lợng cholesterol giúp bác sĩ có thể chẩn đoán
bênh nhân bị bệnh tim mạch, nhng một một phép phân đo tỉ hàm lợng các lipid tỉ
trọng cao và thấp cùng với các chất béo khác thì sẽ có tác dụng hơn.
1.4 Định nghĩa
Định nghĩa của chúng tôi về phép đo đạc phân tích nh là một hệ thống đợc tổng
hợp có giá trị và số lợng lớn bắt nguồn từ hệ thống đo lờng. Để thực sự hiểu đợc
khái niệm này chúng ra cần phải biết cái gì có số lợng lớn. Số lợng lớn đợc định
nghĩa nh là thuộc tính vốn có của hiện tợng, sự vật chất về mặt qui mô và có thể
xác định đợc số lợng. Suy nghĩ về các việc này bạn có thể hiểu vì sao các khái
niệm đó phù hợp với định nghĩa này. Là các nhà hóa học chúng ta thờng xuyên đo
đạc nồng độ của các hợp chất đặc biệt. Chất thuộc loại mà chúng ta muốn xác định
nồng độ cần phải có trạng thái. Rõ ràng có nhiều cách đo đạc (ví dụ xác định nồng
độ NaCl trong nớc biển) nhng có thể giảm khi xuất hiện sự đồng phân hóa hoặc sự
hình thành các loài. Xác định giá trị của 1 hiện tợng có thể phải dựa vào các hoạt
động nh là đo tốc độ biến đổi của một phản ứng, hoặc năng lợng bị mất đi. Cuối
cùng (trớc khi chúng ta có thể vợt qua các trở ngại của các phép đo) chúng ta cần
biết giá trị là gì? Giá trị là độ lớn của một lợng xác định trong một phép đo lờng
và đợc biểu hiện bằng số
1.5 Thang chia độ và đơn vị
16



Chúng ta thực hiện các phép đo đạc và kết quả các phép đo đạc đợc thể hiện bằng 1
con số và thứ nguyên của nó. Làm thế nào để chúng ta có thể thu đợc số liệu quan
trọng của thực nghiệm, nhng nó thờng bao gồm việc so sánh giữa hệ thống các số
liệu cha biết với hệ thống các số liệu đã biết, trong trờng hợp khi chúng ra đo chiều
dài của một vật nào đó bằng thớc kẻ thích hợp có chia đơn vị độ dài, hoặc không
chính xác đầu tiên chúng ta xác định kích thớc một dụng cụ và sau đó đo mẫu để
phân tích. Các phép so sánh gián tiếp thờng đợc dùng trong hóa học hiện đại. Đỉnh
sắc khí phổ của vật liệu cha biết nồng độ có thể so sánh với các nguyên liệu đã biết
nồng độ thông qua đồ thị ta sẽ thu đợc các giá trị cha biết. Trong trờng hợp đo nồng
độ glucose trong máu thì dụng cụ thờng dùng là 1 dụng cụ có dòng điện tơng ứng
với nồng độ của glucose. Tỉ lệ thích hợp không đổi để kiểm tra sử dụng đối với
bệnh nhân ở nhà đợc thiết lập ở nhà máy để có thể đọc đợc nồng độ glucose một
cách chính xác. Thứ nguyên của phép đo đợc xác định cẩn thận bằng dữ kiện về
mẫu đo và số lợng. Phép đo nồng độ trong mẫu sắc ký khí là sự xác định chiều cao
pic của mẫu cộng với sự xác định kích cỡ bằng phép tính toán gần đúng. Vấn đề
quan trọng là phải xác định đợc các dụng cụ có thể đem lại cho chúng ta câu trả lời
chính xác về đơn vị đo, ví dụ nh một chiếc máy đo pH, hoạt động nhờ dòng điện
mà có thể so sánh các tín hiệu điện (đo điện thế với các điện cực bằng thủy tinh) sử
dụng các dụng cụ chuẩn đã biết (thang chia độ là dung dịch đệm) với các mẫu cha
biết. ở chơng 5 chúng ta sẽ chỉ ra cách làm thế nào để từ các thang chia độ đó có
thể thiết lập và sử dụng để tìm ra giá trị của các phép đo chuẩn.
1.6 Tại sao chúng ta cần phải xử lý các dữ liệu phân tích?
Do các dữ liệu phân tích trong một vài phép đo thờng không chắc chắn. Vấn đề ở
chỗ chúng ta phải giải thích đợc các kết quả không chắc chắn đó, và ngay lập tức
xuất hiện câu hỏi Làm thế nào để xác thực đợc kết quả đó?. Một cách không
khoa học đợc sử dụng để chấp nhận các phép đo lấy giá trị mệnh giá. Rất ít khi
chúng ta thắc mắc về khối lợng của đậu nớng hoặc khoai tây đợc ghi trên bao bì
sản phẩm trong các siêu thị. Trong các vụ kiện, các lái xe thờng chấp nhận bằng

chứng do cảnh sát đa ra do họ đi quá tốc độ hoặc do nồng độ cồn cao quá mức cho
phép. Tuy nhiên, khi bị thu bằng lái hoặc thậm chí bị tạm giam thì có một số bị cáo
đã cố gắng kháng án, phản biện lại các kết quả đo đạc đó. Trong buôn bán, khi có
sự sai khác rất nhỏ giữa các phép đo, chẳng hạn nh là hàm lợng protein trong lúa
mì, có thể dẫn đến sự thiệt hại hàng nghìn USD đối với ngời mua hoặc ngời bán,
các phép đo này cần phải thực hiện cẩn thận để tránh sự tranh cãi giữa hai bên. Khi
vấn đề này xảy ra, chúng ra sẽ nhận thức rõ đợc tầm quan trọng của các phép đo
chính xác. Một vài phép đo hóa học có giá trị đối với các nhà hóa học phân tích
hiện đại cần phải đa ra thông tin chính xác về kết quả. Trong thực tế, một vài phép
phân tích không có thông tin thích hợp về độ tin cậy thì không đợc sử dụng. Các
nhà hóa học phân tích hiện đại có thể không hiểu làm thế nào mà nhà hóa học Thụy
Điển Berzelius có thể nhận thức những điều ông đã viết ra, vào thế kỉ 19, nó liên
quan đến nhiệm vụ của phân tích không thể thu đợc các kết quả chính xác mà
tôi cho rằng ngẫu nhiên có thể thu đợc nhng có thể xác định đợc giá trị gần
đúng trong phân tích hóa học. Không có một thiết bị nano hiện đại nào, máy
quang phổ hoặc các dụng cụ đắt tiền cũng không thể cho các giá trị chính xác tuyệt
đối. Chúng ta có thể đánh giá thấp các giá trị không chắc chắn kết hợp với các phép

17


đo. Chúng ta cũng có thể ớc lợng giá trị không chắc chắn, nhng kết quả chính xác
tuyệt đối thì chúng ta không thể thu đợc.
Mục đích của cuốn sách này là trang bị cho bạn các công cụ để giúp bạn đạt đợc
kết quả có giá trị cao nhất, đó là khi bạn, một nhà hóa học phân tích, đa ra kết quả
tốt nhất có thể cùng với trạng thái chính xác nhất.
1.7 Ba kiểu sai số.
Chúng ta cùng thảo luận về khái niệm sai số và gần đúng. Trong hệ thống đo lờng, sai số đợc định nghĩa nh là kết quả của phép đo không đúng với giá trị đo
thực tế và nó không có ý nghĩa. Sai số trong hóa phân tích là một giá trị cụ thể mà
có thể xác định nếu biết giá trị đúng.

?Table 1.1 Types of error
Nếu chúng ta theo dõi một thí nghiệm chúng ta sẽ luôn luôn thu đợc kết quả có sai
số. Tại sao chúng ta không thu đợc kết quả đúng? Có thể chúng ta mắc một lỗi rất
đơn giản trong phép cân, phép chia độ hoặc thậm chí là tính toán. Lặp lại thí
nghiệm đó có thể sẽ xác định tại sao lại có sự sai số đó. Kiểu sai số đầu tiên là kiểu
sai số toàn phần, thực sự không có cuốn sách hóa phân tích nào có thể giúp bạn giải
thích đợc sai số này. Bằng phơng pháp phân tích thống kê có thể xác định đợc loại
sai số này, và có thể loại bỏ các kết quả quá mức cho phép, nhng có một cách khác
chúng ta có thể tận dụng kết quả này. Nếu kết quả thống kê này là đúng, nó có thể
đợc đa vào sách ghi chú trong phòng thí nghiệm. Bạn phải chú ý, nếu không cẩn
thận mà không ghi lại hoặc xóa đi các kết quả thì có thể các kết quả khoa học sẽ
không chính xác. Hãy cẩn thận với các số liệu bị loại ra vì có thể nó nằm ở khoảng
giữa phù hợp với kết quả. Tuy nhiên, bất kì kết quả nào thuộc cũng có thể loại sai
số tổng thể này, bởi vì tính chất tự nhiên duy nhất của nó, nó không thể chỉ dẫn cho
chúng ta làm gì tiếp theo.
Tại sao chúng ta lại không lấy đợc các số liệu phân tích hoàn toàn đúng, khả năng
thứ hai là do chính phơng pháp của nó có thể không hoàn toàn chính xác. Không có
một số lần lặp nào có thể cải thiện đợc tình trạng này. Đây là kiểu sai số thứ hai,
sai số hệ thống, đó là sự sai lệch thờng trực so với kết quả đúng. Sai số hệ thống thờng đợc tính theo sự chênh lệch độ dốc của các đờng chéo, khi ứng dụng với một
dụng cụ. Một ngời mù màu có thể đánh giá nhầm điểm cuối của phép chuẩn độ, độ
chính xác của một mẫu phân tích có thể chỉ đạt khoảng 90%. Trong mỗi nguyên
nhân này, nếu các kết quả không đúng với các vấn đề, thì có thể nó luôn luôn sai,
và luôn luôn sai với cùng những thí nghiệm cụ thể. Sai số hệ thống có thể đợc ớc lợng bằng phép đo mẫu với số lợng lớn và lặp lại nhiều lần. Điểm khác biệt giữa giá
trị trung bình của các phép đo và giá trị thực của nguyên liệu là sai số hệ thống.
Chúng ta thờng mong muốn tìm đợc nguyên nhân của sai số hệ thống trong một thí
nghiệm và hiệu chỉnh chúng trong các phép đo khác. Trong phần chỉ dẫn làm thế
nào để ớc lợng đợc sai số hệ thống, nó đã chỉ ra cần phải lặp lại thí nghiệm nhiều
lần. Điều này thật sự cần thiết vì góp phần vào nguyên nhân của sai số còn có loại
sai số ngẫu nhiên. Sai số ngẫu nhiên là loại sai số thứ ba mà có thể trả lời câu hỏi
tại sao trong thực nghiệm của chúng ta lại luôn có sai số. Mặc dù với những nỗ lực

tốt nhất của bạn, có thể hiệu chỉnh các sai số hệ thống, giải quyết đợc các sai số
tổng thể, các thí nghiệm lặp lại có thể cho các kết quả khác nhau. Đôi khi kết quả
tốt hơn mong đợi, tuy nhiên đôi khi lại không tốt bằng. Rất hiếm khi thu đợc giá trị
chấp nhận đợc. Giá trị trung bình của các kết quả có thể đa ra một câu trả lời có thể
18


chấp nhận đợc. Các giá trị quá cao hoặc quá thấp có thể loại bỏ. Có rất nhiều các
nhân tố có thể góp phần tạo nên sai số ngẫu nhiên: không thể phân tích chính xác
các điều kiện, sự thay đổi bất thờng của môi trờng (nhiệt độ, áp suất), sự làm tròn
trong tính toán, bỏ qua sức cản của gió, hoặc sự rung của tay khi phân tích. Những
gì không góp phần làm sai số ngẫu nhiên thay đổi trong các điều kiện nh là sự thay
đổi của vạch chia độ trong các công cụ và sắc kí cột.
1.7.1. Ví dụ: pipet
Thực tế là tại sao chúng ta không thu đợc chính xác 10 ml khi sử dụng pipet 10 ml
để lấy.
Chúng ta sẽ tìm hiểu 3 yếu tố gây nên vấn đề này.
Có nhiều hơn, và nh một thí nghiệm để ngời đọc có thể cố gắng suy nghĩ về các
vấn đề có thể dẫn đến sai sót này với các hoạt động dờng nh rất đơn giản trong hóa
phân tích.
1. Nhà sản xuất thừa nhận rằng pipet mà bạn đang sử dụng chỉ phù hợp ở 20 0C, và
chỉ đảm bảo thể tích ở khoảng 9,98 ml đến 10,02 ml. Bạn sẽ thật là may mắn nếu
bạn đong đợc đúng 10ml bằng pipet, nhng có lẽ điều đó không thể xảy ra. Chú ý
rằng có một vài sai số trong loại này là sai số hệ thống.
2. Khi bạn dùng pipet, bạn có thực sự đong đầy chính xác tại điểm giới hạn ở các
lần là nh nhau không? Một loạt 10 thí nghiệm đong nớc cất bằng pipet và cân thì
thu đợc một dãy các giá trị từ 9,95 đến 10,04 ml. Đây chắc chắn là kiểu sai số ngẫu
nhiên.
3. Bạn có thể nhận thấy rằng trong suốt quá trình thực nghiệm nhiệt độ trong phòng
thí nghiệm luôn dao thay đổi trong khoảng từ 19,2 đến 23,10C và bạn vẫn biết rằng


Figure 1.1 Uncertainties and errors in delivering 10mL by a
pipette.
thể tích của 10 ml nớc có thể tăng 0,0021 ml khi nhiệt độ tăng
lên 10. Nếu nh các thí nghiệm xảy ra trong thời gian dài đủ để
cho phép nhiệt độ thay đổi một cách ngẫu nhiên, sau đó sự thay
đổi này sẽ bao gồm cả trong các kết quả thí nghiệm đong và cân
ở 2. Thêm vào đó, ngoại trừ giá trị trung bình trong suốt thí
nghiệm chính xác là 200C sẽ có một sai số hệ thống nảy sinh từ sự khác nhau đó.
1.7.2 Ví dụ: cuộc thi chuẩn độ - the Royal Austrialian Chemical Institute
Lấy một ví dụ về cuộc thi chuẩn độ của trờng RACI năm 1997. Trong cuộc thi
này , mỗi đội có 3 học sinh của một trờng cấp 3 có một câu hỏi về việc xác định
nồng dộ dung dịch axit axetic, sử dụng dung dịch NaOH và HCl đã biết nồng độ.
Table 1.2 The results of the 1997 RACI titration competition. The values are
independent students results for the concentration of a solution of acetic acid
(units: M). The correct answer was 0.1147 M
0.1150, 0.1152, 0.1143, 0.1144, 0.1153, 0.1138, 0.1139, 0.1150, 0.0920, 0.1556,
0.1141, 0.1219, 0.1222, 0.1143, 0.9083, 0.1134, 0.0936, 0.1155, 0.1145, 0.1177,
0.1146, 0.1158, 0.1142, 0.1148, 0.1144

19


Các thí sinh sử dụng dung dịch HCl đẻ chuẩn lại nồng độ dung dịch NaOH, dung
dịch để chuẩn độ nồng độ axit axetic. Bảng 1.2 là các kết quả của 1 thí sinh trong
mỗi đội của 25 đội đã tham gia cuộc thi này năm 1997 tại trờng đại học New South
Wales, Sydney. Mặc dù không có thí sinh nào tính chính xác, song vẫn có một vài
kết quả gần đúng và một vài câu trả lời hơi thiếu chính xác (ví dụ 0,9083M). Chúng
ta biết rằng các thí sinh không đợc cung cấp đầy đủ NaOH để chuẩn độ đợc 25ml
CH3COOH 0,9083 M, vì thế chúng ta có thể chắc chắn khẳng định rằng có sai số

toàn bộ trong tính toán hoặc ghi kết quả. Đồ thị biểu diễn kết quả tăng dần theo độ
lớn của các nhóm (hình 1.2).
Kết quả cao quá sẽ chắc chắn bị loại ra khỏi hệ thống, có thể nhìn thấy trên đồ thị
hình 1.2, nhng chúng ta sẽ chỉ ra 6 kết quả khác cũng có thể thuộc loại này bằng
các phơng pháp mà chúng ta sẽ giải thích ở chơng 3. Dữ liệu còn lại đợc xếp theo
nhóm xung quanh các câu trả lời, tính toán từ một phép phân tích giống nh ở phía
trên đối với pipet, nhng bao gồm tất cả các nguồn không chắc chắn. Ngoài 25 kết
quả, 7 kết quả bị loại bỏ vì sai số toàn phần và 7 số liệu cao hơn và 11 sô liệu thấp
hơn số liệu chính xác. Đồ thị là một biểu đồ hình 1.3 biểu diễn sự khác biệt giữa sai
số ngẫu nhiên và các giá trị vợt ra ngoài.
Hai cột biểu thị giá trị số liệu của các thí sinh có kết quả vợt quá 2,5% kết quả
chính xác. Có lẽ sẽ rất đáng ngạc nhiên, nếu ai đó thu đợc kết quả chỉ vợt quá 2%.
Đỉnh của biểu đồ là vị trí không có sai số, nhng nhìn vào sự trải dài của kết quả

Figure 1.2 Results of the 1997 RACI titration competition. Inset: results for
teams 320. The line is the accepted result (0.1147 M) and the dashed lines
are _1%.
Figure 1.3 Histogram of the 1997 RACI titration results. Each bar is the number
of students whose result fell between the number indicated and the number to
the right. Note that the 25 data points in table 1.2 represent a subset of all the
data from the RACI titration competition. The entire data set of 75 results
was used to generate this histogram.
Figure 1.4 Histogram of the 1997 RACI titration results if there had been a
systematic error.

20


không có lí do gì để nói rằng sai số hệ thống có ý nghĩa ở đây. Chúng ta sẽ nhìn
thấy sau hình dạng của đờng cong bao phủ trên đồ thị biểu diễn một cách lí tởng

hóa dải các giá trị dữ liệu. Trong một ví dụ giả thuyết, nếu đỉnh của đồ thị tại đó thì
chúng ta có thể kết luận rằng có 1 sai số hệ thống dơng trong phép đo này. Trong
giả thuyết nguyên nhân này có thể RACI đã có nó sai và nồng độ thực tế của dung
dịch axit axetic cao hơn so với họ tính toán, hoặc có thể nồng độ HCl chuẩn thấp
hơn nồng độ đa ra.
Các dữ liệu phân tích có thể biểu diễn điều gì đã xảy ra, nhng nó không thể nói cho
bạn biết tại sao nó lại xảy ra nh thế.
Tại sao chúng ta lại đa ra vấn đề phân loại các loại sai số khác nhau? Bởi vì có 1
lần chúng tôi có thể nhận ra các sai số hệ thống và chúng tôi có thể chỉnh sửa
chúng, và với sai số ngẫu nhiên chúng ta có thể xử lí bằng phơng pháp thống kê, nó
sẽ giúp chúng ta ớc lợng kết quả đúng là bao nhiêu và kết quả nào không chấp
nhận đợc.

Figure 1.5 Errors in measurement results, showing the difference between
systematic, random, and gross errors.
Hình 1.5 nói về cách biểu diễn mối liên hệ giữa giá trị đúng của phép đo và các sai
số trong kết quả của các phép đo đơn giản, và sự phân bố của sai số ngẫu nhiên.
1.7.3 Sự không chắc chắn của phép đo đạc
Sự tranh luận về các loại sai số đã nêu ra ở trên đợc biết đến nh là mục tiêu kinh
điển đối với các phép đo. Nó đã giúp ích cho các phép đo khoa học rất tốt, nhng
nó dựa trên giả định rằng kết quả của phép đo có thể đợc miêu tả bằng 1 giá trị thực
đơn giản. Trong những năm gần đây đã có sự thay đổi trong cách hiểu về sự khái
niệm giá trị đúng có thể không đúng và vì thế khái niệm của độ chính xác và
ngẫu nhiên và sai số hệ thống cũng có thể không có giá trị. Sự gần đúng không
chắc chắn đợc hiểu nh là chỉ có một phép đo không chắc chắn, tiếp theo từ các
thành phần khác nhau. Nó mô tả phạm vi của giá trị cha biết của phép đo sẽ đợc
biết sau khi đo đạc, đa ra bảng thông tin từ phép đo. Trong cuốn sách này chúng tôi
có giải thích về một số công cụ thống kê cần thiết để ớc lợng sự thiếu chắc chắn
này, và mục tiêu kinh điển là bắt đầu sử dụng quan điểm này trong phép đo đạc hóa
học.

1.8 Độ chính xác gần đúng và độ lệch tiêu chuẩn
Độ chính xác là một khái niệm mà bao gồm cả câu trả lời đúng (đôi khi biết nh là
chính xác) với sự không chắc chắn có thể chấp nhận (với độ chính xác tốt).

21


Mối liên hệ giữa độ chính xác và độ lệch chuẩn đợc biểu diễn ở hình 1.6 nơi có độ
lệch chuẩn cao đợc biểu diễn bởi các cụm điểm tập trung tại một đích và nơi có độ
chính xác cao đợc biểu diễn bằng các điểm tập trung xung quanh tâm. ở độ chính
xác cuối có nghĩa là câu trả lời đúng, nhng bây giờ nó có thể hiểu là giá trị thực
không có độ lệch chuẩn. Các trụ không trực giao với nhau nh các khái niệm này và
cũng không hoàn toàn độc lập với nhau.
1.8.1 Có phải các sinh viên RACI đã chính xác?
Có phải các phép chuẩn độ đã chính xác? Có phải họ sẽ trở thành các nhà hóa phân
tích giỏi? Ngoại trừ một vài ngời lãng phí thời gian để cố gắng thu đợc các câu trả
lời kì quặc, thực tế mọi ngời làm việc rất tốt. Họ đã đa ra câu trả lời trung bình
đúng, và mặc dù sự trải dài của các kết quả lớn hơn một chút so với có thể thu đợc
từ thực hành phân tích tốt nhất, các học sinh đã thực hành rất tốt. Nếu chúng ta
muốn biết nồng độ của axit axetic là bao nhiêu thì kết quả mà đa số sinh viên đa ra
có thể đợc coi là chính xác.
1.8.2 Làm thế nào để ớc lợng đợc độ lệch chuẩn
Chúng ta đã thảo luận về sự không chắc chắn của kết quả các phép đo với các giá
trị kéo dài. Trong cuộc thi ở RACI nó xuất hiện mà các thực nghiệm của các sinh
viên đã mắc sai số hệ thống tìm thấy các kết quả vợt quá 2% giá trị trung bình.
Nhiều các giá trị đạt đến gần giá trị trung bình hơn, và các kết quả đợc phân bố
đồng đều quanh giá trị trung bình, với một nửa số giá trị cao hơn giá trị trung bình
và một nửa giá trị thấp hơn giá trị trung bình. Nhiều kết quả phân tích cũng chỉ ra
mẫu này khi lặp lại. Nó có thể biểu diễn các dữ liệu phân phối ngẫu nhiên, giá trị
trung bình có thể đợc biểu diễn bằng phân phối chuẩn hoặc Gass:

f(x / à, ) =

1
2

exp[

(x à)2
22

]

Chú ý rằng pdf là một hàm số của x các giá trị đợc có thể thu đợc từ dữ liệu.
Một hàm số xác suất đợc xác định trong khu vực của nó, các kết quả có thể tìm
thấy giữa 2 giá trị của x (x1 và x2) là vùn mà hàm số giữa x1 và x2. Hình dạng của
hàm số giống đồ thị nh ở hình 1.3.
Hàm số đợc mô tả bằng 2 tham số: à là giá trị trung bình của các dữ liệu đợc xác
định bằng hàm số và 2 . Hàm số đạt giá trị cực đại khi x = à và lớn hơn giá trị của
, nhiều hơn sự trải dài các giá trị của hàm số. Nếu dữ liệu là kết quả các thí
nghiệm lặp lại của cùng 1 mẫu, thì sau đó là độ lệch tiêu chuẩn của các phép
phân tích. Biểu thức 1.1 là một kết quả thực tế không thể xảy ra, nhng nó có liên
quan đến nhau. Hàm f nhận giá trị nguyên trong khoảng giới hạn x = a đến x = b.
Từ đồ thị hình 1.3 thiết lập đợc biểu thức 1.1 với à = 0,069% và = 0,84% (chú ý
rằng chúng ta đang xác định sự phân bố của sai số trong kết quả của mỗi phép
chuẩn độ). Căn bậc hai của phơng sai đợc gọi là độ lệch chuẩn. Mặc dù kiến thức
thu đợc từ biểu thức 1.1 có thể không quá nhiều đối với một nhà hóa học, nhng nó
có ứng dụng ở một số tính chất khác. Nó tạo ra một đờng cong biểu diễn phân phối
thờng từ à đến à + là 68% của nó từ đến + . Nếu độ rộng là 2 thì độ
bao phủ là 95% còn nếu là 3 thì là 99,7%. Hình 1.7 biểu diễn giới hạn của tỷ lệ
trong phân phối thờng.


22


Figure 1.7 Probability distribution function (pdf) of the normal distribution with
à = 0 and = 1 . z is the number of standard deviations from the mean. The
ranges shown contain the percentages of the distribution given.
Sự trùng hợp ngẫu nhiên của các độ lệch chuẩn gần phân phối ở 95%, có lẽ phổ
biến ở khoảng tin cậy là 95%. Lu ý rằng phạm vi dới đờng cong, trên thực tế
khoảng biến thiên 2 khoảng bao gồm khoảng 95% diện tích và cũng có nghĩa là
xác suất tìm thấy 1 giá trị ở giữa khoảng 2 là xấp xỉ 95%. Hãy thử tởng tợng nếu
cuộc thi ở RACI đợc mở rộng ra đối với tất cả học sinh trên thế giới, những ngời
đang học hóa, và giá trị trung bình và độ lệch chuẩn đã đợc báo cáo ở trên. Sau đó
chúng tôi có thể nói rằng nếu chúng tôi chọn ngẫu nhiên 100 học sinh, kiểm tra
chắc chắn để không ai trong số họ mắc sai số tổng thể, 95 ngời trong số họ có thể
mong đợi thu đợc kết quả nằm trong khoảng à 2 (nằm giữa 0,069 0,84.2 =
-1,61% nồng độ đề bài đã cho và 0,069 + 0,84.2 = 1,75% nồng độ đề bài đã cho).
Điều này có thể rất hữu dụng. Nếu giá trị trung bình và độ lệch chuẩn đã biết, và sự
phân phối là phân phối chuẩn, tiếp đó chúng ta có thể nói rằng có rất nhiều kết quả
giống nhau mà không phải làm những thí nghiệm khác. Chúng ta có thể sử dụng
kiến thức về phân phối để xác định thí sinh nào đã thực hành tốt, thí sinh nào thực
hành không tốt, và các kết quả của họ là đúng với thực nghiệm phù hợp với sự phân
phối kết quả. Một thí sinh có thể sai số quá 5% thì có thể chỉ là ngẫu nhiên 1 : 10 9.
Nó có thể là chúng ta tin rằng anh ấy hoặc cô ấy chỉ quan tâm đến sai số toàn bộ
hơn là cái gì đã xảy ra với các thành viên khác của phân phối chuẩn.
Chúng ta sẽ xem xét ở chơng tiếp theo về à và và các số liệu thống kê này
không phải lúc nào cũng xuất hiện, và cũng cha chắc giống nhau nh giá trị trung
bình và độ lệch chuẩn của các dữ liệu ít.
1.9 ý nghĩa của các hình vẽ
Đây là cách trình bày kết quả mà có thể mô tả độ chính xác của kết quả. Các hình

vẽ có thể đa ra nhiều hơn bao hàm cả độ chính xác. ý nghĩa của các hình vẽ là biểu
thị các thông tin một cách hữu dụng. Không thể đo chính xác chiều dài của một cái
bể bơi đến từng milimet.
1.9.1 Xác định ý nghĩa của các hình vẽ minh họa
Nếu không chắc chắn thì số liệu của các hình vẽ đợc xác định chính xác nhất bằng
cách viết kết quả bằng dạng lũy thừa của 10 và các số ả Rập.
Ví dụ 1.1
Có bao nhiêu hình vẽ miêu tả kết quả các phép đo dới đây?
1. Nồng độ của Cu2+ trong nớc máy là 0,00000572M
2. Nồng độ của glucose trong máu là 5,0 mM
23


3. Khối lợng của ammonium nitrate là 5,2 tấn
Dung dịch
1. Rõ ràng nồng độ của Cu2+ cũng có thể biểu diễn dới dạng lũy thừa của 10, từ
0,00000572M thành 5,72.10-6M. Vì thế có 3 ý nghĩa của các con số trên hình
vẽ, 1 con số trớc dấu phảy và 2 con số sau dấu phẩy.
2. Nồng độ của glucose trong máu là 5,0 mM có thể viết thành 5,0.10 -3M và vì
thế chỉ có 2 số có nghĩa.
3. 5,20 tấn ammonium nitrate bằng 5200 kg. Biểu diễn theo kí hiệu thì khối lợng là 5,20.103kg và có 3 số có ý nghĩa.
Bình luận
1. Trong dung dịch Cu2+ 0,00000572M các chữ số 0 ở trớc chữ số 5 không thể tính
nh là ý nghĩa của hình vẽ bởi vì các chữ số 0 chỉ đợc dùng để xác định số thập
phân. Nếu điều này không phải là nguyên nhân, rất đơn giản chỉ cần thay đổi đơn
vị là chúng ta có thể biến đổi đợc ý nghĩa của hình vẽ.
2. Mẫu nồng độ glucose trong máu số 0 đợc coi nh là nó đợc liệt kê trong nguồn
gốc của giá trị, nó gợi ý cho chúng ta biết nồng độ glucose là 5,0 chứ không phải là
5,1 hoặc 4,9. Tuy nhiên chúng ta không thể biết 5,0 có thực sự là 5,01 hay một giá
trị nào đó nằm giữa 4,95 và 5,04?

3. Chú ý với khối lợng của ammonium nitrate là 5200 kg, chúng ta không có ý kiến
gì về của 2 chữ số 0 là có ý nghĩa hoặc không và vì thế chúng ta có thể giả thiết
rằng không có ý nghĩa và chúng ta có thể rút ra kết luận rằng chỉ có 2 ý nghĩa đó.
Biểu thức của khối lợng là 5,20 tấn, tuy nhiên, chữ số 0 đầu tiên có ý nghĩa nh là
bao gồm các kí hiệu toán học và thứ 2 là không có ý nghĩa. Công dụng của đơn vị
với tiền tố nh là m hoặc à là một cách áp dụng của công thức toán học.
1.9.2 Có bao nhiêu hình vẽ có ý nghĩa?
Đối với một phép đo đợc thực hiện bởi công cụ hiện đại thì các hình vẽ thờng đợc
lấy ra từ máy tính và có thể đợc sử dụng nh là mẫu chính xác với ý nghĩa thực sự.
Kết quả chỉ đợc viết ra khi con số có thể làm tròn đến con số gần đúng của ý nghĩa
hình học. Hãy dùng máy tính trong tất cả các phép tính toán và loại bỏ đi một vài
chỉ số liên quan về ý nghĩa hình học đến khi thu đợc các kết quả đạt yêu cầu.
Để xác định đợc con số chính xác, cần thiết phải biết về sự không chắc chắn của
phép đo đạc. Điều này có thể thu đợc từ kiến thức về phân tích, kinh nghiệm, hoặc
sự phán đoán thông thờng, hoặc có thể xác định từ độ lệch chuẩn của các thí
nghiệm đợc lặp lại. Ví dụ, đùng thớc kẻ 30 cm, chia độ đến mm để đo chiều dài 10
cm sẽ chấp nhận sai số gần 1mm hoặc nửa mm. Nếu độ lệch chuẩn của kết quả đã
biết hoặc nếu khoảng tin cậy là 95% thì đây là một chỉ dẫn cho con số có nghĩa.
- Viết độ lệch chuẩn hoặc không chắc chắn dới 2 dạng khác nhau.
- Sau đó viết kết quả dới cùng độ lớn. Vì thế, nếu nồng độ của CH 3COOH
trong phép chuẩn độ đợc xác định là 0,1146 M với khoảng tin cậy 95% là
0,0096 M thì chúng ta có thể xác định giá trị của nồng độ CH 3COOH là
0,1146 0,0096. Tuy nhiên nếu nồng độ không chắc chắn là 0,011 M thì có
thể biểu diễn là 0,115 0,011 (khoảng tin cậy là 95%). Trong các ví dụ đợc
đa ra ở cuốn sách này chúng tôi sẽ đa ra những câu trả lời rõ ràng nhất về ý
nghĩa của các hình vẽ đợc xác định bằng qui luật này.
1.10 Mục đích

24



Cuối cùng thì các kết quả xác định bằng hóa phân tích cần phải đủ chính xác và
phù hợp với tính chất sử dụng của nó. Khái niệm fit for purpose tổng kết những
gì cần thiết. Cần nhớ rằng không ai muốn phân tích hóa học vì chính mục đích của
nó. Họ muốn biết học có thể ăn thức ăn gì, uống nớc gì và tìm kiếm gì trong 1 mỏ
vàng. Chất lợng của hóa phân tích có thể trả lời các câu hỏi này. Một mẩu giấy quì
có thể kiểm tra pH rất tốt nếu chênh nhau 2 đơn vị pH, nhng nếu muốn xác định
chính xác dung dịch là axit, thì giấy quì có thể hoàn toàn phù hợp, và sử dụng máy
đo pH cẩn thận.
Phòng thí nghiệm hóa học vơng quốc Anh đã đa ra 6 nguyên tắc cơ bản về sự hợp
lý của các phép phân tích:
- Làm việc để đáp ứng nhu cầu của khách hàng.
- Sử dụng các phơng pháp và công cụ hợp lí.
- Sử dụng các điều kiện làm việc nhóm.
- Tham gia các hoạt động đánh giá độc lập về chuyên môn.
- Đảm bảo có thể so sánh với các phép đo ở các phòng thí nghiệm khác.
- Sử dụng tốt các hệ thống điều khiển và chất lợng thực hành.
Các phơng pháp phân tích dữ liệu đợc miêu tả trong cuốn sách này sẽ đợc thực hiện
đầy đủ các nguyên tắc.

CHNG II.
25


×