Tải bản đầy đủ (.docx) (157 trang)

Ứng dụng tin học trong công nghệ hóa học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (8.58 MB, 157 trang )

Học viện kỹ thuật quân sự

BàI GIảNG

tin học ứng dụng
TRONG công nghệ HóA HọC

Hà nội - 2017

1


Môc lôc
Chương 1....................................................................................................5
PHÂN TÍCH VÀ XỬ LÝ SỐ LIỆU THỰC NGHIỆM.........................................5
1.1. CÁC ĐẶC TRƯNG THỐNG KÊ CỦA TẬP SỐ LIỆU ĐO...............................................5
1.1.1. Các tham số đặc trưng về sự tập trung của tập số liệu...................................................5
1.1.2. Các tham số đặc trưng về sự phân tán của tập số liệu....................................................7
1.1.3. Các đặc trưng phân phối thống kê của tập số liệu..........................................................9
1.2. ĐÁNH GIÁ TẬP SÓ LIỆU KỂT QUẢ ĐO......................................................................14
1.2.1. Sai số đo....................................................................................................................14
1.2.2. Độ chính xác của tập số liệu kết quả đo...................................................................15
1.2.3. Độ sai biệt của tập số liệu kết quả đo........................................................................15
1.2.4. Sai số tối đa cho phép...............................................................................................15
1.2.5. Khoảng chính xác tin cậy...........................................................................................16
1.2.6. Khoảng giới hạn tin cậy của một tập số liệu kết quả đo................................................16
1.3. SO SÁNH CẶP THAM SỐ ĐẶC TRƯNG CỦA HAI TẬP SỐ LIỆU KẾT QUẢ ĐO......18
1.3.1. So sánh 2 trung bình với phương sai đã biết hay mẫu lớn (N > 30)..............................18
1.3.2. So sánh 2 trung bình với dữ liệu từng cặp...........................................20
1.3.3. So sánh trung bình với phương sai bằng nhau.............................................................21
1.3.4. So sánh 2 trung bình với phương sai khác nhau................................23


1.3.5. So sánh 2 phương sai....................................................................................................24
1.4. BÀI TOÁN PHÂN TÍCH PHƯƠNG SAI (ANOVA).......................................................26
1.4.1. Phân tích phương sai 1 nhân tố................................................................26
1.4.2. Phân tích phương sai 2 nhân tố................................................................29
1.4.3. Phân tích phương sai 2 nhân tố có lặp..........................................................................31
1.5. PHÂN TÍCH TƯƠNG QUAN, HỒI QUY.......................................................................35
1.5.1. Phân tích tương quan...................................................................................................35
1.5.2. Phân tích hồi quy.........................................................................................................36
1.6. TÌM HÀM HỒI QUY.....................................................................................................43
1.6.1. Sử dụng các hàm SLOPE, INTERCEPT và RSQ.........................................................43
1.6.2. Sử dụng Trendline........................................................................................................44
1.6.3. Kết hợp hàm INDEX và LINEST................................................................................45
1.6.4. Sử dụng hàm LINEST.................................................................................................45
1.6.5. Sử dụng chức năng “Solver”........................................................................................46

Chương 2..................................................................................................51
QUY HOẠCH THỰC NGHIỆM...................................................................51

2


2.1. CÁC PHƯƠNG PHÁP QUY HOẠCH THỰC NGHIỆM..............................51
2.1.1. Một số khái niệm..........................................................................................................51
2.1.2. Qui hoạch thực nghiệm yếu tố toàn phần 2k.................................................................55
2.1.3. Qui hoạch thực nghiệm yếu tố từng phần 2k - p..............................................................56
2.1.4. Qui hoạch trực giao cấp 2............................................................................................57
2.1.5. Qui hoạch thực nghiệm để tìm cực trị..........................................................................59
2.2. XÁC ĐỊNH CÁC HỆ SỐ CỦA PHƯƠNG TRÌNH HỒI QUY........................................61
2.2.1. Tính hệ số hồi qui bj của phương trình hồi qui tuyến tính............................................62
2.2.2. Tính hệ số hồi qui bj của phương trình hồi qui bậc 2....................................................62

2.3. ỨNG DỤNG EXCEL ĐỂ TỐI ƯU HÓA THỰC NGHIỆM.............................................62

Chương 3..................................................................................................76
PHƯƠNG PHÁP SỐ GIẢI CÁC BÀI TOÁN...................................................76
TRONG HÓA HỌC VÀ CÔNG NGHỆ HÓA HỌC..........................................76
3.1. CÁC BÀI TOÁN LIÊN QUAN ĐẾN PHƯƠNG TRÌNH ĐẠI SỐ PHI TUYẾN..............76
3.1.1. Phương pháp số giải phương trình đại số phi tuyến.....................................................76
3.1.2. Sử dụng “Goal Seek” tìm nghiệm phương trình đại số phi tuyến.................................78
3.2.3. Thể tích mol và hệ số chịu nén nhờ phương trình trạng thái........................................79
3.1.4. Vận tốc giới hạn của bi cầu rơi vào trong chất lỏng......................................................80
3.2. CÁC BÀI TOÁN LIÊN QUAN ĐẾN HỆ PHƯƠNG TRÌNH ĐẠI SỐ.............................81
3.2.1. Phương pháp số giải hệ phương trình đại số................................................................81
3.2.2. Sử dụng “Solver” của Excel để giải hệ phương trình đại số.........................................85
3.2.3. Cân bằng vật chất trong hệ thống phân tách ở chế độ ổn định.....................................90
3.2.4. Cân bằng hóa học trong hệ đa cấu tử...........................................................................91
3.3. CÁC BÀI TOÁN LIÊN QUAN ĐẾN HỆ PHƯƠNG TRÌNH VI PHÂN THƯỜNG........92
3.3.1. Các phương pháp số giải phương trình và hệ phương trình vi phân thường................92
3.3.2. Tính toán động học phản ứng......................................................................................96
3.3.3. Trao đổi nhiệt trong dãy thùng trộn ở chế độ không ổn định.......................................97
3.3.4. Sự khuếch tán cùng phản ứng hóa học trong không gian một chiều...........................100

Chương 4................................................................................................102
ỨNG DỤNG PHẦN MỀM DESIGN-II TRONG TÍNH TOÁN VÀ MÔ HÌNH HÓA
QUÁ TRÌNH CÔNG NGHỆ HÓA HỌC.......................................................102
4.1. SƠ LƯỢC QUÁ TRÌNH PHÁT TRIỂN CÁC HỆ THỐNG TỰ ĐỘNG HÓA THIẾT KẾ
CÔNG NGHỆ HÓA HỌC...................................................................................................102
4.2. GIỚI THIỆU MỘT SỐ MÔ-ĐUN CÔNG NGHỆ TRONG PHẦN MỀM DESIGN-II. .104
4.2.1. Các mô đun thiết bị cơ bản........................................................................................104
4.2.2. Các thiết bị phản ứng.................................................................................................109
3



4.2.3. Các thiết bị cân bằng lỏng - hơi..................................................................................110
4.2.4. Các thiết bị công nghệ phụ trợ khác...........................................................................112
4.3. CƠ SỞ DỮ LIỆU TÍNH CHẤT NHIỆT ĐỘNG HỌC CÁC CHẤT..............................113
4.3.1. Phân tích nhiệt động học............................................................................................113
4.3.2. Sử dụng cơ sở dữ liệu của DESIGN-II làm sổ tay tra cứu...........................................116
4.4. CÁC BƯỚC SỬ DỤNG PHẦN MỀM DESIGN-II........................................................116
4.4.1. Khởi động DESIGN-II...............................................................................................116
4.4.2. Tạo một tài liệu mới...................................................................................................117
4.4.3. Sắp đặt các mẫu thiết bị lên trang làm việc................................................................117
4.4.4. Liên kết các mô-đun thiết bị bằng dòng công nghệ và định hướng dòng công nghệ....118
4.4.5. Lựa chọn hệ đơn vị đo................................................................................................119
4.4.4. Lựa chọn các chất và các thông số của dòng vào........................................................120
4.4.7. Lựa chọn phương pháp nhiệt động để tính toán tính chất các cấu tử.........................123
4.4.8. Thiết lập các thông số đầu vào của thiết bị.................................................................123
4.4.9. Xác định phương pháp hội tụ khi tính toán lặp..........................................................125
4.4.10. Lưu và thực thi tính toán.........................................................................................126
4.4.11. Hiển thị giá trị các dòng lên trang làm việc..............................................................127

TÀI LIỆU THAM KHẢO..............................................................................3
Phô lôc....................................................................................................4

4


Chương 1
PHÂN TÍCH VÀ XỬ LÝ SỐ LIỆU THỰC NGHIỆM
1.1. CÁC ĐẶC TRƯNG THỐNG KÊ CỦA TẬP SỐ LIỆU ĐO
1.1.1. Các tham số đặc trưng về sự tập trung của tập số liệu

a) Tần suất pi
Giả thiết có một tập gồm có N số liệu kết quả đo, trong đó có ni giá trị
Xi (Xi xuất hiện ni lần) ni gọi là tần số của giá trị Xi, khi đó, tần suất của giá
trị Xi được tính như sau:
n
pi  i
N;
0 < pi < 1
(1.1)
Khi N   thì pi  Pi (Pi là xác suất, xuất hiện giá trị Xi).
Để tìm tần số của từng giá trị khác nhau trong dãy số liệu, có thể sử dụng
hàm FREQUENCY (data_array, bins_array). Trong đó, data_array là địa chỉ
mảng dữ liệu; bins_array là địa chỉ mảng các giá trị khác nhau của dữ liệu.
Ví dụ 1: Cho một tập số liệu kết quả đo:
33
32
30
31
22
29
32
24
34
33
33
25
34
26
29
35

33
34
Tìm tần suất và tần suất dồn của từng giá trị?
Giải:
N = 18.
Dãy các giá trị của tập số liệu đo được sắp xếp lại theo thứ tự tăng dần
và tính tần suất, tần suất dồn theo bảng sau:
Tần số
�X i Tần suất Tần suất dồn
Giá trị
ni
pi
pi
ni

Giá trị TB
22
1
22.00
0.056
0.056
24
1
23.00
0.056
0.111
25
1
23.67
0.056

0.167
26
1
24.25
0.056
0.222
29
2
25.83
0.111
0.333
30
1
26.43
0.056
0.389
31
1
27.00
0.056
0.444
32
2
28.00
0.111
0.556
33
4
29.43
0.222

0.778
34
3
30.24
0.167
0.944
35
1
30.50
0.056
1.000
Vẽ biểu đồ tần suất
- Chọn menu: Insert/ Chart…/ Line/ Next;
- Nhập vào Data Range : $E$2:$E$12 và chọn mục Column;
5


- Chọn Tab Series, nhập địa chỉ cột giá trị: $F$3:$F$8 vào Category (X)
axis labels;
- Chọn Next, Finish.
0.250
0.200
0.150

0.100
0.050
0.000

22


24

25

26

29

30

31

32

33

34

35

b) Số trội Mo
Sổ trội là số có tần suất lớn nhất trong tập số liệu kết quả đo. Hàm Excel
tính số trội: MODE (number1, number2, ...).
Số trội của tập số liệu trong ví dụ 1: Mo = 33 (pi = 4).
c) Số trung vị
Số trung vị Med là số đứng giữa tập số liệu đã được sắp xếp theo thứ
tự từ bé đến lớn, chia dãy số đó làm 2 phần bằng nhau về số số liệu.
Giả sử X1, X2, X3, XN là dãy các giá trị của tập số liệu kết quả đo, được
sắp xếp theo thứ tự tăng dần, thì:
- Số trung vị của tập N số lẻ được tính theo công thức sau:

Med = X(N+1)/2
- Số trung vị của tập N số chẵn được tính theo công thức sau:
1
Med   X N /2  X N /21 
2
Hàm Excel tính trung vị: MEDIAN (number1, number2, ...).
1
1
Med   X N /2  X N /21    32  32   32
2
2
Trong ví dụ 1, số trung vị:
d) Trung bình cộng
Gọi X là giá trị trung bình cộng của một tập số liệu không phân nhóm
thì X được tính theo công thức sau:
1 N
X  �X i
N i 1
(1.2)
Hàm Excel tính trung bình cộng: AVERAGE (number1, number2, ...).

6


Trong ví dụ 1, số trung bình cộng:
1 N
1
X  �X i   22  24  ...  35   30,5
N i 1
18

e) Trung bình nhân
GMx  N X 1 X 1... X N

(1.3)
Giá trị trung bình nhân thường dùng để tính tốc độ tăng trung bình, sự
pha loãng v.v...
Hàm Excel tính trung bình nhân: GEOMEAN (number1, number2, ...).
f) Trung bình điều hòa
1
HMx 
N
1
1

N i 1 X i
(1.4)
Trung bình điều hòa thường dùng để tính vận tốc, thời gian trung bình.
Hàm Excel tính trung bình điều hòa: HARMEAN (number1, number2, ...).
g) Trung bình gia quyền (có trọng số)
N X  N B X B  ...  N k X k
Xh  A A
N A  N B  ...  N k
(1.5)
Trong đó NA, NB, v.v... là các trọng số tương ứng của từng tập số liệu; X A ,
X B , v.v... là giá trị trung bình của từng tập số liệu.
Trung bình gia quyền thường được dùng để tính trung bình của hệ gồm
nhiều tập số liệu hoặc tập số liệu có trọng số.
1.1.2. Các tham số đặc trưng về sự phân tán của tập số liệu
a) Phương sai ( 2 hay S2)
Phương sai là trung bình của tổng bình phương sai khác giữa các giá trị

của tập số liệu so với giả trị trung bình của tập số liệu kết quả đo:
2
1 N
S 2  ' � X i  X 
N i 1
(1.6)
Với N’ = N khi N > 30 (phương sai ký hiệu là 2); N’ = N - 1 khi N < 30
(phương sai ký hiệu là S2); N’ – bậc tự do của tập số liệu đo.
Công thức thực dụng để tìm phương sai:

7


2

�N
��
X i ��


1 �N 2 �
2
i 1

��
S  ' �X i 

N �i 1
N






(1.7)
Phương sai đặc trưng cho sự sai biệt của các số liệu trong kết quả đo.
Phương sai càng lớn, sai biệt càng lớn. Ngược lại phương sai càng nhỏ thì sai
biệt càng nhỏ.
Phương sai còn biểu diễn độ phân tán của tập số liệu kết quả đo đối với
giá trị trung bình. Phương sai càng lớn độ phân tán xung quanh giá trị trung
bình càng lớn và ngược lại.
Hàm Excel tính phương sai: VAR(number1, number2, ...).
Trong ví dụ 1, giá trị phương sai:
2
1 N
1 N �
2
2
S 
Xi  X  


  35  30,5  � 15,088
�22  30,5   �




N  1 i 1
18  1 i 1

2

b) Độ lệch chuẩn ( f hay Sf)
Độ lệch chuẩn của một tập số liệu kết quả đo là giá trị căn bậc 2 trị sổ
phương sai của nó:

f  2

Sf  S2
hay
(1.8)
Độ lệch chuẩn có cùng thứ nguyên và cũng có ý nghĩa như phương sai. Trong
thực tế, người ta hay tính độ lệch chuẩn theo công thức sau đây:

Sf 

� X

i

X

N

2



�d


2

N

(1.9)

Hàm Excel tính độ lệch chuẩn: STDEV(number1, number2, ...).
Trong ví dụ 1, giá trị độ lệch chuẩn:
c) Độ sai chuẩn (  X hay S X )

X 

f

S f  S 2  15,088 �3,9

SX 

N

Sf

N
hay
(1.10)
Độ sai chuẩn có thể hiểu là trung bình phân tán của các giá trị kết quả đo.
3,9
SX 
 0,919
18

Trong ví dụ 1, giá trị độ sai chuẩn:
d) Hệ số biến thiên
Hệ số biến thiên là tỷ số giữa độ lệch chuẩn với giá trị trung bình:
8


CV 

Sf

�100

X

(1.11)
Vì hệ số biến thiên không có thứ nguyên, cho nên có thể dựa vào hệ số
biến thiên để so sánh gần đúng độ sai biệt của các kết quả đo nhận được bằng
các cách khác nhau.
Khi độ lệch chuẩn lớn (Sf) (tức sai biệt của các số liệu đo lớn), thì CV lớn
và ngược lại.
ví dụ 1, hệ số biến thiên:

CV 

Sf
X

�100 

3,9

�100  12, 7%
30,5

Trong
Bài tập
Kết quả xác định hàm lượng (%) P2O5 trong hệ (NH 4)2HPO4-K2CO3H2O bằng phương pháp so màu được cho trong bảng dưới đây:
Số thí
Số mẫu
1
2
3
4
5
6
7
8
nghiệ
m
1
27.9
19,3
4,5
22,3
10,8
16,3
8,8
12,6
2
27.2
19,7

5,2
23,5
8,9
15,8
8,7
13,5
3
26.8
4,8
21,7
17,2
9,2
13,3
Tính độ lệch chuẩn cho toàn bộ phép đo. Biết rằng phương sai cho 8
mẫu đo bằng được tính theo công thức:
8

Stb2 

�S
j 1
8

2
j

�f
j 1

fj

j

, trong đó fj – bậc tự do của mỗi mẫu.
Đáp số: SX = 0,654.
1.1.3. Các đặc trưng phân phối thống kê của tập số liệu
Đặc trung phân phối thống kê của một tập số liệu kết quả đo là quy
luật phân bố ngẫu nhiên của các giá trị kêt quả đo trên trục số thực. Đặc
trưng phân phối thống kê là quy luật, nên về mặt toán học nó thường được
biểu diễn bằng một hàm số và có đồ thị tương ứng.
Mỗi tập số liệu kết quả nghiên cứu là một tập số ngẫu nhiên (thường là
rời rạc) có những đặc trưng phân phối thống kê riêng. Dưới đây trình bày các
quy luật phân phối thống kê ngẫu nhiên phổ biến nhất.
a) Phân phối chuẩn Gauss

9



1
Y X 
e
 2

 X   2
2

2

u


1
Y  u 
e 2
 2

2

hay
(1.12)
Trong đó: X là biến số ngẫu nhiên;  là hằng số, bằng giá trị kỳ vọng
của biến ngẫu nhiên;  là hằng số, bằng giá trị phương sai của biến ngẫu
nhiên:

u

X 
 .

Hàm phân phối chuẩn có đặc diểm là: X  Mo  Med  .
Đồ thị hàm phân phối chuẩn có dạng như hình 1.1. Diện tích nằm dưới
đường cong phân phối chuẩn chính là tần suất dồn của các giá trị nằm trong
vùng lấy tích phân. Diện tích này cũng biểu diễn xác suất xuất hiện của các
giá trị X, nằm trong vùng lấy tích phân.

Hình 1.1. Đồ thị phân phối chuẩn Gauss
Xác suất thống kê gắn liền với khái niệm độ tin cậy thống kê (P). Diện
tích giới hạn bởi đường cong cũng chính là độ tin cậy thống kê để xuất hiện
Xi trong khoảng tích phân. Kí hiệu độ tin cậy thống kê để xuất hiện giá trị Xi
nằm trong vùng (- , Xi) là P(Xi). Độ tin cậy thống kê luôn là một số nhỏ hơn
hoặc bằng 1 tức là P(Xi) < 1.

Nếu kí hiệu  là độ không tin cậy thống kê, thì:
P +  = 1 hay P = 1 -  hoặc  = 1 – P.
Trong xác suất, người ta qui ước:
Biến cố có P = 0,9999 là biến cố hoàn toàn chắc chắn.
Biến cố có P = 0,999 là biến cố hết sức chắc chắn.
Biến cố có P = 0,99 là biến cố rất chắc chắn.
Biến cố có P = 0,95 là biến cố chắc chắn.
Biến cố có P = 0,90 là biến cố có chiều hướng chắc chắn.

10


Từ hàm phân phổi chuẩn, khi cho một giá trị ui(X) thì ta tính được độ tin
cậy thống kê Pi, ứng với một diện tích Pi. Ngược lại, khi cho giá trị Pi thì có
thể tính được một giá trị ui(X). Thay cho tính toán, người ta lập sẵn những
bảng số để tra giá trị u khi biết giá trị P hoặc ngược lại.
Hàm Excel trả về giá trị hàm phân phối chuẩn: NORMDIST(x, mean,
standard_dev, cumulative).
b) Phân phối Student
Hàm phân phối Student có dạng:


f 1

X X
� t2 �2
X 
tf  i
y  t, f   B �
1 �

tf 
Sf
Sx
� f � ;
hoặc
(1.13)
Trong đó: t là một biến ngẫu nhiên; f là bậc tự do (f = N - 1); B là hằng số.
Khi X là số có tần suất rất lớn thì có thể coi X i �X . Đồ thị của hàm
i

Student giống như hàm phân phối chuẩn. Tuy nhiên, độ nhọn của đồ thị hàm
phân phối Student phụ thuộc vào bậc tự do.

Hình 1.2. Đồ thị phân phối Student
Bậc tự do càng lớn thì độ nhọn càng nhỏ và ngược lại. Do độ nhọn phụ
thuộc vào bậc tự do, nên giá trị chuẩn t cũng phụ thuộc vào bậc tự do. Trong
thực tế, người ta nhận thấy:
N > 30: tuân theo phân phối chuẩn.
N < 30: tuân theo phân phối Student.
Đối với phân phổi Student cũng có bảng tra chuẩn Student tính sẵn. Dựa
vào bảng này, khi biết hai trong ba giá trị t, f và P thì xác định được giá trị
còn chưa biết.
11


c) Phân phối Khi bình phương
Hàm phân phối Khi bình phương có dạng:
Y   , f   Ce
2


2
2

 
2

f 2
2

(1.35)

2

N �
X X �
 2  �� i



i 1 �  f

Với:
Khi lấy các giá trị: 0 <  < +
(1.36)
Hàm Khi bình phương chỉ phụ thuộc vào 1 bậc tự do. Đồ thị của hàm
phân phối Khi bình phương có dạng:

Nếu cho trước độ tin cậy thống kê P và giá trị f, tra bảng sẽ tìm được giá
trị  và ngược lại.
d) Phân phối Fisher

Hàm số của phân phối Fisher có dạng:
2

Y  F , f1 , f 2   A

F



f1  2
2

f 2  f1 

f1  f 2
2

(1.14)
Trong đó: F là biến số ngẫu nhiên; f1, f2 là các bậc tự do; A là hằng số phụ
thuộc f1 và f2. F phụ thuộc vào hai loại bậc tự do và được tính theo công thức
sau:
F

2
f1

S

 2
S

 f2
2
1
2
2

với 0  F  +

Đồ thị của hàm Fisher có dạng

12

(1.34)


Tùy thuộc vào bậc tự do mà đồ thị có các dạng khác nhau. Hàm phân
phối Fisher cũng có các tính chất như các hàm phân phôi khác. Diện tích giới
hạn bởi đường cong cũng biêu diễn độ tin cậy thống kê.
Người ta cũng lập các bảng tra sẵn, khi cho (P, f 1 và f2 ) sẽ tra được giá
trị của chuẩn F, ngược lại cho 3 trong 4 thông số ( F, P, f 1,f2 ) sẽ tra được số
thứ 4 chưa biết. Có 2 loại bảng số chính để tra chuẩn F: Bảng F(0.95, f 1, f2 )
và bảng F(0.99, f1, f2 ).
e) Phân phối Poisson
- Hàm số cùa phân phối Poisson có dạng:

 X e 
Y X 
X!

với   

Tức là kỳ vọng và phương sai bằng nhau. X là số tự nhiên.

(1.14)

Hình 1.3. Đồ thị hàm phân phối Poisson
Cần phân biệt khái niệm hàm phân phối và chuẩn phân phối (chuẩn
thống kê):
-Hàm phân phối là qui luật phân bổ số liệu kết quả đo có tính ngẫu
nhiên (các biến ngẫu nhiên).
-Chuẩn phân phối là những giá trị của hàm phân phối tính được theo
điều kiện cho trước.

13


Như vậy chuẩn phân phối có 2 dạng:
+ Giá trị tra bảng;
+ Giá trị tính được.
Người ta so sánh giữa giá trị tra bảng và giá trị tính được để đánh giá độ tin
cậy thống kê của một sự kiện theo điều kiện cho trước (theo giá trị tra bảng).
Ta có nhận xét, một tập số liệu kết quả thực nghiệm phụ thuộc vào bậc
tự do:
+ 1 bậc tự do thì tuân theo hàm Student;
+ Không phụ thuộc vào bậc tự do thì tuân theo hàm Gauss hoặc Poisson.
Trong thực nghiệm, cách xác định định tính luật phân phối của 1 tập
số liệu kết quả đo như sau:
Nếu N > 30 và có 1 trong 3 tính chất sau thì tập số liệu kết quả đo có
qui luật phân phối chuẩn Gauss:
1) Đồ thị phân phối tần suất có dạng chuông;
2) Mo = Med = X;

3) Xi nhận các giá trị ở ngoài khoảng X ± 2 là 5% hoặc Xi nhận các
giá trị nằm trong khoảng X ± 2 là 95%.
Nếu N < 30 và có 1 trong 3 tính chất trên thì tập số liệu kết quả đo có
qui luật phân phối Student.
1.2. ĐÁNH GIÁ TẬP SÓ LIỆU KỂT QUẢ ĐO
Một tập số liệu kết quả đo có thể được phân tích đánh giá thông qua
các đại lượng chính sau đây.
1.2.1. Sai số đo
Có 4 loại sai số đo:
- Sai số tuyệt đối:

 A  X i  X �X i  

(1.15

Sai số tuyệt đổi là sự sai khác của một giá trị đo nào đó với giá trị trung bình
(hoặc giá trị thật). Sai khác này có thể là âm hoặc dương.
- Sai số tương đối:

R 

Xi  X
X 
�100  i
�100
X
X

(1.16)
Sai số tương đối là tỷ số của sai số tuyệt đối đối với giá trị trung bình.

Sai số này không có thử nguyên cho nên được dùng để so sánh sai sổ tương
đối của các phương pháp đo cho kết quả không cùng thứ nguyên.
14


- Sai số hệ thống:
X  X   �0

(1.17)
Nếu hiệu số này đáng tin cậy thì số đo đã mắc sai số hệ thống, Khi đó
giá tri Xi tập trung về một phía của giá trị thực trên trục số. Có thể tìm được
nguyên nhân gây sai số hệ thống để loại bỏ.
- Sai số ngẫu nhiên:
X  X   �0

(1.18)
Phép đo mắc sai số ngẫu nhiên khi hiệu số giữa giá trị trung bình cộng
X với giá trị thật gần bằng không. Khi đó các giá trị Xi phân bổ đều hai phía
của giá trị thực trên trục số. Sai số ngẫu nhiên bao giờ cũng mắc phải và chỉ
có thể tìm các giải pháp để giảm sai số ngẫu nhiên.
1.2.2. Độ chính xác của tập số liệu kết quả đo
Vì trung bình cộng biểu diễn độ tập trung của các giá trị thực nghiệm
nên độ chính xác (Accuracy) của tập số liệu kết quả đo được đánh giá thông
qua giá trị trung bình cộng. Giá trị trung bình cộng mà sai khác với giá trị
thật càng nhỏ thì độ chính xác của số đo càng lớn và ngược lại.
Nguyên nhân dẫn đến độ chính xác kém có thể là:
- Chọn mẫu không đúng về chất lượng và số lượng;

- Giải pháp đo số liệu không chính xác.
1.2.3. Độ sai biệt của tập số liệu kết quả đo

Vì phương sai biểu diễn độ sai biệt trung bình (Precision) của các giá
trị trong tập số liệu kết quả đo so với giá trị trung bình nên phương sai càng
nhỏ thì độ sai biệt càng nhỏ và ngược lại.
Nguyên nhân chính dẫn đến độ sai biệt lớn:
- Chọn mẫu có chất lượng, số lượng không đặc trưng cho mục tiêu đo;
- Tay nghề người đo kém, không thu thập được số đo.
Thực ra giá trị trung bình cộng X cũng phản ánh phần nào độ sai biệt
khi so với giá trị thật và ngược lại giá trị phương sai S2 cũng phản ánh phần
nào độ chính xác khi độ sai biệt nhỏ. Tuy nhiên mỗi đại lượng có tính trội
biểu diễn cho độ chính xác và độ sai biệt khác nhau: X có tính trội phản ánh
độ chính xác, S2 có tính trội phản ánh độ sai biệt:

15


Hình 1.4. Minh họa tính trội của độ chính xác và độ sai biệt
Độ sai biệt
Rất nhỏ
Lớn
Nhỏ
Độ chính xác Rất tốt
Tốt
Kém
Kết luận
Đúng-Tốt
Sai số ngẫu nhiên
Sai số hệ thống
1.2.4. Sai số tối đa cho phép
Sai số tối đa cho phép P(X) của một tập số liệu kết quả đo được qui
định: cho phép lấy các giá trị Xi sai khác với giá trị trung bình X lớn nhất là

±3. Sai số tối đa cho phép chia làm hai loại:
+ Sai số tối đa cho phép tuyệt đối:
P(X) = ±3f
(1.19)
+ Sai số tối đa cho phép tương đối:
P  X  �3 f

�100
X
X
(1.20)
Sai số tối đa tương đối cho phép được biểu diễn dưới dạng phần trăm
(%) do đó không còn thứ nguyên, dùng để so sánh sai số tối đa cho phép
tương đối của phương pháp đo này với sai số tối đa cho phép tương đối của
phương pháp đo khác. Những giá trị kết quả đo nào nằm ngoài khoảng sai số
tối đa cho phép tuyệt đối thì phải loại bỏ (các giá trị đó đã mắc sai số thô).
1.2.5. Khoảng chính xác tin cậy
Khoảng chính xác tin cậy được tính theo công thức sau:
X  P, f   X    t  P, f  �S X
(1.21)
Trong đó: P là độ tin cậy thống kê; f là bậc tự do cùa tập số liệu kết quả đo;
S X là độ sai chuẩn.
Khoảng chính xác tin cậy của một tập số liệu kết quả đo chính là
khoảng sai khác giữa giá trị trung bình với giá trị kỳ vọng có một độ tin cậy
thống kê cho trước. Như vậy khoảng chính xác tin cậy của 1 tập số liệu kết
quả đo phụ thuộc vào độ tin cậy thống kê (P) và bậc tự do (f).
Khoảng chính xác tin cậy của mỗi giá trị kết quả đo được tính như sau:
X  P, f   X i  X  t  P, f  �S f
(1.22)


16


Trong đó: t(P, f) là giá trị tra ở bảng phân vị cùa hàm phân phối Student.
Khi một tập số liệu kết quả đo có khoảng chính xác tin cậy không thoả
mãn với độ tin cậy thống kê (P) cho trước thì có thể tăng thêm số mẫu đo
(N). Số mẫu đo cần thiết để có khoảng chính xác tin cậy trùng với khoảng
chính xác tin cậy lý thuyết cho trước, được tính theo công thức sau:
t  P, f  S f �

N �

� X

2

(1.23)

Trong đó: X là giá trị cho trước.
1.2.6. Khoảng giới hạn tin cậy của một tập số liệu kết quả đo
Khoảng giới hạn tin cậy của một tập số liệu kết quả đo được qui định
nằm trong khoảng:
X �X  P, f   X �t  P, f  �S X
(1.24)
Giá trị Xi bất kỳ của một tập số liệu kết quả đo được chấp nhận theo độ
tin cậy thống kê p cho trước, có bậc tự do f = N - l phải luôn nằm trong
khoảng giới hạn tin cậy.
Trong ví dụ 1, khoảng giới hạn tin cậy được tính như sau:
Với độ tin cậy 95%:
Tra bảng phân vị Student: t  p, f   t  0.95,18  1  t  0.95,17   2,11

95%CL  X �t  P, f  �S X  X �t  P, f  �

Sf

3,884
 30,5 �2,11 �
 30,5 �1,93
N
18

Hay 28,57  X i  32,43
Với độ tin cậy 99%:

Tra bảng phân vị Student: t  p, f   t  0.95,18  1  t  0.95,17   2,898
S
3,884
95%CL  X �t  P, f  �S X  X �t  P, f  � f  30,5 �2,898 �
 30,5 �2,65
N
18
Hay 27,85  X i  33,15
Như vậy, rõ ràng yêu cầu độ tin cậy càng cao thì khoảng giá trị tin cậy
sẽ càng rộng.
Ngoài cách sử dụng các hàm của Excel, chúng ta còn có thể sử dụng
chúng ta còn có thể sử dụng công cụ Data Analysis để tính đặc trưng thống
kê số liệu như sau:
- Nhập dữ liệu trong cột A1:A12;
- Chọn menu Data/Data Analysis…/Descriptive Statistics;
17



- Nhập các mục:
Input Range: địa chỉ tuyệt đối chứa dữ liệu $A$1:$A$12
Output Range: địa chỉ xuất kết quả
Confidence Level for Mean (Độ tin cậy cho trung bình).
Kết quả bao gồm: Kỳ vọng (trung bình), phương sai, trung
vị, mode, độ lệch chuẩn, độ nhọn, độ nghiêng (hệ số bất đối
xứng so với phân phối chuẩn), khoảng biến thiên, max, min,
sum, số mẫu (count), khoảng tin cậy của trung bình ở mức
95% .
Sau đây là kết quả tính các đặc trưng thống kê của ví dụ 1 khi sử dụng
các hàm của Excel và sử dụng Data Analysis

18


Chú ý: khi số mẫu n > 30, ta sẽ sử dụng hàm CONFIDENCE.NORM
thay cho hàm CONFIDENCE.T (sử dụng chuẩn phân bố Gauss thay vì phân
bố Student).
Bài tập 1
Giá trị nhiệt độ trung bình của lò nung xác định được qua 4 lần đo độc
lập bằng hỏa quang kế là 2250 oC với độ lệch chuẩn Sf = 10 oC. Xác định
khoảng tin cậy của nhiệt độ lò nung với độ tin cậy 95%?
Đáp số: 2240,2  T  2259,8
Bài tập 2
Tạp chất độc hại có trong các muối photphat dùng làm thực phẩm là flo.
Dưới đây là kết quả phân tích hàm lượng flo trong sản phẩm thương mại
(%): 0,18; 1,12; 0,13; 0,15. Hãy xác định giới hạn trên của hàm lượng flo
trong sản phẩm này với độ tin cậy 95%.
Đáp số: F(%) < 0,19.

Bài tập 3
Khi chuẩn độ 10ml NaOH 0,1N bằng HCl thu được thể tích dung dịch
chuẩn HCl: 10,09; 10,11; 10,09; 10,10; 10,12 ml. Xử lý số liệu thực nghiệm
với độ tin cậy α = 0,952.
Kết quả phân tích hàm lượng iot trong một mẫu nước biển ở Thanh Hóa
theo phương pháp động học xúc tác-trắc quang lần lượt là: 24,75; 25,12;
24,76; 26,28; 25,15 µg/l. Xử lý số liệu thực nghiệm với độ tin cậy α = 0,95.
1.3. SO SÁNH CẶP THAM SỐ ĐẶC TRƯNG CỦA HAI TẬP SỐ LIỆU
KẾT QUẢ ĐO
1.3.1. So sánh 2 trung bình với phương sai đã biết hay mẫu lớn (N > 30)
 Dùng menu: Tools/ Data Analysis… / z-test:Two Sample for Means
X1  X 2
z
 12  22

N1 N 2
 Tiêu chuẩn kiểm định:
 Phân vị 2 phía z/2 là: z Critical two-tail (z /2 = NORM.S.INV(1-/2))
 Nếu z  z /2 thì bác bỏ H , chấp nhận H (trung bình hai mẫu khác
0

1

nhau)
 Nếu z  z /2 thì chấp nhận H0 , bác bỏ H1 (trung bình hai mẫu như nhau)
Ví dụ:
Người ta chọn 2 mẫu, mỗi mẫu 10 máy lấy từ hai lô (I và II được sản
xuất với phương sai biết trước tương ứng là 1 và 0,98) để khảo sát thời gian
19



hoàn thành công việc theo phút của chúng:
6 8 9 10 6 15 9 7
I
13 11
5 5 4 3
9
9
6 13
II
17 12
Hỏi khả năng hoàn thành công việc của hai máy có khác nhau hay không?
với  = 0,05.
Nhập và xử lý dữ liệu
- Variable 1 Range , Variable 2 Range: địa chỉ tuyệt đối của vùng dữ
liệu của I, II
- Variable 1 Variance (known), Variable 2 Variance (known): phương
sai của I, II
- Labels: chọn khi có tên biến ở đầu cột hoặc hàng
- Alpha: mức ý nghĩa .
- Output options: chọn cách xuất kết quả

Kết quả

20


Do z  z /2 nên trung bình hai mẫu không bằng nhau, nói một cách
khác là khả năng làm việc của hai lô máy này khác nhau (lô I lớn hơn lô II).
1.3.2. So sánh 2 trung bình với dữ liệu từng cặp

 Được dùng khi mẩu bé, phụ thuộc, phương sai 2 mẫu
không bằng nhau và mỗi phần tử khảo sát có 2 chỉ tiêu X
(trước), Y (sau) khi thay đổi điều kiện thí nghiệm.
 Dùng menu: Tools/Data Analysis…/ t-test:Paired Two
Sample for Means
N

t
 Tiêu

chuẩn
N

SD 

� D  D 
i 1

kiểm

định:

D
SD N ;

D

� X
i 1


i

N

 Yi 
;

2

i

N 1
 Phân vị 2 phía t/2 là: t Critical two-tail (t /2 = T.INV.2T(,f))
 Nếu t  t /2 thì bác bỏ H0 , chấp nhận H1 (trung bình hai mẫu khác nhau)
 Nếu t  t /2 thì chấp nhận H , bác bỏ H (trung bình hai mẫu như nhau)
0

1

Ví dụ:
Để nghiên cứu của một loại thuốc ngủ, người ta cho 10 bệnh nhân uống
thuốc. Lần khác họ cũng cho bệnh nhân uống thuốc nhưng là thuốc giả
(thuốc không có tác dụng). Kết quả thí nghiệm như sau:
Bệnh nhân
1
2
3
4
5
6

7
8
9
10
Số giờ ngủ có thuốc
6,1 7,0 8,2 7,6 6,5 8,4 6,9 6,7 7,4 5,8
Số giờ ngủ với thuốc giả 5,2 7,9 3,9 4,7 5,3 5,4 4,2 6,1 3,8 6,3
Giả sử số giờ ngủ của các bệnh nhân có qui luật chuẩn. Với mức ý nghĩa  =
0,05 hãy kết luận về ảnh hưởng của loại thuốc ngủ trên?
Nhập và xử lý dữ liệu

21


Kết quả

t = 3,1835 > t /2 = 2,2622 nên chấp nhận H1. Vậy loại thuốc ngủ trên có ảnh
hưởng làm tăng số giờ ngủ trung bình.
1.3.3. So sánh trung bình với phương sai bằng nhau
Được dùng khi 2 mẫu bé, độc lập và phương sai 2 mẫu bằng nhau;
Chọn menu: Tools/Data Analysis…/ t-test:Two-Sample Assuming Equal
Variances;
X1  X 2
t
�1
1 �
S p2 � 

N1 N 2 �


Tính
tiêu
chuẩn
kiểm
định:
;
2
2
 N  1 S1   N 2  1 S2
S p2  1
N1  N 2  2

22


Phân vị 2 phía t /2 là: t Critical two-tail;
Nếu t  t /2 thì bác bỏ H , chấp nhận H (hai trung bình khác nhau);
0

1

Nếu t  t /2 thì chấp nhận H0, bác bỏ H1 (hai trung bình như nhau).
Ví dụ: Người ta cho 10 bệnh nhân uống thuốc hạ cholesterol đồng thời cho
10 bệnh nhân khác uống giả dược, rồi xét nghiệm về nồng độ cholesterol
trong máu (g/l) của cả 2 nhóm:
Thuốc
1,10 0,99 1,05 1,01 1,02 1,07 1,10 0,98 1,03 1,12
Giả dược
1,25 1,31 1,28 1,20 1,18 1,22 1,22 1,17 1,19 1,21
Với  = 0,05 hãy cho biết thuốc có tác dụng hạ cholesterol trong máu không?

Nhập và xử lý dữ liệu

Kết quả

Do t  t /2 ( 8,388  2,101 ) nên chứng tỏ trung bình hai mẫu khác nhau,
thuốc có tác dụng hạ cholesterol trong máu (1,047 < 1,223).

23


Bài tập:
Khi nghiên cứu quá trình polyme hóa theo cơ chế gốc của các muối trên
cơ sở 4-vinylpyridin và hai ankyl halogen khác nhau: butyl iodua C 4H9I và
etyl bromua C2H5Br nhận thấy: hiệu suất phản ứng trung bình của C 4H9I là
67,72% (N1 = 8), còn của C2H5Br là 91,61% (N2 = 8). Phương sai của chúng
đều bằng S = 16,6%. Hãy so sánh hiệu suất phản ứng của hai chất trên với 
= 0,05?
Đáp số:
Hiệu suất của C2H5Br cao hơn so với C4H9I.
1.3.4. So sánh 2 trung bình với phương sai khác nhau
Khi mẫu bé, độc lập và có phương sai khác nhau (2 mẫu phân biệt)
Chọn menu: Tools/Data Analysis…/ t-test:Two-Sample Assuming UnEqual
Variances
X1  X 2
t
S12 S 22

N1 N 2
Tiêu chuẩn kiểm định:
Phân vị 2 phía /2 là: t Critical two-tail

Nếu t  t /2 thì bác bỏ H , chấp nhận H (hai trung bình khác nhau);
0

1

Nếu t  t /2 thì chấp nhận H0, bác bỏ H1 (hai trung bình như nhau).
Ví dụ: Thời gian tan rã (phút) của một loại viên bao từ 2 xí nghiệp dược
phẩm (XNDP) khác nhau được kiểm nghiệm như sau:
XNDP I
61 71 68 73 71 70 69 74
XNDP II
62 69 65 65 70 71 68 73
Thời gian tan rã của viên bao thuộc hai XNDP có giống nhau không?
Nhập, xử lý dữ liệu

24


Kết quả

Do t  t /2 (0,9152 < 2,1448) nên chấp nhận H0 tức là thời gian tan rã
trung bình của viên bao thuộc 2 XNDP như nhau.
1.3.5. So sánh 2 phương sai
So sánh 2 phương sai được áp dụng để so sánh độ sai biệt của 2 phương
pháp đo khác nhau;
Chọn menu: Tools/Data Analysis…/F-Test Two-Sample for Variances;
S12
F 2
S1
Tính tiêu chuẩn kiểm định

2
2
Nếu F < F thì chấp nhận giả thiết H0: S1 �S2 (tức là hai phương pháp này

có độ sai biệt như nhau) và ngược lại: F = F.INV.RT(, df1, df2)

25


×