Tải bản đầy đủ (.pdf) (157 trang)

NHẬP MÔN XỬ LÝ SỐ LIỆU VÀ KẾ HOẠCH HÓA THỰC NGHIỆM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.65 MB, 157 trang )

Lê Đức Ngọc

NHẬP MÔN
XỬ LÝ SỐ LIỆU
VÀ KẾ HOẠCH HÓA THỰC NGHIỆM

Hà nội- 5/2010


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

MỤC LỤC
Lời nói đầu.
Mục lục.
PHẦN I: THỐNG KÊ VÀ PHÂN TÍCH THỐNG KÊ SỐ ĐO
Chương 1: Các đặc trưng thông kê của một tập số liệu kết quả đo.
1.Các tham số đặc trưng về sự tập trung của tập số liệu.
1.1.Tần xuất (pi)
1.2.Số trội (Mo).
1.3.Khoảng của tập số (R)
1.4.Số trung vị (Med) và số tứ phân vị (Q).
1.5.Trung bình cộng(X).
2.Các tham số đặc trưng về sự phân tán của tập số liệu.
2.1.Phương sai (σ2 hoặc S2).
2.2.Độ lệch chuẩn (σ f hoặc Sf).
2.3.Độ sai chuẩn (σx hoặc Sx).
2.4.Hệ số biến thiên (Cv).
3.Các đặc trưng phân phối thống kê của tập số liệu.
3.1.Phân phối Chuẩn (phân phối Gauss)( u ).
3.2.Phân phối Student (phân phối t).
3.3.Phân phối Fisher.


3.4.Phân phối Khi bình phương.
3.5.Phân phối Poisson.
3.6.Phân phối Nhị thức.
3.7.Mối quan hệ giữa các hàm phân phối và các chuẩn phân phối.
Chương 2 :Phân tích đánh giá tập số liệu kết quả đo.
4.1.Sai số đo.
4.2.Độ chính xác của tập số liệu kết quả thực nghiệm.
4.3.Độ sai biệt của tập số liệu kết quả thực nghiệm.
4.4.Sai số tối đa cho phép ΔP(X).
4.5.Khoảng chính xác tin cậy.
4.6.Khoảng giới hạn tin cậy của một tập số liệu kết quả đo.
Chương 3 : Phân tích so sánh cặp tham số đặc trưng của hai tập số liệu kết quả đo.
5.1.Giả thiết thống kê và kết luận thống kê.
5.2.Quan hệ giữa chuẩn phân phối và kết luận thống kê.
5.3.Phân tích so sánh.
5.3.1.So sánh độ chính xác.
5.3.2.So sánh sai biệt.
PHẦN II: PHÂN TÍCH NHÂN TỐ ẢNH HƯỞNG LÊN SỐ ĐO
Chương 4 : Phân tích Hồi qui và Tương quan của các nhân tố.
6.1.Hồi qui và Tương quan hai nhân tố.
6.1.1.Hồi qui tuyến tính
6.1.2.Hồi qui phi tuyến tính.
6.1.3.Hệ số tương quan (r) Spearman.
6.1.4.Hệ số tương quan thứ bậc Spearman rho.
2


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

6.2.Hồi qui và tương quan đa nhân tố.

chương 5: Phân tích tác động của các nhân tố qua tham số.
( phân tích bằng phương sai )
7.1.Bài toán 1 yếu tố, k mức đo,mỗi mức đo lặp lại n lần.
7.2.Bài toán 2 yếu tố A và B; yếu tố A, k mức đo; yếu tố B, m mức đo; với mỗi mức của 2
yếu tố A và B đều tiến hành đo lặp lại n lần.
7.3.Bài toán 3 yếu tố trở lên ( Phương pháp Ô vuông Latin).
Chương 6 : Phân tích tác động của các nhân tố không qua tham số
8.1.Bài toán tỷ lệ giữa 2 đại lượng, mỗi đại lượng 2 mức.
8.1.1.Dùng chuẩn Khi bình phương ( χ2 ) để đánh giá.
8.1.2.Dùng Hệ số tương quan để đánh giá.
8.2.Bài toán tỷ lệ giữa 2 đại lượng X ( có s mức ) và Y ( có r mức ).
8.3.Bài toán so sánh 2 tỷ lệ.
PHẦN III- KÊ HOẠCH HOÁ THỰC NGHIỆM
Chương 7: Mô hình hoá thực nghiệm đa nhân tố bậc một đầy đủ và rút gọn
9.1. Đại cương về mô hình hoá thực nghiệm đa nhân tố
9.2.Mô hình hoá thực nghiệm bậc 1 đầy đủ :
9.3. Mô hình hoá thực nghiệm bậc 1 rút gọn:
Chương 8: Mô hình hoá thực nghiệm đa nhân tố bậc hai đầy đủ hay rút gọn
10.1- Mô hình hoá thực nghiệm bậc 2 tâm trực giao.
10.2- Mô hình hoá thực nghiệm bậc 2 tâm xoay:
Chương 9 : Phương pháp mạng đơn hình
PHẦN IV- TỐI ƯU HOÁ THỰC NGHIỆM
10.1- Khái niệm và phân loại các phương pháp tối ưu hoá:
10.2.Phương pháp thực nghiệm theo đường dốc nhất
10.3. Phương pháp khảo sát mặt mục tiêu
10.4.Phương pháp thực nghiệm theo đơn hình.
Phụ lục 1 : Các bài tập ôn luyện
Phụ lục 2: Các bảng số thống kê
1.Bảng chuẩn u
2.Bảng chuẩn t

3.Bảng chuẩn χ2
4.Bảng chuẩn F

3


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

PHẦN I
XỬ LÝ SỐ LIỆU KẾT QUẢ ĐO
CHƯƠNG 1.
CÁC ĐẶC TRƯNG THỐNG KÊ CỦA MỘT TẬP SỐ LIỆU KẾT QUẢ ĐO.
Những đại lượng đặc trưng chính cho một tập số liệu kết quả đo, được phân làm 3 loại
chính :1/ Các tham số đặc trưng về sự tập trung của tập số liêu, 2/ Các tham số đặc trưng về
sự phân tán của tập số liệu, 3/ Đặc trưng phân phối thống kê của tập số liệu.
1. Các tham số đặc trưng về sự tập trung của tập số liêu:
1.1. Tần suất (pi):
Giả thiết có một tập số liệu kết quả đo gồm có N số liệu, trong đó có ni giá trị Xi (Xi
xuất hiện ni lần) ni gọi là tần số của giá trị Xi, khi đó, tần suất của giá trị Xi được tính như sau:
n
pi = i
0 ≤ pi ≤ 1
1.1
N
pi là tần suất xuất hiện giá trị Xi , khi N → ∞ thì pi → Pi (Pi là xác suất, xuất hiện giá trị Xi).
Ví dụ 1: Khi khảo sát 100 đối tượng đo X, thu được 100 số liệu đo cho ở bảng sau:
1
2
3
4

5
6
7
8
9
10

1

2

3

4

5

6

7

8

9

10

4.37
3.71
4.31

3.93
4.60
4.38
4.10
4.11
3.87
3.84

4.13
4.05
4.08
4.14
3.94
4.36
3.84
4.31
4.05
4.03

4.46
3.70
3.65
3.67
4.32
3.69
4.03
4.27
3.94
3.56


4.45
4.21
4.23
3.82
4.55
4.04
4.58
4.31
4.23
3.81

4.73
4.35
4.00
4.16
4.40
4.40
4.20
4.62
3.95
3.93

4.20
3.89
4.58
4.17
4.55
3.98
4.37
3.80

4.32
4.28

3.64
3.67
4.30
4.30
4.82
4.38
4.58
4.08
4.03
4.03

4.15
4.80
4.42
4.18
4.58
4.00
4.14
4.05
3.91
3.74

3.96
4.16
3.90
4.56
4.19

4.08
4.88
3.85
4.18
4.27

3.65
4.07
4.36
3.93
4.52
4.16
4.21
4.21
4.23
4.72

Khi sắp xếp lại theo thứ tự tăng dần, 100 số liệu kết quả đo trên, ta có :
1
2
3
4
5
6
7
8
9
10
11
12

13
14
15
16
17
18
19
20

3.56
3.64
3.65
3.65
3.67
3.67
3.69
3.70
3.71
3.74
3.80
3.81
3.82
3.84
3.84
3.85
3.87
3.89
3.90
3.91


21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

3.93
3.93
3.93
3.94
3.94
3.95
3.96
3.98
4.00

4.00
4.03
4.03
4.03
4.03
4.04
4.05
4.05
4.05
4.07
4.08

41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58

59
60

4.08
4.08
4.10
4.11
4.13
4.14
4.14
4.15
4.16
4.16
4.16
4.17
4.18
4.18
4.19
4.20
4.20
4.21
4.21
4.21

4

61
62
63
64

65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80

4.23
4.23
4.23
4.27
4.27
4.28
4.30
4.30
4.31
4.31
4.31
4.32
4.32

4.35
4.36
4.36
4.37
4.37
4.38
4.38

81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100

4.40

4.40
4.42
4.45
4.46
4.52
4.55
4.55
4.56
4.58
4.58
4.58
4.58
4.60
4.62
4.72
4.73
4.80
4.82
4.88


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

Bảng biểu diễn số liệu thống kê 100 kết quả đo từ 100 đối tượng đã cho trên đây
theo phân nhóm cách nhau khoảng 17 đơn vị một trình bầy như sau:
Nhóm
Tần số
Giá trị TB
Tần suất
Tần xuất dồn

ni
Xi
pi = ni/N
∑pi
3.50 - 3.67
4
3.59
0.04
0.04
3,67 - 3,84
9
3.76
0.09
0.13
3.84 - 4.01
16
3.94
0.16
0.29
4.01 - 4.18
22
4.10
0.22
0.51
4.18 - 4.35
24
4.27
0.24
0.75
4.35 - 4.52

11
4.44
0.11
0.86
4.52 - 4.69
10
4.61
0.10
0.96
4.69 - 4.86
3
4.78
0.03
0.99
4.86 - 5.03
1
4.95
0.01
1.00
Lớp trội từ 4.18 đến 4.35 là lớp có tần suất lớn nhất (0.24).
Bảng số liệu trên có thể được biểu diễn trên 2 loại đồ thị sau:
120

30

100

20

80


60

10

40

20

0
1

2

3

4

5

6

7

8

0

9


1

2

Đồ thị tần suất lớp

3

4

5

6

7

8

9

Đồ thị tần suất dồn

Việc phân nhóm một tập số liệu được tiến hành qua một số bước:
Ví dụ 2: Trắc nghiệm môn toán được tiến hành đối
50 học sinh:
48
35
36
32
30

46
35
15
44
28
16
41
20
19
38
25
18
39
28
33
19
36
34
29
38
13
16
41
15
44

với một lớp học. Dới đây là điểm số của
40
43
48

46
47
43
39
31
29
28

42
40
45
39
31
28
29
18
19
12

Thông thường, chia làm 10 nhóm, Bước 1: Tính khoảng của tập số liệu:
Rmax-Rmin = 48 – 12 = 36
Bước 2: Tính khoảng của nhóm : 36 : 10 = 3,6 , chẵn hoá là 4.
Bước 3 : Tính khoảng của nhóm có giá trị nhỏ nhất: 12 + 3= 15 , ta có nhóm có giá trị nhỏ
nhất là 12-15, tư dó xây dưng nên các nhóm có giá trị cao hơn, đếm các giá trị nằm trong tập
số liệu để tìm tần số của nhóm, kết quả ta có tập số liệu trên được phân nhóm như sau:
5


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010


Khoảng điểm
48 - 51
44 - 47
40 - 43
36 - 39
32 - 35
28 - 31
24 - 26
20 - 23
16 - 19
12 - 15

Tần số
2
6
7
7
5
10
1
1
7
4

1.2. Số trội (Mo):
Số trội (Mo) là số có tần suất lớn nhất (chính là số có tần số xuất hiện lớn nhất ) trong
tập số liệu kết quả đo.
1.3. Khoảng của tập số (R):
Khoảng của tập số ,R , là khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất của tập
số liệu kết quả đo. Như vậy, khoảng của tập số được tính theo công thức sau:

R = Xmax - Xmin
1.2
1.4. Số trung vị (Med) và số tứ phân vị (Q):
Số trung vị (Med) là số đứng giữa tập số liệu đã được xắp xếp theo thứ tự từ bé đến
lớn, chia dãy số đó làm 2 phần bằng nhau về số số liệu.
a/ Đối với các số liệu không nhóm lại :
Giả sử X1, X2 ,X3 .....Xn là dãy các giá trị của tập số liệu kết quả đo, được sắp xếp theo
thứ tự tăng dần, thì :
-Số trung vị của tập N số lẻ được tính theo công thức sau:
Med = X N +1
1.3
2

Ví dụ 3 : Tìm trung vị của tập số : 5 , 7 , 9 , 1 3 , 1 5 , 1 6 , 1 9
Giải: Med = X(7+1)/2 = X4 , số thư 4 là số 13 vậy Med =13
-Số trung vị của tập N số chẵn được tính theo công thức sau:

1
Med = [ X N + X N ]
+1
2 2
2

1.4

Ví dụ 4: Tìm trung vị của tập số : 3 , 5 , 7 , 9 , 1 3 , 1 5 , 1 6 , 1 9
Giải: Med =

1
[ X 8 + X 8 ] = (X4 +X5)/2 , vậy Med = (9 +13)/2 = 11

+1
2 2
2

b/ Đối với số liệu gộp thành nhóm :
- Tìm trung vị tập số liệu có phân nhóm theo công thức sau:
N
− cf
M Meadian = LL + ( 2
)×i .
1.5
fm
Trong đó :
LL = Giới (lowest limit); N = Tổng số trường hợp
cf = Tần số dồn (cumulative frequency)
fm = Tần số ứng với khoảng điểm kế tiếp với khoảng điểm có tần số dồn được chọn
i = Giá trị khoảng điểm (interval)
6


Ví dụ 5: Tính giá trị trung vị cho tập số liệu sau:
X
51 – 53
48 – 50
45 – 47
42 – 44
39 – 41
36 – 38
33 – 35
30 – 32

27 – 29
24 – 26
21 – 23
18 – 20
15 – 17

F
3
4
2
8
1
3
9
2
3
5
6
0
4

Cf
50
47
43
41
33
32
29
20

18
15
10
4
4

Me

Me

Giải:
M Meadian

50
− 20
) × 3 = 32,5 + 1,3 = 33,8 .
= 32,5 + ( 2
9

Số tứ phân vị là các số chia tập số liệu thành 4 phần tư. Có 3 số tứ phân vị là Q1= X1/4,
Q2= X2/4 và Q3= X3/4. Số Q2= X2/4 trùng với số trung vị Med.
a/ Đối với các số liệu không nhóm lại :
-Số tứ phân vị của tập N giá trị chia hết cho 4, thì tính theo công thức:
1
Q1 = [X N + X N ]
1.6
+1
2
4


4

1
Q3 = [ X 3 N + X 3 N ]
+1
2
4

1.7

4

Ví dụ :Tìm Q1 và Q3 của tập số liệu:
- Số tứ phân vị của tập N không chia hết cho 4, thì tính theo công thức :
Q1 = X N

Q3 = X 3 N
4

+1

4

+1

b/ Đối với số liệu gộp thành nhóm :
Giả sử nhóm thứ i ( Xi, Xi + 1 ) có ni giá trị nằm trong nhóm đó và ta có
∑ ni = N

1.8


1.9

i

thì Med nằm trong nhóm thứ k ( Xk, Xk + 1) được tính như sau :

Me =

N k −1
− ∑ ni
2 i =1
nk

(X k +1 − X k ) + X k

Tương tự, các tứ phân vị được xác định theo công thức chung sau đây:

1.10


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

Qs =

N k −1
S. − ∑ n i
4 i =1
nk


(X k +1 − X k ) + X k ; Với S = 1, 2, 3.

1.11

Trong thực tế, người ta tính tứ phân vị Q1 và Q3 cho một tập số liệu có phân nhóm theo công
thức giống như công thức tính trung vi, tuy nhiên có sự khác nhau về vị trí nên công thưc có
khác nhau chút ít:
N
3N
− cf
− cf
Q1 = LL + ( 4
)×i .
1.12
Q3 = LL + ( 4
)×i .
fm
fm
Ví dụ 6: Tính Q1 và Q3 cho tập số liệu phân nhóm sau đây:
x
F
Cf
Q1
Q3
90 -94
2
45
85 – 89
6
43

80 – 84
3
37
75 – 79
0
34
Q3
70 – 74
5
34
65 – 69
3
29
60 – 64
2
26
55 – 59
6
24
50 – 54
4
18
Q1
45 – 49
5
14
40 – 44
3
9
35 – 39

2
6
30 – 34
1
4
25 – 29
0
3
20 – 24
3
3
45
−9
11,5 − 9
Q1 = 44,5 + ( 4
) × 5 = 44,5 + (
) × 5 = 44,5 + 2, 25 = 46, 75 .
5
5
33, 75 − 29
Q3 = 69,5 + (
) × 5 = 69,5 + 4, 75 = 74, 25 .
5
1.5. Trung bình cộng:
Gọi X là giá trị trung bình cộng của một tập số liệu không phân nhóm thì X được
tính theo công thức sau:

X=

1 N

∑ Xi
N i =1

khi Xi xuất hiện ni lần thì tính theo :
với

X=

1.13
1
∑ niXi
N i

1.14

N = ∑ ni
i

Ví dụ 7: Điểm thi môn toán của 10 học viên thuộc nhóm khá là : 78, 79, 62, 84, 90, 71, 76,
83, 98, 77. Điểm trung bình của 10 học viên là:

X=

1 N
78 + 79 + 62 + 84 + 90 + 71 + 76 + 83 + 98 + 77
Xi =
= 79 điểm

N i =1
10

8


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

Trong trường hợp tập số liệu được phân nhóm, giá trị trung bình cộng được thính
theo công thức tổng quát sau:

X=

f1 x1 + f 2 x2 + ... + f k xk 1
= ∑ f i xi
f1 + f 2 + ... + f k
N

1.15

Trong đó : xi là giá trị trung bình của nhóm, fi tần số của nhóm.
Ví dụ 8: Điểm thi trắc nghiệm của 100 học viên cho ở bảng sau:
Điển số
Tần số
Giá trị trung Tần số x giá trị trung
bình nhóm
bình nhóm
90 ~100
8
95
760
80 ~89
10

85
850
70 ~79
10
75
750
60 ~69
30
65
1950
50 ~59
20
55
1100
40 ~49
12
45
540
30 ~39
5
35
175
20 ~29
2
25
50
10 ~19
2
15
30

0~9
1
5
5
Tổng
100
6210
Khi đó, X = 1 ∑ f i xi = 6210 = 62,1
N
100
Công thức tính giá trị trung bình cho tập số liêu phân nhóm cũng dùng cho trường hợp tính
giá trị trung bình gia quyền (có trọng số), khi đó fi trọng số của giá trị xi .

Trong thực tế, người ta tính giá trị trung bình của một tập số liêu phân nhóm theo
công thức sau:
∑ fd ).i
1.16
X = Mean = Am + (
N
Trong đó : Am = Số trung bình cộng giả thiết (Assumed mean).
f = Tần số (Frequency),
d = Độ lệch (deviation)
i = Khoảng điểm (interval), N = Số lượng các trường hợp (Numbers).
Ví dụ 9: Tính số trung bình công của các điểm số được nhóm thành các khoảng điểm của
tập số liêu sau.
x
F
D
Fd
90 - 94

2
5
10
85 – 89
2
4
8
80 – 84
5
3
15
75 – 79
7
2
14
70 – 74
10
1
10
65 – 69
11
0
0
60 – 64
8
-1
-8
55 – 59
3
-2

-6
50 – 54
0
-3
0
45 – 49
2
-4
-8
N = 50
Σ fd = 35
Giải:
35
X = Mean = 67 + ( ).5 = 67 + 0, 7.5 = 70,5
50
9


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

1.6. Trung bình nhân :

GMx = n x1 x 2 x3 ...x n

1.17

Thường dùng để tính tốc độ tăng trung bình của tăng theo cấp số, sự pha loãng . . .
Ví dụ 10: Thống kê số học viên tại chức đăng ký dự thi trong 4 năm của một cơ sở đào tạo
cho ở bảng dưới đây. Tính 1/ Bình quân số đăng ký dự thi trong 4 năm, 2/ Tốc độ đăng ký dự
thi tăng bình quân trong 4 năm.

Năm
2000
2001
2002
2003
Số đăng ký thi
500
800
1600
3200

Giải :
1- Bình quân số đăng ký dự thi trong 4 năm là:
GMx = 4 500x800x1600x3200 = 1196 học viên
2- Tốc độ tăng từng năm:
2001 là 800:500 =1.6 ;

2002 là : 1600:800 =2 ;

2003 là 3200:1600 = 2

Vậy tốc độ đăng ký dự thi tăng bình quân trong 4 năm là:
GMx = 3 1,6 x 2 x 2 = 1,86 , tức bình quân tốc độ đăng ký dự thi tăng 186% so với nămg trước.
Nói một cách khác, hàng năm tốc độ tăng bình quân đăng ký dự thi là 86%.
1.7. Trung bình điều hoà :

HMx =

1


1.18

1 N 1

N 1 xi

Dùng để tính vận tốc, thời gian trung bình. . .
Ví dụ 11: Trung bình 1 giờ, học viên A giải được 8 bài toán, học viên B giải được 7 bài toán,
học viên C được 10 bài toán. Tính tốc độ giải toán bình quân của 3 học viên trên.
Giải:
3
HMx=
= 8,15 bài / 1 giờ
1 1 1
+ +
8 7 10
1.8. Trung bình của hệ : (trung bình gia quyền)

X h=

N A X A + N B X B + ... + N k X k
N A + N B + ... + N K

1.19

Dùng để tính trung bình của hệ gồm nhiều tập số liệu hoặc tập số liệu có trọng số . . .
Ví dụ 12: Tính điểm bình quân của 5 lớp khối 10 thi môn Toán theo bảng dữ kiện sau:
Lớp
A
B

C
D
E
Sĩ số
45
50
40
50
60
Điểm TB
80
70
65
80
65

Giải:

X=

45 × 80 + 50 × 70 + 40 × 65 + 50 × 80 + 60 × 65 17000
=
= 69, 4
45 + 50 + 40 + 50 + 60
245
10


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010


2. Các tham số đặc trưng cho sự phân tán của tập số liệu :
2.1. Phương sai (σ2 hoặc S2):
Phương sai là trung bình của tổng bình phương sai khác giữa các giá trị của tập số liệu
so với giá trị trung bình của tập số liệu kết quả đo:

σ2
Với:

hay

S2 =

1 N
∑ (X i − X) 2
N' i =1

1.20

N' = N - 1 khi N < 30 (S2).
N' = N khi N > 30 (σ2).
N' có bản chất là bậc tự do của tập số liệu kết quả đo.

công thức thực dụng để tìm phương sai:
N

S2 =

1 N
{∑ (X i 2 −
N' i =1


(∑ X i ) 2
i =1

}

N

Phương sai của hệ :
N S *2 + N B S B*2 + N A ( X A − X ) + N B ( X B − X )
S2 h = A A
N A + NB −1

1.21

1.22

( N A − 1) S A2
( N B − 1) S B2

S*2B=
NA
NB
Phương sai đặc trưng cho sự sai biệt của các số liệu trong kết quả đo. Phương sai càng
lớn, sai biệt càng lớn. Ngược lại phương sai càng nhỏ thì sai biệt càng nhỏ.
Phương sai còn biểu diễn độ phân tán của tập số liệu kết quả đo đối với giá trị trung
bình. Phương sai càng lớn độ phân tán chung quanh giá trị trung bình càng lớn và ngược lại.
Trong đó :

S*2A=


2.2. Độ lệch chuẩn (σf hoặc Sf):
Độ lệch chuẩn của một tập số liệu kết quả đo là giá trị căn bậc 2 trị số phương sai của nó:
σf = σ2
hoặc S f = S 2
Độ lệch chuẩn có cùng thứ nguyên và cũng có ý nghĩa như phương sai.
Trong thực tế, người ta hay tính độ lệch chuẩn theo công thức sau đây:
S=

∑ ( xi − x)
N

2

=

∑d

2

N

Ví dụ 13: Xác định S của các điểm số không phân nhóm sau đây:
X
D
d2
92
+9
81
75

-8
64
85
+2
4
83
0
0
90
+7
49
73
-10
100
79
-4
16
80
-3
9
88
+5
25
83
0
0
2
N = 10
Σd = 348


11

1.23

1.24


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

Mean = 83

S=

∑ ( xi − 83)
10

2

348
= 5,89
10

=

Ví dụ 14: Tính độ lệch chuẩn của tập số liệu được phân nhóm sau đây
2

70 − 74
65 − 69


X
72
67

f
2
5

f X
114
335

f X
10368
22445

60 − 64
55 − 59
50 − 54

62
57
52

9
8
6

558
456

312

34596
25992
16224

N = 30,

σx =

∑ fX = 1805 , ∑ fX

2

= 109 625

109 625 1805 2
) = 5,8
−(
30
30

Ví dụ 15: Tính độ lệch chuẩn của hệ gồm 3 loại 1, 2 và 3 :

Loại

Ni

Xi


σi

1

12

80

8.578

2

11

77.8

6.820

3

9

81.4

9.912

N = 12 + 11 + 9 = 32,
1
X = ( N1 X 1 + N 2 X 2 + N 3 X 3 )
N

12 × 80 + 11× 77.8 + 9 × 81.4
=
= 79, 638
32

d12 = (80 − 79.638) 2 = 0.131,
d 22 = (77.8 − 79.638) 2 = 3.378,
d32 = (81.4 − 79.638) 2 = 3.105,
s=

1
⎡⎣12(8.5782 + 0.131) + 11(6.8202 + 3.378) + 9(9.912 2 + 3.105) ⎤⎦ = 8,56
32

2.3.Độ sai chuẩn ( σ X hoặc S X ):
Độ sai chuẩn bằng độ lệch chuẩn chia cho căn bậc 2 của số giá trị kết quả đo:
S
σ
hoặc
1.25
SX = f
σX = f
N
N

Độ sai chuẩn có thể hiểu là trung bình phân tán của các giá trị kết quả đo.

12



Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

2.4.Hệ số biến thiên (Cv):
Hệ số biến thiên là tỷ số giữa độ lệch chuẩn với giá trị trung bình:
S
C V = f .100
X

1.26

Vì hệ số biến thiên không có thứ nguyên, cho nên có thể dựa vào hệ số biến thiên để
so sánh gần đúng độ sai biệt của các kết quả đo thu nhận được bằng các cách khác nhau.
Khi độ lệch chuẩn lớn (Sf) ( tức sai biệt của các số liệu đo lớn), thì Cv lớn và ngược
lại.
Ví dụ 16: Đánh giá sự phát triển của trẻ 7 tuổi theo cân nặng trung bình là 20,37 kg với độ
lệch chuẩn là 2,16 kg; trong khi đó, nếu đánh giá theo chiều cao trung bình là 113,64 cm với
độ lệch chuẩn là 4,04 cm. Hỏi đánh giá nào mắc sai số lớn hơn?
Giải:
Theo cân nặng:

CV =

2.16
× 100% = 10.6%
20.37

CV =

4.04
× 100% = 3.56%

113.64

Theo chiều cao:

Vậy theo cân năng mắc sai số lớn hơn.
Ví dụ 17: 10 người học có điểm trung bình môn Toán và môn ngoại ngữ tương ứng là 85 và
72, trong khi đó học có độ lệch chuẩn của môn Toán và ngoại ngữ đều là 6,82.
Tính Cv cho môn toán là:

CV1 =

6.82
× 100% = 8.02%
85

Còn Cv cho môn ngoại ngữ là

CV2 =

6.82
= 9.47%
72

Vậy, tuy có đô lệch chuẩn giống nhau, nhưng sai số đối với môn ngoại ngữ lớn hơn.
3. Các đặc trưng phân phối thống kê của tập số liệu:
Đặc trưng phân phối thống kê của một tập số liệu kết quả đo là qui luật phân bố ngẫu
nhiên của các giá trị kết quả đo trên trục số thực. Đặc trưng phân phối thống kê là qui luật,
nên về mặt toán học nó thường được biểu diễn bằng một hàm số và có đồ thị tương ứng.

Mỗi tập số liệu kết quả nghiện cứu là một tập số ngẫu nhiên (thường là rời rạc) có

những đặc trưng phân phối thống kê riêng và thường tuân theo 1 trong 6 qui luật phân phối
thống kê ngẫu nhiên phổ biến nhất, đó là:
3.1. Phân phối chuẩn (phân phối Gauss)( u):
- Hàm số của phân phối chuẩn được biểu diễn bằng phương trình toán học:
( X −μ )
1

Y(X) =
e 2σ 2
σ 2π

13

2

1.27


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

Trong đó:
X : là biến số ngẫu nhiên.
μ : là hằng số, bằng giá trị kỳ vọng của biến ngẫu nhiên .
σ : là hằng số, bằng giá trị phương sai của biến ngẫu nhiên.
Gọi u là chuẩn Gauss và đặt:
X −μ
u=

σ


1.28

thay vào phương trình trên ta được dạng chính tắc của hàm phân phối chuẩn:
2

u
1

Y(u ) =
e 2
σ 2π

1.29

-

Dạng chính tắc của hàm phân phối chuẩn là dạng của hàm phân phối chuẩn đã chuyển hệ toạ
độ từ Y(X) sang Y(u).
-

Đồ thị của hàm phân phối chuẩn:
f(x)

-3σ

-2σ



μ

68.26%
95.44%
99.74%



+2σ

+3σ

Nếu đặt σ là đơn vị của thang chia trục hoành mà giá trị của nó được xác định từ điểm uốn
của đường cong chuẩn hạ xuống trục hoành, μ là tham số đặc trưng cho sự tập trung các giá
trị của hàm phân phối, thì hàm phân phối chuẩn có dạng chuông úp ( xem trang bên)
Hàm phân phối chuẩn có đặc diểm là: X ≅ Mo ≅ Med ≅ μ
- Dạng tích phân của hàm phân phối chuẩn:
f(x)

f(x)

a)

b)

+∝

u1

+∞

a/


∫ Y(u )du = F(u ) = 1 = tần suất dồn từ

-∞ đến +∞

−∞
+u

b/

∫ Y(u)du = F(u) = P = tần suất dồn từ

−u

14

-u đến +u

+∝


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

-ý nghĩa hình học của tích phân là diện tích giới hạn bởi đường cong :
F(-1σ , +1σ) = 68,27 %,
F(-2σ, +2σ) = 95,45 %,
F(-3σ, +3σ) = 99,73 %
Diện tích này chính là tần suất dồn của các giá trị nằm trong vùng lấy tích phân. Diện
tích này cũng biểu diễn xác suất xuất hiện của các giá trị Xi nằm trong vùng lấy tích phân.
Xác suất thống kê gắn liền với khái niệm độ tin cậy thống kê (P). Diện tích giới hạn

bởi đường cong cũng chính là độ tin cậy thống kê để xuất hiện Xi trong khoảng tích phân. Kí
hiệu độ tin cậy thống kê để xuất hiện giá trị Xi nằm trong vùng (- ∞, Xi) là P(Xj).
Độ tin cậy thống kê luôn là một số nhỏ hơn hoặc bằng 1 ( P(Xj) ≤1 ).
Nếu kí hiệu ∝ là Độ không tin cậy thống kê, thì:
P+α=1
hay P = 1 - α hoặc α = 1 - P
Khi P =1, điều đó có nghĩa là xác suất xuất hiện giá trị Xi là 100%.
Trong xác suất, người ta qui ước:
Biến cố có P = 0.9999 là biến cố hoàn toàn chắc chắn.
Biến cố có P = 0.999 là biến cố hết sức chắc chắn.
Biến cố có P = 0.99 là biến cố rất chắc chắn.
Biến cố có P = 0.95 là biến cố chắc chắn.
Biến cố có P = 0.90 là biến cố có chiều hướng chắc chắn.
Từ hàm phân phối chuẩn, khi cho một giá trị ui (X) thì ta tính được độ tin cậy thống kê
Pi, ứng với một diện tích Pi . Ngược lại, khi cho giá trị Pj thì có thể tính được một giá trị uj(X).
Thay cho tính toán, người ta lập sẵn những bảng số để tra giá trị u khi biết giá trị P hoặc
ngược lại (xem phụ lục A).
3.2 Phân phối student (phân phối t):
Hàm số của phân phối student có dạng:
−f +1

t2 2
y( t , f ) = B(1 + )
f

tf =

Với

tf =


X −μ
Sx

X −μ
u
=
S f .σ f
S
N .σ f

1.30

hoặc

Xi − X
Sf

khi N

∞ thì

1.31

S

σ và t

u


σ

Sf là độ lệch chuẩn, S x là độ sai chuẩn
Hàm phân bố t phụ thuộc vào biến số t là một biến ngẫu nhiên.
f : bậc tự do (f = N - 1). ;
B : là một hằng số.
Sf: độ lệch chuẩn. Vậy t bao giờ cũng phụ thuộc vào bậc tự do.

15

1.32


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

- Đồ thị của hàm phân phối student:
f(

N(0,1)
t12
t5
t2
t1
t1 < t2 < t3

-3

-2

-1


0

+1

+2

+3

Khi Xi là số có tần số rất lớn (tức là số có tần suất rất lớn) thì có thể suy ra gần đúng Xi ≅ X
(giá trị có tần suất rất lớn thì giá trị của nó coi như trùng với giá trị trung bình).
Đồ thị của hàm Student giống như hàm phân phối chuẩn có dạng chuông úp. Nó có
đầy đủ các tính chất giống như hàm phân phối chuẩn. Nhưng khác ở chỗ:độ nhọn của đồ thị
hàm phân phối student phụ thuộc vào bậc tự do Y(p, f).
Bậc tự do càng lớn thì độ nhọn càng nhỏ và ngược lại. Do độ nhọn phụ thuộc vào bậc
tự do, nên giá trị chuẩn t cũng phụ thuộc vào bậc tự do t(p,f).Trong thực tế, người ta nhận thấy
:
N > 30: tuân theo phân phối chuẩn.
N < 30: tuân theo phân phối Student.
Đối với phân phối Student cũng có bảng tra chuẩn Student tính sẵn. Dựa vào bảng
này, khi biết hai trong ba giá trị t, f và P thi xác định được giá trị còn chưa biết.
Có 2 loại bảng tra giá trị t (gọi là bảng phân vị của chuẩn t). Khi giả thiết thống kê đặt là :
* Nếu giả thiết :
*Nếu giả thiết :
-H0 : Xi = Xk
-H0 : Xi = Xk
-Ha : Xi > Xk hoặc Xi < Xk
-Ha : Xi ≠ Xk
Thì tra bảng phân vị
Thì tra bảng phân vị

của chuẩn t theo 1 phía.
của chuẩn t theo 2 phí
f(t

f(t)

α

α/

α/

0

0

3.3 Phân phối Fisher
Hàm số của phân phối Fisher có dạng:

Y(F, f1, f2) = A

F

(

f1 − 2
)
2
f1 + f 2
2


1.28

(f 2 - f1 )
Trong đó: F là biến số ngẫu nhiên; f1, f2 là các bậc tự do ; A là hằng số phụ thuộc f1 và f2.
F phụ thuộc vào hai loại bậc tự do và được tính theo công thức sau
16


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

F=

S12
S 22

=

χ

2
f1

χ

2
f2

Với


0 ≤ F≤+∞

1.33

Đồ thị của hàm Fisher có dạng:
f(x)
1

1,10
10,20
5,10

0.5

3,6

0

1

2

3

4

x

Tuỳ thuộc vào bậc tự do mà đồ thị có các dạng khác nhau. Hàm phân phối Fisher cũng
có tính chất như các hàm phân phối khác. Diện tích giới hạn bởi đường cong cũng biểu diễn

độ tin cậy thống kê.
Người ta cũng lập các bảng tra sẵn, khi cho (P, f1 và f2) sẽ tra được giá trị của chuẩn
F, ngược lại cho 3 trong 4 thông số ( F,P,f1,f2 ) sẽ tra được số thứ 4 chưa biết.
Có 2 loại bảng số chính để tra chuẩn F: Bảng F(0.95,f1, f2) và bảng F(0.99,f1,f2) (xem
phụ lục A).
3.4 Phân phối Khi bình phương:
Hàm số của phân phối Khi bình phương có dạng:
f −2
χ2
2
2 2
2
Y (χ , f ) = C.e (χ )

Với:

N

X −X 2
χ = ∑( i
)
σf
i =1
2

1.34

Khi lấy các giá trị : 0 < χ < + ∞

1.35


Hàm Khi bình phương chỉ phụ thuộc vào 1 bậc tự do.
Đồ thị của hàm phân phối Khi bình phương có dạng:
f(x)
05

1
3
5

0

7
10

5

15

x

Nếu cho trước độ tin cậy thống kê P và giá trị f, tra bảng sẽ tìm được giá trị χ2 và ngược lại.

17


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

3.5 Phân phối Poisson:
-Hàm số của phân phối Poisson có dạng:

Y(X) =

μ X .e −μ
X!

Với σ = μ

1.36

Như vậy, kì vọng và phương sai của hàm phân phối Poisson trùng nhau.
-Đồ thị của hàm phân phối Poisson có dạng :
p(x
0.

0

5

10

3.6. Phân phối nhị thức :
-Hàm phân phối của các phép thử lặp ( Phép thử Becnuli ) có dạng :
P{ X=n } = CNn . pn.(1- p )N-n

1.37

Trong đó: N = số lần thử nghiệm.
n = số lần biến cố A xuất hiện
Khi đó: nếu X là biến ngẫu nhiên có đặc trưng phân phối thống kê với tham số ( N,p )
là phân phối nhị thì:

- Kì vọng của biến ngẫu nhiên X là: Np
- Phương sai của biến ngẫu nhiên X là : σ2 = Npq
1.38
- Độ lệch chuẩn của biến ngẫu nhiên X là : σ = Npq
- Độ sai chuẩn của biến ngẫu nhiên X là: σ x = pq
-Đồ thị của hàm phân phối nhị thức có dạng :
p(x)
r=5
p=

02

0

5

10

x

Cần phân biệt khái niệm hàm phân phối và chuẩn phân phối (chuẩn thống kê):
- Hàm phân phối là qui luật phân bố số liệu kết quả đo có tính ngẫu nhiên (các biến
ngẫu nhiên).
- Chuẩn phân phối (chuẩn thống kê) là những giá trị của hàm phân phối tính được theo
điều kiện cho trước.
18


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010


Như vậy chuẩn phân phối có 2 dạng: Giá trị tra bảng và Giá trị tính được.
Người ta so sánh giữa giá trị tra bảng và giá trị tính được để đánh giá độ tin cậy thống
kê của một sự kiện, theo điều kiện cho trước (theo giá trị tra bảng).
3.7 Mối quan hệ giữa các hàm phân phối và các chuẩn phân phối:
Ta có nhận xét, một tập số liệu kết quả thực nghiệm phụ thuộc vào bậc tự do:
+ 2 bậc tự do thì tuân theo hàm F.
+ 1 bậc tự do thì tuân theo hàm t hoặc χ 2
+ Không phụ thuộc vào tự do thì tuân theo hàm u hoặc P.
Trong thực nghiệm, cách xác định định tính luật phân phối của 1 tập số liệu kết quả
đo như sau:
-Nếu N >30 và có 1 trong 3 tính chất sau thì tập số liệu kết quả đo có qui luật phân
phối chuẩn:
1/ Đồ thị phân phối tần suất có dạng chuông.
2/ Mo ≅ Med ≅ X .
X ± 2 σ là 5% hoặc
3/ Xi nhận các giá trị ở ngoài khoảng
X ± 3 σ là 1%.
Xi nhận các giá trị nằm ngoài khoảng

-Nếu N < 30 và có 1 trong 3 tính chất trên thì tập số liệu kết quả đo có qui luật phân
phối Student
Sơ đồ sau đây cho thấy các qui luật phân phối thống kê đã trình bày chỉ là 1 trường
hợp riêng của nhau mà thôi:
Phân phối F

F=

S12
S 22


Y(F,f1,f2)
Y(F,f1,f2) →Y(χ2,f)

Y(F,f1,f2)→Y(t,f)
f1 = 1, f2 = f

F = t2 = χ2 /f

f1 = f, f2 = ∞
Phân phối χ2

Phân phối t

X −μ
tf =
Sx
f=∞
Y(t,f) →Y(u)
t=u

χ2 =

Y(t,f)

Phân phối chuẩn
Y(u)

Y(X)

P→0

N→ ∞
Phân phối nhị thức
Y(p,q)
19

Y(χ2,f)

f=1
Y( χ2 ,f) →Y(u)
χ2 = u
X −μ
u=
σ

μ= σ2
X > 15

Phân phối Poisson

f.S2N
2

P=

μ X −μ
.e
X!


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010


CHƯƠNG 2
ĐÁNH GIÁ TẬP SỐ LIỆU KẾT QUẢ ĐO.
Một tập số liệu kết quả đo có thể được phân tích đánh giá thông qua các đại lượng
chính sau đây:
4.1. Sai số đo:
Có 4 loại sai số đo:
- Sai số tuyệt đối:
εA = Xi - X ≡ Xi - μ

2.1

Sai số tuyệt đối là sự sai khác của một giá trị đo nào đó với giá trị trung bình
( hoặc giá trị thật ). Sai khác này có thể là âm hoặc dương.
- Sai số tương đối:

εR =

Xi − X
X

.100 =

Xi − μ
X

.100

2.2


Sai số tương đối là tỷ số của sai số tuyệt đối đối với giá trị trung bình. Sai số này
không có thứ nguyên cho nên được dùng để so sánh sai số tương đối của các phương pháp đo
cho kết quả không cùng thứ nguyên.
- Sai số hệ thống:

ΔX = X - μ ≠ 0

2.3

Nếu hiệu số này là đáng tin cậy tức là khác không là đáng tin cậy thì số đo đã mắc sai
số hệ thống. Khi đó giá trị Xi tập trung về một phía của giá trị thực trên trục số. Sai số hệ
thống có thể tìm được nguyên nhân gây sai số hệ thống để loại bỏ.
- Sai số ngẫu nhiên:
ΔX = X - μ ≈ 0
2.4
đo mắc sai số ngẫu nhiên khi hiệu số giữa giá trị trung bình cộng X với giá trị thật
gần bằng không là đáng tin cậy. Khi đó các giá trị Xi phân bố đều hai phía của giá trị thực trên
trục số. Sai số ngẫu nhiên bao giờ cũng mắc phải và chỉ có thể tìm các giải pháp để giảm sai
số ngẫu nhiên.
4.2. Độ chính xác của tập số liệu kết quả đo.
Vì trung bình cộng biểu diễn độ tập trung của các giá trị thực nghiệm nên độ chính xác
của tập số liệu kết quả đo được đánh giá thông qua giá trị trung bình cộng. Giá trị trung bình
cộng mà sai khác với giá trị thật càng nhỏ thì độ chính xác của số đo càng lớn và ngược lại.
Nguyên nhân dẫn đến độ chính xác kém có thể là:
- Chọn mẫu không đúng về chất lượng và số lượng
- Giải pháp đo số liệu không chính xác
4.3.Độ sai biệt của tập số liệu kết quả đo:
Vì phương sai biểu diễn độ sai biệt trung bình của các giá trị trong tập số liệu kết quả
đo so với giá trị trung bình. Phương sai càng nhỏ thì độ sai biệt càng nhỏ và ngược lại.
Nguyên nhân chính dẫn đến độ sai biệt lớn:

- Chọn mẫu về chất lượng và số lượng không đặc trưng cho mục tiêu đo.
- Tay nghề người làm đo kém, không thu thập được số đo.
20


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

Thực ra giá trị trung bình cộng X cũng phản ánh phần nào độ sai biệt khi so với giá
trị thật và ngược lại giá trị phương sai S2 cũng phản ánh phần nào độ chính xác khi độ sai biệt
nhỏ. Tuy nhiên mỗi đại lượng có tính trội biểu diễn cho độ chính xác và độ sai biệt khác nhau:
X có tính trội phản ánh độ chính xác, S2 có tính trội phản ánh độ sai biệt.
Hình vẽ minh hoạ độ chính xác và độ sai biệt.

Độ sai biệt (Precision) :
Độ chính xác (Accuracy):
Kết luận
:

Cực kỳ nhỏ
Cực kỳ tốt
Đúng - Tốt

lớn
Tốt
Sai số ngẫu nhiên

nhỏ
Tồi
Sai số hệ thống


4.4 Sai số tối đa cho phép ΔP(X).
Sai số tối đa cho phép ΔP(X) của một tập số liệu kết quả đo được qui định: cho phép
lấy các giá trị Xi sai khác với giá trị trung bình X lớn nhất là ±3σ. Nó phản ánh tính thống
kê của kết quả đo. Sai số tối đa cho phép chia làm hai loại:
+ Sai số tối đa cho phép tuyệt đối:
ΔP(X) = ±3σ
2.5

+ Sai số tối đa cho phép tương đối:
ΔP(X) ± 3σ
=
.100
X
X

2.6

Sai số tối đa cho phép tương đối được biểu diễn dưới dạng phần trăm (%) do đó không
còn thứ nguyên, dùng để so sánh sai số tối đa cho phép tương đối của phương pháp đo này với
sai số tối đa cho phép tương đối của phương pháp đo khác.
Những giá trị kết quả đo nào nằm ngoài khoảng sai số tối đa cho phép tuyệt đối thì
phải loại bỏ (và gọi các giá trị đó đã mắc sai số thô ).
4.5. Khoảng chính xác tin cậy:
Khoảng chính xác tin cậy được tính theo công thức sau:
ΔX(P,f) = X - μ = t(P,f). Sx
Trong đó:
P: độ tin cậy thống kê.
f: bậc tự do của tập số liệu kết quả đo
S x : Độ sai chuẩn.


2.7

Khoảng chính xác tin cậy của một tập số liệu kết quả đo chính là khoảng sai khác giữa
giá trị trung bình với giá trị có một độ tin cậy thống kê cho trước. Như vậy khoảng chính xác
tin cậy của 1 tập số liệu kết quả đo phụ thuộc vào độ tin cậy thống kê (P) và bậc tự do (f).
Khoảng chính xác tin cậy của mỗi giá trị kết quả đo được tính như sau:
ΔXi(P,f) = Xi - X = t(P,f).Sf
2.8
t(P,f): là giá trị tra ở bảng phân vị của hàm phân phối Student.
21


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

Khi một tập số liệu kết quả đo có khoảng chính xác tin cậy không thoả mãn với độ tin
cậy thống kê (P) cho trước thì có thể tăng thêm số mẫu (N) đo. Số mẫu đo cần thiết để có
khoảng chính xác tin cậy trùng với khoảng chính xác tin cậy lý thuyết cho trước, được tính
theo công thức sau:

⎧ t (P, f ).S f ⎫
N=⎨

⎩ ΔX ⎭

2

Trong đó: ΔX là cho trước.

2.9


4.6. Khoảng giới hạn tin cậy của một tập số liệu kết quả đo:
Khoảng giới hạn tin cậy của một tập số liệu kết quả đo được qui định nằm trong
khoảng:
X ± ΔX(p,f) = X ± t(p,f). Sx
2.10

Giá trị Xi bất kỳ của một tập số liệu kết quả đo được chấp nhận theo độ tin cậy thống
kê P cho trước, có bậc tự do f = N-1 phải luôn nằm trong khoảng giới hạn tin cậy và thường
được biểu diễn như sau:
2.11
Xi ( X - ΔX ÷ X + ΔX)
Hay

P = [ X - t(p,f). Sx < Xi < X + t(p,f). Sx ]
Ví du 18: Cho một tập số liệu kết quả đo :
33 32 30
31
22
29
32
24
33 33 25
34
26
29
35
33
a/ Tinh các đại lượng đặc trưng của tập sô liệu trên.
b/ Phân tích đánh giá tập số liệu.


2.12

34
34

Giải :

x18 =

1 18
∑ xi = 30,5
18 i =1

M0 = 33 (ni = 4)
Me = 33

S218 = 256,50/18 - 1 = 15,088
S18 = √ S2 = 3,9
Cv = 3,9/30,5 x 100 = 12,7%
95% CL = 30,5 ±

2,10 × 3,9
= 30,5 ± 1,93
18

P = ( 30,5 - 1,93 < xi < 30,5 + 1,93 ) = 95%
28,57 < xi < 32,43
99% CL = 30,5 ±

2,88 × 3,9

= 30,5 ± 2,65
18

P = ( 30,5 - 2,65 < xi < 30,5 + 2,65 ) = 99%
27,85 < xi < 33,15

22


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

CHƯƠNG 3
SO SÁNH CẶP THAM SỐ ĐẶC TRƯNG
CỦA HAI TẬP SỐ LIỆU KẾT QUẢ ĐO
5.1. Giả thiết thống kê và kết luận thống kê:
5.1.1.Giả thiết thống kê:
Giả sử ta có Xi và Xk là 2 tham số đặc trưng của 2 tập số liệu kết quả đo. Xuất hiện 2
giả thiết thống kê, trình bầy ở bảng sau:

Giả thiết thống kê
Giả thiết không
(giả thiết không liên quan)

Ký hiệu

í nghĩa

Biểu diễn

H0


Xi ≡ Xk

Xi - Xk ≡ 0

Giả thiết khác không
(giả thiết liên quan)

Ha
(H1)

Xi ≠ Xk
Xi>Xk;
Xi
Xi - Xk ≠ 0

Trong đó : Xi và Xk có thể là hai sự kiện, hai biến cố, hoặc hai đại lượng ngẫu nhiên
có cùng thứ nguyên.
5.1.2. Kết luận thống kê:
Có hai loại kết luận thống kê :

Thật
H0
(Xi ≡ Xk)
Ha
(Xi ≠ Xk)

Bảng phân loại các kết luận thống kê:
Kết luận thống kê

Kết luận thống kê
loại 2:
loại 1:
Giả
Bác bỏ H0;
Chấp nhận H0;
Chấp nhận Ha
Bác bỏ Ha
Ha
Sai
Đúng
(Sai
lầm
loại
1)
(Xi ≠ Xk)
H0
Đúng
Sai
( Sai lầm loại 2)
(Xi ≡ Xk)

+ Kết luận thống kê loại 1: Phủ định H0 (bác bỏ H0) và Khẳng định Ha (chấp nhận Ha).
Kết luận thống kê loại 1 dẫn đến sai lầm loại 1, đó là Đúng là H0 (xi ≡xk) lại kết luận là Ha (xi
≠ xk). Nói một cách khác: đúng là chúng giống nhau lại bảo chúng khác nhau.”
+ Kết luận thống kê loại 2: Phủ định Ha (bác bỏ Ha).Khẳng định H0 (chấp nhận H0).
Kết luận thống kê loại 2 dẫn đến sai lầm loại 2, đó là đúng là Ha (Xi ≠ Xk) lại kết luận là H0
(Xi ≡ Xk). Nói một cách khác : đúng là chúng khác nhau lại kết luận chúng giống nhau .
Cần nhớ rằng : Kết luận thống kê là khẳng định ( hay chấp nhận ) một giả thiết thống
kê này và phủ nhận ( hay bác bỏ ) giả thiết thống kê kia, chứ không có nghĩa là cho rằng giả

thiết thống kê này đúng còn giả thiết thống kê kia sai.
Trong trường hợp buộc phải kết luận thống kê thì phải giữ nguyên tắc: thà mắc sai
lầm loại 1 còn hơn mắc sai lầm loại 2. Nói cách khác: nếu không đủ bằng chứng để khẳng
định giả thiết H0, thì thà phủ nhận giả thiết H0, còn hơn khẳng định giả thiết H0.

23


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

5.2. Quan hệ giữa chuẩn phân phối và kết luận thống kê.
Các chuẩn phân phối có thể tính được từ các số liệu của tập số liệu kết quả đo:
X −X
X−μ
X −μ
t ( P ,f ) = i
hoặc =
u=
Sf
σ
Sx

S2
F( P,f1 ,f 2 ) = 1
S22

N

Xi − X 2
)

S
f
i =1

χ 2 ( P ,f ) = ∑ (

Sơ đồ quan hệ giữa chuẩn phân phối và kết luận thống kê:
f(x)
Ptt < Ptb

tt < tb
f(x)
Ptt ≡ Ptb

tt = tb
f(x)

Ptt > Ptb

tb < tt

- Nếu ttính < tbảng nghĩa là độ tin cậy thống kê của ttính nhỏ hơn độ tin cậy thống kê
của tbảng vậy thì ttính không đáng tin cậy bằng tbảng.
Do ttính không đáng tin cậy bằng tbảng nên hiệu số X - μ không đáng tin cậy, điều đó
có nghĩa sự khác nhau giữa giá trị trung bình và giá trị thật là không đáng tin cậy . Vì chúng
khác nhau không đáng tin cậy cho nên có thể coi như chúng giống nhau (chấp nhận H0, phủ
nhận Ha).
- Nếu ttính > tbảng , thì ttính có độ tin cậy thống kê lớn hơn độ tin cậy thống kê của tbảng.
Vì vậy ttính đáng tin cậy và do đó hiệu số X - μ chỉ sự sai khác giữa X và μ là đáng tin cậy
(phủ nhận H0, chấp nhận Ha).

- Nếu ttính = tbảng thì độ tin cậy bằng nhau cho nên X - μ thoả mãn độ tin cậy thống kê
cho trước. Nói cách khác độ chính xác tin cậy của tập số liệu kết quả đo thoả mãn độ tin cậy
24


Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-5/2010

thống kê cho trước. Trong trường hợp này, chúng ta chọn thà mắc sai lầm loại 1 còn hơn mắc
sai lầm loại 2 để kết luận thống kê. Nghĩa là thà kết luận X khác μ hơn là kết luận X giống
μ để chọn quyết định cho phù hợp.
Do tbảng phụ thuộc độ tin cậy thống kê ( P ) cho trước, nên một kết luận thống kê rút ra
được chỉ ứng với một độ tin cậy thống kê cho trước mà thôi. Khi độ tin cậy thống kê thay đổi
thì kết luận thống kê cũng có thể thay đổi theo.
Lập luận về quan hệ giữa chuẩn phân phối t và kết luận thống kê cũng áp dụng cho các
chuẩn phân phối khác. Và việc sử dụng các chuẩn phân phối của các hàm phân phối để kết
luận thống kê cho đúng - gọi là kiểm định thống kê. (xem các ví dụ cuối chương).
Ví dụ 19: Sử dụng 4 kết quả đo A,B,C và D. Kết quả làm lặp lại theo mỗi đo 6 lần thu được
trình bày trong bảng sau :
N
A
B
C
D
1
18,00
18,55
17,65
19,10
2
18,05

17,60
17,70
18,40
3
17,95
18,00
17,90
18,10
4
18,15
18,30
17,65
18,70
5
17,95
18,25
17,85
18,80
6
18,20
17,90
17,75
18,50

a/ Tính giá trị Trung bình và Phương sai của mỗi đo và nhận xét.
b/ Biết giá trị thật là 18,1. Phân tích đánh giá sai số của mỗi đo.
Giải :
A
B
C

D
X =
18,050
18,100
17,750
18,600
2
0,012
0,112
0,018
0,120
S =
A
B
C
D
17,000
tA =

18,000

18,05 − 18,1
0,012

= 0,354 << tb ( 95,5 ) = 2,57

6

Kết luận : H0 : x ≡ μ → sai số ngẫu nhiên
tC =


17,75 − 18,1
0,018

= 6,48 >> tb ( 95,5 ) = 2,57

6

Kết luận : Ha : x ≠ μ → sai số hệ thống.
25

19,000


×