Chương I
X
LÝ D
LI U TRONG CHĂN NUÔI THÚ Y
1. NG D NG MINITAB TRONG X LÝ S LI U
Minitab 14 for Windows XP ñư c s d ng ñ minh ho cho các bài t p trong ph n
giáo trình này. N u b n ñ c s d ng các phiên b n khác c a Minitab có th s khơng đư c
h tr m t s các cơng c và giao di n s khác so v i giáo trình này.
1.1. Kh i đ ng Minitab
N u cài ñ t Minitab 14 for Windows XP theo m c ñ nh ta có th kh i ñ ng ph n m m
b ng cách
1) Ch n bi u tư ng Minitab trên Desktop c a màn hình
2) Theo đư ng d n Stat > Progam > MINITAB 14 >
ho c
MINITAB 14
3) C:\Progam Files\MINITAB 14\Mtb14.exe
Giao di n ph n m m Minitab 14 for Windows XP g m m t s thành ph n chính: 1)
Menu Bar, 2) Standard toolbar, 3) Project Manager Toolbar, 4) Worksheet Toolbar, 5)
Title, 6) Session Window, 7) Data Window 8) Project Manager Window và 8) Status bar.
Menu
Bar Standard Toolbar
Project Manager Toolbar
Title
Worksheet Toolbar
Project Manager Windows
Session
Window
Data
Window
(Worksheet
Windows)
Status Bar
5
1.2. Nh t đ và th ng kê
a. Tóm t t d li u ñ i v i bi n ñ nh lư ng
Ví d 1.1: Kh i lư ng (gam) c a 16 chu t cái t i th i đi m cai s a như sau:
54,1
49,8
24,0
46,0
44,1
34,0
52,6
54,4
56,1
52,0
51,9
54,0
58,0
39,0
32,7
58,5
ð tính các tham s th ng kê mơ t
S li u đư c nh p vào vào c t trong Windows Worksheet
Thay th d u ph y (,) b ng d u ch m
(.) trong ph n th p phân. Ô s li u
khuy t ñư c thay th b ng d u sao
(*), khơng đư c đ tr ng.
C t s li u ph i
dư i d ng s .
ð i v i m t ch tiêu nghiên c u, s
li u ñư c nh p dư i d ng c t.
Tên c t s li u luôn n m trên hàng
th 1. ð t tên c t ng n g n, khơng
nên dùng các ký t đ c bi t (:, /…)
ho c các ký t ti ng Vi t (ơ, ă…).
Trong cùng m t worksheet khơng đ t
tên c t trùng nhau. Ph n m m Minitab
không phân bi t ñư c các ký t vi t
hoa và vi t thư ng (ví d : MINITAB
= Minitab = minitab).
Ch n Stat
Basic Statistics
Display Descriptive Statistics
Ph n ô bên trái h p tho i hi n th c t
(C1) và tên c a c t s li u (P)
Ch n P và nh n Select ñ hi n th c t
c n tính các tham s th ng kê mơ t
vào ô Variables.
Ch n OK ñ hi n th k t qu .
K t qu thu ñư c t Minitab như sau
Descriptive Statistics: P
Variable
P
6
N
16
N*
0
Mean
47.58
SE Mean
2.54
StDev
10.16
Minimum
24.00
Q1
40.28
Median
51.95
Q3
54.33
Maximum
58.50
Minitab cho k t qu theo m c ñ nh. Có th s d ng m t trong các tùy ch n (option)
sau ñây ñ cho ra k t qu phù h p
Ch n Statistics…có th l a ch n các tham s sau ñây
M t s thu t ng trong options Minitab c a th ng kê mô t
Minitab
Mean
Ti ng Vi t
Trung bình
Minitab
Trimmed mean
Ti ng Vi t
Trung bình hi u ch nh
SE of mean
Sai s tiêu chu n
Sum
T ng s
Standard deviation
ð l ch chu n
Minimum
Giá tr bé nh t
Variance
Phương sai
Maximum
Giá tr l n nh t
Coefficient of variation
H s bi n ñ ng
Range
Kho ng bi n ñ ng
First quartile
T v th nh t
Sum of squares
T ng bình phương
Median
Trung v
Skewness
ð l ch
ð nh n
Third quartile
T v th 3
Kurtosis
Interquartile
T v th 2
MSSD
N nonmissing
N không khuy t
Cumulative N
N c ng g p
N missing
N khuy t
Percent
Ph n trăm
N total
N t ng s
Cumulative percent
Ph n trăm c ng g p
Ch n Graphs…ñ hi n các lo i th ñ th sau ñây:
Histogam of data t ch c ñ
Histogam of data, with normal curve t ch c ñ v i ñư ng cong chu n
Individual value plot v t ng giá tr
Boxplot of data ñ th h p
Ch n OK đ có đư c đ th
Ví d ch n Boxplot of data đ có đư c ñ th h p dư i ñây
7
Khai báo vào By variables (Optional) đ tính các tham s th ng kê theo phân lo i nhóm.
Xét Ví d 1.1, gi s
tiên sinh ra l a th
theo sinh ra l a th
trúc s li u thành 2 c
(LUA)
r ng 8 chu t cái ñ u
nh t và 8 chu t ti p
2. Ta có th b trí c u
t, c t C1 (P) và c t C2
K t qu t Minitab
Descriptive Statistics: P
Variable
P
LUA
1
2
N
8
8
N*
0
0
Mean
44.88
50.28
SE Mean
3.82
3.32
StDev
10.79
9.39
Minimum
24.00
32.70
Q1
36.53
42.23
Median
47.90
53.00
Q3
53.73
57.53
b. Tóm t t d li u ñ i v i bi n ñ nh tính
ð i v i bi n đ nh tính s li u thơ thu th p đư c t thí nghi m có th đư c trình bày
theo m t trong 2 cách sau ñây:
8
Ví d 1.2: S bị s a ba tr i A, B, C l n lư t là 106, 132 và 122 con. Ch n ng u
nhiên và ki m tra b nh viêm n i m c t cung 3 tr i, k t qu như sau:
Cách 1:
Tr i
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
Bò
s
1
2
3
4
5
6
7
8
9
10
1
12
13
14
15
16
17
K t
qu
+
-
-
-
+
+
+
-
-
-
+
-
-
-
-
-
+
Tr i
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
Bò
s
1
2
3
4
5
6
7
8
9
10
1
12
13
14
15
16
17
18
19
20
21
22
K t
qu
-
-
+
-
-
-
-
-
+
+
-
-
-
-
-
+
-
+
-
+
-
-
Tr i
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
Bò
s
1
2
3
4
5
6
7
8
9
10
1
12
13
14
15
16
17
18
19
20
K t
qu
+
+
-
-
-
-
+
-
-
-
+
-
+
-
-
-
-
+
+
+
Cách 2:
Tr i
Viêm n i m c t cung
Có
A
Khơng
6
T ng s
11
17
B
6
16
22
C
8
12
20
S li u đư c nh p vào c t trong Windows Worksheet (v i cách 1)
Nh p d li u vào 2 c t, Tr i vào c t C1
(TRAI) và c t K t qu xét nghi m vào
c t C2 (KETQUA).
Lưu ý: Sau khi nh p thông tin vào c t
C1 và C2 ký hi u thay ñ i tương ng
C1-T và C2-T. Minitab thông báo các
thông tin trong c t không ph i dư i
d ng s mà dư i d ng ký t (Text)
V i s li u d ng thô (cách 1) có th
t o thành b ng tóm t t như cách 2
b ng các l nh sau
Stat
Tables
Cross Tabulation
and Chi-Square...
Khai báo vào ô For rows và For
columns
9
Options Display hi n th :
Count
t n s ñ i v i t ng trư ng h p
Row percents
t l (ph n trăm) theo hàng
Column percents
t l (ph n trăm) theo c t
Total percents
t l (ph n trăm) theo hàng/c t t ng s
Ch n OK đ có k t qu
Tabulated statistics: TRAI; KETQUA
Rows: TRAI
Columns: KETQUA
+ All
A
11
6
17
B
16
6
22
C
12
8
20
All
39 20
59
Cell Contents:
Count
ð i v i bi n đ nh tính có th mơ t b ng bi u ñ thanh (Bar Chart), bi u ñ bánh (Pie Chart).
Graph
Ch n OK
Bar Chart…Counts of unique values
Ch n Multiple Graphs…
Ch n OK đ có bi u ñ thanh
10
Th c hi n tương t ñ có bi u ñ bánh
S li u ñư c nh p vào c t trong Windows Worksheet (v i cách 2)
Nh p d li u vào 3 c t, Tr i vào c t
C1 (TRAI), c t K t qu xét nghi m
vào c t C2 (KETQUA) và T n su t
vào c t C3 (TANSUAT).
d ng ký t (Text)
V i s li u d ng thơ (cách 1) có th
t o thành b ng tóm t t như cách 2
b ng các l nh sau
Stat
Tables
Cross Tabulation
and Chi-Square...
Khai báo vào ô For rows, For
columns và Frequencies are in.
Ch n Counts và Row percents trong
Display ñ có k t qu
Tabulated statistics: TRAI; KETQUA
Using frequencies in TANSUAT
Rows: TRAI
Columns: KETQUA
+
All
A
11
6
17
64.71 35.29 100.00
B
16
6
22
72.73 27.27 100.00
C
12
8
20
60.00 40.00 100.00
All
39
20
59
66.10 33.90 100.00
Cell Contents:
Count
% of Row
Bi u ñ trong cách nh p s li u th 2
hoàn toàn gi ng như cách nh p s
li u, tuy nhiên cách khai báo trong h p
tho i có m t s đi m khác
Graph
table
Bar Chart…Values from
Khai báo vào ô Graph variables và
Categorical variables
11
1.3. Ư c lư ng và ki m ñ nh giá tr trung bình
a. Ki m đ nh phân ph i chu n
ð i v i t t c các phép th dư i ñây bi n ñ nh lư ng ñ u ñư c gi thi t là s li u thu
th p đư c (s li u thơ) tuân theo phân ph i chu n. N u s li u khơng tn theo phân ph i
chu n thì các phép th s khơng có hi u l c. Trong trư ng h p này c n bi n ñ i s li u v
phân ph i chu n ho c s d ng ki m ñ nh phi tham s .
Gi thi t c a phép th : H0: S li u có phân b chu n và H1: S li u khơng có phân b
chu n
Ví d 1.3: Tăng tr ng trung bình (gam/ngày) c a 36 l n ni v béo gi ng Landrace
đư c rút ng u nhiên t m t tr i chăn nuôi. S li u thu ñư c như sau:
577
596
594
612
600
584
618
627
588
601
606
559
615
607
608
591
565
586
621
623
598
602
581
631
570
595
603
605
616
574
578
600
596
619
636
589
Cán b k thu t tr i cho r ng tăng tr ng trung bình c a tồn đàn l n trong tr i là
607gam/ngày. Theo anh ch k t lu n đó ñúng hay sai, vì sao? Bi t r ng ñ l ch chu n c a
tính tr ng này là 21,75 gam.
Nh p s li u vào Worksheet
Ch n OK ñ có k t qu
12
Stat
Basic Statistics
Normality Test...
Giá tr P-Value = 0,997 trong ñ th trên l n hơn 0,05 (α), như v y H0 ñư c ch p nh n.
K t lu n s li u tuân theo phân ph i chu n.
b. Phép th Z
S d ng phép th Z ñ ki m ñ nh m t giá tr trung bình khi bi t đ l ch chu n c a
qu n th (σ). Minitab s tính kho ng tin c y (CI 95%) và th c hi n phép ki m ñ nh. ð i
σ
v i ki m đ nh 2 phía ta có gi thi t: H0: µ = µ 0 v i đ i thi t µ ≠ µ 0; trong đó µ là giá tr
trung bình c a qu n th và µ 0 là giá tr ki m đ nh.
Stat
Basic Statistics
1-sample Z...
Trong Samples in columns khai báo
c t s li u (P).
Trong Standard deviation ñi n giá tr
21,75 (ñ l ch chu n c a qu n th σ).
Trong Test mean ñi n giá tr 607 (giá
tr qu n th ki m đ nh µ0).
Ch n OK đ có k t qu
One-Sample Z: P
Test of mu = 607 vs not = 607
The assumed standard deviation = 21.75
Variable
N
Mean
StDev SE Mean
P
36 599.194 18.656
3.625
95% CI
(592.090; 606.299)
Z
-2.15
P
0.031
V i xác su t c a phép th P = 0,031 < 0,05 (α), bác b H0 và ch p nh n ñ i thi t H1.
K t lu n: Tăng tr ng c a l n Landrace tr i nêu trên không b ng 607 gam/ ngày (P <
0,05). Kho ng tin c y 95% là 592,090 – 606,299 gam/ ngày.
Lưu ý: Trong m t s trư ng h p, s
li u đã đư c tóm t t (s li u tinh) dư i
d ng các tham s th ng kê mơ t . Như
_
ví d 1.3 ta có n = 36; x = 599,194
gam. Vì v y các giá tr này có th s
d ng ñ khai báo vào l a ch n
Summarized data, các giá tr khác (σ
và µ) đư c khai báo tương t đ có k t
qu sau
One-Sample Z
Test of mu = 607 vs not = 607
The assumed standard deviation = 21.75
N
Mean SE Mean
95% CI
36 599.194
3.625 (592.089; 606.299)
Z
-2.15
P
0.031
13
c. Phép th T
Trong trư ng h p không bi t ñ l ch chu n c a qu n th (σ), phép th T ñư c s d ng
ñ ki m đ nh giá tr trung bình và đ l ch chu n c a m u (s) ñư c s d ng thay ñ l ch
chu n qu n th . Gi thi t c a phép th , c u trúc s li u tương t như phép th Z.
Stat
Basic Statistics
1-sample T...
Khai báo ñ i v i s li u thơ
.. và đ i v i s li u tinh
Ch n OK đ có k t qu
One-Sample T: P
Test of mu = 607 vs not = 607
Variable
N
Mean
StDev
P
36 599.194 18.656
SE Mean
3.109
95% CI
(592.882; 605.507)
T
-2.51
P
0.017
V i P = 0,017 ta cũng có k t lu n tương t như đ i v i khi s phép th Z.
1.4. Ki m ñ nh 2 giá tr trung bình
Khi ti n hành thí nghi m đ so sánh s khác nhau gi a 2 cơng th c thí nghi m, có 2
trư ng h p ch n m u có th x y ra: 1) Ch n m u ñ c l p và 2) ch n m u theo c p (xem
2.4, tr.23, Giáo trình Thi t k thí nghi m 2007). Tuỳ thu c vào cách ch n m u b trí thí
nghi m mà ta có th s d ng phép th T hay T c p cho phù h p.
a. Ki m ñ nh s ñ ng nh t c a phương sai khi l y m u ñ c l p
ð i v i ki m ñ nh 2 giá tr trung bình, ngồi gi thi t là s li u tuân theo phân ph i
chu n, cịn v n đ th 2 là Hai phương sai có đ ng nh t hay khơng?
ð i v i ki m đ nh hai phía ta có gi thi t H0: Hai phương sai ñ ng nh t (σ²1 = σ²2) và
H1: Hai phương sai khơng đ ng nh t (σ²1 ≠ σ²2) . Khi ch p nh n gi thi t H0, phương sai
chung (σ2)s ñư c s d ng ñ ti n hành ki m ñ nh trong phép th T; ngư c l i (bác b H0)
thì phép th T g n đúng s đư c th c hi n.
Ví d 1.4: ð so sánh kh i lư ng c a 2 gi ng bò, ti n hành ch n ng u nhiên và cân 12
con ñ i v i gi ng th nh t và 15 con ñ i v i gi ng th 2. Kh i lư ng (kg) thu ñư c như sau:
Gi ng bò th nh t
198,6
190,7
221,1
186,7
203,1
148,1
146,2
152,8
162,4
14
180,3
194,7
Gi ng bò th hai
187,6
196,3
203,8
190,2
201,0
140,2
159,4
135,3
151,2
146,3
163,5
146,6
181,8
165,1
165,0
141,6
Theo anh (ch ), kh i lư ng c a 2 gi ng bị có s sai khác khơng?
C u trúc s li u c a bài toán ki m đ nh 2 giá tr trung bình có th đư c trình bày b ng
m t trong 2 cách sau ñây:
Cách 1: S li u c a 2 công th c thí
nghi m đư c nh p vào m t c t và c t th
2 ñ xác ñ nh giá tr c a t ng công th c
....
Cách 2: S li u ñư c nh p vào 2 c t
riêng bi t theo t ng cơng th c thí
nghi m. Tên c t th hi n giá tr trong
m i công th c
Lưu ý: C u trúc s li u có th nh p trong cùng m t Worksheet ho c 2 Worksheet riêng bi t.
Stat
Basic Statistics
C u trúc s li u cách 1
2 Variances...
... cách 2
Có th s d ng Summarized data khi s li u ñã ñư c tinh hoá. ð i v i trư ng h p
này c n khai báo dung lư ng m u (Sample size) và phương sai (Variance) ñ i v i t ng
cơng th c thí nghi m tương ng (First ho c Second).
Ch n OK đ có k t qu
15
Test for Equal Variances: KL versus GIONG
95% Bonferroni confidence intervals for standard deviations
GIONG
N
Lower
StDev
Upper
1
12
7.17875
10.6160
19.6238
2
15
8.63359
12.3014
20.8502
F-Test (normal distribution)
Test statistic = 0.74; p-value = 0.631
Levene's Test (any continuous distribution)
Test statistic = 0.46; p-value = 0.503
Xác su t p-value = 0,631 > 0,05 (α) vì v y H0 ñư c ch p nh n. K t lu n hai phương
sai ñ ng nh t (P > 0,05).
b. Phép th T
S d ng phép th T ñ ki m ñ nh 2 giá tr trung bình khi khơng bi t đ l ch chu n c a
qu n th (σ). Minitab s tính kho ng tin c y (CI 95%) s chênh l ch gi a 2 giá tr trung
σ
bình qu n th và th c hi n phép ki m ñ nh. ð i v i ki m đ nh 2 phía ta có gi thi t: H0: µ 1
= µ 2 v i đ i thi t H1: µ 1 ≠ µ 2; trong đó µ 1 và µ 2 là giá tr trung bình c a qu n th th nh t
và th 2.
Stat
Basic Statistics
2-Sample T...
Có th s d ng Summarized data khi s li u đã đư c tinh hố. ð i v i trư ng h p
này c n khai báo dung lư ng m u (Sample size), giá tr trung bình (Mean) và đ l ch
chu n (Standard deviation) đ i v i t ng cơng th c thí nghi m tương ng (First ho c
Second).
Ch n Assume equal variances n u 2 phương sai ñ ng nh t và ngư c l i n u 2 phương
sai khơng đ ng nh t (xem 4.1).
Ch n hi n th ñ th trong Graphs... và m c tin c y trong Options..., theo m c đ nh
Minitab tính kho ng tin c y 95%.
V i c u trúc s li u cách 1
Ch n OK đ có k t qu
16
... cách 2
Two-Sample T-Test and CI: KL; GIONG
Two-sample T for KL
GIONG
N
Mean StDev
1
2
12
15
196.2
153.7
SE Mean
10.6
12.3
3.1
3.2
Difference = mu (1) - mu (2)
Estimate for difference: 42.4750
95% CI for difference:
(33.2301; 51.7199)
T-Test of difference = 0 (vs not =): T-Value = 9.46
P-Value = 0.000
DF = 25
Both use Pooled StDev = 11.5901
Xác su t p-value = 0,000 < 0,05 (α) vì v y H0 b bác b và H1 ñư c ch p nh n. K t
lu n r ng Kh i lư ng c a hai gi ng bị có s sai khác (P-value < 0,05).
c. Phép th T c p đơi
ð i v i các thí nghi m ch n m u theo c p, ñi u ki n duy nh t c a bài toán là ki m tra
phân b chu n c a ph n chênh l ch (d) s li u gi a 2 cơng th c thí nghi m.
V i ki m đ nh 2 phía ta có gi thi t H0: µd = 0 đ i thi t H1: µd ≠ 0 (µd là trung bình c a
s chênh l ch gi a 2 trung bình µ 1 và µ 2).
Ví d 1.5: Tăng tr ng (pound) c a 10 c p bê sinh đơi gi ng h t nhau v i hai ch đ
chăm sóc khác nhau (A và B). Bê trong t ng c p ñư c b t thăm ng u nhiên v m t trong
hai cách chăm sóc.
Hãy ki m ñ nh gi thi t H0: Tăng tr ng trung bình hai cách chăm sóc như nhau, đ i
thi t H1: Tăng tr ng trung bình hai cách chăm sóc khác nhau v i m c ý nghĩa α = 0,05.
S li u thu ñư c như sau:
C p sinh đơi
1
2
3
4
5
6
7
8
9
10
Tăng tr ng
cách A
43
39
39
42
46
43
38
44
51
43
Tăng tr ng
cách B
37
35
34
41
39
37
35
40
48
36
6
4
5
1
7
6
3
4
3
7
Chênh l ch (d)
Nh p s li u vào Worksheet
Lưu ý:
S li u ñư c nh p vào Worksheet theo
m t cách duy nh t vào 2 c t theo t ng
c p s li u tương ng.
Th t các c p s li u khơng đóng vai
trị quan tr ng.
S thay đ i v trí trong 1 c p có th ñưa
ta ñ n các k t lu n thi u chính xác.
17
Calc
…ch n OK đ có đư c ph n chênh l ch
Calculator...
Ti n hành ki m ñ nh phân b chu n c a ph n chênh l ch D (xem 4.1)
Stat
Basic Statistics
Paired T..
Có th s d ng Summarized data
(differences) khi s d ng các thông tin
c a c t chênh l ch D ñ ki m ñ nh.
ð i v i trư ng h p này c n khai báo
dung lư ng m u (Sample size), giá tr
trung bình (Mean) và ñ l ch chu n
(Standard deviation) c a c t D.
Ch n hi n th ñ th trong Graphs... và
m c tin c y trong Options..., theo m c
đ nh Minitab tính kho ng tin c y 95%.
Ch n OK đ có k t qu
Paired T-Test and CI: A; B
Paired T for A - B
N
Mean
StDev SE Mean
A
10 42.8000
3.8239
1.2092
B
10 38.2000
4.1312
1.3064
Difference 10 4.60000 1.95505 0.61824
95% CI for mean difference: (3.20144; 5.99856)
T-Test of mean difference = 0 (vs not = 0): T-Value = 7.44
P-Value = 0.000
Xác su t p-value = 0,000 < 0,05 (α) vì v y H0 b bác b và H1 ñư c ch p nh n. K t
lu n r ng Tăng tr ng trung bình hai cách chăm sóc có s sai khác (P-value < 0,05).
1.5. Phân tích phương sai
Phân tích phương sai (Analysis of Variance - ANOVA) là cơng c h u ích đ so sánh
nhi u giá tr trung bình. ði u ki n c a bài tốn phân tích phương sai là 1) s li u tuân theo
phân b chu n và 2) phương sai đ ng nh t. Trong khn kh giáo trình này chúng tơi ch
đ c p đ n vi c ki m tra ñi u ki n c a bài tốn đ i v i các mơ hình thi t k thí nghi m đơn
gi n (Thí nghi m m t y u t hoàn toàn ng u nhiên).
ð ki m đ nh 2 phía ta có gi thi t H0: µ1 = µ2 = ... = µa đ i thi t H1: µ1 ≠ µ2 ≠ ...≠ µa
(µ là trung bình c a qu n th cơng th c thí nghi m th 1, 2, ...a).
18
a. Thí nghi m m t y u t hồn tồn ng u nhiên
Xét trư ng h p đơn gi n nh t đ i v i bài tốn phân tích phương sai. Ch có m t y u t
duy nh t trong thí nghi m, các y u t phi thí nghi m cịn l i đư c coi là có tác đ ng như
nhau đ n đ i tư ng thí nghi m.
A
B
C
D
E
0,95
0,43
0,70
1,00
0,90
0,85
0,45
0,90
0,95
1,00
0,85
0,40
0,75
0,90
0,95
0,90
Ví d 1.6: Theo dõi tăng tr ng c a cá (kg)
trong thí nghi m v i 5 công th c nuôi (A,
B, C, D và E). Hãy cho bi t tăng tr ng c a
cá các cơng th c ni. N u có s khác
nhau thì ti n hành so sánh s sai khác c a
t ng c p giá tr trung bình.
0,42
0,70
0,90
0,95
C u trúc s li u c a bài tốn ki m đ nh nhi u giá tr trung bình có th đư c trình bày
b ng m t trong 2 cách sau:
Cách 1: S li u c a các công th c thí
nghi m đư c nh p vào m t c t và c t th
2 ñ xác ñ nh giá tr c a t ng công th c
Cách 2: S li u ñư c nh p vào các c t
riêng bi t theo cơng th c thí nghi m. Tên
c t th hi n giá tr trong m i công th c
Ki m tra ñi u ki n c a bài tốn (s đ ng nh t c a phương sai và phân ph i chu n c a
s li u) s đư c trình bày sau. Ti n hành so sánh các giá tr trung bình b ng phép phân tích
phương sai (ANOVA) đ i v i c u trúc s li u cách 1 và cách 2.
V i các bài tốn s d ng phép phân tích phương sai ñ so sánh, c u trúc s li u cách 1
s phù h p và thu n l i hơn trong quá trình x lý s li u. Trong các ví d ti p theo chúng
tơi ch đ c p ñ n vi c x lý s li u có c u trúc cách 1.
Stat
ANOVA
One-Way...
Stat
ANOVA
One-Way (Unstacked)...
19
Ch n OK đ có k t qu
One-way ANOVA: KL versus TA
Source DF
SS
MS
F
P
TA
4 0.76325 0.19081 60.99 0.000
Error
15 0.04693 0.00313
Total
19 0.81018
S = 0.05593
R-Sq = 94.21%
R-Sq(adj) = 92.66%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N
Mean
StDev --+---------+---------+---------+------A
4 0.8875 0.0479
(--*--)
B
4 0.4250 0.0208 (--*--)
C
4 0.7625 0.0946
(--*--)
D
4 0.9375 0.0479
(--*--)
E
4 0.9500 0.0408
(-*--)
--+---------+---------+---------+------0.40
0.60
0.80
1.00
Pooled StDev = 0.0559
Xác su t p-value = 0,000 < 0,05 (α) vì v y H0 b bác b và H1 ñư c ch p nh n. K t lu n
r ng Tăng tr ng trung bình c a cá các cơng th c th c ăn có s sai khác (P-value < 0,05).
So sánh c p khi bác b gi thi t H0 ch p nh n gi thi t H1
Ch n Comparisons... trong h p tho i One-Way Analysis of Variances
Các l a ch n:
Tukey’s, family error rate: v i sai s
c a toàn b các c p so sánh là 5%
Fisher’s, individual error rate: v i sai
s c a t ng c p so sánh là 5%
Dunnett’s, family error rate: so sánh
v i nhóm đ i ch ng, sai s c a toàn b
các c p so sánh là 5%
Hsu’s MCB, family error rate: v i sai
s c a toàn b các c p so sánh là 5%
Ch n OK đ có k t qu
Tukey 95% Simultaneous Confidence Intervals
All Pairwise Comparisons among Levels of TA
Individual confidence level = 99.25%
TA = A subtracted from:
TA
Lower
Center
Upper --------+---------+---------+---------+B
-0.58471 -0.46250 -0.34029
(---*--)
C
-0.24721 -0.12500 -0.00279
(--*---)
D
-0.07221
0.05000
0.17221
(--*---)
E
-0.05971
0.06250
0.18471
(---*--)
--------+---------+---------+---------+-0.35
0.00
0.35
0.70
20
TA = B subtracted from:
TA
Lower
Center
Upper
C
0.21529 0.33750 0.45971
D
0.39029 0.51250 0.63471
E
0.40279 0.52500 0.64721
TA = C subtracted from:
TA
Lower
Center
Upper
D
0.05279 0.17500 0.29721
E
0.06529 0.18750 0.30971
TA = D subtracted from:
TA
Lower
Center
Upper
E
-0.10971 0.01250 0.13471
--------+---------+---------+---------+(---*--)
(---*--)
(--*--)
--------+---------+---------+---------+-0.35
0.00
0.35
0.70
--------+---------+---------+---------+(--*--)
(--*---)
--------+---------+---------+---------+-0.35
0.00
0.35
0.70
--------+---------+---------+---------+(--*---)
--------+---------+---------+---------+-0.35
0.00
0.35
0.70
Ngồi k t qu phân tích phương sai như ph n trên, Minitab ñã cung c p k t qu so
sánh t ng c p. S sai khác có ý nghĩa (P-value < 0,05) gi a các nghi m th c d a trên
kho ng tin c y c a t ng c p. Khơng có s sai khác gi a các nghi m th c n u kho ng tin
c y có ch a s 0 và ngư c l i có s sai khác n u khơng ch a s 0. Ví d trong k t qu nêu
trên n u so sánh gi a A-B ta có kho ng tin c y (-0,58471; -0,34029) khơng ch a s khơng
nên k t lu n có s sai khác gi a A và B (P-value < 0,05). N u so sánh A và D ta có kho ng
tin c y (-0,07221; +17221) có ch a s 0 nên k t lu n khơng có s sai khác gi a A và D (Pvalue > 0,05). ð có th trình bày k t qu so sánh c p đơi b n đ c có th tham kh o trang
57 chương 4 Giáo trình Thi t k thí nghiêm (2007).
Ki m tra s ñ ng nh t c a phương sai v i c u trúc s li u cách 1
Stat
ANOVA
Test for Equal Variances...
Ch n OK ñ hi n th ñ th và
..k t qu
Test for Equal Variances: KL versus TA
95%
TA
A
B
C
Bonferroni confidence intervals for standard deviations
N
Lower
StDev
Upper
4 0.0231412 0.0478714 0.309607
4 0.0100628 0.0208167 0.134631
4 0.0457534 0.0946485 0.612137
21
D 4 0.0231412 0.0478714 0.309607
E 4 0.0197348 0.0408248 0.264034
Bartlett's Test (normal distribution)
Test statistic = 5.76; p-value = 0.218
Levene's Test (any continuous distribution)
Test statistic = 0.81; p-value = 0.539
Xác su t p-value = 0,218 > 0,05 (α) vì v y H0 ñư c ch p nh n. K t lu n r ng Các
Phương sai ñ ng nh t (P-value > 0,05).
Ki m tra phân b chu n v i c u trúc s li u cách 1
Không ti n hành ki m tra phân b chu n c a c t s thô (KL) mà ti n hành ki m tra
ph n sai s ng u nhiên εij theo mô hình:
yi j = µ + ai + εi j
(i = 1, a; j = 1, ri)
trong đó yij = quan sát th j cơng th c i, µ= trung bình chung, ai = chênh l ch do nh
hư ng c a công th c i và εij = sai s ng u nhiên; các εij ñ c l p, phân ph i chu n N∼(0,σ2).
N u ph n sai s ng u nhiên tuân theo phân ph i chu n thì s li u bài tốn cũng có phân
ph i chu n.
Stat
ANOVA
One-Way...
Ch n Store residuals và OK đ có RESI1 (εij)
Ti n hành ki m tra phân b chu n c a c t s li u RESI1 (xem 3.1 Ki m ñ nh phân
ph i chu n). Phép ki m ñ nh s cho ta P-Value = 0,159 > 0,05 (α) nên có th k t lu n S
li u tuân theo phân ph i chu n (P > 0,05).
Lưu ý: V i c u trúc s li u cách 2, có th ki m đ nh phân ph i chu n c a s li u v i
t ng nghi m th c riêng bi t. K t qu ki m ñ nh, xác su t ñ s li u các nghi m th c A,
B, C, D và E có phân ph i chu n l n lư t là 0,255; 0,845; 0,092; 0,255 và 0,410. Ta cũng
có k t lu n tương t .
b. Thí nghi m m t y u t kh i ng u nhiên đ y đ
Xem xét m t thí nghi m mà đ i tư ng thí nghi m ch u tác ñ ng ñ ng th i c a m t y u
t chính (y u t thí ngh êm) và y u t ph (kh i).
Ví d 1.7: Nghiên c u s lư ng t bào lymphô chu t (×1000 t bào mm-3 máu)
đư c s d ng 4 lo i thu c khác nhau (A, B, C và D; thu c D là placebo) qua 5 l a; s li u
thu đư c trình bày b ng dư i. Cho bi t nh hư ng c a thu c đ n t bào lymphơ?
22
L a1
L a2
L a3
L a4
L a5
Thu c A
7,1
6,1
6,9
5,6
6,4
Thu c B
6,7
5,1
5,9
5,1
5,8
Thu c C
7,1
5,8
6,2
5,0
6,2
Thu c D
6,7
5,4
5,7
5,2
5,3
C u trúc s li u
S li u c a bài tồn này ch có m t c u
trúc duy nh t trong Minitab; bao g m 3
c t:
1) c t S lư ng t bào C1 (TEBAO),
2) c t Thu c C2 (THUOC) và
3) c t L a C3 (LUA)
Trong thí nghi m này đ i tư ng thí
nghi m b tác đ ng b i y u t chính
(y u t thí nghi m) và y u t ph (kh i)
So sánh s sai khác gi a các nghi m th c b ng Phân tích phương sai (ANOVA)
Stat
ANOVA
Ch n Store residuals đ có RESI1
Two-Way...
Ch n OK đ có k t qu
Two-way ANOVA: TEBAO versus THUOC; LUA
Source DF
THUOC
3
LUA
4
Error
12
Total
19
S = 0.2304
SS
1.8455
6.4030
0.6370
8.8855
R-Sq =
MS
0.61517
1.60075
0.05308
F
11.59
30.16
P
0.001
0.000
92.83%
R-Sq(adj) = 88.65%
Xác su t c a phép th ñ i v i y u t Thu c P = 0,001 < 0,05 (α), bác b gi thi t H0
và ch p nh n ñ i thi t H1. K t lu n thu c có nh khác nhau lên t bào lymphơ c a chu t (P
< 0,05).
23
Ví d 1.8: M t thí nghi m đư c ti n hành ñ
xác ñ nh nh hư ng c a 3 công th c th c ăn
(A1, A2 và A3) đ n tăng tr ng trung bình trên
ngày (gam / ngày) c a bê ñ c. Bê ñ c ñư c
cân và chia thành 4 kh i d a theo kh i lư ng
b t đ u thí nghi m. Trong m i kh i có 6 đ ng
v t thí nghi m đư c ch n ra và ñư c phân
ng u nhiên v v i các nghi m th c. S li u
thu th p sau khi k t thúc thí nghi m như sau:
Kh i
I
II
III
IV
A1
826
806
864
834
795
810
850
845
A2
827
800
871
881
729
709
860
840
A3
753
773
801
821
736
740
820
835
C u trúc s li u mơ hình thí nghi m trong
ví d 1.8 tương t như ví d 1.7.
Trong ví d 1.8 có 2 đơn v thí nghi m m t
nghi m th c và kh i vì v y ngồi tác đ ng
c a kh i và cơng th c thí nghi m cịn t n t i
s tương tác gi a kh i và cơng th c thí
nghi m.
Stat
ANOVA
General Linear Model...
Ch n Comparisons đ so sánh c p đơi
Ch n OK đ có k t qu
General Linear Model: KL versus CT, KHOI
Factor Type
Levels Values
CT
fixed
3 A1, A2, A3
KHOI
fixed
4 I, II, III, IV
Analysis of Variance for KL, using Adjusted SS for Tests
Source DF
Seq SS
Adj SS
Adj MS
F
P
CT
2
8025.6
8025.6
4012.8
7.08 0.005
KHOI
3 33816.8 33816.8 11272.3 19.90 0.000
Error
18 10197.4 10197.4
566.5
Total
23 52039.8
S = 23.8017
R-Sq = 80.40%
R-Sq(adj) = 74.96%
Xác su t c a phép th ñ i v i y u t Th c ăn P = 0,005 nên bác b gi thi t H0 và
ch p nh n ñ i thi t H1. K t lu n công th c ăn có nh đ n tăng tr ng c a bê. Xác su t c a
phép th ñ i v i y u t KHOI P = 0,000 nên bác b gi thi t H0 và ch p nh n ñ i thi t H1.
K t lu n KHOI có nh đ n tăng tr ng c a bê.
24
1.6. Tương quan và h i quy
ð tính h s tương quan và xây d ng phương trình h i quy, s li u luôn ph i t o
thành t ng b và ñư c nh p vào t ng c t đ i t ng ch tiêu.
Ví d 1.9: Ti n hành cân kh i lư ng (P), ño ñư ng kính l n (D) và ñư ng kính bé (d)
c a 22 qu tr ng gà. S li u thu đư c trình bày b ng dư i ñây.
P (gam)
66,80
60,10
71,20
61,60
61,20
59,00
67,90
59,00
51,50
62,60
64,20
D (mm)
58,37
54,95
60,58
56,73
57,36
53,26
57,07
58,17
52,28
55,62
56,82
d (mm)
45,12
44,35
45,56
44,34
43,57
44,86
46,27
42,82
41,91
44,95
44,79
P (gam)
71,20
54,20
54,50
69,10
55,90
66,00
68,00
62,00
56,70
67,00
53,80
D (mm)
61,15
54,24
54,99
60,99
54,41
58,19
59,93
56,80
55,66
58,49
52,44
d (mm)
46,00
42,58
42,32
44,85
42,62
45,69
45,50
44,20
42,41
45,56
43,38
C u trúc s li u trong Worksheet
Lưu ý:
ð tính h s tương quan và xây d ng
phương trình h i quy, s li u luôn ph i
t o thành t ng c p và ñư c nh p vào
t ng c t ñ i t ng ch tiêu.
1) C t Kh i lư ng C1 (KL)
2) C t ðư ng kính l n C2 (DL)
3) C t ðư ng kính bé C3 (DB)
a. H s tương quan
Gi thi t ñ i v i ki m đ nh hai phía H0: ρ = 0 và ñ i thi t H1: ρ ≠ 0, trong ñó ρ là
tương quan gi a 2 bi n nghiên c u.
Stat
Basic Statistics
Correlation...
Ch n OK đ có k t qu
Correlations: KL; DL; DN
KL
DL
0.897
0.000
DN 0.905 0.648
0.000 0.001
Cell Contents: Pearson correlation
P-Value
DL
Ch n Display p-values ñ hi n th xác
su t ñ i v i t ng h s tương quan.
Ch n Store matrix (display nothing) ñ
nh ma tr n h s tương quan vào b nh
đ m và khơng hi n th k t qu ra màn hình.
H s tương quan gi a kh i lư ng và đư ng kính l n là 0,897; kh i lư ng và đư ng
kính bé là 0,905; đư ng kính l n và đư ng kính bé là 0,648. Xác su t đ i v i t ng h s
25
tương quan (p-values) đ u bé hơn 0,05 (α) vì v y k t lu n m i quan h gi a các ch tiêu
này khác 0.
b. Phương trình h i quy tuy n tính
Có th xây d ng h i quy ñơn bi n y = a + bx ho c ña bi n y = a + b1x1 + b2x2
+...+bnxn. Có th xây d ng phương trình h i tuy n tính đơn bi n quy ư c tính kh i lư ng
tr ng thơng qua đư ng kính l n/đư ng kính bé ho c đa bi n thơng qua đư ng kính l n và
đư ng kính bé.
Stat
Regression
Regression...
Response: Khai báo c t C1 (KL) bi n
ph thu c.
Predictors: Khai báo c t C2 (DL) bi n
ñ c l p.
Ch n OK đ có k t qu
Regression Analysis: KL versus DL
The regression equation is
KL = - 53.7 + 2.04 DL
Predictor
Coef SE Coef
T
P
Constant
-53.67
12.78 -4.20 0.000
DL
2.0379
0.2250
9.06 0.000
S = 2.69651
R-Sq = 80.4%
R-Sq(adj) = 79.4%
Analysis of Variance
Source
DF
SS
MS
F
P
Regression
1 596.60 596.60 82.05 0.000
Residual Error 20 145.42
7.27
Total
21 742.02
Unusual Observations
Obs
DL
KL
Fit SE Fit Residual St Resid
7 57.1 67.900 62.629
0.579
5.271
2.00R
8 58.2 59.000 64.871
0.658
-5.871
-2.25R
R denotes an observation with a large standardized residual.
Phương trình h i quy ư c tính kh i lư ng (y) thơng qua đư ng kính l n (x) y = -53,7 + 2,04x.
B ng th nh t trong ph n k t qu ki m đ nh các h s c a phương trình h i quy. V i xác
su t P = 0,000 ta có th k t lu n các h s trong phương trình h i quy khác 0 (P < 0,05).
H s xác đ nh c a phương trình R² = 80,4%, hi u ch nh R² = 79,4%.
Các quan sát ngo i lai (Unusual Observations) trong mơ hình và ví d nêu trên. Các
giá tr hàng th 7 và 8 trong ví d trên đư c coi là ngo i lai.
Stat
26
Regression
Regression...
Predictors: Khai báo c t C2 (DL) và
C3 (DN) bi n đ c l p.
ð xây d ng phương trình h i quy ña
bi n, bi n ñ c l p bao g m t 2 bi n tr
lên.
Ch n OK đ có k t qu .
Regression Analysis: KL versus DL; DN
The regression equation is
KL = - 117 + 1.21 DL + 2.48 DN
Predictor
Coef SE Coef
T
P
Constant
-116.555
5.472 -21.30 0.000
DL
1.21473 0.08323
14.60 0.000
DN
2.4764
0.1623
15.26 0.000
S = 0.759757
R-Sq = 98.5%
R-Sq(adj) = 98.4%
Analysis of Variance
Source
DF
SS
MS
F
P
Regression
2 731.05 365.53 633.24 0.000
Residual Error 19
10.97
0.58
Total
21 742.02
Source DF Seq SS
DL
1 596.60
Ta có k t qu hồn tồn tương t như vi c xây d ng phương trình h i quy đơn gi n.
2.
NG D NG EXCEL TRONG X
LÝ S
LI U
Ph n m m Excel cho phép phân tích d li u nói chung, d li u d li u trong chăn
ni, thú y nói riêng, m t cách khá hi u qu thông qua vi c s d ng menu Tools> Data
Analysis (n u khơng có m c này thì ch n Tools> Add-in > Analysis ToolPak ñ cài ñ t
thêm). Sau đây là m t s cơng c x lý s li u th ng kê mà Excel cung c p.
2.1. Th ng kê mô t và t ch c ñ
2.1.1. Th ng kê mô t
Th ng kê mô t cho phép tính các s đ c trưng m u/ các giá tr th ng kê m u như
trung bình, ñ l ch chu n, sai s chu n, trung v , mode... S li u tính tốn đư c b trí theo
c t ho c theo dịng.
a. Các bư c th c hi n trong Excel
Ch n Tools>Data Analysis>Descriptive Statistics, khai báo các m c sau trong h p tho i:
- Input range: mi n d li u k c nhãn.
- Grouped by: Column (s li u theo c t, Row s li u theo hàng).
- Labels in first row: ðánh d u √ vào ô này n u có nhãn dịng đ u.
27
- Confidence level for mean: 95% (ñ tin c y 95%).
- K-th largest: 1 (1 S l n nh t, 2 s l n nhì ).
- K-th smallest: 1 (1 S nh nh t, 2 s nh nhì ).
- Output range: mi n ra.
- Summary Statistics: ðánh d u √ n u mu n hi n các th ng kê cơ b n.
- OK.
Ví d 1.1: Kh i lư ng (gam) c a 16 chu t cái t i th i ñi m cai s a:
54.1
49.8
24
46
44.1
34
52.6
54.4
56.1
52
51.9
54
58
39
32.7
58.5
Ch n Tools>Data Analysis>Descriptive Statistics, sau đó khai báo h p tho i (xem
hình sau)
K t qu thu đư c cho trong hình sau:
b. Phân tích các k t qu thu đư c
M t s nh n xét trên các th ng kê thu ñư c như sau:
- Mean cho ta giá tr trung bình c a dãy s .
- Median cho trung v (giá tr ñi m gi a c a dãy s ).
N u 2 giá tr Mean và Median x p x nhau ta thì s li u là cân đ i.
- Phương sai m u hay ñ l ch chu n m u cho ta bi t ñ phân tán c a s li u quanh giá
tr trung bình, n u các giá tr này càng nh ch ng t s li u càng t p trung.
28
- Kurtosis ñánh giá ñư ng m t ñ phân ph i c a dãy s li u có nh n hơn hay tù hơn
ñư ng m t ñ chu n t c. N u trong kho ng t -2 đ n 2 thì có th coi đ nh n x p x ñ
nh n chu n.
- Skewness ñánh giá ñư ng phân ph i nghiêng trái hay nghiêng ph i. N u trong
kho ng t -2 ñ n 2 thì có th coi s li u cân đ i x p x phân ph i chu n .
- Confidence Level ñư c hi u là n a ñ dài kho ng tin c y. Gi s Confidence Level là m
thì kho ng tin c y c a trung bình t ng th là: (Mean- m , Mean+m). Trong ví d 1.1 ta có kho ng
tin c y 95% c a “dài bông” là: (47.575 - 5.415 , 47.575 - 5.415), t c là (42.160, 52.990).
2.1.2. T ch c ñ
T n s xu t hi n c a s li u trong các kho ng cách ñ u nhau cho phép phác ho bi u
đ t n s , cịn g i là t ch c ñ . ð v t ch c ñ c n ph i ti n hành phân t s li u.
a. T o mi n phân t
ð ti n hành phân t s li u (t o Bin), c n th c hi n các bư c sau:
- Dùng các hàm Min, Max ñ xác ñ nh giá tr nh nh t và giá tr l n nh t.Tính biên đ
= Max - Min. D a vào đó ta có th đ nh s t c n chia. S t có th theo cơng th c
k=6*log(n), n là s s li u. T đó ta ñ nh ra kho ng cách t là h = biên ñ /k.
ð nh ra giá tr c n dư i và giá tr c n trên c a mi n phân t , thư ng thì l y giá tr c n
dư i nh hơn Min, giá tr c n trên l n hơn Max.
- Ghi giá tr c n dư i vào ơ đ u c a mi n phân t . Con tr t i ô này.
- Ch n Edit > Fill > Series ñ khai báo các m c:
+ Trong m c Series in ch n Columns (d li u theo c t).
+ Trong m c Type ch n Linear (d li u tăng theo c p s c ng).
+ Trong Step value: nh p giá tr bư c tăng (h).
+ Trong Stop value: nh p giá tr cu i (giá tr c n trên).
+ OK.
Ví d 1.2: D a trên 30 s li u v chi u dài cá ta t o mi n phân t (Bin) như trên hình
sau, v i mi n phân t t ô D2 t i ô D12 (k c nhãn), giá tr c n dư i là 10, c n trên là 55,
giá tr bư c tăng 5.
Hình 1.1. T o mi n Bin cho các s li u v chi u dài cá
29