Tải bản đầy đủ (.docx) (73 trang)

Thực hành xử lý số liệu thực phẩm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (353.97 KB, 73 trang )

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH
VIỆN CÔNG NGHỆ SINH HỌC – THỰC PHẨM

THỰC HÀNH XỬ LÝ SỐ LIỆU THỰC NGHIỆM

BÀI TẬP THỰC HÀNH XỬ LÝ SỐ
LIỆU THỰC NGHIỆM

GVHD: PHẠM MINH TUẤN
Tên : NGUYỄN NHẬT THANH VINH
Mssv:12068071
Lớp: DHTP8B
Tổ: 5

TPHCM, tháng 3 năm 2015


Bài 1:

Hình 1.1: Hiệu suất trung bình trích li polyphenol của trà xanh theo dung môi (%).
Bảng hiệu suất trung bình (%) trích li polyphenol theo dung môi
Dung môi
Dietylete
Cồn

Hiệu suất
69.2 ± 5.17
68± 15.03

Vì p-value = 0.8701 > 0.05 nên theo thống kê không có sự khác biệt về hiệu suất trích ly
polyphenol của hai dung môi với α = 5%. Ta có thể chọn cả 2 dung môi để trích ly. Nhưng để an


toàn cho sức khỏe, dễ kiếm và giá thành rẻ thì nên chọn cồn.
Phụ lục :
> dietylete <- c(68,63,74,66,75)
> con <-c(52,84,58,84,62)
> bai1 <- data.frame(dietyleter,con)
> bai1
> var.test(dietyleter,con)
F test to compare two variances
data: dietyleter and con
F = 0.1181, num df = 4, denom df = 4, p-value = 0.06226
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.01230061 1.13469446
sample estimates:
ratio of variances
0.1181416
# p-value = 0.06226 > 0.05 nên hiệu suất trích li của 2 dung môi có cùng phương sai.
> t.test(dietyleter,con,var.equal=T)
Two Sample t-test


data: dietyleter and con
t = 0.1688, df = 8, p-value = 0.8701
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-15.19373 17.59373
sample estimates:
mean of x
69.2


mean of y
68.0

> sd(dietyleter)
[1] 5.167204
> sd(con)
[1] 15.0333
Bài 2:
Hình 2.1: Thời gian bền bọt của mẫu đối chứng và mẫu sử dụng phụ gia
Bảng so sánh sự khác biệt về khả năng bền bọt giữa mẫu đối chúng và mẫu có sử dụng phụ gia
Thời gian bền bọt
Đối chứng
1.05 ± 0.05
CMC
1.22 ± 0.04
Vì p-value=1.24e-07 (<<0.05), theo thống kê có sự khác biệt về thời gian bền bọt của mẫu khi sử
dụng phụ gia CMC và không sử dụng phụ gia với α=5%. Nên có thể sử dụng phụ gia này để tăng
khả năng bền bọt.
Phụ lục :
> thoigian17,1.19,1.21)
> phugia<-as.factor(gl(2,10))
> bai2<-data.frame(phugia,thoigian)


> var.test(thoigian~phugia)
F test to compare two variances
data: thoigian by phugia
F = 1.1999, num df = 9, denom df = 9, p-value = 0.7905
alternative hypothesis: true ratio of variances is not equal to 1

95 percent confidence interval:
0.2980354 4.8307459
sample estimates:
ratio of variances
1.199889
> t.test(thoigian~phugia,var.equal=TRUE)
Two Sample t-test
data: thoigian by phugia
t = -8.3884, df = 18, p-value = 1.24e-07
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.2200804 -0.1319196
sample estimates:
mean in group 1 mean in group 2
1.047

1.223

> by(thoigian,phugia,sd)
phugia: 1
[1] 0.04900113
phugia: 2
[1] 0.04473378


Bài 3:

Hình 3.1 So sánh khả năng thuỷ phân protein của 4 loại enzyme trong việc thuỷ phân cá
trong quá trình sản xuất nước mắm
Bảng khả năng thuỷ phân protein của 4 loại enzyme:

Loại enzyme

Hàm lượng acid amin tổng số (mg/kg)

Loai A

18.17ab1.17

Loại B

14.80c 0.84

Loại C

19.00a0.82

Loại D

16.25bc 1.26

Vì pvalue

=7.463e-05 <<0.05 nên theo thống kê có sự khác biệt về hàm lượng acid amin được thuỷ
phân giữa các loại enzyme. Enzyme loại C thuỷ phân ra hàm lượng acid amin tổng số cao
nhất (19.00 mg/kg) nhưng không có sự khác biệt so với enzyme loại A (18.17 mg/kg). Vì
vậy có thể chọn loại enzyme A hoặc C để tăng hiệu suất thủy phân protein.
Phụ lục:
> enzyme <- as.factor(rep(1:4,c(6,5,4,4)))
> acidamin<-c(17,18,17,20,19,18,14,15,16,15,14,19,20,18,19,16,15,16,18)
> bai3 <- data.frame(enzyme,acidamin)

> analysis <- lm(acidamin ~ enzyme)
> anova(analysis)
Analysis of Variance Table

Response: acidamin
Df Sum Sq Mean Sq F value Pr(>F)
enzyme

3 50.564 16.8547 15.431 7.463e-05 ***


Residuals 15 16.383 1.0922
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> res <- aov(acidamin ~ enzyme)
> TukeyHSD(res)
Tukey multiple comparisons of means
95% family-wise confidence level

Fit: aov(formula = acidamin ~ enzyme)
$enzyme
diff

lwr

upr

p adj

2-1 -3.3666667 -5.1905943 -1.5427391 0.0004459
3-1 0.8333333 -1.1109800 2.7776467 0.6151972

4-1 -1.9166667 -3.8609800 0.0276467 0.0539882
3-2 4.2000000 2.1794103 6.2205897 0.0001307
4-2 1.4500000 -0.5705897 3.4705897 0.2079384
4-3 -2.7500000 -4.8798886 -0.6201114 0.0098498

> by(acidamin,enzyme,mean)
enzyme: 1
[1] 18.16667
-----------------------------------------------------------enzyme: 2
[1] 14.8
------------------------------------------------------------


enzyme: 3
[1] 19
-----------------------------------------------------------enzyme: 4
[1] 16.25
> by(acidamin,enzyme,sd)
enzyme: 1
[1] 1.169045
-----------------------------------------------------------enzyme: 2
[1] 0.83666
-----------------------------------------------------------enzyme: 3
[1] 0.8164966
-----------------------------------------------------------enzyme: 4
[1] 1.258306

Bài 4:

Hình 4.1 Khả năng trương nở của bánh dựa theo nồng độ phụ gia

Bảng khả năng trương nở của bánh phồng tôm dựa vào nồng độ phụ gia
Nồng độ

Độ trương nở của bánh

0.5%

71.14a ± 6.89

0.3%

63.71ab ± 6.63


0.1%

61.14b ± 7.15

Vì p-value = 0.037 < 0.05 nên theo thống kê có sự khác biệt về độ trương nở của bánh ở
các nồng độ phụ gia khác nhau theo α=5%. Độ trương nở của bánh cao nhất là 71.14 ở
nồng độ 0.5%, không có sự khác biệt so với nồng độ 0.3% với khả năng trương nở của
bánh là 63.71. Để kinh tế và an toàn sức khỏe nên chọn phụ gia ở nồng độ 0.3% để chế
biến bánh phồng tôm.
Phụ lục:
> phugia=c(68,80,69,76,68,77,60,71,62,58,74,65,59, 57,58,60,70,51,57,71,61)
> group=gl(3,7)
> group<- as.factor (group)
> data<-data.frame(group,phugia)
> analysis<-lm(phugia~group)
> anova(analysis)

Analysis of Variance Table

Response: phugia
Df Sum Sq Mean Sq F value Pr(>F)
group

2 377.52 188.762 3.9733 0.03722 *

Residuals 18 855.14 47.508
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> res<-aov(phugia~group)
> TukeyHSD(res)
Tukey multiple comparisons of means
95% family-wise confidence level


Fit: aov(formula = phugia ~ group)

$group
diff

lwr

upr

p adj

2-1 -7.428571 -16.83138 1.9742350 0.1369187
3-1 -10.000000 -19.40281 -0.5971936 0.0361071
3-2 -2.571429 -11.97423 6.8313778 0.7677005

> by(phugia,group,sd)
group: 1
[1] 6.890297
group: 2
[1] 6.626067
group: 3
[1] 7.151423
> by(phugia,group,mean)
group: 1
[1] 71.14286
group: 2
[1] 63.71429
group: 3
[1] 61.14286
Bài 5:

Hình 5.1 Hàm lượng izozym EST trong máu ngoại vi của hai nhóm người
Bảng hàm lượng izozym EST trong máu ngoại vi của 2 nhóm người:


Nhóm

Hàm lượng izozym EST

Đối chứng

3.43 ± 0.69

Thí nghiệm


3.77 ± 0.25

Vì p- value = 0.01027 < 0.05, theo thống kê có sự khác biệt về hàm lượng izozym EST giữa hai
hóm người với α=5%. Hàm lượng izozym EST trong máu của nhóm người tiếp xúc lâu dài, trực
tiếp với hoá chất (3.77) cao hơn hàm lượng izozym EST trong máu của nhóm người không tiếp
xúc trực tiếp với hoá chất (3.43).
Phụ lục:
> nhom<-gl(2,35,70)
>hamluong3.48,3.45,3.58,3.59,3.62,3.59,3.57,3.21,2.74,3.29,3.48,3.45,3.58,3.59,3.62,3.59,3.57,3.57,3.59,3.
58,3.67,3.69,3.74,3.58,3.68,3.59,3.58,3.74,3.75,3.61,3.78,3.67,3.69,7.74,3.58,3.68,3.59,3.58,3.5
8,3.68,3.59,3.58,3.74,3.75,3.61,3.78,3.67,3.69,3.74,3.58,3.68)
> bai5<-data.frame(hamluong,nhom)
> var.test(hamluong ~ nhom)

F test to compare two variances

data: hamluong by nhom
F = 0.1304, num df = 34, denom df = 34, p-value = 4.224e-08
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.06584335 0.25842418
sample estimates:
ratio of variances
0.1304435


> t.test(hamluong ~ nhom,equal=F)

Welch Two Sample t-test


data: hamluong by nhom
t = -2.6854, df = 42.722, p-value = 0.01027
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.5868817 -0.0834040
sample estimates:
mean in group 1 mean in group 2
3.434000

3.769143

> by(hamluong,nhom,sd)
nhom: 1
[1] 0.2508128
-----------------------------------------------------------nhom: 2
[1] 0.6944459
> by(hamluong,nhom,mean)
nhom: 1
[1] 3.434
-----------------------------------------------------------nhom: 2


[1] 3.769143
Bài 6:

Hình 6.1 Biểu đồ thể hiện mức độ ưa thích của 240 người đối với mứt rau câu có cho
thêm hương chanh dây và vani
Bảng khảo sát sự ưa thích 2 loại hương chanh dây và hương vani
Không thích


Thích

Hương chanh dây

15

132

Hương vani

33

145

Vì p-value = 0.05107 > 0.05, theo thống kê không có sự khác biệt về mức độ ưa thích giữa 2
loại hương chanh dây và vani. Vì thế trong quá trình chế biến nhà sản xuất có thể dùng 1 trong 2
hương để tăng hương vị cho sản phẩm mứt rau câu, nhưng để cho tiết kiêm nên dùng hương
chanh dây.
Phụ lục:
> bai6<-matrix(c(15,132,33,145),nrow=2,ncol=2,byrow=T,
day","huong vani"),c("khong thich","thich")))

dimnames=list(c("huong

> bai6
khong thich thich
huong chanh day
huong vani


15 132
33 145

> chisq.test(bai6)

Pearson's Chi-squared test with Yates' continuity correction

data: bai6
X-squared = 3.8061, df = 1, p-value = 0.05107

chanh


Bài 7:

Hình 7.1 Biểu đồ thể hiện hàm lượng saponin (%) của 1 loại nhân sâm theo từng vùng
khác nhau
Bảng hàm lượng trung bình saponin (% )trong một loại nhân sâm theo vùng
Vùng

Hàm lượng saponin (%)

Vùng I

7.19a ± 0.43

Vùng II

5.90b ± 0.20


Vùng III

6.39c ± 0.16

Vì p-value =9.412e-06 <<0.05 nên có sự khác biệt hàm lượng saponin trong nhân sâm giữa các
vùng. Hàm lượng saponin cao nhất (7.19%) ở vùng I, hàm lượng này có sự khác biệt so với
những vùng còn lại. Nếu có nhu cầu, nên sử dụng nhân sâm ở vùng I.
Phụ lục :
> vung <- c(1,1,1,1,1,1,1, 2,2,2,2,2, 3,3,3,3,3,3)
> vung <- as.factor(vung)
>saponin> bai7 <- data.frame(vung,saponin)
> anova(lm(saponin~vung))
Analysis of Variance Table
Response: saponin
Df Sum Sq Mean Sq F value Pr(>F)
vung
2 5.1625 2.58126 27.595 9.412e-06 ***
Residuals 15 1.4031 0.09354
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> TukeyHSD(aov(saponin~vung))
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = saponin ~ vung)
$vung
diff
lwr
upr
p adj



II-I -1.2937143 -1.758883797
III-I -0.8040476 -1.246026657
III-II 0.4896667 0.008616515
> by(saponin,vung,mean)
vung: I
[1] 7.195714
vung: II
[1] 5.902
vung: III
[1] 6.391667
> by(saponin,vung,sd)
vung: I
[1] 0.4311944
vung: II
[1] 0.2043771
vung: III
[1] 0.155231

-0.8285448
-0.3620686
0.9707168

0.0000084
0.0007453
0.0457802

Bài 8:
Hình 8.1 Biểu đồ thể hiện độ trong của 2 sản phẩm


Hình 8.2 Biểu đồ thể hiện độ màu của 2 sản phẩm

Hình 8.3 Biểu đồ thể hiện hương của 2 sản phẩm

Hình 8.4 Biểu đồ thể hiện vị mặn của 2 sản phẩm

Kết luận:
1) Vì p-value=6.559e-05<0.05 nêncó sự khác nhau về mức độ ưa thích độ trong ở 2 sản

phẩm. Sản phẩm 1 có mức độ ưa thích độ trong (7.6) cao hơn độ trong của sản phẩm 1
(5.5)
> dotrong <- c(1,1,1,1,1,1,1,1,1,1, 2,2,2,2,2,2,2,2,2,2)
> my <- c(7,6,7,8,9,7,8,9,7,8,6,5,5,6,4,5,6,7,5,6)
> yt1 <- data.frame(dotrong,my)


> yt1
> var.test(dotrong,my)

F test to compare two variances

data: dotrong and my
F = 0.1353, num df = 19, denom df = 19, p-value = 6.045e-05
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.05356051 0.34187428
sample estimates:
ratio of variances
0.135318
> t.test(dotrong,my)


Welch Two Sample t-test

data: dotrong and my
t = -15.1991, df = 24.05, p-value = 7.848e-14
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-5.73567 -4.36433
sample estimates:
mean of x mean of y
1.50

6.55


2) Vì p-value=2.779e-05<0.05 nên có sự khác nhau về mức độ ưa thích độ màu ở 2 sản
phẩm. Mức độ ưa thích độ màu ở sản phẩm 1(7.7) cao hơn độ màu của sản phẩm 2(5.4)
> Yt2 <- c(1,1,1,1,1,1,1,1,1,1, 2,2,2,2,2,2,2,2,2,2)
> domau <- c(8,7,8,9,9,8,6,7,8,7,5,6,5,7,5,4,6,5,6,5)
> my <- data.frame(Yt2,domau)
> my
> var.test(Yt2,domau)

F test to compare two variances

data: Yt2 and domau
F = 0.1221, num df = 19, denom df = 19, p-value = 2.779e-05
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.04832871 0.30847997

sample estimates:
ratio of variances
0.1221001
Vì p-value = 2.779e-05<0.05 nên hàm khác phương sai
> t.test(Yt2,domau)
Welch Two Sample t-test
data: Yt2 and domau


t = -14.5225, df = 23.572, p-value = 2.975e-13
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-5.768385 -4.331615
sample estimates:
mean of x mean of y
6.55
3/ Vì p-value < 2.2e-16 nên <0.05 nên sự khác biệt về hương của hai sản phẩm. Mà giá

1.50

trị trung bình của sản phẩm 1sản phẩm 2.
> Yt3 <- c(1,1,1,1,1,1,1,1,1,1, 2,2,2,2,2,2,2,2,2,2)
> huong <- c(8,7,8,7,6,7,7,8,8,9,7,8,6,5,5,7,8,9,8,8)
> my <- data.frame(Yt3,huong)
> my
> var.test(Yt3,huong)
F test to compare two variances
data: Yt3 and huong
F = 0.2066, num df = 19, denom df = 19, p-value = 0.001198

alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.08177937 0.52199399
sample estimates:
ratio of variances
0.2066116
> t.test(Yt3,huong)
Welch Two Sample t-test
data: Yt3 and huong
t = -20.9232, df = 26.53, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-6.369248 -5.230752
sample estimates:
mean of x mean of y
1.5
7.3


4) Vì p-value <0.05 nên sự khác biệt về vị mặn giữa hai loại sản phẩm có ý nghĩa thống kê. Mà
giá trị trung bình của sản phẩm 2> giá trị trung bình của sản phẩm1 nên ta chọn vị mặn của sản
phẩm 2.
> Yt4 <- c(1,1,1,1,1,1,1,1,1,1, 2,2,2,2,2,2,2,2,2,2)
> viman <- c(8,6,7,6,7,8,7,6,7,6,7,8,7,8,9,7,8,8,9,8)
> my <- data.frame(Yt4,viman)
> my
> var.test(Yt4,viman)
F test to compare two variances
data: Yt4 and viman
F = 0.3021, num df = 19, denom df = 19, p-value = 0.01227

alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1195807 0.7632782
sample estimates:
ratio of variances
0.3021148
Vì p-value = 0.01227<0.05 nên hàm khác phương sai.
> t.test(Yt4,viman)
Welch Two Sample t-test
data: Yt4 and viman
t = -24.5654, df = 29.52, p-value < 2.2e-16


alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-6.336678 -5.363322
sample estimates:
mean of x mean of y
1.50

7.35

Bài 9:

Hình 9.1 Biểu đồ so sánh sự hài lòng của khách hàng về 2 sản phẩm A và B

Sản phẩm A

Sản phẩm B


Hài long

124

107

Không hài long

26

43

Vì p-value = 0.02816<0.05 nên có sự khác biệt về mức độ hài lòng của khách hàng về 2 sản
phẩm A và B. Ta thấy, sản phẩm A có mức độ hài lòng (124) cao hơn mức độ hài lòng của sản
phẩm B (107). Nếu là nhà sản xuất, đề nghị chọn sản phẩm A để tập trung phát triển.
Phụ lục
>a <-c(124,26,107,43)
>b<-matrix(a,nrow=2,byrow=F,dimnames=list(c("Hài
lòng"),c("SPA","SPB")))

lòng","Không

>chisq.test(b)
Pearson's Chi-squared test with Yates' continuity correction
data: b
X-squared = 4.8184, df = 1, p-value = 0.02816

hài



Bài 10:

Hình 10.1 Biểu đồ so sánh thị hiếu của khách hàng về 2 loại sản phẩm: sản phẩm đang
bán và sản phẩm cải tiến
Sản phẩm

Điểm

Đang bán

7.09 ± 1.14

Cải tiến

8.00± 0.77

Vì p-value = 0.04033 < 0.05, nên thị hiếu của khách hàng về 2 loại sản phẩm đang bán và cải
tiến có sự khác nhau. Thị hiếu của khách hàng về sản phẩm đang bán thấp hơn thị hiếu về sản
phẩm cải tiến. Vì vậy nên tung sản phẩm cải tiến ra thị trường.
Phụ lục:
>caitien <- c(8,8,9,7,8,7,7,9,8,9,8)
> dangban <- c(6,8,7,8,8,9,7,5,6,7,7)
> bai10 <- data.frame(dangban, caitien)
>var.test(caitien,dangban)
F test to compare two variances
data: caitien and dangban
F = 0.4648, num df = 10, denom df = 10, p-value = 0.2428
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1250511 1.7275230

sample estimates:
ratio of variances
0.4647887
>t.test(caitien,dangban,var.equal=T)


Two Sample t-test
data: caitien and dangban
t = 2.1926, df = 20, p-value = 0.04033
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.04423118 1.77395064
sample estimates:
mean of x mean of y
8.000000 7.09090
>sd(dangban)
[1] 1.136182
> sd(caitien)
[1] 0.7745967
Bài 11:

Hình 11.1 Biểu đồ thể hiện hiệu suất trích ly ở những thời gian khác nhau
Thời gian

Hiệu suất trích ly

55

17.72a ± 0.90


70

21.07b ± 0.57

85

23.30bc ± 1.13

100

24.38c ± 0.49

115

24.99c ± 0.74

Vì p = 6.447e-06 < 0.05,nên có sự khác biệt về hiệu suất trích ly ở các thời gian khác nhau. Ta
thấy, hiệu suất trích ly cao nhất ở thời gian 115 phút. Tuy nhiên hiệu suất trích ly này không có


sự khác biệt ở thời gian 85 phút, 100 phút, và 115 phút nên có thể chọn một trong 3 mốc thời
gian đó để trích ly. Để tiết kiệm thời gian, nên chọn mốc thời gian 85 phút là thích hợp nhất.\
Phụ lục:
> thoigian<- gl(5,3)
>thoigian<-as.factor(thoigian)
>hieusuat4.73,24.41,25.82)
> bt11 <- data.frame(hieusuat,thoigian)
> a <- lm(hieusuat~thoigian)
> anova(a)

Analysis of Variance Table
Response: hieusuat
Df Sum Sq Mean Sq F value Pr(>F)
thoigian 4 105.167 26.2917 36.126 6.447e-06 ***
Residuals 10 7.278 0.7278
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> res<- aov(hieusuat~thoigian)
> TukeyHSD(res)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = hieusuat ~ thoigian)
$thoigian
diff

lwr

upr

p adj

2-1 3.3466667 1.05425211 5.639081 0.0050286
3-1 5.5800000 3.28758544 7.872415 0.0000884
4-1 6.6633333 4.37091878 8.955748 0.0000184
5-1 7.2666667 4.97425211 9.559081 0.0000083
3-2 2.2333333 -0.05908122 4.525748 0.0570307


4-2 3.3166667 1.02425211 5.609081 0.0053534
5-2 3.9200000 1.62758544 6.212415 0.0015862
4-3 1.0833333 -1.20908122 3.375748 0.5536133

5-3 1.6866667 -0.60574789 3.979081 0.1864817
5-4 0.6033333 -1.68908122 2.895748 0.9028933
> by(hieusuat,thoigian,mean)
thoigian: 1
[1] 17.72
thoigian: 2
[1] 21.06667
thoigian: 3
[1] 23.3
thoigian: 4
[1] 24.38333
thoigian: 5
[1] 24.98667
> by(hieusuat,thoigian,sd)
thoigian: 1
[1] 0.9000556
thoigian: 2
[1] 0.5727419
thoigian: 3
[1] 1.309313
thoigian: 4
[1] 0.489932
thoigian: 5
[1] 0.7392113
Bài 12:


Hình 12.1 Biểu đồ thể hiện năng suất của các giống lúa
Năng suất
Giống 1


7.00a ±1.00

Giống 2

8.60ab ±1.14

Giống 3

4.60c ±1.14

Giống 4

4.80c ±0.84

Vì p-value =3.229e-05<0.05, theo thống kê có sự khác biệt về năng suất giữa các giống lúa với
mức ý nghĩa 5%. Ta thấy giống lúa 2 cho năng suất cao nhất, năng suất này không có sự khác
biệt so với giống lúa 1. Để phổ biến rộng rãi trong sản xuất, có thể chọn giống 1 hoặc giống 2.
Phụ lục:
> giong<- c(1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4)
> giong<- as.factor(giong)
> nangsuat <-c(8, 7, 6, 6, 8, 9, 10, 7, 9, 8, 5, 5, 4, 3, 6, 5, 4, 5, 4, 6)
> bai12 <- data.frame(giong,nangsuat)
> phuongsai <-lm (nangsuat~giong)
> anova(phuongsai)
Analysis of Variance Table
Response: nangsuat
Df Sum Sq Mean Sq F value Pr(>F)
giong


3 54.55 18.183 16.915 3.229e-05 ***

Residuals 16 17.20 1.075
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> res <-aov(nangsuat~giong)


> TukeyHSD(res)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = nangsuat ~ giong)
$giong
diff

lwr

upr

p adj

2-1 1.6 -0.2760962 3.4760962 0.1091981
3-1 -2.4 -4.2760962 -0.5239038 0.0102311
4-1 -2.2 -4.0760962 -0.3239038 0.0189329
3-2 -4.0 -5.8760962 -2.1239038 0.0000822
4-2 -3.8 -5.6760962 -1.9239038 0.0001458
4-3 0.2 -1.6760962 2.0760962 0.9897700
>by(nangsuat,giong,mean)
giong: 1
[1] 7
giong: 2

[1] 8.6
giong: 3
[1] 4.6
giong: 4
[1] 4.8
> by(nangsuat,giong,sd)
giong: 1
[1] 1
giong: 2


×