Tải bản đầy đủ (.pdf) (71 trang)

34 bài tập phân tích và xử lý dữ liệu bằng R

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.33 MB, 71 trang )

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TPHCM

Bài tập xử lý số liệu
Giảng viên hướng dẫn: Phạm Minh Tuấn
Sinh viên: Lê Ngọc Châu_14131841
11/30/2015


Bài tập xử lý số liệu
Bài 1:
90

Hiệu suất trích ly (%)

80
70
60
50
40
30
20
10
0
Diethyl

Cồn
Dung mơi

Biểu đồ so sánh hiệu suất trích ly của Diethyl và Cồn
Bảng 1 : Hiệu suất trích ly polyphenol trong 2 loại dung mơi.
Dung mơi


Hiệu suất trích ly %
Diethyl
69.2a ± 5.167204
Cồn
68.0a ± 15.0333
Ghi chú: kí tự [ a] trên cùng 1 cột thể hiện sự khác biệt giữa hai dung mơi này trong việc
trích ly polyphenol khơng có ý nghĩa thống kê.
Qua kiểm định chúng ta thấy sự khác nhau về hiệu suất trích ly của hai dung mơi
khơng có ý nghãi thống kê (p-value=0.8943>0.05). Vì vậy, chúng ta có thể chọn một
trong hai dung mơi trên để trích ly polyphenol. Nhưng nếu xét về mặt kinh tế chúng ta
vẫn nên chọn cồn để tiết kiệm chi phí.
Phụ lục:
> Diethyl<-c(68, 63, 74, 66, 75 )
> Con<-c(52,84, 58, 84, 62)
> var.test(Diethyl,Con)
F test to compare two variances
data: Diethyl and Con
F = 0.11814, num df = 4, denom df = 4, p-value = 0.06226
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.01230061 1.13469446
sample estimates:
Lê Ngọc Châu

Page 1


Bài tập xử lý số liệu
ratio of variances
0.1181416

> t.test(Diethyl,Con,paired=T)
Paired t-test
data: Diethyl and Con
t = 0.14148, df = 4, p-value = 0.8943
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-22.3491 24.7491
sample estimates:
mean of the differences
1.2
Bài 2:
1.4

Thời gain bền bợt (h)

1.2
1
0.8
0.6
0.4
0.2
0
Đối chứng

CMC
Loại phụ gia

Biểu đồ thể hiện sự khác nhau về khả năng tạo bền bọt của phụ gia CMC so với đối
chứng.
Bảng 2 : Khả năng tạo bền bột của phụ gia CMC so với đối chứng.

Phụ gia
Khả năng bền bọt ( h )
Đối chứng
1.047a ± 0.049
CMC
1.223b ± 0.044734
Ghi chú : [a],[b] cho thấy sự khác nhau về khả năng bền bọt giữa phụ gia CMC và q
trình đối chứng lại có ý nghĩa thống kê.
Lê Ngọc Châu

Page 2


Bài tập xử lý số liệu
Quá trình xử lý số liệu cho ta thấy sự khác biệt về khả năng bền bọt giữa phụ gia
CMC và quá trình đối chứng là có ý nghĩa thống kê (p-value = 1.374e-05 < 0.05).
Vì vậy khơng chọn phụ gia CMC để tăng khả năng bền bọt.
Phụ lục:
> doichung=c(1.1,0.99,1.05,1.01,1.02,1.07,1.1,0.98,1.03,1.12)
> cmc=c(1.25,1.31,1.28,1.2,1.18,1.22,1.22,1.17,1.19,1.21)
> bai2=data.frame(doichung, cmc)
> var.test(doichung,cmc)
F test to compare two variances
data: doichung and cmc
F = 1.1999, num df = 9, denom df = 9, p-value = 0.7905
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.2980354 4.8307459
sample estimates:
ratio of variances

1.199889
> t.test(doichung,cmc,paired=T)
Paired t-test
data: doichung and cmc
t = -8.7467, df = 9, p-value = 1.078e-05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.2215188 -0.1304812
sample estimates:
mean of the differences
-0.176
Bài 3:

Lê Ngọc Châu

Page 3


Lượng acid amin phân giải (mg/kg)

Bài tập xử lý số liệu
25
20
15
10
5
0
Loại A

Loại B


Loại C

Loại D

Loại enzyme

Biểu đồ thể hiện lượng acid amin được phân giải từ 4 loại enzyme
Bảng 3: Hàm lượng acid amin (mg/kg) khi thủy phân protein trong nước mắm
bằng 4 loại Enzyme.
Hàm lượng acid amin
Loại Enzyme thủy phân
(mg/kg)
18.17ac ± 1.17
A
B
C
D

14.80b ± 0.84
19.00c ± 0.82
16.25ab ± 1.26

Ghi chú: [a],[b],[c] cho thấy sự khác biệt có ý nghĩa thống kê.
Qua quá trình kiểm định lại bảng số liệu thu thập được ta thấy rằng các số liệu này
có ý nghĩa thống kê (p-value=7.46e-05<0.05). Hay nói cách khác là các số liệu thu thập
được về quá trình thủy phân acid amin ở trrong cá của 4 loại enzyme là có ý nghĩa.
Cũng qua phân tích ta thấy rằng enzyme C cho kết quả thủy phân cao nhất . Vậy
nếu là nhà sản xuất thì nên chọn enzyme C cho quá trình sản xuất nước mắm cảu mình.
Phụ lục:

> Group=c(rep("A",6),rep("B",5),rep("C",4),rep("D",4))
> group=as.factor(Group)
> LoaiA=c(17,18,17,20,19,18)
> LoaiB=c(14,15,16,15,14)
> LoaiC=c(19,20,18,19)
Lê Ngọc Châu

Page 4


Bài tập xử lý số liệu
> LoaiD=c(16,15,16,18)
> loaienzyme=c(LoaiA,LoaiB,LoaiC,LoaiD)
> data=data.frame(loaienzyme,group)
> bai3=aov(loaienzyme~group)
> summary(bai3)
Df Sum Sq Mean Sq F value Pr(>F)
group
3 50.56 16.855 15.43 7.46e-05 ***
Residuals 15 16.38 1.092
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> TukeyHSD(bai3)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = loaienzyme ~ group)
$group
diff
lwr
upr p adj
B-A -3.3666667 -5.1905943 -1.5427391 0.0004459

C-A 0.8333333 -1.1109800 2.7776467 0.6151972
D-A -1.9166667 -3.8609800 0.0276467 0.0539882
C-B 4.2000000 2.1794103 6.2205897 0.0001307
D-B 1.4500000 -0.5705897 3.4705897 0.2079384
D-C -2.7500000 -4.8798886 -0.6201114 0.0098498
Bài 4:

Lê Ngọc Châu

Page 5


Bài tập xử lý số liệu
90

Khả năng trương nở

80
70
60
50
40
30
20
10
0
0.50%

0.30%


0.10%

Nồng độ phụ gia (%)

Bảng 4 : Khả nằng trương nở của bánh khi thêm 3 nồng độ khác nhau của 1 loại phụ gia.
Nồng độ phụ gia
Hiệu suất trương nở của bánh %
0.1%
61.14a ± 7.15
0.3%
63.71ab ± 6.63
0.5%
71.14b ± 6.89
Ghi chú: [a],[b],[c] cho thấy sự khác biệt có ý nghĩa thống kê.
Qua q trình phân tích ta thấy sự khác biệt về khả năng trương nở của loại phụ
gia trên với 3 nồng độ khác nhau là có ý nghĩa thống kê (p-value=0.0372<0.05)
Ở nồng độ 0.5% -0.3% thì phụ gia cho khả năng trương nở tốt nhất (71.14% và
63.71%) và ở 2 nồng độ này khả năng trương nở cũng không cho thấy sự khác biệt. Vì
vậy chúng ta nên chọn nồng độ phụ gia là 0.3% để chế biến bánh phồng tơm nhằm tiết
kiệm chi phí sản xuất.
Phụ lục:
> hieusuat= c(68,80,69,76,68,77,60, 71,62,58,74,65,59,57, 58,60,70,51,57,71,61)
> cphugia=c(rep("0.5%",7),rep("0,3%",7),rep("0.1%",7))
> bai4=data.frame(hieusuat, cphugia)
> av = aov(hieusuat~cphugia)
> summary(av)
Df Sum Sq Mean Sq F value Pr(>F)
cphugia
2 377.5 188.76 3.973 0.0372 *
Residuals 18 855.1 47.51

--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> hn=aov(hieusuat~cphugia)
> TukeyHSD(hn)
Lê Ngọc Châu

Page 6


Bài tập xử lý số liệu
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = hieusuat ~ cphugia)
$cphugia
diff
lwr
upr p adj
0.1%-0,3% -2.571429 -11.9742350 6.831378 0.7677005
0.5%-0,3% 7.428571 -1.9742350 16.831378 0.1369187
0.5%-0.1% 10.000000 0.5971936 19.402806 0.0361071

Hàm lượng izozyme EST trong máu
ngoại vi

Bài 5:
3.8
3.7
3.6
3.5
3.4
3.3

3.2
Đối chứng

Thí nghiệm

Nhóm người

Biểu đồ thể hiện sự khác biệt về hàm lượng izozyme EST trong máu ngoại vi của hai
nhóm người

Bảng 5: Hàm lượng izozyme EST trong máu ngoại vi của hai nhóm người.
Nhóm người
Hàm lượng izozyme EST trong máu
Đối chứng
3.53a ± 0.12
Thí nghiệm
3.64b ± 0.09
Ghi chú: [a],[b] cho thấy sự khác biệt có ý nghĩa thống kê.
Qua phân tích số liệu ta thấy có sự khác biệt về hàm lượng izozyme EST trong
máu ngoại vi của hai nhóm người ( đối chứng và thí nghiệm) (p-value= 0.045 <0.05).
Phụ lục:
Lê Ngọc Châu

Page 7


Bài tập xử lý số liệu
>doichung=c(3.45,3.58,3.59,3.62,3.59,3.57,3.35,3.74,3.29,3.48,3.45,3.58,3.59,3.62,3.59,3
.57,3.35,3.74,3.29,3.48,3.45,3.58,3.59,3.62,3.59,3.57,3.35,3.74,3.29,3.48,3.45,3.58,3.59,3
.62,3.59)

>thinghiem=c(3.57,3.57,3.59,3.58,3.67,3.69,3.74,3.58,3.68,3.59,3.58,3.74,3.75,3.61,3.78,
3.67,3.69,3.35,3.58,3.68,3.59,3.58,3.58,3.68,3.59,3.58,3.74,3.75,3.61,3.78,3.67,3.69,3.74,
3.58,3.68)
> var.test(doichung,thinghiem)
F test to compare two variances
data: doichung and thinghiem
F = 2.0128, num df = 34, denom df = 34, p-value = 0.045
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
1.016014 3.987686
sample estimates:
ratio of variances
2.012845
> t.test(doichung,thinghiem)
Welch Two Sample t-test
data: doichung and thinghiem
t = -4.4164, df = 61.095, p-value = 4.169e-05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.16270852 -0.06129148
sample estimates:
mean of x mean of y
3.531714 3.643714
Bài 6:

Lê Ngọc Châu

Page 8



Bài tập xử lý số liệu
160

Đánh giá cảm quan

140
120
100
80

Thích

60

Khơng thích

40
20
0
Hương chanh dây
Hương vani
Hương vị sản phẩm

Biểu đồ thể hiện kết quả đánh giá cảm quan cảu người tiêu dùng với 2 sản phẩm
Bảng 6: Mức độ yêu thích hại loại hương vị (số người )
Khơng thích
Thích
Hương chanh dây
15
132

Hương vani
33
145
Mặc dù sản phẩm với hương chanh dây được sự đánh giá cao hơn ( chanh dây
=90% và vani=81%) nhưng kết quả phân tích cho ta thấy kết quả thống kê đánh giá cảm
quan của người tiêu dùng với 2 sản phẩm trên là khơng có ý nghĩa thống kê (p-value=
0.05107 >0.05) nên nhà sản xuất có thể chọn một trong 2 loại sản phẩm trên để sản xuất.
Phụ lục:
>B6<-matrix(c(15,132,33,145),nrow=2, byrow= T)
> chisq.test(B6)
Pearson's Chi-squared test with Yates' continuity correction
data: B6
X-squared = 3.8061, df = 1, p-value = 0.05107
Bài 7:

Lê Ngọc Châu

Page 9


Bài tập xử lý số liệu
9
8
7
6
5
4
3
2
1

0
Vùng I

Vùng II

Vùng III

Biểu đồ thể hiện hàm lượng saponin (%) trong 1 loại nhân sâm được thu hái từ 3 vùng
khác nhau
Bảng 7: Hàm lượng saponin của 1 loại nhân sâm.
Hàm Lượng Saponin trong 1 loại nhân
Tên Vùng
sâm
Vùng 1
7.20b ± 0.43
Vùng 2

5.90a ± 0.20

Vùng 3
6.39c ± 0.16
Ghi chú : [a],[b],[c] thể hiện sự khác nhau biệt về hàm lượng saponin của 1 loại nhân
sâm giữa các vùng có ý nghĩa thống kê.
Qua q trình phân tích ta thấy sự khác nhau biệt về hàm lượng saponin của 1 loại
nhân sâm giữa các vùng có ý nghĩa thống kê ( p-value=9.412e-06<0.05). Kết quả trên
cũng cho ta thấy hàm lượng saponin giữa 3 vùng đều khác nhau và vùng 1 là vùng có hàm
lượng saponin trong nhân sâm là cao nhất. Như vậy chúng ta nên chọn nhân sâm ở vùng
1.
Phụ lục:
> vung1=c(7.53 ,6.87 ,7.12 ,7.53, 6.84 ,6.67 ,7.81)

> vung2=c(5.87 ,5.64 ,6.14 ,6.07 ,5.79)
> vung3=c(6.13 ,6.35 ,6.50 ,6.49 ,6.55 ,6.33)
> data=c(vung1,vung2,vung3)
> a=c(rep("vung1",7),rep("vung2",5),rep("vung3",6))
> a=as.factor(a)
> b7=data.frame(a,data)
> attach(b7)
Lê Ngọc Châu

Page 10


Bài tập xử lý số liệu
The following objects are masked _by_ .GlobalEnv:
a, data
> bai7=lm(data~a)
> anova(bai7)
Analysis of Variance Table
Response: data
Df Sum Sq Mean Sq F value Pr(>F)
a
2 5.1625 2.58126 27.595 9.412e-06 ***
Residuals 15 1.4031 0.09354
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
7.195714 0.431194
5.902 0.204377
6.391667 0.155231
> av=aov(data~a)
> TukeyHSD(av)
Tukey multiple comparisons of means

95% family-wise confidence level
Fit: aov(formula = data ~ a)
$a
diff
lwr
upr p adj
vung2-vung1 -1.2937143 -1.758883797 -0.8285448 0.0000084
vung3-vung1 -0.8040476 -1.246026657 -0.3620686 0.0007453
vung3-vung2 0.4896667 0.008616515 0.9707168 0.0457802
Bài 8:

Lê Ngọc Châu

Page 11


Bài tập xử lý số liệu
10
Diểm đánh giá trung bình

9
8
7
6
5

Mẫu 1

4


Mẫu 2

3
2
1
0
Trong

Mặn

Màu

Hương

Tính chất

Biểu đồ thể hiện sự đánh giá của nguời tiêu dùng đối với 4 tính chất của 2 loại sản phẩm
Bảng 8: Đánh giá của khách hàng về 2 sản phẩm.
Đánh giá của khách hàng
Sản phẩm
Độ trong
Độ màu
Hương
Vị mặn
a
c
e
Sản phẩm 1
7.6 ± 0.97
7.7 ± 0.95

7.5 ± 0.85
6.8g ± 0.79
Sản phẩm 2
5.5b ± 0.85
5.4d ± 0.84
7.1e ± 1.37
7.9h ± 0.74
Ghi chú : [a],[b],[c],[d],[e],[g],[h] thể hiện sự khác nhau có ý nghĩa thống kê.
Qua q trình phân tích ta thấy có sự khác biệt trong kết quả thống kê về 3 loại tính
chất của 2 sản phẩm: độ trong (p-value = 6.559e-05<0.05), độ màu (p-value = 1.968e05<0.05), độ mặn (p-value = 0.004744) là có ý nghĩa và sự khác biệt về mùi hương giữa 2
sản phẩm là khơng có ý nghãi thống kê (p-value = 0.443>0.05).
Nếu là một nhân viên R&D tơi sẽ chọn 3 tính chất cảm quan là độ trong, độ màu,
vị mặn của 2 sản phẩm trên để định hướng sản phẩm trong tương lai của công ty. Vì sự
khác biệt trong thống kê của 3 tính chất trên có ý nghĩa.
Phụ lục:
> trong1=c(7,6,7,8,9,7,8,9,7,8)
> trong2=c(6,5,5,6,4,5,6,7,5,6)
> mau1=c(8,7,8,9,9,8,6,7,8,7)
> mau2=c(5,6,5,7,5,4,6,5,6,5)
> huong1=c(8,7,8,7,6,7,7,8,8,9)
> huong2=c(7,8,6,5,5,7,8,9,8,8)
> man1=c(8,6,7,6,7,8,7,6,7,6)
> man2=c(7,8,7,8,9,7,8,8,9,8)
> var.test(trong1,trong2)
Lê Ngọc Châu

Page 12


Bài tập xử lý số liệu

F test to compare two variances
data: trong1 and trong2
F = 1.2923, num df = 9, denom df = 9, p-value = 0.7087
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.320991 5.202823
sample estimates:
ratio of variances
1.292308
> t.test(trong1,trong2,var.equal=TRUE)
Two Sample t-test
data: trong1 and trong2
t = 5.1612, df = 18, p-value = 6.559e-05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
1.245166 2.954834
sample estimates:
mean of x mean of y
7.6
5.5
> var.test(mau1,mau2)
F test to compare two variances
data: mau1 and mau2
F = 1.2656, num df = 9, denom df = 9, p-value = 0.7314
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.3143633 5.0953989
sample estimates:
ratio of variances
1.265625

Lê Ngọc Châu

Page 13


Bài tập xử lý số liệu
> t.test(mau1,mau2,var.equal=TRUE)
Two Sample t-test
data: mau1 and mau2
t = 5.7301, df = 18, p-value = 1.968e-05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
1.456718 3.143282
sample estimates:
mean of x mean of y
7.7
5.4
> var.test(huong1,huong2)
F test to compare two variances
data: huong1 and huong2
F = 0.38462, num df = 9, denom df = 9, p-value = 0.1708
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.09553302 1.54845929
sample estimates:
ratio of variances
0.3846154
> t.test(huong1,huong2,var.equal=TRUE)
Two Sample t-test
data: huong1 and huong2

t = 0.78446, df = 18, p-value = 0.443
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.6712642 1.4712642
sample estimates:
Lê Ngọc Châu

Page 14


Bài tập xử lý số liệu
mean of x mean of y
7.5
7.1
> var.test(man1,man2)
F test to compare two variances
data: man1 and man2
F = 1.1429, num df = 9, denom df = 9, p-value = 0.8456
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.2838695 4.6011362
sample estimates:
ratio of variances
1.142857
> t.test(man1,man2,var.equal=TRUE)
Two Sample t-test
data: man1 and man2
t = -3.2205, df = 18, p-value = 0.004744
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:

-1.8176015 -0.3823985
sample estimates:
mean of x mean of y
6.8
7.9
Bài 9:

Lê Ngọc Châu

Page 15


Bài tập xử lý số liệu
140
120

Số người

100
80
Thích

60
40
20
0
Sản phẩm A

Sản phẩm B
Sản phẩm


Biểu đồ thể hiện mức độ yêu thích của người tiêu dung đối với 2 loại sản phẩm
Bảng 9: Sự hài lòng của khách hàng về 2 sản phẩm A và B.
Sản phẩm A
Sản phẩm B
Hài lịng
124
107
Khơng hài lịng
26
43
Qua q trình phân tích kết quả thống kê ta nhận thấy sự khác biệt trong kết quả
trên là có ý nghĩa (p-value = 0.02816<0.05). Và sản phẩm A được sự đánh giá cao hơn từ
nguời tiêu dùng ( sản phẩm A 83% , sản phẩm B 71%). Như vậy nếu là một người tiêu
dùng thì sản phẩm được tơi ưu tiên chọn là sản phẩm A.
Phụ lục:
> a=matrix(c(124,107,26,43),nrow=2,byrow=F)
> chisq.test(a)
Pearson's Chi-squared test with Yates' continuity correction
data: a
X-squared = 4.8184, df = 1, p-value = 0.02816
Bài 10:

Lê Ngọc Châu

Page 16


Điểm đánh giá trung bình của người
tiêu dùng


Bài tập xử lý số liệu
10
9
8
7
6
5
4
3
2
1
0
Đang bán

Cải tiến
Sản phẩm

Biểu đồ thể hiện điểm trung bình từ khách hàng cho 2 sản phẩm
Bảng 10: Điểm thị hiếu của khách hàng đối với 2 sản phẩm
Sản phẩm đang bán
7.1a±1.14
Sản phẩm cải tiến
8.0a±0.77
a là kí hiệu thể hiện khơng có ý nghĩa thống kê
Ta thấy p-value= 0.1066 > 0.05 nên bảng số liệu thu thập được khơng có ý nghĩa
thống kê. Như vậy khơng nên đưa sản phẩm cải tiến ra ngoài thị trường.
Phụ lục:
> db=c(6, 8, 7, 8, 8, 9, 7, 5 ,6 ,7 ,7)
> ct=c(8 ,8 ,9 ,7 ,8 ,7 ,7, 9, 8, 9 ,8)

> var.test(db,ct)
> c=c(rep("db",11),rep("ct",11))
> e=as.factor(c)
> f=c(db,ct)
> t.test(f~e,paired=T)
> library(sciplot)
> bargraph.CI(e,f,col="blue",xlab="sản phẩm",ylab="điểm tb")
Kiểm tra phương sai:
F test to compare two variances
data: db and ct
F = 2.1515, num df = 10, denom df = 10, p-value = 0.2428
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
Lê Ngọc Châu

Page 17


Bài tập xử lý số liệu
0.5788635 7.9967340
sample estimates:
ratio of variances
2.151515
Kiểm định paired test:
Paired t-test
data: f by e
t = 1.7733, df = 10, p-value = 0.1066
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.2331642 2.0513461

sample estimates:
mean of the differences
0.9090909
Bài 11:
30

Hiệu suất trích ly (%)

25
20
15
10
5
0
55

70

85

100

115

Thời gian (phút)

Biểu đồ thể hiện hiệu suất trích ly (%) của enzyme pectinase theo thời gian.
Bảng 11: Hiệu suất trích ly (%) của enzyme pectinase theo theo thời gian.
Thời gian trích ly( phút)
Hiệu suất trích ly

50
17.72a ± 0.90
70
21.07b ± 0.57
85
23.30bc ± 1.31
100
24.38c ± 0.49
115
24.99c ± 0.74
Lê Ngọc Châu

Page 18


Bài tập xử lý số liệu
Ghi chú : [a],[b],[c] trên cùng 1 cột thể hiện sự khác nhau có ý nghĩa thống kê.
Qua q trình phân tích ta thấy sự khác biệt về hiệu suất trích ly ở các mốc thời
gian là có ý nghĩa thống kê (p-value=6.447e-06<0.05).
Thời gian trích ly hợp lý nhất là 85 phút. Vì ở cả 3 mốc thời gian là 85,100,115 thì
sựu khác biệt của nó đều khơng có ý nghĩa thống kê. Nhưng để tiết kiệm chi phí trong sản
xuất thì chúng ta nên chọn thời gian trích là 85 phút để mang lại hiệu quả tốt hơn về kinh
tế.
Phụ lục:
> a=c(16.77,18.56,17.83)
> b=c(21.51,20.42,21.27)
> c=c(22.16,24.73,23.01)
> d=c(24.92,24.27,23.96)
> e=c(24.73,24.41,25.82)
> data=c(a,b,c,d,e)

> group=c(rep("55",3),rep("70",3),rep("85",3),rep("100",3),rep("115",3))
> group=as.factor(group)
> bai11=data.frame(data,group)
> b11=lm(data~group)
> aov=anova(b11)
> aov
Analysis of Variance Table
Response: data
Df Sum Sq Mean Sq F value Pr(>F)
group
4 105.167 26.2917 36.126 6.447e-06 ***
Residuals 10 7.278 0.7278
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> av=aov(data~group)
> TukeyHSD(av)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = data ~ group)
$group
diff
Lê Ngọc Châu

lwr

upr

p adj
Page 19



Bài tập xử lý số liệu
115-100 0.6033333 -1.68908122 2.8957479 0.9028933
55-100 -6.6633333 -8.95574789 -4.3709188 0.0000184
70-100 -3.3166667 -5.60908122 -1.0242521 0.0053534
85-100 -1.0833333 -3.37574789 1.2090812 0.5536133
55-115 -7.2666667 -9.55908122 -4.9742521 0.0000083
70-115 -3.9200000 -6.21241456 -1.6275854 0.0015862
85-115 -1.6866667 -3.97908122 0.6057479 0.1864817
70-55 3.3466667 1.05425211 5.6390812 0.0050286
85-55 5.5800000 3.28758544 7.8724146 0.0000884
85-70 2.2333333 -0.05908122 4.5257479 0.0570307
Bài 12:
12
10
8
6
4
2
0
Giống 1

Giống 2

Giống 3

Giống 4

Biểu đồ so sánh năng suất của 4 giống lúa
Bảng 12: Ảnh hưởng của giống đến năng suất lúa.
Giống lúa

Năng suất
1
7.0a ± 1.00
2
8.6a ± 1.14
3
4.6b ± 1.14
4
4.8b ± 0.84
Ghi chú : [a],[b] thể hiện sự khác nhau về năng suất có ý nghĩa thống kê.
Qua q trình phân tích ta thấy sự khác nhau về năng suất có ý nghĩa thống kê (pvalue=3.229e-05<0.05). Hay nói cách khác năng suất của mỗi giống lúa sai khác nhau là
do phẩm giống của chúng khác nhau.
Cũng qua kết quả phân tích ta thấy rằng khơng có sự khác biệt về năng suất của
giống 1 và 2. Nên có thể chọn giống 1 hoặc giống 2 để đem sản xuất đại trà.
Lê Ngọc Châu

Page 20


Bài tập xử lý số liệu
Phụ lục:
> g1=c(8,7,6,6,8)
> g2=c(9,10,7,9,8)
> g3=c(5,5,4,3,6)
> g4=c(5,4,5,4,6)
> g=c(g1,g2,g3,g4)
> group=c(rep("giống 1",5),rep("giống 2",5),rep("giống 3",5),rep("giống 4",5))
> group=as.factor(group)
> data=data.frame(g,group)
> bai12=lm(g~group)

> anova(bai12)
Analysis of Variance Table
Response: g
Df Sum Sq Mean Sq F value Pr(>F)
group
3 54.55 18.183 16.915 3.229e-05 ***
Residuals 16 17.20 1.075
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> av=aov(g~group)
> TukeyHSD(av)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = g ~ group)
$group
diff
lwr
upr p adj
giống 2-giống 1 1.6 -0.2760962 3.4760962 0.1091981
giống 3-giống 1 -2.4 -4.2760962 -0.5239038 0.0102311
giống 4-giống 1 -2.2 -4.0760962 -0.3239038 0.0189329
giống 3-giống 2 -4.0 -5.8760962 -2.1239038 0.0000822
giống 4-giống 2 -3.8 -5.6760962 -1.9239038 0.0001458
giống 4-giống 3 0.2 -1.6760962 2.0760962 0.9897700
Bài 13:

Lê Ngọc Châu

Page 21



Hàm lượng vitaminc theo tính chất
khơ(mg/g)

Bài tập xử lý số liệu
120
100
80
60
40
20
0
0

0.05

0.1

0.15

0.2

0.25

0.3

Nồng độ chế phẩm (%v/w

)

Biểu đồ thể hiện sự ảnh hưởng của nồng độ enzyme đến hàm lượng vitamin C

Bảng 13: Hàm lượng vitamin C (mg/kg) tính theo lượng chất khô
Nồng độ chế phẩm
Hàm lượng Vitamin C
0
49.83a ± 2.03
0.05
78.13b ± 1.51
0.1
89.04c ±1.33
0.15
91.74cd ± 0.90
0.2
94.32de± 0.72
0.25
96.75e ± 1.38
0.3
97.57de ± 1.17
Ghi chú : [a],[b],[c],[d],[e] thể hiện sự khác biệt có ý nghĩa thống kê .
Qua q trình phân tích ta thấy sự khác nhau về hàm lượng vitamin c có ý nghĩa
thống kê (p-value= 2.389e-15 <0.05).Cũng qua kết qủa phân tích trên ta thấy sự khác biệt
về hàm lượng vitamin c ở 3 loại nồng độ 0.2,0.25 và 0.3 khơng có ý nghĩa thống kê vì vậy
có thể chọn 1 trong 3 nồng độ chế phẩm trên để đạt được hàm lượng vitamin c cao nhất.
Nhưng nếu xét về mặt kinh tế chúng ta nên dừng ở mức nồng đọ chế phẩm là 0.2 để tiết
kiệm.
Phụ lục:
> nd1=c(49.02,48.33,52.14)
> nd2=c(76.43,78.64,79.31)
> nd3=c(88.65,90.52,87.94)
> nd4=c(90.75,92.51,91.96)
> nd5=c(93.56,94.42,94.99)

> nd6=c(95.23,97.12,97.91)
> nd7=c(96.41,97.56,98.73)
Lê Ngọc Châu

Page 22


Bài tập xử lý số liệu
>
group=c(rep("0",3),rep("0.05",3),rep("0.1",3),rep("0.15",3),rep("0.2",3),rep("0.25",3),rep(
"0.3",3))
> group=as.factor(group)
> nd=c(nd1,nd2,nd3,nd4,nd5,nd6,nd7)
> data=data.frame(nd,group)
> bai13=lm(nd~group)
> anova(bai13)
Analysis of Variance Table
Response: nd
Df Sum Sq Mean Sq F value Pr(>F)
group
6 5184.2 864.04 474.76 2.389e-15 ***
Residuals 14 25.5 1.82
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> av=aov(nd~group)
> TukeyHSD(av)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = nd ~ group)
$group
diff

lwr
upr p adj
0.05-0 28.2966667 24.5355155 32.057818 0.0000000
0.1-0 39.2066667 35.4455155 42.967818 0.0000000
0.15-0 41.9100000 38.1488488 45.671151 0.0000000
0.2-0 44.4933333 40.7321822 48.254484 0.0000000
0.25-0 46.9233333 43.1621822 50.684484 0.0000000
0.3-0 47.7366667 43.9755155 51.497818 0.0000000
0.1-0.05 10.9100000 7.1488488 14.671151 0.0000018
0.15-0.05 13.6133333 9.8521822 17.374484 0.0000001
0.2-0.05 16.1966667 12.4355155 19.957818 0.0000000
0.25-0.05 18.6266667 14.8655155 22.387818 0.0000000
0.3-0.05 19.4400000 15.6788488 23.201151 0.0000000
0.15-0.1 2.7033333 -1.0578178 6.464484 0.2468338
Lê Ngọc Châu

Page 23


Bài tập xử lý số liệu
0.2-0.1 5.2866667 1.5255155 9.047818 0.0040668
0.25-0.1 7.7166667 3.9555155 11.477818 0.0000992
0.3-0.1 8.5300000 4.7688488 12.291151 0.0000325
0.2-0.15 2.5833333 -1.1778178 6.344484 0.2892414
0.25-0.15 5.0133333 1.2521822 8.774484 0.0063632
0.3-0.15 5.8266667 2.0655155 9.587818 0.0017029
0.25-0.2 2.4300000 -1.3311512 6.191151 0.3506392
0.3-0.2 3.2433333 -0.5178178 7.004484 0.1131016
0.3-0.25 0.8133333 -2.9478178 4.574484 0.9873690
Bài 14:

400
350

Số lượng bệnh nhân

300
250
200

Tăng 0.5-1 kg/tháng
Tăng 1.5-3 kg/tháng

150
100
50
0
Thực đơn 1

Thực đơn 2
Loại thực đơn

Thực đơn 3

Biểu đồ thể hiện sự tăng trọng lượng cơ thể trên 3 thực đơn
Bảng 14 :Lượng tăng trọng lượng bệnh nhân (kg/tháng) như sau:
Thực đơn 1
Thực đơn 2
Thực đơn 3
Tăng 1.5-3 kg/tháng
245

145
367
Tăng 0.5-1 kg/tháng
170
270
48
Qua q trình phân tích ta thấy sự khác biệt về lượng tăng trọng lượng của bệnh
nhân là có ý nghĩa thống kê (p-value < 2.2e-16).
Qua bảng số liệu thống kê ta thấy rằng thực đơn 3 cho số lượng bện nhân tăng
trọng lượng là cao nhất. Vì vậy để giúp bệnh nhân mau lấy lại trọng lượng ban đầu ta nên
cho bệnh nhân ăn theo thực đơn 3.
Lê Ngọc Châu

Page 24


×