BÀI THỰC HÀNH TIN HỌC ỨNG DỤNG
Họ và tên: Triệu Đức Anh
MSV: 1654060873
Bài 1 :
Phần 1:nhập dữ liệu
Phần 2: xác định tuổi bình quân của người hút thuốc:
Câu lệnh: Analyze/ Despcriptive Statistics/ Descriptives
> Cửa sổ Descriptives chọn biến Tuoi vào Variable(s) / OK .
Kết quả:
Descriptive Statistics
N
Tuổi
Valid N (listwise)
Minimum
14
14
-1
Maximum
64
Mean
34.71
Std.
Deviation
Câu lệnh: Analyze/ Custom
Tables/ Custom tables-> Cửa
17.718 sổ
Cửa sổ Custom Tables gắp các biến Tuoi vào cột Columns, Thoi quen hut thuoc và Gioi tinh vào cột Rows/
Nhấn Categories and total-> tích vào Total và Label nhập: “ Bình quân”-> apply ; Nhấn Summary Statistics..
Chọn Maximum, Minimum, Std.Deviation đưa sang cột Display -> Apply to Selection/ OK.
Kết quả:
Custom Tables
Table 1
Thói quen hút
thuốc
Giới tính
Tuổi
Mean Maximum Minimum Standard
Deviation
Không hút
38
64
17
16
Có hút
28
56
-1
20
bình quân
34
64
-1
18
Nữ
40
64
18
16
Nam
29
56
-1
19
bình quân
35
64
-1
18
3 . Có sự khác biệt đáng kể về tuổi theo giới tính và thói quen hút thuốc hay không?
-Câu lệnh: Analyze/ Descriptive Statistics/ Crosstabs
..> Cửa sổ crosstabs gắp biến Gioi Tinh vào Row(s) , Thoi quen hut thuoc vào Column(s); tích chọn Display
clustered bar charts; Nhấn Statistics và chọn Chi-square -> continue -> OK.
Crosstabs
Giới tính * Thói
quen hút thuốc
Case Processing Summary
Cases
Valid
Missing
N
Percent
N
Percent
13
92.9%
1
7.1%
Giới tính * Thói quen hút thuốc Crosstabulation
Count
Thói quen hút thuốc
Total
Không hút
Có hút
Giới tính
Nữ
4
2
6
Total
N
Percent
14 100.0%
Nam
3
7
Total
Pearson Chi-Square
Continuity
Correctionb
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
4
6
7
13
Chi-Square Tests
Value
df
Asymptotic Exact Sig.
Significance (2-sided)
(2-sided)
a
.737
1
.391
.090
1
.764
.746
1
Exact Sig.
(1-sided)
.388
.592
.680
1
.383
.409
13
Kết luận:
giá trị chi square là 0.737, giá trị bậc tự do df là 1, giá trị sig. là 0.592> α= 0,05 Với mức độ tin cậy là 95% thì
không có sự khác biệt đáng kể về tuổi theo giới tính và thói quen hút thuốc.
Bài 2
Phần 1:Nhập dữ liệu:
Phần 2: vẽ đồ thị hình hộp để phản ánh mức tiêu thụ xăng của 3 loại xe.
Câu lệnh: Graphs/chart Builder
Cửa sổ:
Kết quả.
Phần 3: Tính các giá trị trung bình của mẫu về mức tiêu thụ xăng?
Câu lệnh: Analyze/ Descriptive Statistics / Descriptive
Đưa biến mức tiêu thụ xăng[xangtieuthu] sang Variable(s) / OK.
Kết quả
Descriptives
Descriptive Statistics
N
Minimum Maximum
21
19.9
24.6
Mean
22.314
Std.
Deviation
1.3024
mức tiêu thụ xăng
21
Valid N (listwise)
Câu lệnh: Analyze/ Custom Tables/ Custom Tables.
> Gắp biến mức tiêu thụ xăng[xangtieuthu] vào cột Columns; Biến loai xe vào cột Rows; Nhấn Categories and
Total.. -> tích vào Total và Label nhập: “ Bình quân”-> apply / OK.
Kết quả:
Custom Tables
Table 1
mức tiêu
thụ xăng
Mean
xe A
xe B
loại xe
xe C
Bình quân
20.9
23.2
22.8
22.3
Phần 4
Giả thuyết:
H0= M1=M2=M3
H1 có ít nhất một M khác với các M còn lại.
H1 , H2 , H3 là mức tiêu thụ xăng tương ứng với 3 loại xe A , B , C
Công thức Analyze / compare means/ one way anova => cửa sổ
Kết quả :
Bảng descriptive mô tả mức tiêu thụ xăng của từng loại xe
Descriptives
mức tiêu thụ xăng
N
Mean
Std.
Deviation
Std.
Error
95% Confidence Interval
for Mean
Lower
Upper
Minimu Maximu
Bound
Bound
m
m
xe A
xe B
xe C
Total
7
20.900
.7916
.2992
20.168
21.632
19.9
22.2
7
23.200
.9092
.3436
22.359
24.041
22.0
24.6
7
22.843
.7913
.2991
22.111
23.575
21.9
24.1
21
22.314
1.3024
.2842
21.721
22.907
19.9
24.6
Bảng ANOVA : mô tả để kiểm định
ANOVA
mức tiêu thụ xăng
Between Groups
Within Groups
Total
Sum of
Squares
21.449
12.477
33.926
df
Mean Square
2
10.724
18
.693
20
F
15.471
Sig.
.000
Vì Sig ANOVA = 0.000 < α = 0.05 suy ra bác bỏ H0 từ đó với mức độ tin cậy 95% ta luôn khẳng định có ít
nhất 1 loại xe có mức tiêu thụ xăng khác biệt với các xe còn lại.
Multiple Comparisons
Dependent Variable: mức tiêu thụ xăng
LSD
Mean
(I)
(J) loại Differenc
loại xe xe
e (I-J)
xe A xe B
-2.3000*
xe C
-1.9429*
xe B xe A
2.3000*
95% Confidence
Interval
Std.
Lower
Upper
Error Sig. Bound Bound
.4450 .000
-3.235
-1.365
.4450 .000
-2.878
-1.008
.4450 .000
1.365
3.235
xe C
xe C
xe A
xe B
.3571 .4450
1.9429* .4450
-.3571 .4450
.433
.000
.433
-.578
1.008
-1.292
1.292
2.878
.578
sánh mức tiêu thụ xăng của các loại xe :
Loại xe A có mức tiêu thụ xăng BQ thấp hơn đáng kể so với xe B và C
Mức tiêu thụ xăng của xe B và C không có khác biệt đáng kể.
Bài 3:
Phần 1 :
Nhập số liệu
Phần 2
Giả thuyết:
H0=M1 =M2 =M3= M4
M là giá trị BQ cho thang đo về thái độ du lịch của các nhóm hộ gia đình
H1 : có ít nhất 1 M khác với 3 M còn lại một cách đáng kể.
Câu lệnh: Analyze/ compera means / one way anova => cửa sổ
Đọc kết quả
Xét bảng
ANOVA
thái đô đối với du lich
Sum of
Squares
Between
38.267
Groups
Within Groups
16.667
Total
54.933
df
Mean Square
3
12.756
11
1.515
F
8.419
Sig.
.003
14
Sig ANOVA =0.03 < 0.05 suy ra ta bác bỏ H0. Với mức độ tin cậy 95% luôn luôn khẳng định rằng có ít nhất
một nhóm hộ gia đình có mức thu nhập khác biệt với 3 nhóm còn lại.
Xét bảng
Mức thu nhập của khối hộ gia đình thái độ du lịch của nhóm hộ 1 có sự thấp hơn đáng kể so với nhóm hộ gia
đình 3 và 4.
Đồng thời nhóm hộ 2 có sự thấp hơn đáng kể so với mức 4.
Bài 4:
Phần 1: nhập dữ liệu
Phần 2
1, kiểm tra phân phối chuẩn cho các biến số kiên tục trong mô hình :
Doanh số
Chi phí quảng cáo
Câu lệnh: Graphs/ legacy dialogs/ histogram
2, viết phương trình hồi quy
Pt1: + X
Trong đó X là chi phí quảng cáo
Y là doanh số bán hàng
3, chạy phương trình hồi quy:
Câu lệnh : Analyze/ regression / linear. Cửa sổ
4, kiểm định sự tồn tại của mô hình
Muốn mô hình tồn tại ta có giả thuyết
1 khác 0
H0=
H1 =
Muốn kiểm định giả thuyết căn cứ vào giá trị cột sig của bảng Anova
ANOVAa
Sum of
Model
Squares
df
Mean Square
1
Regression
74148.615
1
74148.615
Residual
31468.052
10
3146.805
Total
105616.667
11
a. Dependent Variable: doanh số bán (tr.đ)
b. Predictors: (Constant), chi phí quảng cáo (tr.đ)
F
23.563
Sig.
.001b
Sig Anova= 0.001 < =0.05 ta có thể bác bỏ H0 ta chấp nhận H1 suy ra khác 0 suy ra mô hình luôn tồn tại.
5, kiểm định sự phù hợp của mô hình
Model Summary
Adjusted R Std. Error of
Model
R
R Square
Square
the Estimate
a
1
.838
.702
.672
56.096
a. Predictors: (Constant), chi phí quảng cáo (tr.đ)
Vì =0.672 có ý nghĩa là trong các nhân tố ảnh hưởng đến doanh số thì chi phí quảng cáo giải quyết được 67.2%
còn lại 32.8% là các nhân tố khác chưa có điều kiện đưa vào mô hình.
Suy ra mô hình tương đối phù hợp.
6,kiểm tra sự tồn tại của các hệ số hồi quy:
Căn cứ vào bảng:
Coefficientsa
Unstandardized
Standardized
Coefficients
Coefficients
B
Std. Error
Beta
80.623
51.252
t
1.573
Sig.
.147
2.114
4.854
.001
Model
1
(Constant)
chi phí quảng cáo
10.263
(tr.đ)
a. Dependent Variable: doanh số bán (tr.đ)
.838
Cột sig (dòng chi phí quảng cáo)
Vì giá trị cột sig= 0.001 < α=0.05 suy ra có cơ sở bác bỏ H0 và khẳng định rằng hệ số khác 0 và cho ta thấy
chi phí quảng cáo có ảnh hưởng đáng kể đến doanh số bán hàng.
7,viết pt của mô hính hồi quy.
Căn cứ vào bảng:
Coefficientsa
Unstandardized
Coefficients
Std.
B
Error
80.623 51.252
Standardiz
ed
Coefficien
ts
Model
Beta
t
Sig.
1
(Constant)
1.573 .147
chi phí quảng
10.263
2.114
.838 4.854 .001
cáo (tr.đ)
Căn cứ vào cột B của bảng : hệ số hồi quy chưa được chuẩn hóa :
Y=80.627+10.263*X .
8,phân tích tác động biên:
Trong trường hợp các nhân tố không đổi khi chi phí quảng cáo tăng lên 1triệu thì doanh số bán hàng tăng lên
10.263 triệu và ngược lại.
Chi phí quảng cáo có tác động thuận theo doanh số vì >0.
Bài 5
Phần 1:Nhập dữ liệu:
Phần 2: kiểm định chi bình phương ( chi-quare)
-Câu lệnh: Analyze/ Descriptive Statistics/ Crosstabs
Cửa sổ:
:
> Cửa sổ crosstabs gắp biến Gioi Tinh vào Row(s) , Thoi quen hut thuoc vào Column(s); tích chọn Display
clustered bar charts; Nhấn Statistics và chọn Chi-square -> continue -> OK.
Kết quả:
Case Processing Summary
Cases
Valid
Missing
N
Percent
N
Percent
đô tuổi * mức đô quan
tâm
16
100.0%
0
Total
N
Percent
0.0%
16
100.0%
đô tuổi * mức đô quan tâm Crosstabulation
Count
mức đô quan tâm
quan tâm nhất quan tâm nhì quan tâm ba
đô tuổi 18 -25
0
1
3
26 - 35
1
1
2
36 - 45
2
2
0
46 - 60
3
1
0
Total
6
5
5
Total
4
4
4
4
16
Chi-Square Tests
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
Asymptotic
Significanc
Value df e (2-sided)
9.333a 6
.156
12.17
6
.058
3
7.560 1
.006
16
a. 12 cells (100.0%) have expected count less than 5. The minimum expected count is 1.25.
n: Kết Kết Kết luận: Sig = 0.156>
α= 0,05 , value : 9.333 , df : 6
Suy ra: Với mức độ tin cậy là 95% nên có bằng chứng cho thấy hai biến này độc lập với
nhau. Do đó kết luận giữa độ tuổi và mức độ quan tâm đến chủ đề gia đình trên báo Sài Gòn tiếp
thị không có mối quan hệ với nhau.
Bài 6
Phần 1 nhập dữ liệu
Phần 2: Phân tích phương sai :
Câu lệnh:Analyze/ general Linier Modle/ univariate / cửa sổ:
Tùy chọn options: Nhấn vào
Chọn Descriptive Statistics,và Estimates of effect size và Homogeneity tests.
Tùy chọn Post Hoc.
• Từ danh sách Factors bên trái, chọn biến “thoigiantuhoc” và “ngheyeuthich” và đưa vào ô bên phải Post Hoc
Tests.
Và chọn Tukey.
Kết quả:
Bảng thống kê mô tả cung cấp về: độ lệch chuẩn, số mẫu, giá trị trung bình
Between-Subjects Factors
Value Label
yêu thích ngành
1
không thích
nghề
lắm
2
thích
3
rất thích
thời gian tư hoc
1
tự học rất ít
2
tự học trung
bình
3
tự học nhiều
N
7
7
7
7
7
7
Descriptive Statistics
Dependent Variable: điểm trung bình HT
yêu thích ngành
nghề
thời gian tư hoc
Mean
không thích lắm
tự học rất ít
5.100
tự học trung
8.000
bình
Total
5.514
thích
tự học rất ít
7.000
tự học trung
7.500
bình
tự học nhiều
8.000
Total
7.500
rất thích
tự học trung
9.000
bình
tự học nhiều
9.483
Total
9.414
Total
tự học rất ít
5.371
tự học trung
7.786
bình
tự học nhiều
9.271
Total
7.476
Levene's Test of Equality of Error
Variancesa
Dependent Variable: điểm trung bình HT
F
df1
df2
Sig.
2.295
6
14
.094
Tests the null hypothesis that the error
variance of the dependent variable is equal
across groups.
a. Design: Intercept + ngheyeuthich +
thoigiantuhoc + ngheyeuthich *
thoigiantuhoc
Std.
Deviation
.1673
N
6
.
1
1.1067
.
7
1
.5000
5
.
.5000
1
7
.
1
.4491
.4488
.7342
6
7
7
.6986
7
.6945
1.7790
7
21
Vì Sig =0,94 > α= 0,05 . với độ tin cậy 95% luôn luôn khẳng định không có ý nghĩa thống kê, như thế có thể
kết luận được phương sai giữa các nhóm biến bằng nhau.
Tests of Between-Subjects Effects
Dependent Variable: điểm trung bình HT
Type III Sum
Source
of Squares
df
Mean Square
F
Corrected Model
61.150a
6
10.192
66.416
Intercept
680.549
1
680.549 4434.917
ngheyeuthich
3.039
2
1.520
9.903
thoigiantuhoc
4.437
2
2.218
14.457
ngheyeuthich *
2.449
2
1.224
7.978
thoigiantuhoc
Error
2.148
14
.153
Total
1237.060
21
Corrected Total
63.298
20
a. R Squared = .966 (Adjusted R Squared = .952)
Sig.
.000
.000
.002
.000
Partial Eta
Squared
.966
.997
.586
.674
.005
.533
Chúng ta nhìn vào dòng ngheyeuthich*thoigiantuhoc với giá trị kiểm định sig= 0.05 =α = 0.05 do đó ảnh
hưởng tương tác là có , điều đó chỉ ra rằng không có sự khác biệt trong ảnh hưởng của thời gian tư học và yêu
thích ngành nghề lên sự điểm trung bình HT.
Vì cột sig = 0.002 (ngheyeuthich) và sig = 0.00 (thoigiantuhoc) > α=0.05 suy ra 2 yếu tố yêu thích ngành nghề
và thời gian tự học đều ảnh hưởng tương đương đau đến điểm trung bình HT.
Suy ra mối quan hệ giữa điểm trung bình HT của sv liên quan đến mức độ yêu thích và thời gian tự học của sinh
viên không có sự khác nhau nhiều.
Bài 7
Phần 1: nhập dữ liệu:
Phần 2: vẽ đồ thị hình lá và biểu đồ hình hộp:
1, đồ thị hình lá:
câu lệnh : Analyze/ Descriptive/ Explore/ cửa sổ
Tùy chọn Plots:
trong ô Descriptive ta chọn Stem-and-leaf
trong ô Boxplot ta có thể chọn Dependents Together
kết quả:
tuổi
ngành hoc
kế toán, kiểm toán
quản tri kinh doanh
Case Processing Summary
Cases
Valid
Missing
N
Percent
N
Percent
Total
N
Percent
30
100.0%
0
0.0%
30
100.0%
30
100.0%
0
0.0%
30
100.0%
Descriptives
tuổi
ngành hoc
kế toán, kiểm
toán
Mean
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Statistic
26.93
Lower
Bound
Upper
Bound
25.04
28.83
26.72
27.00
Std.
Error
.927
quản tri kinh
doanh
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
Mean
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
25.789
5.078
19
39
20
8
.533
-.127
30.90
Lower
Bound
Upper
Bound
.427
.833
1.232
28.38
33.42
30.81
31.00
45.541
6.748
19
45
26
11
.062
-.654
.427
.833
Từ đó ta thấy: sinh viên học nhiều nhất từ khoảng 26 đến 32 tuổi
Sinh viên học ngành quản trị kinh doanh có độ tuổi tập chung chủ yếu từ 26 đến 37. Và ngành này có độ tuổi
trung bình của sinh viên là 30.9 tuôi
Sinh viên học ngành kế toán, kiểm toán có độ tuổi chủ yếu từ 22 đến 31
Độ tuổi trung bình của sinh viên ngành này là 26,93.
Suy ra ta thấy ngành kế toán kiểm tuổi của sinh viên tham gia học thấp hơn ngành quản trị kinh doanh.
Bài 8:
Nhập dữ liệu:
Giả thuyết
H0: M1 =M2
trong đó M1 là M nam
H1: M1 khác M2
M2 là M nữ
Câu lệnh Analyze / compera means/ paired sampele T>Test
Cửa sổ:
Kết quả:
Pair 1 thunhapnam
thunhapnu
Paired Samples Statistics
Std.
Mean
N
Deviation
305.357
14
61.3810
267.643
14
51.3744
Paired Samples Correlations
N
Correlation
Std. Error
Mean
16.4048
13.7304
Sig.
Pair 1 thunhapnam &
thunhapnu
14
.748
.002
Paired Samples Test
Pair thunhapnam 1
thunhapnu
Paired Differences
t
95% Confidence
Interval of the
Std.
Std.
Difference
Deviatio Error
Mean
n
Mean
Lower
Upper
37.71
41.0973 10.9837 13.9854 61.4432 3.434
43
df
13
Sig. (2tailed)
.004
Vì Sig (2 tailed) = 0,004 < α = 0,05
Suy ra : Bác bỏ H0.
Với độ tin cậy 95% mức thu nhập của nam cao hơn đáng kể mức thu nhập của nữ sinh viên sau khi tốt nghiệp.
Bài 9:
Phần 1: nhập dữ liệu
Phần 2:kiểm đinh chi-quare
Giả thuyết
H0: M1 =M2
H1: M1 khác M2
trong đó M1 là M nam
M2 là M nữ
Câu lệnh: Analyze- Descriptive Statistics – Crosstabs
Cửa sổ: