Tải bản đầy đủ (.docx) (43 trang)

BÀI THỰC HÀNH TIN học ỨNG DỤNG SPSS

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.3 MB, 43 trang )

BÀI THỰC HÀNH TIN HỌC ỨNG DỤNG
Họ và tên: Triệu Đức Anh
MSV: 1654060873
Bài 1 :
Phần 1:nhập dữ liệu

Phần 2: xác định tuổi bình quân của người hút thuốc:
Câu lệnh: Analyze/ Despcriptive Statistics/ Descriptives
> Cửa sổ Descriptives chọn biến Tuoi vào Variable(s) / OK .

Kết quả:
Descriptive Statistics
N

Tuổi
Valid N (listwise)

Minimum

14
14

-1

Maximum

64

Mean

34.71



Std.
Deviation
Câu lệnh: Analyze/ Custom
Tables/ Custom tables-> Cửa
17.718 sổ


Cửa sổ Custom Tables gắp các biến Tuoi vào cột Columns, Thoi quen hut thuoc và Gioi tinh vào cột Rows/
Nhấn Categories and total-> tích vào Total và Label nhập: “ Bình quân”-> apply ; Nhấn Summary Statistics..
Chọn Maximum, Minimum, Std.Deviation đưa sang cột Display -> Apply to Selection/ OK.

Kết quả:
Custom Tables
Table 1

Thói quen hút
thuốc

Giới tính

Tuổi
Mean Maximum Minimum Standard
Deviation
Không hút
38
64
17
16
Có hút

28
56
-1
20
bình quân
34
64
-1
18
Nữ
40
64
18
16
Nam
29
56
-1
19
bình quân
35
64
-1
18

3 . Có sự khác biệt đáng kể về tuổi theo giới tính và thói quen hút thuốc hay không?
-Câu lệnh: Analyze/ Descriptive Statistics/ Crosstabs


..> Cửa sổ crosstabs gắp biến Gioi Tinh vào Row(s) , Thoi quen hut thuoc vào Column(s); tích chọn Display

clustered bar charts; Nhấn Statistics và chọn Chi-square -> continue -> OK.
Crosstabs

Giới tính * Thói
quen hút thuốc

Case Processing Summary
Cases
Valid
Missing
N
Percent
N
Percent
13
92.9%
1
7.1%

Giới tính * Thói quen hút thuốc Crosstabulation
Count
Thói quen hút thuốc
Total
Không hút
Có hút
Giới tính
Nữ
4
2
6


Total
N
Percent
14 100.0%


Nam

3
7

Total

Pearson Chi-Square
Continuity
Correctionb
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases

4
6

7
13

Chi-Square Tests

Value
df
Asymptotic Exact Sig.
Significance (2-sided)
(2-sided)
a
.737
1
.391
.090
1
.764
.746

1

Exact Sig.
(1-sided)

.388
.592

.680

1

.383

.409


13

Kết luận:
giá trị chi square là 0.737, giá trị bậc tự do df là 1, giá trị sig. là 0.592> α= 0,05 Với mức độ tin cậy là 95% thì
không có sự khác biệt đáng kể về tuổi theo giới tính và thói quen hút thuốc.


Bài 2
Phần 1:Nhập dữ liệu:

Phần 2: vẽ đồ thị hình hộp để phản ánh mức tiêu thụ xăng của 3 loại xe.
Câu lệnh: Graphs/chart Builder
Cửa sổ:

Kết quả.


Phần 3: Tính các giá trị trung bình của mẫu về mức tiêu thụ xăng?
Câu lệnh: Analyze/ Descriptive Statistics / Descriptive

Đưa biến mức tiêu thụ xăng[xangtieuthu] sang Variable(s) / OK.
Kết quả
Descriptives
Descriptive Statistics


N

Minimum Maximum


21

19.9

24.6

Mean

22.314

Std.
Deviation

1.3024

mức tiêu thụ xăng

21
Valid N (listwise)

Câu lệnh: Analyze/ Custom Tables/ Custom Tables.

> Gắp biến mức tiêu thụ xăng[xangtieuthu] vào cột Columns; Biến loai xe vào cột Rows; Nhấn Categories and
Total.. -> tích vào Total và Label nhập: “ Bình quân”-> apply / OK.
Kết quả:
Custom Tables
Table 1
mức tiêu
thụ xăng
Mean



xe A
xe B
loại xe
xe C
Bình quân

20.9
23.2
22.8
22.3

Phần 4
Giả thuyết:
H0= M1=M2=M3
H1 có ít nhất một M khác với các M còn lại.
H1 , H2 , H3 là mức tiêu thụ xăng tương ứng với 3 loại xe A , B , C
Công thức Analyze / compare means/ one way anova => cửa sổ

Kết quả :
Bảng descriptive mô tả mức tiêu thụ xăng của từng loại xe

Descriptives

mức tiêu thụ xăng

N

Mean


Std.
Deviation

Std.
Error

95% Confidence Interval
for Mean
Lower
Upper
Minimu Maximu
Bound
Bound
m
m


xe A
xe B
xe C
Total

7

20.900

.7916

.2992


20.168

21.632

19.9

22.2

7

23.200

.9092

.3436

22.359

24.041

22.0

24.6

7

22.843

.7913


.2991

22.111

23.575

21.9

24.1

21

22.314

1.3024

.2842

21.721

22.907

19.9

24.6

Bảng ANOVA : mô tả để kiểm định
ANOVA
mức tiêu thụ xăng


Between Groups
Within Groups
Total

Sum of
Squares
21.449
12.477
33.926

df

Mean Square
2
10.724
18
.693
20

F
15.471

Sig.
.000

Vì Sig ANOVA = 0.000 < α = 0.05 suy ra bác bỏ H0 từ đó với mức độ tin cậy 95% ta luôn khẳng định có ít
nhất 1 loại xe có mức tiêu thụ xăng khác biệt với các xe còn lại.

Multiple Comparisons

Dependent Variable: mức tiêu thụ xăng
LSD
Mean
(I)
(J) loại Differenc
loại xe xe
e (I-J)
xe A xe B
-2.3000*
xe C
-1.9429*
xe B xe A
2.3000*

95% Confidence
Interval
Std.
Lower
Upper
Error Sig. Bound Bound
.4450 .000
-3.235
-1.365
.4450 .000
-2.878
-1.008
.4450 .000
1.365
3.235



xe C

xe C
xe A
xe B

.3571 .4450
1.9429* .4450
-.3571 .4450

.433
.000
.433

-.578
1.008
-1.292

1.292
2.878
.578

sánh mức tiêu thụ xăng của các loại xe :
Loại xe A có mức tiêu thụ xăng BQ thấp hơn đáng kể so với xe B và C
Mức tiêu thụ xăng của xe B và C không có khác biệt đáng kể.

Bài 3:
Phần 1 :
Nhập số liệu


Phần 2
Giả thuyết:
H0=M1 =M2 =M3= M4
M là giá trị BQ cho thang đo về thái độ du lịch của các nhóm hộ gia đình
H1 : có ít nhất 1 M khác với 3 M còn lại một cách đáng kể.
Câu lệnh: Analyze/ compera means / one way anova => cửa sổ


Đọc kết quả
Xét bảng

ANOVA
thái đô đối với du lich
Sum of
Squares
Between
38.267
Groups
Within Groups
16.667
Total

54.933

df

Mean Square
3


12.756

11

1.515

F
8.419

Sig.
.003

14

Sig ANOVA =0.03 < 0.05 suy ra ta bác bỏ H0. Với mức độ tin cậy 95% luôn luôn khẳng định rằng có ít nhất
một nhóm hộ gia đình có mức thu nhập khác biệt với 3 nhóm còn lại.
Xét bảng


Mức thu nhập của khối hộ gia đình thái độ du lịch của nhóm hộ 1 có sự thấp hơn đáng kể so với nhóm hộ gia
đình 3 và 4.
Đồng thời nhóm hộ 2 có sự thấp hơn đáng kể so với mức 4.

Bài 4:
Phần 1: nhập dữ liệu

Phần 2
1, kiểm tra phân phối chuẩn cho các biến số kiên tục trong mô hình :
Doanh số
Chi phí quảng cáo

Câu lệnh: Graphs/ legacy dialogs/ histogram
2, viết phương trình hồi quy
Pt1: + X


Trong đó X là chi phí quảng cáo
Y là doanh số bán hàng
3, chạy phương trình hồi quy:
Câu lệnh : Analyze/ regression / linear. Cửa sổ

4, kiểm định sự tồn tại của mô hình
Muốn mô hình tồn tại ta có giả thuyết
1 khác 0
H0=
H1 =
Muốn kiểm định giả thuyết căn cứ vào giá trị cột sig của bảng Anova
ANOVAa
Sum of
Model
Squares
df
Mean Square
1
Regression
74148.615
1
74148.615
Residual
31468.052
10

3146.805
Total
105616.667
11
a. Dependent Variable: doanh số bán (tr.đ)
b. Predictors: (Constant), chi phí quảng cáo (tr.đ)

F
23.563

Sig.
.001b

Sig Anova= 0.001 < =0.05 ta có thể bác bỏ H0 ta chấp nhận H1 suy ra khác 0 suy ra mô hình luôn tồn tại.
5, kiểm định sự phù hợp của mô hình


Model Summary
Adjusted R Std. Error of
Model
R
R Square
Square
the Estimate
a
1
.838
.702
.672
56.096

a. Predictors: (Constant), chi phí quảng cáo (tr.đ)
Vì =0.672 có ý nghĩa là trong các nhân tố ảnh hưởng đến doanh số thì chi phí quảng cáo giải quyết được 67.2%
còn lại 32.8% là các nhân tố khác chưa có điều kiện đưa vào mô hình.
Suy ra mô hình tương đối phù hợp.
6,kiểm tra sự tồn tại của các hệ số hồi quy:
Căn cứ vào bảng:
Coefficientsa
Unstandardized
Standardized
Coefficients
Coefficients
B
Std. Error
Beta
80.623
51.252

t
1.573

Sig.
.147

2.114

4.854

.001

Model

1
(Constant)
chi phí quảng cáo
10.263
(tr.đ)
a. Dependent Variable: doanh số bán (tr.đ)

.838

Cột sig (dòng chi phí quảng cáo)
Vì giá trị cột sig= 0.001 < α=0.05 suy ra có cơ sở bác bỏ H0 và khẳng định rằng hệ số khác 0 và cho ta thấy
chi phí quảng cáo có ảnh hưởng đáng kể đến doanh số bán hàng.
7,viết pt của mô hính hồi quy.
Căn cứ vào bảng:
Coefficientsa

Unstandardized
Coefficients
Std.
B
Error
80.623 51.252

Standardiz
ed
Coefficien
ts

Model
Beta

t
Sig.
1
(Constant)
1.573 .147
chi phí quảng
10.263
2.114
.838 4.854 .001
cáo (tr.đ)
Căn cứ vào cột B của bảng : hệ số hồi quy chưa được chuẩn hóa :
Y=80.627+10.263*X .


8,phân tích tác động biên:
Trong trường hợp các nhân tố không đổi khi chi phí quảng cáo tăng lên 1triệu thì doanh số bán hàng tăng lên
10.263 triệu và ngược lại.
Chi phí quảng cáo có tác động thuận theo doanh số vì >0.
Bài 5
Phần 1:Nhập dữ liệu:

Phần 2: kiểm định chi bình phương ( chi-quare)
-Câu lệnh: Analyze/ Descriptive Statistics/ Crosstabs
Cửa sổ:

:
> Cửa sổ crosstabs gắp biến Gioi Tinh vào Row(s) , Thoi quen hut thuoc vào Column(s); tích chọn Display
clustered bar charts; Nhấn Statistics và chọn Chi-square -> continue -> OK.
Kết quả:



Case Processing Summary
Cases
Valid
Missing
N
Percent
N
Percent
đô tuổi * mức đô quan
tâm

16

100.0%

0

Total
N
Percent

0.0%

16

100.0%

đô tuổi * mức đô quan tâm Crosstabulation
Count

mức đô quan tâm
quan tâm nhất quan tâm nhì quan tâm ba
đô tuổi 18 -25
0
1
3
26 - 35
1
1
2
36 - 45
2
2
0
46 - 60
3
1
0
Total
6
5
5

Total
4
4
4
4
16


Chi-Square Tests

Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases

Asymptotic
Significanc
Value df e (2-sided)
9.333a 6
.156
12.17
6
.058
3
7.560 1
.006
16


a. 12 cells (100.0%) have expected count less than 5. The minimum expected count is 1.25.

n: Kết Kết Kết luận: Sig = 0.156>
α= 0,05 , value : 9.333 , df : 6
Suy ra: Với mức độ tin cậy là 95% nên có bằng chứng cho thấy hai biến này độc lập với
nhau. Do đó kết luận giữa độ tuổi và mức độ quan tâm đến chủ đề gia đình trên báo Sài Gòn tiếp
thị không có mối quan hệ với nhau.

Bài 6

Phần 1 nhập dữ liệu

Phần 2: Phân tích phương sai :
Câu lệnh:Analyze/ general Linier Modle/ univariate / cửa sổ:


Tùy chọn options: Nhấn vào
Chọn Descriptive Statistics,và Estimates of effect size và Homogeneity tests.
Tùy chọn Post Hoc.
• Từ danh sách Factors bên trái, chọn biến “thoigiantuhoc” và “ngheyeuthich” và đưa vào ô bên phải Post Hoc
Tests.
Và chọn Tukey.
Kết quả:
Bảng thống kê mô tả cung cấp về: độ lệch chuẩn, số mẫu, giá trị trung bình
Between-Subjects Factors
Value Label
yêu thích ngành
1
không thích
nghề
lắm
2
thích
3
rất thích
thời gian tư hoc
1
tự học rất ít
2
tự học trung

bình
3
tự học nhiều

N
7
7
7
7
7
7


Descriptive Statistics
Dependent Variable: điểm trung bình HT
yêu thích ngành
nghề
thời gian tư hoc
Mean
không thích lắm
tự học rất ít
5.100
tự học trung
8.000
bình
Total
5.514
thích
tự học rất ít
7.000

tự học trung
7.500
bình
tự học nhiều
8.000
Total
7.500
rất thích
tự học trung
9.000
bình
tự học nhiều
9.483
Total
9.414
Total
tự học rất ít
5.371
tự học trung
7.786
bình
tự học nhiều
9.271
Total
7.476

Levene's Test of Equality of Error
Variancesa
Dependent Variable: điểm trung bình HT
F

df1
df2
Sig.
2.295
6
14
.094
Tests the null hypothesis that the error
variance of the dependent variable is equal
across groups.
a. Design: Intercept + ngheyeuthich +
thoigiantuhoc + ngheyeuthich *
thoigiantuhoc

Std.
Deviation
.1673

N
6

.

1

1.1067
.

7
1


.5000

5

.
.5000

1
7

.

1

.4491
.4488
.7342

6
7
7

.6986

7

.6945
1.7790


7
21


Vì Sig =0,94 > α= 0,05 . với độ tin cậy 95% luôn luôn khẳng định không có ý nghĩa thống kê, như thế có thể
kết luận được phương sai giữa các nhóm biến bằng nhau.
Tests of Between-Subjects Effects
Dependent Variable: điểm trung bình HT
Type III Sum
Source
of Squares
df
Mean Square
F
Corrected Model
61.150a
6
10.192
66.416
Intercept
680.549
1
680.549 4434.917
ngheyeuthich
3.039
2
1.520
9.903
thoigiantuhoc
4.437

2
2.218
14.457
ngheyeuthich *
2.449
2
1.224
7.978
thoigiantuhoc
Error
2.148
14
.153
Total
1237.060
21
Corrected Total
63.298
20
a. R Squared = .966 (Adjusted R Squared = .952)

Sig.
.000
.000
.002
.000

Partial Eta
Squared
.966

.997
.586
.674

.005

.533

Chúng ta nhìn vào dòng ngheyeuthich*thoigiantuhoc với giá trị kiểm định sig= 0.05 =α = 0.05 do đó ảnh
hưởng tương tác là có , điều đó chỉ ra rằng không có sự khác biệt trong ảnh hưởng của thời gian tư học và yêu
thích ngành nghề lên sự điểm trung bình HT.
Vì cột sig = 0.002 (ngheyeuthich) và sig = 0.00 (thoigiantuhoc) > α=0.05 suy ra 2 yếu tố yêu thích ngành nghề
và thời gian tự học đều ảnh hưởng tương đương đau đến điểm trung bình HT.
Suy ra mối quan hệ giữa điểm trung bình HT của sv liên quan đến mức độ yêu thích và thời gian tự học của sinh
viên không có sự khác nhau nhiều.
Bài 7
Phần 1: nhập dữ liệu:

Phần 2: vẽ đồ thị hình lá và biểu đồ hình hộp:
1, đồ thị hình lá:
câu lệnh : Analyze/ Descriptive/ Explore/ cửa sổ


Tùy chọn Plots:
trong ô Descriptive ta chọn Stem-and-leaf
trong ô Boxplot ta có thể chọn Dependents Together
kết quả:

tuổi


ngành hoc
kế toán, kiểm toán
quản tri kinh doanh

Case Processing Summary
Cases
Valid
Missing
N
Percent
N
Percent

Total
N
Percent

30

100.0%

0

0.0%

30

100.0%

30


100.0%

0

0.0%

30

100.0%

Descriptives

tuổi

ngành hoc
kế toán, kiểm
toán

Mean
95% Confidence
Interval for Mean

5% Trimmed Mean
Median

Statistic
26.93
Lower
Bound

Upper
Bound

25.04
28.83
26.72
27.00

Std.
Error
.927


quản tri kinh
doanh

Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
Mean
95% Confidence
Interval for Mean

5% Trimmed Mean
Median

Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis

25.789
5.078
19
39
20
8
.533
-.127
30.90
Lower
Bound
Upper
Bound

.427
.833
1.232

28.38
33.42
30.81

31.00
45.541
6.748
19
45
26
11
.062
-.654

.427
.833


Từ đó ta thấy: sinh viên học nhiều nhất từ khoảng 26 đến 32 tuổi
Sinh viên học ngành quản trị kinh doanh có độ tuổi tập chung chủ yếu từ 26 đến 37. Và ngành này có độ tuổi
trung bình của sinh viên là 30.9 tuôi
Sinh viên học ngành kế toán, kiểm toán có độ tuổi chủ yếu từ 22 đến 31
Độ tuổi trung bình của sinh viên ngành này là 26,93.
Suy ra ta thấy ngành kế toán kiểm tuổi của sinh viên tham gia học thấp hơn ngành quản trị kinh doanh.


Bài 8:
Nhập dữ liệu:

Giả thuyết
H0: M1 =M2

trong đó M1 là M nam


H1: M1 khác M2

M2 là M nữ

Câu lệnh Analyze / compera means/ paired sampele T>Test

Cửa sổ:
Kết quả:

Pair 1 thunhapnam
thunhapnu

Paired Samples Statistics
Std.
Mean
N
Deviation
305.357
14
61.3810
267.643
14
51.3744

Paired Samples Correlations
N
Correlation

Std. Error
Mean

16.4048
13.7304

Sig.


Pair 1 thunhapnam &
thunhapnu

14

.748

.002

Paired Samples Test

Pair thunhapnam 1
thunhapnu

Paired Differences
t
95% Confidence
Interval of the
Std.
Std.
Difference
Deviatio Error
Mean
n

Mean
Lower
Upper
37.71
41.0973 10.9837 13.9854 61.4432 3.434
43

df

13

Sig. (2tailed)

.004

Vì Sig (2 tailed) = 0,004 < α = 0,05
Suy ra : Bác bỏ H0.
Với độ tin cậy 95% mức thu nhập của nam cao hơn đáng kể mức thu nhập của nữ sinh viên sau khi tốt nghiệp.
Bài 9:
Phần 1: nhập dữ liệu

Phần 2:kiểm đinh chi-quare
Giả thuyết
H0: M1 =M2
H1: M1 khác M2

trong đó M1 là M nam
M2 là M nữ

Câu lệnh: Analyze- Descriptive Statistics – Crosstabs

Cửa sổ:


×