Tải bản đầy đủ (.docx) (17 trang)

Bài tập thực hành SPSS - Phân tích và xử lý số liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (685.64 KB, 17 trang )

BÀI TẬP
Thực hành trên file SV.sav và KHAOSAT.sav sử dụng SPSS 20 để xử lý
và phân tích số liệu.
BÀI LÀM
Trước hết ta tạo các biến analysic, creative, practice,
tongstat, tongb60 bằng cách: Chọn bảng dữ liệu Variable View/
Chuột phải/Insert Variable/ sau đó chọn Dicemals: 0; Measure:
Scale
Câu 1: Tìm độ tương quan giữa các thang đo chỉ số thông
minh của học sinh và sinh viên
1) Tính giá trị đo analy, creat, pract
Tính thang đo analysic bằng cách: Transform/Computer Variable/

Tính thang đo creative bằng cách: Transform/Computer Variable/


Thực hiện tương tự cho biến practive, tongstat và tongb60
2) Phân tích độ tương quan giữa các thang đo analy, creat, pract
Để tìm tương quan giữa các thang đo analy, creat, pract của trắc
nghiệm Sterberg (tongstat), ta dùng lệnh Analyze \ Correllate \
Bivariate, chọn các biến để đánh giá tương quan là analy, creat,
pract . Được kết quả như sau:

Ở bảng trên, hệ số tương quan R chính là Pearson Correlation. Đương
nhiên một thang đo có mối liên quan chặt chẽ đến chính nó, nên R =
1. Ta thấy các thang đo có mối tương quan như nhau và thuận chiều,
nhưng không cao. Ví dụ, trí thông minh phân tích của học sinh có
mối tương quan với với trí thông minh sáng tạo của họ với hệ số
tương quan là R = 0,543 ; và có mối tương quan với với trí thông
minh thực hành của họ với hệ số tương quan là R = 0,505. Tuy nhiên
các giá trị tương quan này không cao.




- Trong SPSS ta có thể kiểm định giả thuyết ở mức ý nghĩa nhỏ hơn
0.05 (được phân biệt bằng một dấu sao * ở cạnh giá trị thống kê tính
được trên mẫu) và ở mức ý nghĩa nhỏ hơn 0.01 (phân biệt bằng hai
dấu sao **).
- Từ bảng trên ta có thể thấy khả năng để hệ số tương quan tính
được từ mẫu chẳng hạn là 0.543 trong khi trên thực tế không có mối
liên hệ tuyến tính nào trong tởng thể giữa trí thông minh phân tích
và trí thông minh sáng tạo (điều này được phản ánh bởi mức ý nghĩa
của ta là .Sig = 0.000). Nhưng với hai dấu sao ** cạnh con số 0.543
cho phép ta sử dụng mức ý nghĩa 1% (tức là xác suất chấp nhận giả
thuyết sai là 1%) thì giả thuyết ban đầu H 0 cho rằng hệ số tương
quan của tổng thể bằng 0 bị bác bỏ. Tóm lại, ta vẫn khẳng định các
loại trí thông minh trên của học sinh có mối tương quan với nhau ở
mức “trung bình khá .”
Câu 2: So sánh 2 mơ hình trắc nghiệm Sternberg và Munzert
1) Tính giá trị cho các biến tongstat và tong60
Tính giá trị cho biến tongb60 bằng cách: Transform/Computer
Variable/

Thực hiện tính tương tự cho biến tongstat


2) Phân tích độ tương quan giữa 2 thang đo tongstat và tongb60
- Để tính tương quan của trắc nghiệm trên với trắc nghiệm Munzert
(tongb60) trên 2 nhóm mẫu học sinh/ sinh viên, làm như sau:
+ Tiếp theo tính tương quan của TongStat đã tính với tongb60 trên
nhóm mẫu học sinh bằng lệnh Analyze \ Correllate \ Bivariate, kết
quả thu được:


Nhận xét: Đánh giá mối tương quan giữa hai biến định lượng, bảng
trên cho thấy đánh giá tổng điểm về trí thông minh của học sinh
theo trắc nghiệm của Munzert (tong60) và của Sternberg (tongstat)
là tương đồng với nhau.
Câu 3: Kiểm định t – 2 mẫu độc lập
Xét trắc nghiệm Sternberg, so sánh điểm trung bình về trí thông
minh của học sinh
Với yêu cầu: So sánh các điểm trung bình đo bằng trắc nghiệm
Sternberg (tongstat) để đánh giá mức độ khác biệt (trí thông minh)
giữa học sinh thành phố và nông thôn, ta có thể dùng mô hình kiểm
định t hai mẫu độc lập (không cần mô hình ANOVA) như sau:
- Trước hết dùng lệnh Data \ Select case để chọn lại đối tượng là học
sinh với điều kiện ở dòng If là hssv = 1


- Sau đó dùng lệnh Analyze \ Compare Means \ Independent Samples T test để chọn Variables là tongstat và chọn Group là biến
vung
với
định
nghĩa
tương
ứng
1 và 2.




Được kết quả như sau:


Từ bảng trên ta thấy điểm trung bình trí thông minh giữa học
sinh Nông thôn và Thành phố chênh lệch khá lớn. Điều này có lẽ
được giải thích bởi năng lực trí tuệ của học sinh phụ thuộc vào điều
kiện sống của từng vùng. Nhìn độ lệch chuẩn chênh nhau không
nhiều nên ta cần phải tiếp tục quan sát bảng kiểm định hai mẫu độc
lập dưới đây:

Kiểm định Levene về sự ngang bằng các phương sai (Levene’s
Test for Equality of Variances) có giả thuyết H 0 cho rằng “Phương sai
của điểm trung bình trí thông minh của học sinh thành phố và nông
thôn là ngang bằng như nhau”
Vì kết quả kiểm định sự bằng nhau của hai phương sai từ bảng
trên (rơi vào trường hợp đầu (.Sig = 0.729 >= 0.05) thì phương sai
điểm trung bình trí thông minh của học sinh ở vùng thành phố và
nông thôn là bằng nhau, ta sử dụng kết quả ở dòng 1.
Áp dụng: căn cứ vào giá trị Sig. ở dòng một là 0.000 < 0.5 (hay
xác suất trên 0%, rơi vào trường hợp 2), ta kết luận bác bỏ giả thuyết
H0: Mẫu đã cung cấp một bằng chứng mạnh mẽ rằng các trị số điểm


trung bình trí thông minh (19,95 và 16.54) giữa học sinh thành phố
và học sinh nông thôn là khác biệt có ý nghĩa thống kê. Nói cách
khác, từ độ lớn của các trung bình và kết quả của phép kiểm định, ta
có thể kết luận rằng trí tuệ của học sinh thành phố vượt trội và học
sinh nông thôn.
Câu 4: Kiểm định ANOVA
Với yêu cầu đánh giá mức độ khác biệt giữa sinh viên của 7 ngành
như trong đề bài ta làm như sau:
- Trước hết dùng lệnh Data \ Select case để chọn lại đối tượng là
sinh viên thoả các ngành nói trên, với điều kiện dòng if là hssv = 2

and nganh <= 5

+ Sau đó dùng lệnh Analyze \ Compare Means \ One Way
ANOVA. Chọn Dependent List là tongstat và Factor là nganh. Nhấn
nút Options để chọn thêm các thống kê mô tả (Description) và kiểm
định ngang bằng phương sai (Homogeneity of variance test)


Kết quả thu được là:

Trong bảng thống kê mô tả (Description): Các điểm trung bình
(mean) đánh giá trí thông minh của SV các ngành có những khác
biệt nhất định. Thấp nhất là SV Sư phạm (15.73) và KHXH & NV
(15,96); cao nhất là kĩ thuật, CNTT, BK (22,5); ở mức trung bình là
nhóm ngành kinh tế (Kinh tế, TM, QTKD), Y tế, y khoa. Vậy để liệu
chừng sự khác biệt trên có ý nghĩa thống kê không, ta xem tiếp khối
dữ liệu thứ hai.


Trong bảng kiểm định ngang bằng phương sai (Test of
Homogeneity of Variances) Thống kê Levene = 42,943 với mức ý
nghĩa .Sig (hay xác suất p-value) = 0.000< 0.05 cung cấp một bằng
chứng về “ngang bằng phương sai” là không được chấp nhận. Từ đó
trí thông minh của sinh viên giữa các ngành nói trên là khác biệt có ý
nghĩa thống kê, nhưng không khác biệt mạnh mẽ.

Phân tích phương sai (ANOVA): Thống kê tần suất F = 61,291
với mức ý nghĩa .Sig (hay xác suất p-value) = 0.000 rất nhỏ so với
0.5 chỉ ra rằng giả thiết H0 “không có sự khác biệt về trí thông minh
của sinh viên giữa các ngành đang nghiên cứu” bị bác bỏ. Mẫu của

chúng ta cung cấp một bằng chứng mạnh rằng các trí thông minh
của SV thuộc các ngành khác nhau thì khác nhau đáng kể và thấp
dần theo thứ tự: Khối ngành kĩ thuật, CNTT, BK, khối ngành y khoa,
khối ngành kinh tế, ngành KHXH & NV, ngành sư phạm.
Thực tế khối ngành sư phạm có điểm trung bình trí thông minh
thấp nhất là do lấy đầu vào điều tra là từ nhóm GD tiểu học, TLGD.
Kết quả này là do chọn mẫu chứ không phải do bản chất.
Câu 5: Kiểm định ANOVA
Yêu cầu của câu hỏi cần đến một sự kiểm định về sự ảnh hưởng
của một biến (biến lop) đối với biến khác (biến tongsat). Vì vậy ta sẽ
chọn kiểm định ANOVA (phân tích phương sai một yếu tố).


- Trước hết dùng lệnh Data \ Select cases để chọn lại đối tượng là
học sinh với điều kiện dòng if là hssv = 1

- Tiếp theo dùng lệnh Analyze \ Compare Means \ One – Way
ANOVA. - Chọn Dependent List là tongstat và Factor là lop.
- Trong Post Hoc, chọn LSD: để qui định phép kiểm định này lần lượt
thực hiện kiểm định t với từng nhóm.
- Trong Option chọn Descriptive : để đưa ra các thống kê mô tả.

Trong số các kết quả thu được, ta có thể chỉ cần quan tâm đến bảng
sau đây:


Từ bảng trên ta thấy điểm trung bình giữa lớp 10, 11 và lớp 12
là tương đương nhau, nhưng có một khác biệt rõ rệt nhưng không
quá nhiều giữa lớp 10 và lớp 11. Điểu này chứng tỏ về năng lực trí
tuệ của học sinh ở 2 lớp cuối bậc phổ thông tăng lên nhiều hơn so

với khi mới bắt đầu vào bậc học này.
Câu 6: Đánh giá độ tin cậy của các thang đo
Ta tính độ tin cậy cho các thang đo. Tuy nhiên ta nên tính hai
lần để so sánh. Đầu tiên tính độ tin cậy cho tất cả các item, sau đó
mới tính độ tin cậy cho các thang đo analy, creat và pract. Cụ thể
như sau:
Vì Analy là tổng của các item từ aa1 đến aa12, Creat là tổng
của các item từ aa13 đến a24, Pract là tổng của các item từ aa25
đến aa36. Vậy ta tính độ tin cậy của tất cả các item từ aa1 đến aa36.
- Trước hết chọn lệnh Data \ Select cases để chọn All cases
- Sau đó dùng lệnh Analyze \ Scale \ Reliability Analysis, rồi chọn các
item từ aa1 đến aa36. Nhấn nút Statistic chọn Item, Scale, và Scale
item if deleted.


Bảng kết quả thứ nhất thống kê độ tin cậy chung là khá cao với hệ số
Cronbach’s Alpha bằng 0.820.

Bảng kết quả tiếp theo mà ta cần quan tâm thống kê độ tin cậy của
từng item với hệ số tin cậy Cronbach’s Alpha cũng tương đương, đều
có giá trị khá cao, trong khoảng từ 0.812 đến 0.822.
Item-Total Statistics
Scale Mean Scale
if
Item Variance
Deleted
Item
Deleted
TM
18,06

36,861
Sternberg
TM
17,84
36,009
Sternberg
aa3
17,68
36,331
aa4
18,00
36,051
aa5
17,81
35,585
aa6
17,68
35,842
aa7
17,78
35,577
aa8
17,98
35,797
aa9
17,77
36,172
aa10
17,81
35,989

aa11
17,96
35,469
aa12
17,89
35,975

Corrected
if Item-Total
Correlation

Cronbach's
Alpha if Item
Deleted

,191

,820

,325

,816

,311
,322
,403
,401
,413
,362
,309

,333
,417
,328

,816
,816
,813
,813
,813
,814
,816
,815
,812
,815


aa13
aa14
aa15
aa16
aa17
aa18
aa19
aa20
aa21
aa22
aa23
aa24
aa25
aa26

aa27
aa28
aa29
aa30
aa31
aa32
aa33
aa34
aa35
aa36

17,82
17,98
17,70
17,79
17,85
17,63
17,91
17,95
18,24
18,14
17,98
18,02
18,02
17,59
17,70
18,04
17,66
18,10
17,60

17,61
18,19
18,24
18,09
18,16

36,014
37,176
36,500
36,507
35,509
36,096
36,044
36,080
37,028
37,448
36,740
36,300
36,601
36,325
37,390
36,298
35,701
36,198
35,813
36,064
36,934
36,986
36,155
36,584


,327
,127
,270
,246
,411
,383
,316
,311
,222
,100
,201
,281
,229
,365
,107
,285
,444
,319
,467
,407
,217
,232
,324
,271

,815
,822
,817
,818

,813
,814
,816
,816
,819
,822
,820
,817
,819
,815
,822
,817
,812
,816
,812
,813
,819
,818
,816
,817

Bây giờ lại dùng lệnh Analyze \ Scale \ Reliability Analysis, rồi
chọn các thang đo analy, creat, pract. Nhấn nút Statistic chọn Item,
Scale, và Scale item if deleted.
Bảng kết quả thứ nhất thống kê độ tin cậy chung tuy vẫn cao
với giá trị hệ số Cronbach’s Alpha bằng 0.753 nhưng cũng đã giảm
xuống khi chuyển sang thang đo tổng .
Reliability Statistics
Cronbach's


N of Items

Alpha
,753

3
Bảng kết quả tiếp theo mà ta cần quan tâm thống kê độ tin cậy

của từng thang đo do đó cũng giảm tương ứng và thậm chí giảm
mạnh (hệ số Cronbach’s Alpha có giá trị trong khoảng từ 0,643 đến


0,698). Tuy nhiên giá trị trên trung bình của các độ tin cậy là chấp
nhận được và cho phép ta kết luận các thang đo analy, creat, pract
của trắc nghiệm STAT trên nhóm mẫu học sinh và sinh viên là khá
tốt.
Item-Total Statistics
Scale Mean Scale
if
Item Variance
Deleted
Item
Deleted
analysic 11,78
16,559
creative 12,52
20,219
practice 12,51
20,419


Corrected
if Item-Total
Correlation
,611
,589
,558

Cronbach's
Alpha if Item
Deleted
,643
,666
,698

Câu 7: Đánh giá độ phân biệt của các Item trong trắc nghiệm
Trước hết dùng lệnh Data \ Select case để chọn lại đối tượng là sinh
viên với điều kiện dòng if là hssv = 2
- Sau đó có thể dùng lệnh Analyze \ Descriptive Statistics \
Frequencies. Chọn tất cả các item từ aa1  aa36, và tongstat. Trên
bảng tongstat, ta giả định chia làm 3 nhóm điểm (cột đầu tiên):
nhóm điểm cao, nhóm điểm trung bình và nhóm điểm thấp. Từ đó
suy ra nhóm cao có tongstat >= 23 , nhóm thấp có tongstat <= 15,
nhóm trung bình có tongstat từ 16 đến 22.

tongstat

Valid

0
4

5
6
7
8
9
10

Frequenc
y
56
2
4
5
8
11
24
26

Percent
3,4
,1
,2
,3
,5
,7
1,5
1,6

Valid
Percent

3,6
,1
,3
,3
,5
,7
1,5
1,7

Cumulative
Percent
3,6
3,7
4,0
4,3
4,8
5,5
7,1
8,8


11
12
13
14
15
16
17
18
19

20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
Total
Syste
Missing
m
Total

43
50
63
68
91
78
96
80
82

110
79
97
82
88
68
64
51
42
37
21
16
6
2
3
1553

2,6
3,1
3,9
4,2
5,6
4,8
5,9
4,9
5,0
6,8
4,9
6,0
5,0

5,4
4,2
3,9
3,1
2,6
2,3
1,3
1,0
,4
,1
,2
95,5

73

4,5

1626

100,0

2,8
3,2
4,1
4,4
5,9
5,0
6,2
5,2
5,3

7,1
5,1
6,2
5,3
5,7
4,4
4,1
3,3
2,7
2,4
1,4
1,0
,4
,1
,2
100,0

11,5
14,7
18,8
23,2
29,0
34,1
40,2
45,4
50,7
57,8
62,8
69,1
74,4

80,0
84,4
88,5
91,8
94,5
96,9
98,3
99,3
99,7
99,8
100,0

Độ phân biệt của các item là hiệu của của nhóm cao trừ cho
nhóm thấp. Vậy phải ta phải tính từng nhóm:
+ Để tính điểm cho nhóm cao, ta dùng lệnh Data \ Select case để
chọn lại đối tượng là sinh viên với điều kiện dòng if là hssv = 2 and
tongstat >= 23
+ Sau đó có thể dùng lệnh Analyze \ Descriptive Statistics \
Frequencies. Chọn tất cả các item từ aa1aa36, để tìm điểm cho
nhóm cao.


+ Điểm của nhóm cao nhất là: 480
Làm tương tự cho nhóm thấp.
+ Để tính điểm cho nhóm thấp, ta dùng lệnh Data \ Select case để
chọn lại đối tượng là sinh viên với điều kiện dòng if là hssv = 2 and
tongstat <= 15
+ Sau đó có thể dùng lệnh Analyze \ Descriptive Statistics \
Frequencies. Chọn tất cả các item từ aa1aa36, để tìm điểm cho
nhóm thấp.

+ Điểm của nhóm thấp là: 451
Vậy
Độ phân biệt của các Item là: 480 – 451 = 29




×