12/30/2013
TIN HỌC ỨNG DỤNG
Chương 2: Phân tích dữ liệu với SPSS
Phan Minh Trung
Trung tâm Tin học – Đại học An Giang
Email:
Website: />Tin học ứng dụng quản lý
1
Nội dung
1
• Giới thiệu SPSS & Cài đặt
2
• Mã hoá dữ liệu, Khai báo biến, Nhập liệu, Xử lý,„
3
• Kiểm đðnh thang đo
4
• Mô hình phân tích nhân tố khám phá (EFA).
5
• Phân tích hồi qui.
6
• Thống kê mô tả (tạo bảng tần số, bảng thống kê một số đại lượng, vẽ đồ thð)
Tin học ứng dụng quản lý
2
1
12/30/2013
Giới thiệu SPSS
Viết tắt Statistical Package for the Social Sciences
Sử dụng rộng rãi trong công tác thống kê kinh tế xã hội
SPSS cung cấp một hệ thống quản lý dữ liệu và
phân tích thống kê trong một môi trường đồ họa
Dễ sử dụng, hỗ trợ thao tác thông qua menu kéo
thả và câu lệnh, các bảng biểu, báo cáo được trình
bày đẹp, linh hoạt
3
Tin học ứng dụng quản lý
Cài đặt SPSS
Cài đặt SPSS V20
Tin học ứng dụng quản lý
4
2
12/30/2013
Mã hóa dữ liệu & Nhập liệu
VD: ta có bảng dữ liệu như sau
Người trả lời
Các biến
Giới tính
Tuổi
1
Nữ
19
Sinh viên
2
Nữ
32
Nhân viên
3
Nam
53
Về hưu
…
…
…..
Nam
42
Khác
….
n
Nghề nghiệp
5
Tin học ứng dụng quản lý
Mã hóa dữ liệu & Nhập liệu
Ta qui ước như sau
Giới tính
1. Nam
2. Nữ
Tin học ứng dụng quản lý
Tuổi
1. Từ 1 – 25
2. Từ 26 – 50
3. Trên 50
Nghề nghiệp
1.
2.
3.
4.
Sinh viên
Nhân viên văn phòng
Về hưu
Khác
6
3
12/30/2013
Mã hóa dữ liệu & Nhập liệu
Giới tính
Tuổi
Nghề nghiệp
1
2
1
1
2
2
2
2
3
1
3
3
…
…
…..
1
2
4
….
n
7
Tin học ứng dụng quản lý
Ví dụ: Mã hóa bảng câu hỏi!
Hãy
mã hóa và nhập liệu cho bảng phỏng về
đề tài nghiên cứu cứu “Các yếu tố ảnh hưởng
đến sự hài lòng của khách hàng: trường hơp
nghiên cứu ở Ngân hàng Nông nghiệp PTNT,
chi nhánh TPHCM”. Trong đó bao gồm các
biến độc lập, phụ thuộc, nhân khẩu học.
Xem
Tin học ứng dụng quản lý
phụ lục 2.1
8
4
12/30/2013
Mã hóa dữ liệu
TAN
REL
TAN_1
TAN_2
TAN_3
TAN_4
REL_1
REL_2
REL_3
REL_4
REL_5
REL_6
REL_7
REL_8
RES
RES_1
RES_2
RES_5
RES_4
RES_5
ASS
ASS_1
ASS_2
ASS_3
ASS_4
ASS_5
ASS_6
ASS_7
EMP
EMP_1
EMP_2
EMP_3
EMP_4
EMP_5
EMP_6
EMP_7
EMP_8
EMP_9
SAT
SAT_1
SAT_2
SAT_3
INFO
INFO_1
INFO_2
INFO_3
INFO_4
Mã hóa theo từng nhóm thành phần
Thông tin cá nhân theo 1 nhóm và qui ước các con số khi nhập liệu:
VD INFO_2 (Độ tuổi):
1. ≤ 20
2. Từ 20 – 30 tuổi
3. Từ 31 – 50 tuổi
4. Trên 50 tuổi
9
Tin học ứng dụng quản lý
Nhập liệu
Để
nhập dữ liệu nhanh ta thực hiện như sau:
Nhập
dữ liệu bằng Excel theo cột.
Chuyển
Kiểm
dòng thành cột.
tra dữ liệu.
Chuyển
dữ liệu qua SPSS:
Khai
báo biến đã mã hóa.
Copy
dữ liệu từ Excel qua SPSS.
Tin học ứng dụng quản lý
10
5
12/30/2013
Nhập liệu Excel
Tin học ứng dụng quản lý
11
Chuyển dòng thành cột
Tin học ứng dụng quản lý
12
6
12/30/2013
Kiểm tra dữ liệu bằng Filter trong Excel
Tin học ứng dụng quản lý
13
Khai báo biến bên SPSS
Tin học ứng dụng quản lý
14
7
12/30/2013
Giải thích giao diện khai báo biến.
Name
Tên biến, liên tục không có khoảng trắng
Type
Kiểu dữ liệu (Số, chuỗi,…)
Width
Độ rộng kiểu dữ liệu, nếu type là string thì width là số ký tự tối đa
Decimals
Llượng số thập phân
Label
Nhãn biến (chú thích cho tên biến)
Values
Định nghĩa giá trị cho các biến.
Missing
Khai báo giá trị khuyết
Columns
Độ rộng cột tên biến
Align
Canh lề dữ liệu nhập trong cột.
Measure
Loại thang đo của dữ liệu, Ordinary (thang đo thứ bậc), Nominal (thang đo danh
nghĩa), Scale (gồm cả Interval và Ratio).
Role
Vai trò của biến
15
Tin học ứng dụng quản lý
Xử lý biến„
Đðnh
Tin học ứng dụng quản lý
nghïa giá trð cho các biến.
16
8
12/30/2013
Mô hình Phân tích nhân tố khám phá (EFA)
Qui
trình phân tích nhân tố khám phá
(Exploratory Factor Analysis):
Bước
1: Kiểm đðnh chất lượng thang đo.
Bước
2: Phân tích nhân tố khám phá (EFA).
Kiểm đðnh tính thích hợp của EFA (chî số 0,5 < KMO
<1); Kaiser – Meyer - Olkin.
Kiểm đðnh tương quan giữa các biến: kiểm đðnh
Bartlett với Sig. < 0,05.
Kiểm đðnh mức độ giải thích (% cumulative variance –
phương sai trích) lớn hơn 50%
Tin học ứng dụng quản lý
17
Mô hình Phân tích nhân tố khám phá (EFA)
Qui
trình (tt):
Bước
3: Phân tích hồi qui bội (Multi Regression
Linear).
Tương quan từng phần, mức ý nghïa của HSHQ Sig.<0,05
Mức độ phù hợp của mô hình R2 và R2 đều chînh: sử dụng
phân tích phương sai ANOVA Sig.<0,05
Hiện tượng đa cộng tuyến VIF < 10.
Tin học ứng dụng quản lý
18
9
12/30/2013
Kiểm đðnh thang đo
AnalyzeScale Reliability Analysis
Xuất hiện hình dưới vả đưa thang đo cần kiểm đðnh như
hình:
Tin học ứng dụng quản lý
19
Kiểm đðnh thang đo (tt)
Hệ
số Cronbach Alpha >= 0,6 và tương quan
biến tổng ≥ 0,3
Nếu
nhỏ hơn 0,6 ta loại bỏ biến ở bảng dưới
và thực hiện lại kiểm đðnh như ban đầu.
Tin học ứng dụng quản lý
20
10
12/30/2013
Phân tích nhân tố khám phá
AnalyzeDimension ReductionFactor
Tin học ứng dụng quản lý
21
Phân tích nhân tố khám phá (tt)
Tin học ứng dụng quản lý
22
11
12/30/2013
Phân tích nhân tố khám phá (tt)
Tin học ứng dụng quản lý
23
Phân tích nhân tố khám phá (tt)
Tin học ứng dụng quản lý
24
12
12/30/2013
Phân tích nhân tố khám phá (tt)
Cỡ mẫu
Giá trð chọn (Factor loading)
> 350
0,3
100 ≤ Cỡ mẫu ≤ 350
0,55
< 100
0,75
25
Tin học ứng dụng quản lý
Phân tích nhân tố khám phá (tt)
Dựa
vào bảng Rotated Component Matrix để
trích nhân tố.
Kiểm
đðnh tính thích hợp 0,5 < KMO < 1
Kiểm
đðnh tương quan của các biến quan sát
trong thang đo (Bartlett với Sig. < 0,05).
Kiểm
đðnh mức độ giải thích các biến đặc trưng
đối với nhân tố (% Cumulative ≥ 50% - Phương
sai trích).
Tin học ứng dụng quản lý
26
13
12/30/2013
Phân tích nhân tố khám phá (tt)
KMO
= 0,891 thỏa mãn điều kiện: 0,5 < KMO
< 1, phân tích nhân tố khám phá là thích hợp
cho dữ liệu thực tế.
Kiểm
đðnh Bartlett có Sig. = 0,000 < 0,05, các
biến đặc trưng có tương quan tuyến tính với
nhân tố đại diện.
Tin học ứng dụng quản lý
27
Phân tích nhân tố khám phá (tt)
Phương
sai trích 63,6%. Điều này có nghïa
63,6% thay đổi của các nhân tố được giải
thích bởi các biến quan sát.
Tin học ứng dụng quản lý
28
14
12/30/2013
Phân tích nhân tố khám phá (tt)
Trích
được 4 nhân tố: mô hình 5
nhấn tố còn lại 4 nhân tố:
1.
Cảm thông (EMP)
2.
Phương tiện hữu hình (TAN)
3.
Đáp ứng (RES)
4.
Tin cậy (REL)
Bước tiếp theo là Phân tích hồi
qui bội.
29
Tin học ứng dụng quản lý
Phân tích hồi qui bội
Mô
hình tổng thể: SAT = f(EMP, TAN, RES, REL)
Để
thực hiện hồi qui:
Lấy
trung bình hoặc tổng các thành phần.
Chạy
mô hình hồi qui.
Phương
trình hồi qui:
SAT = B0 + B1EMP + B2TAN + B3RES + B4REL
Tin học ứng dụng quản lý
30
15
12/30/2013
Kiểm đðnh hồi qui
AnalyzeRegressionLinear„
31
Tin học ứng dụng quản lý
Phân tích kiểm đðnh hồi qui
Chọn
Tin học ứng dụng quản lý
Save.
32
16
12/30/2013
Phân tích kiểm đðnh hồi qui (tt)
Kiểm
đðnh HSHQ: tất cả các biến đều có Sig.
nhỏ hơn 0,05. Như vậy các biến tương quan
có ý nghïa với SAT với độ tin cậy 95%.
Tin học ứng dụng quản lý
33
Phân tích kiểm đðnh hồi qui (tt)
Kiểm
đðnh mức độ phù hợp của mô hình: R2
điều chînh là 0,594. Như vậy 59,4% thay đổi
sự hài lòng củ KH được giải bởi các biến độc
lập của mô hình.
Tin học ứng dụng quản lý
34
17
12/30/2013
Phân tích kiểm đðnh hồi qui (tt)
Mức
độ phù hợp: Phân tích phương sai, với
Sig. < 0,05 có thể kết luận rằng mô hình đưa
ra phù hợp với dữ liệu thực tế.
Tin học ứng dụng quản lý
35
Phân tích kiểm đðnh hồi qui (tt)
Đa
cộng tuyến: hệ số phương sai phóng đại
VIF < 2, hiện tượng đa cộng tuyến không bð vi
phạm.
Tin học ứng dụng quản lý
36
18
12/30/2013
Thảo luận kết quả hồi qui
Kết
luận giả thuyết đưa ra: quan hệ dương
giữa các thành phần đến sự hài lòng.
Hệ
số hồi qui chưa chuẩn hóa:
EMP:
0,135 (EMP tăng 1 thì hài lòng tăng 0,135)
TAN:
0,375 (TAN tăng 1 thì hài lòng tăng 0,375)
RES:
0,419 (RES tăng 1 thì hài lòng tăng 0,419)
REL:
0,199 (REL tăng 1 thì hài lòng tăng 0,199)
37
Tin học ứng dụng quản lý
Thống kê mô tả
Thống
kê mô tả các biến:
AnalyzeDescriptive StatisticsFrequencies„
Hoặc
AnalyzeDescriptive StatisticsDescriptives„
Đổ
bảng chéo:
AnalyzeDescriptive Statistics Crosstabs
Tin học ứng dụng quản lý
38
19
12/30/2013
Vẽ biểu đồ
Vẽ
biểu đồ trong phần thống kê.
Vẽ
biểu đồ với GraphsChart Builder„
39
Tin học ứng dụng quản lý
Kiểm đðnh tham số
Kiểm
đðnh T-Test đối với tham số trung bình
của 2 nhóm độc lập:
H0:
không có sự khác biệt về sự hài lòng của
khách hàng theo giới tính (nam – nữ).
Ha:
Có sự khác nhau
AnalyzeCompare meansIndependent-Samples T Test
Tin học ứng dụng quản lý
40
20
12/30/2013
Kiểm đðnh tham số (tt)
Tin học ứng dụng quản lý
41
Kiểm đðnh tham số (tt)
Kết quả: nếu thống kê Levence Sig. > 0,05 thì
khẳng đðnh giả đðnh phương sai đồng nhất, khi đó
các giá trð thống kê (T-Test) tham chiếu theo dòng
Equal Variances Assumed và ngược lại.
Trong trường hợp này, kiểm đðnh Levence với F=0,84
và Sig.=0,36> α =0,05 nên khẳng đðnh phương sai
đồng nhất.
Sig. (2-tailed) = 0,928 > 0,05 nên khẳng đðnh không
có sự khác nhau về sự hài lòng theo giới tính.
Tin học ứng dụng quản lý
42
21
12/30/2013
Kiểm đðnh tham số (tt)
Kiểm
đðnh ANOVA: kiểm đðnh sự khác nhau
trung bình có hơn 2 nhóm trở lên.
Giả
thuyết H0: Không có sự khác biệt về hài lòng
theo Nghề nghiệp
Ha:
Có sự khác nhau
AnalyzeCompare meansOne-Way Anova„
Tin học ứng dụng quản lý
43
Kiểm đðnh tham số (tt)
Tin học ứng dụng quản lý
44
22
12/30/2013
Kiểm đðnh tham số (tt)
Bảng
Test of Homogenetiny of Variances
Sig.=0,554 không có sự khác nhau phương sai
đồng nhất.
Bảng
ANOVA có Sig.=0,487 > 0,05. Có thể kết
luận không có sự khác biệt hay chấp nhập giả
thuyết H0.
45
Tin học ứng dụng quản lý
Thanks for Listening
Cám ơn đã lắng nghe
Tin học ứng dụng quản lý
46
23