Xử lý và Phân tích dữ liệu
với
SPSS
NỘI DUNG
1
SƠ LƯỢC QUÁ TRÌNH NGHIÊN CỨU
2
KHÁI NIỆM CƠ BẢN
3
TỔNG QUAN VỀ SPSS
4
5
ỨNG DỤNG CỦA SPSS
THAO TÁC CƠ BẢN VỚI SPSS
I. QUÁ TRÌNH NGHIÊN CỨU
1. CÂU HỎI
2. TỔNG QUAN
3. PHƯƠNG PHÁP
4. THIẾT KẾ CÔNG CỤ ĐO
5. THU THẬP DỮ LIỆU
6. XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU
7. KẾT QUẢ
II. KHÁI NIỆM CƠ BẢN
Tổng thể - tập hợp các phần tử
Mẫu- tập hợp con của tổng thể (nguyên tắc chọn mẫu)
Thu thập dữ liệu: bảng hỏi (online, offline), quan sát, phỏng vấn…
Xử lý dữ liệu: mã hóa, nhập liệu, hiệu chỉnh
Phân tích dữ liệu => suy diễn thống kê
•
•
Phương pháp thăm dò: thống kê mô tả
Phương pháp khẳng định: lý thuyết xác suất
Báo cáo kết quả: lưu ý tính tương đối, con số xác suất
Mẫu- tập hợp con của tổng thể (nguyên tắc chọn mẫu)
1. Yêu cầu của phân tích nhân tố khám phá EFA (Exploratory Factor Analysis)
N = 5*M
(N = Cỡ mẫu, M= Số câu hỏi)
Theo nghiên cứu của Hair, Anderson, Tatham và Black (1998) cho tham khảo về kích thước mẫu dự kiến. Theo đó kích thước mẫu tối thiểu là
gấp 5 lần tổng số biến quan sát. Đây là cỡ mẫu phù hợp cho nghiên cứu có sử dụng phân tích nhân tố (Comrey, 1973; Roger, 2006)
2. Yêu cầu với phân tích hồi quy đa biến:
N = 50 + 8*M
(N = Cỡ mẫu, M = số nhân tố độc lập)
Theo nghiên cứu của (Tabachnick và Fidell, 1996)
Nếu tổng thể nhỏ và biết được tổng thể thì dùng công thức sau:
n = cỡ mẫu,
N = là số lượng tổng thể
e = là sai số tiêu chuẩn
Bảng cỡ mẫu
Bảng 1. Cỡ mẫu với sai số cho phép là ±3%, ±5%, ±7% và ±10% Độ tin cậy là 95% và P=0.5.
Cỡ của tổng thể
Cỡ mẫu(n) với sai số cho phép :
±5%
±7%
±10%
500
222
145
83
600
240
152
86
700
255
158
88
800
267
163
89
900
277
166
90
1,000
286
169
91
2,000
333
185
95
Bảng cỡ mẫu (tiếp)
Bảng 1. Cỡ mẫu với sai số cho phép là ±3%, ±5%, ±7% và ±10% Độ tin cậy là 95% và P=0.5.
Cỡ của tổng thể
Cỡ mẫu(n) với sai số cho phép :
±3%
±5%
±7%
±10%
3,000
811
353
191
97
4,000
870
364
194
98
5,000
909
370
196
98
6,000
938
375
197
98
7,000
959
378
198
99
8,000
976
381
199
99
9,000
989
383
200
99
Bảng cỡ mẫu (tiếp)
Bảng 1. Cỡ mẫu với sai số cho phép là ±3%, ±5%, ±7% và ±10% Độ tin cậy là 95% và P=0.5.
Cỡ của tổng thể
Cỡ mẫu(n) với sai số cho phép :
±3%
±5%
±7%
±10%
10,000
1,000
385
200
99
15,000
1,034
390
201
99
20,000
1,053
392
204
100
50,000
1,087
397
204
100
100,000
1,099
398
204
100
>100,000
1,111
400
204
100
II. KHÁI NIỆM CƠ BẢN
DỮ LIỆU
ĐỊNH LƯỢNG
(NOMINAL)
(ORDINAL)
Thang đo
Thang đo
KHOẢNG
TỈ LỆ
(SCALE)
II. KHÁI NIỆM CƠ BẢN
Thang đo định danh: gọi tên sự vật, phân loại hiện tượng
Thang đo thứ bậc: sắp xếp về thứ tự hoặc sự hơn kém nhưng không rõ khoảng cách (hài lòng, bình thường, không
hài lòng)
Thang đo khoảng: sắp xếp về thứ tự hoặc hơn kém, có rõ khoảng cách (1- rất hài lòng: 7- Rất không hài lòng)
Thang đo tỷ lệ: là thang đo khoảng + giá trị số 0 là một giá trị thật, có thể chia được (50 tuổi = 2 lần 25 tuổi)
SKIP
II. KHÁI NIỆM CƠ BẢN
Đánh giá - Đo lường - Trắc nghiệm
Biến định tính – định lượng – độc lập – phụ thuộc
Số trung bình – Trung vị – Mode
Phân phối chuẩn - Độ lệch chuẩn – Phương sai
Thống kê mô tả, thống kê tần suất - Khoảng tin cậy – Độ tin cậy
Hồi quy tuyến tính, phương trình hồi quy
Y= 3,567 + 3x+ 2z+5e
Y: Doanh số bán hàng, X: Marketing, Z: cải tiến sản phẩm, e: chiến lược khuyến mại
SKIP
Parasuraman
SỐ TRUNG BÌNH:MEAN
TRUNG VỊ: MEDIAN
MODE VÀ RANGE
PHƯƠNG SAI: VARIANCE
ĐỘ LỆCH CHUẨN: STANDARD DEVIATION
SO SÁNH ĐỘ LỆCH CHUẨN
EXIT
Kiểm định Độ tin cậy thang đo – Cronbach’s coefficient Alpha
Nếu Hệ số tiểu thang đo < 0,40 => thấp, không dùng được
Nếu Hệ số của cả thang đo < 0,60 => thấp, không dùng được
Các tiểu thang đo/thang đo
Hệ số tin cậy Alpha/ Mẫu sinh viên = 448
Chiến lược học
0,77
Phương pháp dạy học
0,73
Năng lực học
0,78
Thái độ học
0,51
Động cơ học
0,66
Toàn bộ thang đo
0,90
III. TỔNG QUAN VỀ SPSS
SPSS là gì? Statistical Package for Social Sciences
Chức năng chính của SPSS?
•
•
•
•
Nhập và làm sạch dữ liệu
Xử lý, biến đổi và quản lý dữ liệu
Tổng hợp và trình bày dữ liệu dưới dạng bảng, biểu đồ, đồ thị
Phân tích dữ liệu, tính toán thống kê và diễn giải kết quả
Tổ chức dữ liệu trong SPSS?
•
•
•
•
File dữ liệu: *.sav hoặc *.sys;
File Syntax: *.sps;
File kết quả: *.spv;
File Script: *.wwd hoặc *.sbs
Đọc và xuất, nhập nhiều định dạng file khác
•
*xls, *xlsx, *dbf, *txt, Oracle, Access, STATA, SAS…
IV. ỨNG DỤNG CỦA SPSS
Thống kê mô tả
•
•
•
Đánh giá tần suất với Frequency (một hoặc nhiều biến)
Tính và so sánh các giá trị trung bình
Đánh giá quan hệ giữa các biến với Crosstabs
Thống kê suy luận
•
Phân tích phương sai một yếu tố (One-way)
Thực hiện các phép hồi quy tuyến tính
Phân tích độ tin cậy của các công cụ đo lường
Phân tích nhân tố