1
CHƯƠNG 7
XỬ LÝ DỮ LIỆU-
ỨNG DỤNG PHẦN MỀM SPSS
NGHIÊN CỨU
MARKETING
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP. HỒ CHÍMINH
KHOA QUẢN TRỊ KINH DOANH
2
NỘI DUNG
A.XỬLÝ DỮ LIỆU
1. Các phương pháp xử lý dữ liệu;
2. Các giai đoạn xử lý dữ liệu.
B. ỨNG DỤNG PHẦN MỀM SPSS
1. Giới thiệu phần mềm SPSS;
2. Chuẩn bị dữ liệu;
3. Định biến vànhập dữ liệu;
4. Các phép biến đổi vàthao tác trên tập dữ liệu.
3
A. XỬ LÝ DỮ LIỆU TRONG NC MAR
Nhiệm vụ tổng quát của việc xử lý dữ liệu là“chuyển hóa”
những ghi chép quan sát hoặc các câu trả lời dưới dạng
“thô”thành các con số thống kê theo một trật tự nhất định
để chuẩn bị cho việc phân tích vàdiễn giải các kết quả
nghiên cứu thu được.
4
1. Các phương pháp xử lý dữ liệu
Xử lý
thủ công
Xử lý
với trợ giúp
của máy tính
Có 2 phương pháp xử lý dữ liệu cơ bản là:
5
2. Các giai đoạn xử lý dữ liệu
Chuẩn bị dữ liệu Nhập dữ liệu và lưu trữ
Giai đọan này gổm 3
bước:
Ø Kiểm tra và hiệu
chỉnh dữ liệu;
Ø Định biến dữ liệu;
Ø Mã hóa dữ liệu.
Giai đọan này cũng gồm 3
bước:
v Nhập dữ liệu vào máy
tính;
v Làm sạch dữ liệu;
v Lưu trữ dữ liệu.
6
2.1.1 Kiểm tra vàhiệu chỉnh dữ liệu
Đây là bước kiểm tra chất lượng thông tin trong bảng
câu hỏi nhằm đảm bảo không cóbảng câu hỏi nào bị thiếu
hoặc chứa đựng những thông tin sai sót theo yêu cầu thiết
kế ban đầu. Người kiểm tra phải bảo đảm tính toàn vẹn và
tính chính xác của từng bảng câu hỏi. Thông thường ở bước
này các nhànghiên cứu sẽ tiến hành kiểm tra các đặc tính
cơ bản của bảng câu hỏi. Cụ thể:
Ø Tính lôgíc của các câu trả lời;
Ø Tính đầy đủ của một câu trả lời vàcủa một bảng câu hỏi;
Ø Tính hợp lý vàxác thực của các câu trả lời.
7
2.1.1 Kiểm tra vàhiệu chỉnh dữ liệu
Quátrình kiểm tra, ràsoát lại bảng câu hỏi lànhằm
mục đích kiểm tra, phát hiện, sửa chữa vàthông báo kịp
thời cho người thu thập dữ liệu để tránh những sai sót
tương tự. Để xử lý các sai sót phát hiện được qua kiểm tra,
ta cóthể chọn cách xử lý tuỳ thuộc vào mức độ sai sót. Cụ
thể:
§ Trả về cho bộ phận thu thập dữ liệu nhằm làm sáng tỏ vấn
đề;
§ Suy luận từ các câu trả lời khác;
§ Loại bỏ bảng câu hỏi.
8
2.1.2 Định biến dữ liệu
Biến nghiên cứu làtập hợp các khái niệm cóý nghiã mô tả
(định tính, định lượng ) cho mục tiêu nghiên cứu, được thể
hiện bằng các ký hiệu (mã hoá) theo một qui ước nào đó.
Biến nghiên cứu được thể hiện vàlàmột bộ phận không thể
thiếu trong mô hình nghiên cứu.
Biến nghiên cứu cóthể được phân loại theo kiểu dữ
liệu (dạng thang đo). Biến định tính làbiến chứa các giá
trị quan sát ở dạng thang đo biểu danh và thang đo xếp
hạng theo bậc. Biến định lượng làbiến chứa các giátrị
quan sát ở dạng thang đo khoảng và thang đo tỷ lệ. Trong
bảng câu hỏi, mỗi một câu hỏi thường phải nhằm một mục
đích quan sát nào đó. Do vậy, thường mỗi một câu hỏi
tương ứng với một biến quan sát.
9
Thídụvềbiến nghiên cứu
Giả sử rằng “Các yếu tố tác động đến quyết định lựa chọn
(mua) mì ăn liền nhãn hiệu “Hảo Hảo”của khách hàng trên thị
trường TP.HCM”là: (a1) Chất lượng SP; (a2) Khẩu vị phùhợp;
(a3) Định lượng vừa đủ; (a4) Dễ dàng mua; (a5) Bao bìhấp dẫn.
Khi đi sâu nghiên cứu về “chất lượng”sản phẩm, các thuộc tính
cấu thành kết luận chất lượng sản phẩm tốt của mì ăn liền ”Hảo
Hảo”gồm có: (a1.1) Sợi mì dai (khi ăn); (a1.2) Màu sắc của mì
và nước dùng tươi ngon; (a1.3) Cóthành phần dinh dưỡng cao;
…Vàcác yếu tố còn lại cũng cócác thuộc tính xác định chúng.
10
Thídụvềbiến nghiên cứu
Ở thídụtrên các biến số: a1; a2; a3; a4 làcác biến số
trực tiếp (cấp 1) tác động đến quyết định lựa chọn mì ăn
liến “Hảo Hảo”. Còn các biến số a1.1; a1.2; …làcác biến
số cấp 2 ( Xem mô hình nghiên cứu).
Thídụ: Với câu hỏi “Xin vui lòng cho biết sở thích của bạn
đối với sữa chua Vinamilk? -> Ta cóthể định biến nghiên
cứu là:
c3: Sở thích của khách hàng đối với sữa chua Vinamilk.
11
2.1.3 Mã hoádữliệu
Mã hoádữliệu (Coding) làquátrình chuyển đổi các
trả lời thành dạng mã số để nhập vàxửlý dữ liệu. Mục đích
của việc mã hoálàtạo nhãn (labels) cho các câu trả lời,
thường làbằng các con số, hay ký hiệu. Một trả lời khi mã
hoá thường sẽ thể hiện bằng 1ký tự chỉ số trả lời (số đo).
Thídụ: Với câu hỏi “Xin vui lòng cho biết sở thích của bạn đối
với sữa chua Vinamilk?
Code: 1 2 3 4 5
Rất ghét Ghét Tạm được Thích Rất thích
12
2.1.3 Mã hoádữliệu
Mã hoácòn giúp giảm thiểu các câu trả lời bằng cách
nhóm các câu trả lời vào 1 nhóm cócùng ý nghiã. Mã hoádữ
liệu làm cơ sở cho việc thống kê phân tích dữ liệu. Tiến trình
mã hoácóthể được tiến hành bằng việc lập Sổ mã hoádữ
liệu như sau:
v Xác định loại câu trả lời cho những câu hỏi tương ứng.
Những câu trả lời này cóthể thu thập từ một mẫu các bảng
câu hỏi đã hoàn tất;
v Xây dựng một danh mục liệt kê các câu trả lời;
v Gán cho các câu trả lời một nhãn hiệu, ký hiệu, một giátrị
(thường làmột con số cụ thể).
TT Câu hỏi nghiên cứu Biến quan sát Mã trả lời Trả lời
1 Vui lòng cho biết giới tính
của bạn?
a1:Giới tính 1
2
Nam
Nữ
2 Xin vui lòng cho biết bạn
thuộc nhóm tuổi nào dưới
đây?
a2: Nhóm tuổi 1
2
3
4
5
Dưới 18 tuổi
Từ 19-25
Từ 26-35
Từ 36-45
Trên 45 tuổi
3 Xin vui lòng cho biết sở
thích của bạn đối với sữa
chua Vinamilk?
a3: Sở thích của
khách hàng đối
với sữa chua
Vinamilk.
1
2
3
4
5
Rất ghét
Ghét
Tạm được
Thích
Rất thích
…
13
Hình 7.1: Sổ mã hoádữliệu
2.2 Nhập dữ liệu và lưu trữ
2.2.1-Nhập dữ liệu vào máy tính
(Inputing data into computer)
2.2.2-Làm sạch dữ liệu
(Data cleaning)
CÁC BƯỚC CÔNG ViỆC
2.2.3- Lưu trữ dữ liệu
(Data saving)
15
2.2.1 Nhập dữ liệu vào máy tính
Bảng câu hỏi sau khi phỏng vấn, hiệu chỉnh vàmã
hoádữliệu thìcông việc tiếp theo lànhập dữ liệu vào máy.
Dữ liệu sau khi nhập xong ở dạng một ma trận được gọi là
Ma trận dữ liệu (data matrix). Các phần mềm xử lý dữ
liệu trong thống kê đều cần dữ liệu ở dạng ma trận.
16
2.2.2 Làm sạch dữ liệu
1-Ô trống
(Missing data)
2-Trả lời
không hợp lý
(Roque value)
Có2 sai sót thường gặp trong nhập dữ liệu là:
17
2.2.2 Làm sạch dữ liệu
Các ô trống làcác ô của ma trận không chứa đựng
dữ liệu trả lời. Nguyên nhân của sai sót làdo thu thập dữ
liệu bị sót, hoặc nhập dữ liệu sai. Để phát hiện ô trống ta có
thể dùng phép đếm (count) theo các biến, vìsốô theo các
biến sẽ phải cósố lượng đúng bằng cỡ mẫu. Khi phát hiện
sai sót phải chỉnh sửa lại.
Trả lời không hợp lý làcác trả lời códữliệu không
nằm trong thang đo đã thiết kế. Vídụ: thang đo có5 bậc (từ
1-5), nhưng lại códựliệu là7, hoặc 33 lànhững dữ liệu
không hợp lý. Để phát hiện các trả lời không hợp lý ta chỉ
cần tính tần số theo cột (biến). Loại sai sót này chủ yếu do
nhập liệu (do gõ sai).
2.2.3 Lưu trữ dữ liệu: Dưới dạng văn bản hoặc files.
Dữ liệu sau khi được lưu giữởdạng ma trận dữ liệu, công
việc tiếp theo làtóm tắt chúng để chuẩn bị cho các phương
pháp phân tích tiếp theo. Dữ liệu thường được tóm tắt ở 3
dạng:
18
3. TÓM TẮT DỮ LIỆU
Dạng thống kê
Dạng đồ thịDạng bảng, biểu
19
3.1 Tóm tắt dạng thống kê
1- Đo lường mức độ tập trung
(Measure of centrality)
2- Đo lường mức độ phân tán
(Measure of dispersion)
Gồm có:
v Trung bình (mean);
v Trung vị ( Median);
v Mode.
Gồm có:
v Phương sai (Variance);
vĐộ lệch chuẩn
(Standard Deviation);
v Khoảng biến thiên
(Range)
20
3.1 Tóm tắt thống kê
3.1.1 Đo lường mức độ tập trung
Ba đại lượng thường sử dụng trong đo lường mức độ
tập trung của các quan sát cócông thức tính như sau:
Ø Trung bình của biến X
i
( i= 1,2,3…n) của mẫu:
X = (1/n ). Σ
n
i=1
X
i
Ø Trung vị làgiátrị nằm giữa của thang đo.
Ø Mode làgiátrị cótần số xuất hiện lớn nhất của một tập
hợp các số đo.
21
3.1 Tóm tắt thống kê
3.1.2 Đo lường mức độ phân tán
Ø Phương sai (S
2
) đo lường mức độ phân tán của một tập
số đo xung quanh trung bình của nó. công thức tính như
sau:
S
2
= [1/(n-1)]. Σ
n
i=1
(X
i
–X)
2
Ø Căn bậc 2 của phương sai được gọi là độ lệch chuẩn
(SD),
SD = S
2
Ø Khoảng biến thiên làkhoảng cách giữa giátrị lớn nhất
vàgiátrị nhỏ nhất của một tập số đo.
22
3.2 Tóm tắt dạng bảng
1-Bảng đơn
(Simple one-way
Tabulation)
2-Bảng chéo
(Cross-Tabulation)
Hai dạng bảng thường dùng trong nghiên cứu
thị trường là:
23
Bảng đơn (mẫu)
Thang đo Tần số tuyệt
đối
Tần số
tương đối
(%)
Tần sô tích
luỹ (%)
5-Rất thích 40 20 20
4-Thích 100 50 70
3-Tạm được 30 15 85
2-Ghét 20 10 95
1-Rất ghét 10 5 100
Tổng N= 200 100%
C3: Sở thích của khách hàng đối với sữa chua Vinamilk.
24
Bảng chéo (mẫu)
C7: Sở thích về sữa chua Vinamilk theo giới tính.
Thang đo
Giới tính Giới tính
Tổng
Nam Nữ
5-Rất thích 10 30 40
4-Thích 40 60 100
3-Tạm được 24 6 30
2-Ghét 18 2 20
1-Rất ghét 8 2 10
Tổng 100 100 N= 200
3.3 Tóm tắt dạng đồ thị
Có4 dạng đồ thị thường dùng là:
Scatter
graph
Bar
chart
Pie
chart
Line
graph
26
3.3 Tóm tắt dạng đồ thị
Đồ thị thanh thường được
sử dụng cho các câu hỏi
cho nhiều trả lời để biểu
diễn tần số -tổng của nó
lớn hơn kích thước mẫu (
tần số tuyệt đối) hay lớn
hơn 100% tần số tương
đối.
27
3.3 Tóm tắt dạng đồ thị
Đồ thị bánh thường
được sử dụng cho các
câu hỏi đơn trả lời để
biểu diễn tần số tương
đối – Tổng của nó
bằng 100%.
28
3.3 Tóm tắt dạng đồ thị
Đồ thị đường và Đồ thị phân tán được sử dụng để biểu
diễn mối quan hệ giữa các biến.
Để chọn phương pháp phân tích dữ liệu phùhợp, nhà
nghiên cứu cần chúý một số vấn đề cóý nghiã quan
trọng sau:
29
4. CHỌN PHƯƠNG PHÁP PHÂN TÍCH
DỮ LIỆU
1- Thang đo
4-Sốbiến
cần phân tích
2-Phân bố
của dữ liệu
3- Phương pháp
chọn mẫu
5-Mối quan hệ
giữa các biến
30
4.1 Thang đo
Cócác cách phân tích thích hợp đối với mỗi loại
thang đo:
v Thang đo định danh chỉ cho chúng ta tính: tần số; kiểm
định tần số (Chi-bình phương).
v Thang đo xếp hạng theo thứ tự cho phép chúng ta tính:
tần số; trung vị; kiểm định tần số; Kolmogorov –
Smirnov; Wilcoxon.
v Thang đo khoảng và thang đo tỷ lệ cho phép chúng ta
thực hiện các phân tích nêu trên. Bên cạnh đócòn cho phép
ta tính: giátrị trung bình; Các phép kiểm định Z, t.
31
4.2 Phân bố của dữ liệu
Tuỳ theo sự phân bố của dữ liệu ở các dạng chúng ta
có phương pháp phân tích tương thích:
(1)Phân bố tham số (Parametric) : => dùng phép kiểm
định Z,t;
(2)Phân bố phi tham số (Non-Parametric): => dùng
phép kiểm định tần số; Wilcoxon.
32
4.3 Phương pháp chọn mẫu
1-Chọn mẫu theo xác suất
2-Chọn mẫu phi xác suất
Đây là phương pháp tốt nhất
để ta cóthể chọn ra một mẫu
cókhả năng đại biểu cho tổng
thể. Vìcóthể tính được sai số
do chọn mẫu, nhờ đóta cóthể
áp dụng được các phương
pháp ước lượng thống kê,
kiểm định giả thuyết thống kê
trong xử lý dữ liệu để suy rộng
kết quả trên mẫu cho tổng thể
chung
Việc chọn mẫu phi ngẫu nhiên
hoàn toàn phụ thuộc vào kinh
nghiệm vàsựhiểu biết về tổng thể
của người nghiên cứu nên kết quả
điều tra thường mang tính chủ
quan của người nghiên cứu. Mặt
khác, ta không thể tính được sai số
do chọn mẫu, do đókhông thể áp
dụng phương pháp ước lượng
thống kê để suy rộng kết quả trên
mẫu cho tổng thể chung
33
4.4 Số biến cần phân tích
Các nhànghiên cứu thường căn cứ vào số lượng
biến số cần phân tích để phân loại các phương pháp phân
tích dữ liệu:
Ø Khi số biến được phân tích là1 thì được gọi là phương
pháp phân tích đơn biến (Univariate data analysic);
Ø Khi số biến được phân tích là2 thìgọi là phương pháp
phân tích nhị biến (Bivariate data analysic);
Ø Khi cónhiều biến để phân tích thìcác phương pháp
phân tích đógọi là phương pháp phân tích đa biến
(Multivariate data analysic).
34
4.5 Mối quan hệ giữa các biến
1-Phân tích
phụ thuộc
2-Phân tích
phụ thuộc
lẫn nhau
Xét về mối liên hệ giữa các biến, chúng ta cóhai
nhóm phân tích chính:
35
4.5.1 Phân tích phụ thuộc
Khi các biến phân tích được chia thành hai nhóm:
Bíên độc lập –biến phụ thuộc thí phương pháp phân tích
là phân tích phụ thuộc. Các phương pháp phổ biến trong
nhóm này cóthể kể như:
(1)Phân tích hồi qui đa biến (Multiple regression
analysis);
(2)Phân tích phân biệt (Discriminant analysis);
(3)Phân tích phương sai đa biến (Multivariate analysis of
variance).
36
4.5.2 Phân tích phụ thuộc lẫn nhau
Trong trường hợp không cóbiến độc lập vàbiến
phụ thuộc mà các biến này phụ thuộc lẫn nhau thì
phương pháp phân tích là phân tích phụ thuộc lẫn nhau.
Các phương pháp thường dùng trong nhóm này như:
(1)Phân tích yếu tố khám phá(Exploratory factor analysis);
(2)Phân tích nhóm đồng nhất (Cluster analysis);
(3)Phân tích đa hướng (Multidimensional Scaling);…
B: ỨNG DỤNG SPSS TRONG XỬ LÝ DỮ LIỆU
1- Giới thiệu phần mềm SPSS
2- Định biến vànhập dữ liệu trên SPSS
3- Các thao tác vàphép biến đổi trên
tập dữ liệu
38
1. Giới thiệu phần mềm SPSS
SPSS (viết tắt của Statistical Package for the Social
Sciences) làmột chương trình máy tính phục vụ công tác
thống kê. SPSS được sử dụng rộng rãi trong công tác thống
kê xã hội. Thế hệ đầu tiên của SPSS được đưa ra từ năm
1968. Thế hệ mới nhất làthế hệ (Verison) 18.0 được giới
thiệu từ tháng 8 năm 2008, cócảphiên bản cho các hệ điều
hành Microsoft Windows, Mac, vàLinux / UNIX.Trong
phạm vi môn học này, chúng ta thống nhất sử dụng SPSS
15.0 cho việc xử lý dữ liệu.
Phần mềm SPSS cótất cả 3 dạng màn hình:
39
1. Giới thiệu phần mềm SPSS
Màn hình
hiển thị dữ liệu
(Data view)
Màn hình
hiển thị kết quả
(Output)
Màn hình
hiển thị biến
(Variables view)
40
1. Giới thiệu phần mềm SPSS
Màn hình quản lý dữ liệu (Data view):là nơi lưu
trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu
(data) bao gồm: Cột (Colum)- Đại diện cho biến quan sát,
mỗi cột chứa đựng các dữ liệu (n dữ liệu); Hàng (Row)-
Đại diện cho 1 phần tử được quan sát, mỗi hàng chức
đựng tất cả các câu trả lời (dữ liệu) của một đối tượng
nghiên cứu; vàô (Cell)- Chứa đựng một kết quả trả lời
tương ứng với một câu hỏi khảo sát (biến) vàmột phần tử.
41
1. Giới thiệu phần mềm SPSS
Màn hình quản lý biến (Variable view):Là nơi
quản lý các biến (Variable) vàcác thông số đặc tính của
biến. Trong màn hình này mỗi dòng quản lý một biến, và
mỗi cột thể hiện một thông số đặc tính của biến. Cụ thể
như sau:
42
1. Giới thiệu phần mềm SPSS
- Tên biến ( Name): Là tên đại diện cho biến. Tên biến sẽ hiển thị
trên đầu mỗi cột trong màn hình quản lý dữ liệu.
- Lọai biến (Type): Thể hiện định dạng dữ liệu trong biến: Dang
số-Numeric (mặc định); Dạng chuỗi –String; Dạng ngày tháng –
Date; Dạng đơn vịtiền tệ -Currency;…
- Chiều rộng cột (Width): Chỉ số lượng ký tự được hiển thị;
- Hiển thị số lẻ (Decimals) : Thể hiện số lượng con số sau dấu phẩy
được hiển thị;
- Nhãn của biến (Label): Nêu rõ hơn về ý nghĩa của biến số;
- Giátrị trong biến (Values): Cho phép khai báo các giátrị trong
biến với ý nghĩa cụ thể;
- Giátrị khuyết (Missing): Do thiết kế bảng câu hỏi cómột số giá
trị chỉ mang tính chất quản lý, không cóý nghĩa phân tích. Để lọai
bỏ biến này ta cần khai báo nó như làgiátrị khuyết để lọai bỏ giá
trị này ra khỏi các phân tích thống kê.
- Dạng thang đo (Measures): Hiển thị dạng thang đo của giátrị
trong biến.
43
1. Giới thiệu phần mềm SPSS
Màn hình hiển thị kết quả (output):
Các phép phân tích thống kê sẽ cho ra các kết quả
như bảng biểu, đồ thị vàcác kết quả kiểm định.
Các kết quả này sẽ được truy xuất ra một màn
hình, và được lưu giữ dưới một tập tin khác
(.SPO). Màn hình này cho phép ta xem và lưu giữ
kết quả phân tích.
44
2. Định biến vànhập dữ liệu trên SPSS
2.1 Định biến trên SPSS
Định biến trong màn hình quản lý biến (Variables view)
thực hiện trước khi nhập dữ liệu vào máy tính. Qui trình
định biến như sau:
1. Đặt tên biến (Name);
2. Định dạng biến (Type);
3. Xác định số lượng con số hiển thị cho giátrị biến (Width)
vàsố lượng con số lẻ hiển thị (Decimals);
4. Gán nhãn cho biến (Variable Label);
5. Định tên cho các giátrị trong biến (Value labels);
6. Định nghiã các giátrị khuyết (Missing values);
7. Định kích thước cột (Column format);
8. Định vị tríhiển thị giátrị (Align);
9. Định dạng thang đo (Measurement)
45
2. Định biến vànhập dữ liệu trên SPSS
2.2 Nhập dữ liệu trên SPSS
Dữ liệu được nhập từ màn hình quản lý dữ liệu (Data
view). Màn hình này thể hiện ra một ma trận dữ liệu gồm:
Cột; hàng; vàô. Với các cột lần lượt tương ứng với các
biến, các dòng tương ứng với mỗi phần tử. Ta cũng cóthể
nhập dữ liệu từ các phần mềm khác như Excel, Fox sau
đóchuyển vào SPSS bằng lệnh Copy.
3. Các phép biến đổi vàthao tác
trên tập dữ liệu
Có5 phép biến đổi trên tập dữ liệu
thường sử dụng là:
Tách tập
dữ liệu
Mã hoá
lại
Làm sạch
Vàtóm tắt
dữ liệu
Đánh giá độ
tin cậy của
thang đo
Hợp nhất
tập dữ liệu
47
3.1 Mã hoálại
1-Mã hoálại
trên cùng 1 biến
(Recode into same variable)
2-Mã hoá
vào biến khác
(Recode into difference
Variable)
Mã hoálại (Recode) làcông cụ biến đổi các giá
trị (đã mã hoá) thành các mã hoámới phùhợp với
đòi hỏi của việc phân tích dữ liệu. SPSS cung cấp
cho ta 2 loại mã hoálại là:
48
3.1 Mã hoálại
Mã hoálại trên cùng một biến thìcác giátrị được
mã hoálại sẽ thay thế cho các giátrị cũ (các giátrị này sẽ
mất đi), cần chúý rằng các giátrị vừa được mã hoálại chưa
có nhãn, do đósau khi recode ta phải khi báo lại nhãn cho
giátrị. Qui trình này được thực hiện qua các bước sau:
§ Transform/ Recode/ Recode into same variables ta sẽ cóhộp
thoại (7.4);
§ Chọn vàchuyển các biến cần mã hoálại sang hộp thoại variables,
nhấn Old and new value để chuyển các giátrị cũ thành các giátrị
mới. Old value dùng để khai báo các giátrị cũ cần chuyển đổi, New
value dùng để khai báo giátrị mới sẽ thay thế cho giátrị cũ. Add để
lưu giữ sự chuyển đổi này.
49
3.1 Mã hoálại
Mã hoálại vào biến khác thìcác giátrị hiện tại của
một biến trở thành giátrị mới trong một biến khác. Qui
trình này thực hiện như sau:
§ Transform/ Recode into different variables ta sẽ có
hộp thoại (7.7);
§ Chọn vàchuyển các biến cần mã hoálại vào hộp thoại
variables, khai báo tên biến mới vànhãn biến mới trong
hộp thoại Output variable. Nhấn Change để xác nhận
khai báo này.
50
3.2 Làm sạch vàtóm tắt dữ liệu với SPSS
Để làm sạch dữ liệu với SPSS ta chỉ cần thực hiện
tính tần số với thao tác đơn giản:
Ø Analyze/ Descriptive statistics/ Frequencies. Ta cóhộp
thoại tóm tắt tần số, ta cần chọn và đưa các biến cần tính
vào ô variables. Nhấn OK ta sẽ cóbảng tóm tắt tần số.
Các bạn chúý phần Missing (lỗi) nếu cóthìphải hiệu
chỉnh lại dữ liệu nhé.
Ø Để tóm tắt thống kê dữ liệu trên SPSS như: (1) Min; (2)
Max; (3) Mean; (4) Phương sai chỉ cần thao tác.
qTại hộp thoại tóm tắt tần số ta chọn Statistics rồi
chọn ô cần thiết rồi Continue/ OK bạn sẽ cókết quả
ngay lập tức.
51
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Khi thực hiện các nghiên cứu định lượng, người nghiên
cứu phải sử dụng nhiều thang đo lường khác nhau. Hiện tượng
kinh tế -xã hội vốn rất phức tạp nên việc lượng hoácác khái
niệm nghiên cứu đòi hỏi phải cósựkiểm tra độ tin cậy của các
thang đo trước khi sử dụng. Phần này chúng ta sẽ thực hành
kiểm tra độ tin cậy của thang đo bằng công cụ Cronbach
Alpha trên SPSS.
Thídụ:Giả sử rằng “Các yếu tố tác động đến quyết định lựa
chọn (mua) mì ăn liền nhãn hiệu “Hảo Hảo”của khách hàng
trên thị trường TP.HCM”là:
(a1) Chất lượng SP;
(a2) Khẩu vị phùhợp;
(a3) Định lượng vừa đủ;
(a4) Dễ dàng mua;
(a5) Bao bìhấp dẫn.
52
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Người nghiên cứu quan tâm vàmuốn đo lường xem
trong 5 nhân tố nêu trện thìmức độ tác động của các yếu tố
nào làmạnh hơn đến quyết định lựa chọn sản phẩm.
Muốn vậy, ta phải xây dựng các câu hỏi và thang đo
có độ tin cậy về khái niệm “Các yếu tố tác động đến quyết
định lựa chọn (mua) mì ăn liền “Hảo Hảo”.
Theo nghiên cứu trước đóthìcác yếu tố quyết
định…gồm 5 khiácạnh. Chúng ta sẽ xem xét tính toán
Cronbach Alpha đối với các mục hỏi của từng khiácạnh.
Câu hỏi liên quan đến đo lường mức độ tác động của các
yếu tố … như sau:
53
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Xin bạn vui lòng trả lời bằng cách khoanh tròn vào một con
sốởtừng dòng. Những con số này thể hiện mức độ bạn đồng ý hay
không đồng ý đối với các phát biểu theo qui ước sau:
Rất không đồng ý Không đồng ý Trung lập Đồng ý Rất đồng ý
1 2 3 4 5
a1: Chất lượng của mì ăn liền “Hảo Hảo”làyếu tố quyết
định việc tôi lựa chọn nó:
1 2 3 4 5
a2: Khẩu vị phùhợp làyếu tố quyết định việc tôi lựa chọn
mì ăn liền “Hảo Hảo”
1 2 3 4 5
a3: Mì ăn liền “Hảo Hảo”có định lượng vừa dủ làyếu tố
quyết định việc tôi lựa chọn nó.
1 2 3 4 5
a4: Việc tôi cáthể mua mì ăn liền “Hảo Hảo”một cách dễ
dàng, ở mọi nơi làyếu tố quyế t định việc tôi lựa chọn nó.
1 2 3 4 5
a5: Bao bìcủa mì ăn liền “Hảo Hảo”rất hấp dẫn làyếu tố
quyết định ciệc tôi lựa chọn nó.
1 2 3 4 5
54
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Vấn đềở đây là đây cóphải làmột thang đo tốt cho
một khía cạnh khái niệm mà ta quan tâm hay không? Để
trả lời câu hỏi này ta sẽ tính toán đại lượng Cronbach
Alpha. Một nghiên cứu sơ bộ với cỡ mẫu n
0
> 30 cho ta ma
trận mẫu, sau khi làm sạch dữ liệu và lưu mẫu ta tiến hành
tính toán Cronbach Alpha:
§ Analys / Scale/ Reliability Analysis. Hộp thoại hiện ra ta
chọn các biến từ a1 – a5 đưa vào hộp Items. Sau đóchọn
Statistics.
§ Trong hộp thoại Statistics, hãy nhấp mouse để chọn các
đại lượng cơ bản nhất như: Item; Scale; Scale if item
deleted sau đónhấn Continue trở về hộp thoại đầu tiên và
chọn OK kết quả tính toán Cronbach Alpha sẽ hiển thị tại
màn hình Output.
55
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Với kết quả Alpha từ :
§ >0.8 -> Là thang đo tốt;
§ 0.7-0.8 -> Là thang đo sử dụng được;
§ 0.6 –0.7 -> Là thang đo sử dụng được đối với những
khái niệm mới, hoặc cho SV mới bắt đầu học nghiên cứu;
§ < 0.6 -> Là thang đo không đảm bảo độ tin cậy,
không sử dụng được vàbạn phải sửa chữa bảng câu hỏi.
Chúý cột Alpha if item deleted nếu cótồn tại giá
trị lớn hơn Alpha thìhãy loại bỏ đi mục hỏi đó(mức độ
tác động đến quyết định …của yếu tố đólàthấp/ không
đáng kể) do đóta loại bỏ bớt đi.
56
3.4 Tách tập dữ liệu (Split file)
Công cụ Split file cho phép tách dữ liệu trong
tập dữ liệu đang quan sát thành những nhóm nhỏ riêng biệt.
Sau khi thực hiện lệnh này các phân tích xử lý thống kê sẽ
cho kết quả riêng biệt theo từng nhóm được tách ra này.
ØData/ Split file ta cóhộp thoại. Ta chọn Group based
on list vàchọncác biến để phân tách dữ liệu, và OK.
57
3.5 Hợp nhất các tập dữ liệu (Merge files)
SPSS cho phép ta hợp nhất các dữ liệu/ biến
quan sát từ trong một tập dữ liệu vào tập dữ liệu đang sử
dụng. Cả hai tạo ra một tập dữ liệu/ biến mới chứa đựng tất
cả các quan sát từ 2 tập dữ liệu.
Ø Add Cases/ hay Add Variables và OK.
58
C. Hướng dẫn tiểu luận môn học
Sau khi hoàn chỉnh Bảng câu hỏi, và điều tra
sơ bộ với cỡ mẫu n
0
> 30. Các bạn thực hiện việc xử lý dữ
liệu với SPSS, trong đóchúý:
1.Hiệu chỉnh vàlàm sạch dữ liệu;
2.Tóm tắt dữ liệu (Dạng bảng, dạng thống kê, dạng đồ thị);
3.Kiểm định độ tin cậy của thang đo với SPSS;
4.Xác định cỡ mẫu cho nghiên cứu chính thức (vận dụng
Excell).
XIN CẢM ƠN CÁC BẠN!
59