1
CHƯƠNG 8:
MỘT SỐ PHƯƠNG PHÁP PHÂN
TÍCH VÀDIỄN GIẢI DỮ LIỆU
- ỨNG DỤNG PHẦN MỀM SPSS
NGHIÊN CỨU
MARKETING
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP. HỒ CHÍMINH
KHOA QUẢN TRỊ KINH DOANH
2
KHÁI NIỆM
Phân tích dữ liệu làviệc phân tích vàdiễn giải ý
nghiã của dữ liệu thu thập được thông qua 1 mẫu nghiên
cứu, vàsuy rộng ra cho tổng thể nghiên cứu. Với kết quả
nghiên cứu (xét trên tổng thể nghiên cứu) thu được ta sẽ có
cơ sở để diễn giải ý nghiã của dữ liệu căn cứ vào mục tiêu
của cuộc nghiên cứu.
Việc điễn giải ý nghiã của kết quả nghiên cứu được
thực hiện thông qua kỹ thuật diễn dịch, bản thân kết quả
nghiên cứu chứa đựng thông tin về đối tượng nghiên cứu.
Việc trình bày vàdiễn giải ý nghiã kết quả nghiên cứu sẽ
được giới thiệu tại Chương 9: Hướng dẫn trình bày báo cáo
nghiên cứu của giáo trình môn học.
•Trong giáo trình chương này đề cập đến 3 phương
pháp phân tích dữ liệu đơn giản. Đólà:
•1. Xếp dữ liệu theo thứ tự
•2. Đo lường khuynh hướng hội tụ của dữ liệu
•3. Đo lường độ phân tán của dữ liệu
• Các bạn cóthể đọc nội dung chi tiết của 3
phương pháp này trong giáo trình của môn học.
• Thực chất, 3 phương pháp nêu trên làviệc tóm
tắt thống kê các dữ liệu nghiên cứu (đã được trình
bày tại Chương 7, mục 3.1), một nội dung không thể
thiếu của việc xử lý dự liệu trong nghiên cứu
marketing.
3
4
NỘI DUNG PHÂN TÍCH
• Đối với hệ cao đẳng
v Phân tích đơn biến;
v Phân tích nhị biến.
• Đối với hệ đại học
Ø 2 phương pháp trên; và
Ø Phân tích phi tham số;
Ø Phân tích các thực nghiệm mở rộng
5
1. Phân tích đơn biến
Ước lượng
tham số thị trường
Kiểm định giả thuyết
về tham số thị trường
Phân tích đơn biến làviệc phân tích vàdiễn giải ý
nghiã của dữ liệu thông kê được thu thập trong mẫu
nghiên cứu, với 1 biến số, vàsuy rộng ra cho tổng
thể nghiên cứu, với độ tin cậy (1-α), và độ chính
xác ε.
6
1.1 Ước lượng tham số thị trường
1.1.1 Nguyên tắc ước lượng
Nguyên tắc của ước lượng làthu thập thông tin từ
mẫu vàdùng các thông tin này để ước lượng các thông tin
của thị trường. Chúng ta thực hiện được điều này vìcómột
mối quan hệ giữa thông tin của mẫu vàthông tin của đám
đông.
Có2 nội dung ước lượng trong thống kê là:
(1) Ước lượng điểm (Point estimation);
(2) Ước lượng khoảng (Interval estimation).
Nguyên tắc của ước lượng điểm làdựa vào các thông
tin của mẫu đã thu thập để ước lượng các thông tin của thị
trường nghiên cứu. Kết quả của ước lượng điểm là1 giátrị
(điểm).
7
1.1.1 Nguyên tắc ước lượng
Nguyên tắc của ước lượng khoảng làdựa vào thông
tin thu thập từ mẫu để ước lượng cho các tham số của đám
đông.
Có3 dạng ước lượng khoảng trong thống kê là:
v Ước lượng tỷ lệ đám đông –P
X
;
v Ước lương trung bình đám đông – μ
X
;
v Ước lương phương sai đám đông – σ
2
X
.
Kết quả của ước lượng là1 khoảng (a,b) chứa tham
số đám đông với xác suất (1-α), nghiã là:
P(a<θ<b) = 1-α
Lưu ý rằng:
§ (1-α) làmức tin cậy (confidence level/ Probability content);
§ (a,b) làkhoảng tin cậy ( Confidence interval) của ước lượng;
§ α làmức ý nghiã (Significance level).
8
1.1.2 Ý nghiã của ước lượng tham số thị trường
Ước lượng các tham số thị trường có vai trò đặc biệt
quan trọng trong nghiên cứu marketing, là phương pháp mà
tất cả các NC mar đều phải sử dụng nhằm tiết kiệm chi phí
trong nghiên cứu. Ý nghiã của ước lượng tham số thị
trường biểu hiện qua một số thídụ dưới đây:
Thídụ 1: Ước lượng tỷ lệ thị trường
Trong nghiên cứu “Các yếu tố tác động đến quyết định lựa
chọn (mua) mì ăn liền nhãn hiệu “Hảo Hảo”của khách hàng trên thị
trường TP.HCM”, một mẫu ngẫu nhiên 200 người tiêu dùng được
chọn phỏng vấn. Với câu hỏi về nơi họ thường mua mì ăn liền nhất.
Sau khi phỏng vấn kết quả cho thấy 70% trả lời làhọ thường mua
tại các đại lý bán lẻ.
Vấn đề là ở chỗ, 70% nêu trên làtỷlệmẫu. Câu hỏi cần
được trả lời là: Trên thị trường TP.HCM, cóbao nhiêu %
khách hàng mua mìtại các đại lý bán lẻ?
Để trả lời câu hỏi trên, ta tiến hành ước lượng tỷ lệ
th
ị
trư
ờ
ng.
9
Thídụvề Ước lượng tỷ lệ thị trường
Với mức tin cậy 1-α = 90%, khoảng tin cậy của ước
lượng tỷ lệ P
X
của đám đông là:
P
x
(1-P
x
) P
x
(1-P
x
)
P
x
-Z
α/2
< P
x
< P
x
+ Z
α/2
n n
Tra trong Excell ta cóZ
α/2
= 1.645, vàkhoảng tin cậy là:
0.648 < P
x
< 0.752
Như vậy, Với độ tin cậy 1-α = 90%, tỷ lệ KH mua mì ăn
liền “Hảo Hảo”tại các đại lý bán lẻ trên thị trường
TP.HCM nằm trong khoảng từ 64,8% đến 75,2%.
10
Thídụvề ước lượng trung bình thị trường
Trong nghiên cứu “Phân tích các yếu tố tác động đến
quyết định lựa chọn (mua) sản phẩm càphê hoàtan G7”,
một mẫu ngẫu nhiên 500 người tiêu dùng được chọn để
phỏng vấn theo câu hỏi có thang đo khoảng 5 điểm: Xin vui
lòng cho biết, theo quan điểm của bạn về phát biểu sau:
“Càphê hoàtan G7 rất tiện lợi cho người sử dụng”
Hoàn toàn phản đối Hoàn toàn đồng ý
1 2 3 4 5
Sau khi phỏng vấn vàtóm tắt thống kê ta cótrung
bình mẫu, phương sai mẫu lần lượt là:
X = 3.92; S
x
= 1.57
11
Thídụvề ước lượng trung bình thị trường
Vìkích thước mẫu lớn nên khoảng tin cậy của ước
lượng trung bình của đám đông (μ), với mức ý nghiã α=1%
là:
t
α/2
S
x
t
α/2
S
x
X < μ
x
< X +
n n
Tra giátrị t
α/2
trong Excell với α=1% ta cót
α/2
= 2.575,
vàkhoảng tin cậy là:
3.82 < μ
x
< 4.02
Như vậy, xác suất 99%, trung bình đám đông nằm trong
khoảng từ 3.82 đến 4.02.
12
1.2 Kiểm định giả thuyết về tham số thị trường
1.2.1 Nguyên tắc kiểm định
Nguyên tắc của kiểm định giả thuyết về thị trường
nghiên cứu là đưa ra các giả thuyết về các tham số thị
trường, thu thập thông tin từ mẫu để kiểm định giả thuyết
đã đưa ra. Trong khi nguyên tắc của ước lượng làthu thập
thông tin từ mẫu vàsuy ra (diễn dịch) ước lượng các tham số
của thị trường.
13
1.2.2 Ý nghiã của kiểm định giả thuyết về
tham số thị trường
Trong nghiên cứu marketing, dùlànghiên cứu hàn
lâm hay ứng dụng thìkiểm định giả thuyết về tham số thị
trường là phương pháp rất thường hay được sử dụng. Dựa
vào những nghiên cứu có trước (dạng nghiên cứu lặp lại),
hay dựa vào kết quả nghiên cứu định tính bằng phương
pháp thảo luận nhóm (trong nghiên cứu khám phá), ta đưa
ra những giả thuyết về thị trường, vàtiến hành thu thập dữ
liệu từ mẫu nghiên cứu, bằng “phép”kiểm định các giả
thuyết ta có được những kết luận về vấn đề nghiên cứu
1.2.3. Qui trình kiểm định giả thuyết
Bước 1: Thiết lập các giả thuyết (H
0
; H
a
);
Bước 2: Chọn mức ý nghiã (α);
Bước 3: Chọn “phép”kiểm định thích hợp
vàtính toán các giátrị thống kê kiểm định
(Z);
Bước 4: Xác định giátrị tới hạn
của phép kiểm định;
Bước 5: So sánh giátrị kiểm
định với giátrị tới hạn để ra
quyết định (Chấp nhận hay bác
bỏ giả thuyết).
Quyết định Giả thuyết H
0
Đúng Sai
Chấp nhận giả
thuyết
Quyết định đúng
(Xác suất 1-α)
Sai lầm loại 2
(Xác suất β)
Bác bỏ giả
thuyết
Sai lầm loại 1
(Xác suất α)
Quyết định đúng
(Xác suất 1-β);
Khả năng của phép
kiểm định (Power
of the test)
15
1.2.4 Các sai lầm trong quyết định
khi kiểm định thống kê
16
Mối quan hệ giữa α và β
Giữa α và β cómối quan hệ với nhau. Giả sử rằng
chúng ta muốn kiểm định trung bình của một biến x (có
phân phối chuẩn) với giả thuyết H
0
: μ = μ
0
vàH
a
: μ > μ
0
.
Nếu giả thuyết này đúng (nghiã là đường A làphân bố thực
của X). Khi ta thực hiện “Phép”kiểm định thìxác suất bác
bỏ giả thuyết H
0
là α %, vànếu Giátrị kiểm định Z nằm
trong khoảng (Z
α
, ∞) thìchúng ta đã từ chối một giã thuyết
đúng – Chúng ta mắc sai lầm loại 1. Tương tự như vậy,
nhưng nếu bây giờ giả thuyết này sai (nghiã là đường A
không phải làphân phối thực của X, màlà đường B). Khi
ta thực hiện “phép”kiểm định (dựa vào đường A), vàkhi
giátrị kiểm định Z nằm trong khỏang (μ
0
, Z
α
) chúng ta
chấp nhận giả thiết H
0
, thìchúng ta đã chấp nhận một giả
thuyết sai – Chúng ta mắc sai lầm loại 2.
17
1-α
Như vậy, khi chúng ta
giảm α (để giảm sai lầm
loại 1), thì đồng thời
chúng ta đã làm tăng β
(tăng sai lầm loại 2), và
làm giảm khả năng của
phép kiểm định.
Mối quan hệ giữa α và β
Thông thường trong nghiên cứu marketing người ta
chọn mức ý nghiã α = 5%.
A
B
μ =μ
0
μ >μ
0
f
(x)
α
Vùng chấp nhận
H
0
: z Є(μ
0
,z
α
)
Vùng bác bỏ
H
0
: z Є(z
α
,∞)
x
x
1-β
Các “phép”kiểm định tham số thị trường thường
dùng trong phân tích đơn biến gồm có:
18
1.2.5 Các “phép”kiểm định tham số
thị trường trong phân tích đơn biến.
Kiểm định tỷ lệ đám đông
(Biến định tính)
Kiểm định phương sai
đám đông
(Biến định lượng)
Kiểm định trung bình
đám đông
(Biến định lượng)
19
1.2.5 Các “phép”kiểm định tham số
thị trường trong phân tích đơn biến.
1-Kiểm định Z
(kiểm định tỷ lệ
-Nonparametric Test)
2- Kiểm định T
(kiểm định trung bình
-One sample T test)
Thay vào đóchúng tôi sẽ hướng dẫn các bạn các
“phép”kiểm định: (1); (2) với sự hỗ trợ của phần mềm
SPSS.
20
Kiểm định Z được sử dụng trong kiểm định tỷ lệ đám
đông (dùng cho biến định tính-Nonparametric). Giả sử
chúng ta phỏng vấn 1 mẫu ngẫu nhiên với 234 KH với câu
hỏi:
C2: Bạn đang sử dụng ĐTDD cónhãn hiệu nào trong các
nhãn hiệu dưới đây
1 Nokia
2 Samsung
3 Apple
4 Ericsion
5 Loại khác
Kiểm định Z
21
Kết quả thu được P
Nokia
= 60%. ta tiến hành kiểm
định giả thuyết H
0
: P
Nokia
< P
0
= 0.70 với giả thuyết H
a
:
P
Nokia
≥ 0.7, vàmức ý nghiã α = 5%, nếu Z ≥ Z
α
thìgiả
thuyết được chấp nhận (nghiã làtỷlệKH sử dụng ĐTDĐ
nhãn hiệu Nokia chiếm dưới 70%), ngược lại giả thuyết sẽ
bịbác bỏ. Chúng ta thực hiện trên SPSS như sau:
Analyze -> Nonparametric Test -> Binominal ta nhập
biến C2 vào ô Test Variable test, nhập giátrị kiểm định vào
ô Test Proportion -> OK
Chúng ta cókết quả kiểm định tại màn hình output.
Quan sát cột Asymp. Sig. (1-failed) nếu cho giátrị≤.050
thìgiả thuyết H
0
bị bác bỏ, ngược lại, giả thuyết H
a
được
chấp nhận.
Kiểm định Z
22
Kiểm định T được sử dụng phổ biến để kiểm định trung
bình cho các biến định lượng (Metric). Giả sử chúng ta phỏng
vấn 234 KH với câu hỏi:
C5: Xin vui lòng cho biết ý kiến của bạn về phát biểu dưới đây
”Điện thoại di động nhãn hiệu NOKIA cóchất lượng tốt”
Hoàn toàn phản đối Hoàn toàn đồng ý
1 2 3 4 5
Sau khi thu thập dữ liệu với cỡ mẫu n
0
= 234 vànhập
liệu, nay ta muốn kiểm định xem trung bình của biến này, với ý
nghiã xem nhận định, đánh giácủa khách hàng về chất lượng
ĐTDD NOKIA
Chúng ta đặt giả thiết H
0
: ĐTDD nhãn hiệu NOKIA cóchất
lượng tốt (với mức ý nghiã α = 5%; Nếu μ
0
≥ 3 thìgiả thuyết
được chấp nhận), vàtiến hành kiểm định biến số trên.
Kiểm định T (One sample T test)
23
Chúng ta thực hiện thao tác trên SPSS như sau:
Analyze -> Compare Means (so sánh trung bình của
biến với 3) -> One-Sample T-Test -> Nhập biến C5 vào, thay
giátrị Test value bằng 5 (mặc nhiên là0) -> OK.
Ở màn hình Output sẽ cho kết quả trung bình (mean) là
một giátrị cụ thể (con số) tại bảng tóm tắt (one sample
Statistics). Tại bảng kết quả kiểm định (One-Sample Test), trên
cột cuối (95% Confidence interval of the difference) ta thấy giá
trị dưới (lower) vàtrên (Upper). Kết quả kiểm định như sau:
(Mean + Lower) ≤μ
0
≤(Mean + Upper)
Nếu (Mean + Lower) ≥3, ta chấp nhận giả thuyết H
0
:
ĐTDĐ nhãn hiệu NOKIA cóchất lượng tốt (với mức ý nghiã α
= 5%). Và ngược lại, ta bác bỏ giả thuyết.
Kiểm định T (One sample T test)
24
2. Phân tích nhị biến
1-Biến A 2-Biến B
Phân tích nhị biến làviệc phân tích vàdiễn giải ý
nghiã của dữ liệu thống kê được thu thập trong mẫu
nghiên cứu, với 2 biến số nhằm xác định và làm rõ mối
liên hệ giữa 2 biến số với nhau, vàsuy rộng ra cho tổng
thể nghiên cứu, với độ tin cậy (1-α), và độ chính xác ε.
Phương pháp phân tích nhị biến sẽ được đề cập với
sự hỗ trợ của phần mềm SPSS, cho các “phép” sau đây:
25
2. Phân tích nhị biến
Kiểm định sự khác biệt
giữa 2 trung bình
Kiểm định mối quan hệ
giữa 2 biến định tính
Kiểm định mối quan hệ
giữa 2 biến định lượng
XIN CẢM ƠN CÁC BẠN!
26