Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
LỜI MỞ ĐẦU
Trong nghiên cứu khoa học cũng như trong giải quyết công việc nói chung,
phương pháp là yếu tố vô cùng quan trọng. Xác định đúng phương pháp là con đường
dẫn tới thành công và cũng là cơ sở, là chuẩn mực để đánh giá một công trình nghiên
cứu. Phương pháp, trong đó bao gồm phương pháp luận, hệ phương pháp nghiên cứu,
phương pháp tiếp cận, lý thuyết nghiên cứu và kỹ thuật nghiên cứu, có thể nói là chìa
khóa để mở lối cho công trình khoa học, đồng thời cũng là cơ sở đảm bảo tính chất
khoa học của kết quả nghiên cứu. Chính vì vai trò quan trọng của phương pháp như
vậy nên trong quá trình học môn: Phương pháp nghiên cứu khoa học, nhóm chúng tôi
đã được tiếp cận chuyên đề “Phương pháp phân tích định lượng trong nghiên cứu
khoa học”. Thiết nghĩ chuyên đề này sẽ đem lại cho chúng ta những gợi mở bổ ích
cho quá trình nghiên cứu khoa học sau này, mà trước mắt là luận văn cao học.
Trong thời đại ngày nay, khi mà chúng ta có thể tiếp cận thông tin, số liệu từ
nhiều nguồn khác nhau: Từ sách vở, báo chí, từ mạng Internet, thì việc thu thập và xử
lí số liệu như thế nào sẽ có vai trò rất quan trọng. Vì vậy, khi chúng ta tiếp cận và hiểu
được phương pháp phân tích định lượng rồi thì sẽ không còn lúng túng, căng thẳng
khi đứng trước một “mớ hỗn độn” những tài liệu từ nhiều nguồn thông tin khác nhau
và tập hợp tài liệu đó làm nổi bật lên bản chất của vấn đề cần nghiên cứu.
Một công trình nghiên cứu khoa học sẽ có sức thuyết phục hơn khi được dẫn
chứng bằng những con số, số lượng cụ thể. Sự vật, hiện tượng bao giờ cũng biểu hiện
bản chất của nó qua tính chất và số lượng. Trong đó, số lượng giúp cho nhận thức của
chúng ta được chính xác, cụ thể, đồng thời hạn chế đặc tính chủ quan của người
nghiên cứu. Tuy nhiên, vấn đề là người nghiên cứu phải biết xử lí những số liệu,
những con số thu thập được như thế nào cho chính xác và khoa học. Với vấn đề này,
phương pháp phân tích định lượng có nhiều ưu điểm hơn hẳn so với các phương pháp
nghiên cứu khác. Với phương pháp phân tích định lượng, chúng ta có thể xử lí các số
liệu đám đông; có thể khắc phục tình trạng thiếu hụt số liệu, kiểm chứng các nhận
định và có khả năng ứng dụng các công cụ, thiết bị tin học hiện đại và nhu cầu nhận
thức của thời đại thông tin.
Do tập thể các thành viên trong nhóm là những học viên đang trong quá trình
học tập, nên khả năng tìm hiểu, nghiên cứu và thu thập thông tin bị hạn chế. Vì vậy,
sự sai sót không thể tránh khỏi. Tập thể nhóm rất mong nhận được sự đóng góp ý kiến
của các anh chị trong lớp và đặc biệt là sự hướng dẫn của Thầy để nhóm hoàn thiện
chuyên đề này tốt hơn.
Tập thể thành viên nhóm
1
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
CHƯƠNG I: TỔNG QUAN VỀ PHƯƠNG PHÁP
NGHIÊN CỨU ĐỊNH LƯỢNG
1.1 Định nghĩa:
Nghiên cứu định lượng là phương pháp thu thập dữ liệu bằng số và giải quyết
quan hệ trong lý thuyết và nghiên cứu theo quan điểm diễn dịch. Hay nói cách khác
nghiên cứu định lượng là những nghiên cứu thu được các kết quả bằng việc sử dụng
những công cụ đo lường, tính toán với những con số cụ thể.
Nghiên cứu định lượng là đi tìm câu trả lời cho câu hỏi bao nhiêu, mức nào.
1.2 Lý thuyết:
Nghiên cứu định lượng chủ yếu là kiểm định lý thuyết, sử dụng mô hình
Khoa học tự nhiên thực chứng luận, phương pháp nghiên cứu định lượng có thể chứng
minh được trong thực tế và theo chủ nghĩa khách quan.
1.3 Phương pháp thực hiện
- Nghiên cứu thực nghiệm thông qua các biến.
- Nghiên cứu đồng đại chéo có nghĩa là thiết kế nghiên cứu trong đó các dữ
liệu được thu thập trong cùng một thời điểm.
Ví dụ: nghiên cứu việc học của con gái ở thành thị và nông thôn.
Nghiên cứu lịch đại thì dữ liệu thu thập theo thời gian trong đó các dữ liệu
được so sánh theo thời gian.
Nghiên cứu trường hợp là thiết kế nghiên cứu tập trung vào một trường hợp cụ
thể.
Nghiên cứu so sánh là thiết kế nghiên cứu trong cùng một thời điểm hay qua
nhiều thời điểm.
1. 4 Cách chọn mẫu:
- Mẫu ngẫu nhiên đơn giản.
- Chọn mẫu hệ thống.
- Chọn mẫu phân tầng.
- Chọn mẫu cụm.
1.5 Cách lập bảng câu hỏi:
2
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
- Theo thứ tự.
- Câu hỏi đóng: Là dạng câu hỏi có số liệu thu thập có thể tương đối dễ dàng
phân tích, mã hóa nhưng nó giới hạn sự trả lời. Thí dụ, sinh viên các khóa học được
đưa ra các câu hỏi nhận xét về giáo trình, bài giảng, sách, … và được chỉ định trả lời
theo thang đánh giá 5 mức độ (rất hài lòng: +2; hài lòng: +1; trung bình: 0; không hài
lòng: -1; rất không hài lòng: -2) để biết sinh viên thỏa mãn hay không thỏa mãn. Đây
là các câu hỏi đóng thể hiện sự mã hóa số liệu.
- Câu hỏi mở: Là dạng câu hỏi có số liệu thu thập không có cấu trúc hay số liệu
khó được mã hóa. Câu hỏi cho phép câu trả lời mở và có các diễn tả, suy nghĩ khác
nhau hơn là ép hoặc định hướng cho người trả lời.
- Câu hỏi được soạn sẵn.
- Câu hỏi ngắn gọn, xúc tích.
- Câu hỏi không gây tranh luận.
1.6 Sử dụng các phương pháp toán học để để ứng dụng trong phân tích
định lượng.
- Thống kê kế toán: Là một bộ phận của toán học ứng dụng dành cho các
phương pháp xử lý và phân tích số liệu thống kê, mà các ứng dụng chủ yếu của nó
trong quản lý là các phương pháp xử lý kiểm tra và dự đoán (dự đoán, điều tra chọn
mẫu,…)
- Mô hình toán: Là sự phản ánh những thuộc tính cơ bản nhất định của các
đối tượng nghiên cứu kinh tế, là công cụ quan trọng cho việc trừu tượng hoá một cách
khoa học các quá trình và hiện tượng kinh tế. Khoa học kinh tế từ lâu đã biết sử dụng
các mô hình kinh tế lượng như mô hình hàm sản suất Cobb – Douglas, mô hình cung
cầu, giá cả v.v
- Vận trù học: Là khoa học có mục đích nghiên cứu các phương pháp phân
tích nhằm chuẩn bị căn cứ chính xác cho các quyết định, đối tượng của nó là hệ thống,
tức là tập hợp các phần tử và hệ thống có tác động qua lại với nhau nhằm đạt tới một
mục tiêu nhất định.
3
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
CHƯƠNG 2: PHÂN TÍCH DỮ LIỆU ĐỊNH LƯỢNG
Chương này trình bày một số phương pháp tiếp cận thường được áp dụng để
phân tích dữ liệu trong nghiên cứu kinh doanh cũng như các nghiên cứu khác. Đầu
tiên chúng tôi giới thiệu các thử nghiệm của những giả thuyết về sự khác nhau. Sau đó
chúng tôi kiểm tra các biến khác nhau và dự đoán các mối liên hệ. Thêm vào đó,
chúng tôi còn thảo luận các phương pháp để giảm dữ liệu và rút ra phạm vi cơ bản.
2.1 Kiểm tra sự khác nhau.
Câu hỏi bạn đang hỏi là liệu rằng kết quả nghiên cứu khoa học trong kinh
doanh có thể được hỏi bằng cách thống kê hay bằng những phương pháp nghiên cứu
khác. Ví dụ nếu 81% trong 100 khách hàng hài lòng với cửa hàng A và 71% hài lòng
với cửa hàng B thì cửa hàng A có tốt hơn không?
2.1.1 Những giả thiết về một giá trị trung bình.
Trong nghiên cứu chúng ta thường phải làm những báo cáo về giá trị trung
bình. Chúng ta phải giải thích độ lệch chuẩn và hệ số Z có nghĩa là gì. Khi mà phương
sai mẫu chưa được biết và sai số chuẩn của giá trị trung bình thì cũng chưa được biết.
Sai số chuẩn của giá trị trung bình phải được ước tính từ các số liệu mẫu.
Sự ước tính:
SD
X
= (11.1)
Trong đó:
- SD
x
: Sai số chuẩn của giá trị trung bình
- SD’ : Độ lệch chuẩn ước tính.
- N : Kích thước mẫu
1
)(
'
1
2
−
−
=
∑
=
N
Xx
SD
N
i
i
(11.2)
Giả thiết kiểm tra là phân phối t với bậc tự do N-1 và tiến đến phân phối
thường khi số lần quan sát tăng lên.
Ví dụ: Tại một chuỗi siêu thị cung ứng sản phẩm mới, có ít nhất 100 đơn vị
sản phẩm được bán mỗi tuần. Sản phẩm mới được kiểm tra trong 10 sản phẩm ngẫu
nhiên được lựa chọn với một giới hạn thời gian nhất định. Kiểm định một đầu,ví dụ
4
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
khi hướng tìm giả thuyết là thích hợp khi mà doanh số ở mỗi cửa hàng ít nhất là 100,
sản phẩm sẽ được giới thiệu trên quy mô toàn quốc. Giả thuyết không (giả thuyết đơn
H
0
) và giả thuyết thay thế (H
A
)
H
0
: X < 100
H
A
: X > 100
Giả sử mức ý nghĩa α = 0.05, nghĩa là chúng ta bác bỏ giả thiết không (H
0
), khi
mà xác xuất cho giả thiết không chính xác là 5%. Vì vậy mức ý nghĩa cho chúng ta
thấy rằng xác xuất mà chúng ta chờ đợi để xem xét là một quyết định sai, điều đó
nghĩa là chấp nhận giả thuyết thay thế (H
A
) khi thực tế giả thuyết không là đúng.
Bằng việc tính toán chúng ta thấy rằng mức trung bình X = 109.4 và độ lệch
chuẩn SD =14.90
Chúng ta cũng có thể thấy rằng sai số chuẩn của giá trị trung bình:
SDx = = = 4.55
Chúng ta tìm t bằng cách tính :
07.2
55.4
1004.109
=
−
=
−
=
X
SD
X
t
µ
Giới hạn t (ví dụ giá trị t được yêu cầu để từ chối giả thiết không) như khi đọc
từ bảng t với bậc tự do là 1.833 (α=0.05).
Ở đây giá trị kiểm tra t được cho sẵn. Giá trị kiểm tra t giả sử là biến phân phối
nhưng không tìm ra được giá trị nào thiết thực hơn. Khi N trở nên lớn (ví dụ N > 30),
phân phối t tiến gần đến phân phối thường.
Hộp 11.1 Những giả thiết
Giả thiết đóng vai trò chính trong việc nghiên cứu. Chúng gợi ý một cách gián
tiếp những giả định hoặc những kỳ vọng và thường quy định bởi những câu hỏi. Nếu
sự hài lòng của khách hàng ở cửa hàng A lớn hơn ở cửa hàng B thì liệu rằng sản phẩm
mới sẽ bán mỗi tuần của cửa hàng A có nhiều hơn 100 đơn vị sản phẩm? Những giả
thiết có thể được quy định (về nguyên tắc cơ bản). Để làm như vậy chúng ta phải đối
chiếu với giả thiết.
V í dụ: Với giả thiết không (H
0
), sự hài lòng của khách hàng ở cửa hàng A tốt
hơn ở cửa hàng B thì sẽ không có sự khác biệt giữa cửa hàng A và cửa hàng B. Để
5
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
làm điều đó chúng ta cần số liệu về việc thực hiện giữa cửa hàng A và cửa hàng B.
Nếu có đủ sự khác biệt để tồn tại chúng ta bác bỏ giả thiết không (H
0
) và chấp nhận
giả thiết thay thế (H
A
). Vì vậy, thông qua việc giả định, chúng ta có được những hiểu
biết, nghĩa là chúng ta đã kiểm nghiệm giả định hoặc kỳ vọng của chúng ta.
2.1.2 Những giả thiết về hai giá trị trung bình.
Những người nghiên cứu thường đối mặt với những câu hỏi như: Thị hiếu
trong khu vực A khác với thị hiếu trong khu vực B không? Phân khúc khách hàng 1
với phân khúc khách hàng 2 không? Có 1 chiến dịch quảng cáo hiệu quả hơn cái khác
không? Công thức để kiểm tra sự khác biệt giữa các nghiệm là được phân bổ bình
thường, và do đó những sự khác biệt của chúng cũng tạo ra sự phân bổ bình thường,
cụ thể theo công thức sau :
Z =
(X
1
– X
2
) - (µ
1
- µ
2
)
Trong đó:
X
1
= Nghiệm 1
X
2
= Nghiệm
= Sai số của hai nghiệm
µ
1
và µ
2
là nghiệm kỳ vọng chưa biết
Sai số của hai nghiệm được tính theo công thức sau:
=
Giả định rằng 2 phương sai tổng thể bằng nhau, phương sai tổng thể chung có
thể được tạo ra bằng cách tổng hợp các mẫu. Khi phương sai không rõ và sai số chuẩn
của các mẫu phải được ước lượng, sau đó t đại diện cho một số liệu thống kê kiểm tra
phân bổ phù hợp với v = N
1
+ N
2
– 2 bậc tự do.
Ví dụ :
Một nhà phân phối đang phát triển 1 sản phẩm mới và tự hỏi liệu nhãn hiệu của
sản phẩm nên có màu đỏ hay màu xanh dương. Những sản phẩm mới với hai nhãn
hiệu khác nhau được thử nghiệm trong 10 cửa hàng được lựa chọn ngẫu nhiên. Doanh
6
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
thu trung bình đạt được với nhãn màu đỏ là 403.0 và với màu xanh dương là 390.3.
Sai số chuẩn của việc ước lượng cho sự khác biệt giữa các mẫu là 8.15
Tính t = = = 1.56
Giá trị này được chuyển đến bảng t cho v = n
1
+ n
2
-2 = 10 + 10 - 2 = 18 bậc tự
do. Kiểm nghiệm là hai phía vì giả thuyết là hai màu sắc phù hợp như nhau. Với α =
0.05, và 18 bậc tự do, tới hạn t = 2.101. Điều này có nghĩa giả thuyết không được chấp
nhận. Ở ví dụ trên chúng ta thấy rằng ( µ1 - µ2 ) = 0. Vì hai nghiệm kỳ vọng chưa biết
và được giả định là như nhau.
NB : Lưu ý rằng trong ví dụ trên hai mẫu được giả định là không liên quan, đó
là được rút ra độc lập với nhau.
2.1.3 Các mẫu liên quan
Giả sử chúng ta muốn tìm hiểu xem thu nhập đã tăng lên từ năm ngoái đến
nay trên cơ sở dữ liệu thu nhập của năm ngoái và thu nhập của năm nay trong một
mẫu sau:
7
Người
Thu nhập
năm trước
Thu nhập
năm nay
Chênh lệch
1 228 224 -4
2 213 225 12
3 257 271 14
30 260 292 32
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Điều này thường được gọi là vấn đề hai mẫu với sự quan sát theo cặp. Chúng
theo cặp bởi vì sự quan sát xảy ra trong một cặp thu nhập năm trước và năm nay của
mỗi cá nhân. Để giải quyết vấn đề này chúng ta có thể lấy giá trị thu nhập của năm
nay (cột 3) trừ đi giá trị thu nhập của năm trước (cột 2), và bây giờ, chúng ta có giá trị
khác biệt ở cột chênh lệch (cột 4).
Cần chú ý rằng sự khác biệt biệt được so sánh từ một mẫu quan sát đã thảo luận
trước đó, vì vậy các phương pháp áp dụng là tương tự.
Giả thuyết vô hiệu H
0
là trung bình của tập hợp chính khác nhau, 30 mẫu khác
nhau trong cột 4 , khi giá tri này bằng 0 . Giả thuyết thay thế H
A
là giá trị trung bình
dãy số lớn hơn 0.
Từ kết quả kiểm mẫu của sinh viên cho thấy:
Với mức ý nghĩa = 8.13
Độ lệch chuẩn ước tính (SD) = 10,91
St sai số là = 1,99
t = 4,08
p = 0,0002
Từ các tính toán thống kê thấy t = 4,08 . Tương ứng với giá trị p = 0,0002 là
nhỏ hơn đáng kể so với 0,05 và do đó H
0
bị từ chối. Trong hầu hết các mẫu kiểm tra
và các chương trình giá trị thống kê kiểm tra và giá trị p tương ứng đều hiển thị do đó
không cần tìm chúng trong bảng phân phối thống kê tương ứng.
Một số phương pháp phi tham số hữu ích cũng có sẵn như là những lựa chọn
thay thế cho các phương pháp cổ điển. Chúng có lợi thế là đòi hỏi ít về những giả
định .
Nhưng nếu giả định cần thiết cho việc sử dụng t kiểm tra là hợp lý thì nó rất
hữu ích vì thử nghiệm này thường có độ chính xác cao hơn. Ví dụ cho khoảng cách tin
cậy hẹp hơn so với phương pháp phi tham số tương ứng. Chú ý phương pháp dựa trên
phân phối t có liên quan tới phương sai, trong khi các phương pháp phi tham số
thường quan tâm tới giá trị trung bình. Nhưng nếu phân phối là đối xứng thì hai giá trị
trên bằng nhau.
8
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Một thử nghiệm phi tham số đơn giản áp dụng cho các vấn đề thu nhập cao hơn
là kiểm tra dấu hiệu. Giả sử trong trường hợp trên 30 mẫu kiểm 7 là dưới trung bình
và 23 là trên trung bình. Dấu hiệu trung bình p = 0,0026, P giá trị chỉ ra sự khác biệt
đáng kể giữa thu nhập năm trước và thu nhập năm nay. Kiểm tra dấu hiệu trong ví dụ
trên là dựa trên thực tế là 7 sự khác biệt tiêu cực và 23 khác biệt tích cực . Không có
thông tin khác được sử dụng. Kiểm tra dấu hiệu, hay nói cách khác là thông tin chứa
trong dữ liệu đó vì mốc dao động xung quanh giá trị trung bình. Một thử nghiệm tham
số, ví dụ t kiểm tra cũng có sự khác biệt rõ ràng với giá trị trung bình.
2.1.4 Sự so sánh từ hai nhóm trở lên
Trong nghiên cứu chúng ta thường gặp sự so sánh từ hai nhóm trở lên xảy ra
cùng một lúc. Để nghiên cứu các tình huống như vậy thì phân tích phương sai
(ANOVA) thường được sử dụng. Trước khi giải thích phương pháp nghiên cứu này,
chúng ta sẽ đề cập rằng tại sao cần phải tiến hành một vài kiểm nghiệm t để so sánh
tất cả sự kết hợp của các nhóm thì thật sự không thích hợp.
Giả sử chúng ta quan tâm đến sự khác nhau giữa ba nhóm. Nếu chúng ta tiến
hành kiểm nghiệm t tại mỗi nhóm, chúng ta phải so sánh giữa nhóm 1 và nhóm 2, giữa
nhóm 1 và nhóm 3, và giữa nhóm 2 và nhóm 3. Nếu mỗi kiểm nghiệm t này sử dụng
mức ý nghĩa là 0.05, sau đó xác xuất nhầm lẫn của sự bác bỏ giả thiết không (H
0
) là
5%. Do đó xác xuất không có lỗi loại I là 95% cho mỗi kiểm nghiệm. Khi giả sử rằng
các cuộc kiểm nghiệm là độc lập với nhau, thì xác xuất không có lỗi loại I là (0.95)
3
=
0.95 x 0.95 x 0.95 = 0.857. Bây giờ xác xuất chắc chắn không có lỗi loại I là 1 - 0.857
= 0.143, hay 14.3% (thí nghiệm thống kê qua tỷ lệ sai số này được tính trên dữ liệu
thực nghiệm giống nhau được biết đến như tỷ lệ sai số thực nghiệm).
Phân tích phương sai dựa trên so sánh chỉ số của phương sai hệ thống với
phương sai không có hệ thống. Giả sử một nghiên cứu thực nghiệm bao gồm khảo sát
của ba phương pháp thiết kế. Nếu các phương pháp thay đổi hiệu lực, thì một khả
năng kỳ vọng sẽ thay đổi ít hơn trong một nhóm được bộc lộ đến một loại thiết kế đặc
thù hơn qua các nhóm. Phân tích phương sai được tính theo công thức như sau:
1. Biến phân toàn phần bằng so sánh mỗi quan sát với số tổng bình quân.
9
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
2. Phương sai giữa các nhóm, được tính bằng so sánh phương pháp xử lý với tổng
bình quân;
3. Phương sai trong nhóm, được tính bằng so sánh mỗi kết quả trong nhóm với
bình quân nhóm.
Ước lượng riêng lẻ của biến tổng thể trên trung bình bình phương:
MS
T
= =
MS
B
= =
MS
W
= =
Trong đó:
1. MS
T
= Biến phân toàn phần bằng so sánh mỗi quan sát với số tổng bình quân.
2. MS
B
= Phương sai giữa các nhóm, được tính bằng so sánh phương pháp xử lý
với tổng bình quân; và
3. MS
W
= Phương sai trong nhóm, được tính bằng so sánh mỗi kết quả trong
nhóm với bình quân nhóm.
Ví dụ:
Giả sử có ba nghiên cứu về quảng cáo trong 24 thành phố được lựa chọn ngẫu
nhiên, so sánh về kích thước và nhân khẩu. Giả sử kết quả từ máy tính cho ra như sau:
Nguồn biến thiên
Tổng bình
phương
Bậc tự do
Trung bình
bình phương
Tỷ lệ F
Giữa các nhóm
Trong các nhóm
Tổng cộng
49.0
87.5
136.5
2
21
23
24.1
4.17
5.88
Bậc tự do được tính toán như sau: Tổng cộng (24-1) = 23, phương sai giữa các nhóm
(3-1)=2, phương sai trong nhóm (23-2)=21
Giả thiết không (Ho) là các trung bình nhóm ví dụ như: X
G1
= X
G2
= X
G2’
và giá
trị tới hạn là α = 0.05. Để kiểm định giả thiết, một thí nghiệm F (trên cơ sở phân phối
10
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
F) là phù hợp. Thí nghiệm F có thể được xem như là khái quát của thí nghiệm t và cho
phép so sánh của hai nhóm trở lên cùng lúc. Giá trị F được tính bằng hiệu số giữa
trung bình bình phương và bình phương phương sai trong nhóm, đó là 24,5/4,17. Khi
tra bảng phân phối F, chúng ta tìm thấy đơn vị tử số (là 2) và mẫu số (là 21) và tìm
thấy giá trị là 3.47. Bởi vì 5.88 lớn hơn 3.47 chúng ta sẽ loại bỏ giả thiết không (H
0
),
kết quả là, mức ý nghĩa của nhóm bằng nhau, và chấp nhận giả thiết thay thế, như vậy,
sự thay đổi chiến dịch quảng cáo là có hiệu quả. Nếu chúng ta đánh giá mức hiệu quả
trung bình của một trong ba chiến dịch quảng cáo trên chúng ta cũng nhận thấy rằng
có một chiến dịch là có hiệu quả nhất.
NB: Trong phân tích dung sai, biến thiên phụ thuộc, hiệu quả của quảng cáo,
được thừa nhận theo hệ mét, đó là khoảng cách hoặc chỉ số tỷ lệ. Biến độc lập (chiến
dịch quảng cáo khác nhau) là xác thực.
Ở trên là một ví dụ về phân tích dung sai đơn giản. Chỉ một hệ số, ảnh hưởng
của thay đổi chiến dịch quảng cáo được phân tích như thế nào. Phân tích dung sai có
thể được mở rộng bao gồm nhiều hơn hai biến độc lập một cách rõ ràng hơn; ví dụ,
thành tích của sinh viên (biến phụ thuộc) có thể được nghiên cứu như đầu ra của
những phương pháp khác nhau của thiết kế và người thiết kế chương trình giáo dục
(biến độc lập). Phân tích phương sai cũng có thể được mở rộng để kiểm tra sự tác
động đồng thời trên hai biến phụ thuộc, giới hạn của sự đa dạng phân tích dung sai.
2.2 Mối quan hệ (sự biến thiên đồng thời) giữa các biến
Trong nghiên cứu, chúng ta thường quan tâm, chú ý đến có 1, 2 hay nhiều mối
quan hệ giữa các biến số. Có nhiều phép đo về những mối quan hệ này, hãy xem ví dụ
của Frankfort –Nachmias và Nachmias (1996) về tổng quan một số phép đo phổ biến
của sự liên hệ.
2.2.1 Hệ số tương quan
Một phép đo quan trọng là sự tương quan hay nói cách khác là hệ số tương
quan tức thời: r đã được đề cập ở những chương trước. Hệ số tương quan tức thời giới
hạn bời khoảng cách của biến số hay qui mô của biến số. Giống như những phép đo
khác về mối quan hệ, hệ số tương quan được xem là biến số chung của 2 phép đo. Hệ
số tương quan tức thời dùng để kiểm tra mối quan hệ tuyến tính giữa 2 biến số X và
Y.
11
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Về lý thuyết, hệ số tương quan có giá trị từ [-1,1] ( -1 ≤ r ≤ 1)
r = +1, cho biết 2 biến số là biến số có thực;
r = -1, cho biết 2 biến số có mối quan hệ hoản toàn ngược nhau;
r dần tới 0, chỉ ra rằng những biến số không có mối liên hệ với nhau.
Công thức tính hệ số tương quan tức thời:
r
xy
=
Trong đó X ,Y đại diện cho mẫu X, Y tương ứng.
Ta có công thức tương đương:
r
xy
=
Trong đó: là phương sai của X
là phương sai của Y
là phương sai hợp của X và Y
Hệ số tương quan diển tả mối quan hệ giữa hai biến số và hệ quả của mối liên
hệ đó.
Bình phương hệ số tương quan là:
Biến xem xét
R
2
=
Biến tổng hợp
Điều này có nghĩa là nếu bình phương hệ số tương quan giữa X và Y là 50%
thì biến X là 50% và biến Y là 50%.
Sự tương quan thường được dùng để kiểm tra 2 chiều các mệnh đề giả thuyết,
có nghĩa là kiểm tra giả thuyết về mối quan hệ giữa hai biến số. Từ vấn đề này, chúng
12
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
ta thấy rằng, hệ số tương quan là số thống kê có ý nghĩa. Nó phụ thuộc vào cả độ lớn
của hệ số tương quan và số lượng quan sát.
Độ lệch tiêu chuẩn của hệ số tương quan là:
Ví dụ: Một bản thử nghiệm nghiên cứu, trong số 2 nhóm khảo sát về sự cảm
nhận quảng cáo chịu tác động, ảnh hưởng bởi sự thu hút quảng cáo (1= tích cực; 0=
tiêu cực) , sự tin chắc vào sản phẩm quảng cáo và giới tính (1= nữ; 0= nam). Số lượng
khảo sát là 60, kết quả được ghi nhận ở bảng 11.1. Qua bảng trên, chỉ ra rằng phụ nữ
thì ít có khuynh hướng cảm nhận quảng cáo và phụ nữ cũng có thể ít tin vào sản phẩm
quảng cáo. Chúng ta cũng thấy rằng, những khảo sát này có ý nghĩa quan trọng trong
phân tích hai chiều (phân tích 2 biến số). Thêm vào đó, chúng ta chú ý rằng: sự thu
hút tích cực có thể được cảm nhận hơn là sự thu hút tiêu cực (mức ý nghĩa 0.05).
2.2.2 Tương quan một phần
Trong chương 10 ( cũng như chứng minh trong chương 5) chúng ta thảo luận
làm cách nào mà chúng ta có thể đưa ra kiểm soát việc liên quan đến mối quan hệ
giữa các biến bằng cách kiểm soát biến thứ ba ( hoặc nhiều hơn). Điều này cũng có
thể thực hiện trong tương quan.
Bảng 11.1 Sự chồng chéo giữa cảm nhận quảng cáo, giới tính, tin tưởng vào
nhà sản xuất và sự hấp dẫn.
Cảm nhận
quảng cáo
Giới tính
Sự tin
tưởng
Sự hấp dẫn
Cảm nhận quảng cáo - -0.33* 0.25** 0.24**
Giới tính - -0.36* 0.09
Sự tin chắc - 0.14
Sự thu hút quảng cáo - -
* , **
Phân tích, nghĩa là tương quan một phần. Công thức cho hệ số tương quan một
phần r
12.3
( đọc giữa tương quan một phần ( biến ) 1 và 2 chấm 3 ) là:
13
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
r
12 3
= (11.5)
Công thức được lặp đi lặp lại, và do đó sau khi kiểm soát cho biến 3 biến tiếp
theo có thể được kiểm soát.
Ví dụ:
Quan sát mối quan hệ giữa thừa nhận quảng cáo và sự hấp dẫn tác động bởi
điều khiển của giới tính. Sử dụng trong công thức 11.5 ta thấy:
r
Ad.rec.,ad.appeals.sex
= = 0.29
Điều này cho thấy rằng bằng cách kiểm soát giới tính thì liên quan mối quan hệ
giữa thừa nhận quảng cáo và quảng cáo hấp dẫn ( xác thực) là trở nên vững chắc.
2.3 Giải thích và dự báo những mỗi quan hệ giữa các biến
Mô tả, giải thích và dự báo mối quan hệ giữa các biến là công việc quan trọng
trong nghiên cứu kinh doanh. Chẳng hạn, một người quản lý có thể quan tâm đến mối
qua hệ giữa lượng tiền phải trả cho quảng cáo và bán hàng hoặc là mối quan hệ giữa
số lượng hàng bán và lượng khách đến tham quan. Như vậy thông tin rất quan trọng
trong kinh doanh bởi vì nó cho phép giải quyết một cách hoàn thiện hơn, chẳng hạn
làm thế nào biết chi trả cho quảng cáo bao nhiêu là tốt.
Một trong các phương pháp tiếp cận ứng dụng và hữu ích nhất để kiểm tra mối
quan hệ giữa các biến là phân tích hồi quy. Trong phân tích hồi quy chúng ta có một
biến phụ thuộc (nghĩa là biến được giải thích) va một hoặc nhiều hơn biến không phụ
thuộc. Cả biến phụ thuộc lẫn biến không phụ thuộc thường giả định là tham số (nghĩa
là khoảng cáchhoặc là thước đo tỷ lệ). Như thảo luận ở dưới đây, cái gọi là biến giả
còn có thể sử dụng như biến không phụ thuộc. Trong phân tích hồi quy ( như phân
tích nhiều loại khác) chúng ta muốn có một mô hình phù hợp nhất là miêu tả dữ liệu,
cái có thể làm trong phân tích hồi quy bằng cách áp dụng phương pháp bình phương
nhỏ nhất. Chính xác hơn, điều này được thực hiện bằng một đường thẳng phù hợp mà
giảm thiểu các độ lệch bình phương từ đó đường thẳng hiển thị như trong hình 11.1
14
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
2.3.1 Hồi quy tuyến tính đơn giản.
Nó được biết rằng có thể vẽ bất kỳ đường thẳng nếu bạn biết hai điều: (1) độ
dốc (hoặc độ nghiêng) của đường thẳng, và (2) điểm mà tại đó đường thẳng băng qua
trục thẳng đứng của đồ thị ( được biết như là phần mặt phẳng bị chặn của đường
thẳng).
h
l
β
1
=
β
0
Hình 11.1 Mô hình tuyến tính
Phương trình của đường thẳng là:
Y = β
0
+ β
1
x
1
+ ε
i
Y là biến kết quả chúng ta muốn dự báo, x
1
là điểm của đối tượng hoặc của
người dự báo biến; β
1
là độ đốc của đường thẳng khít với dữ liệu. β
0
là phần mặt phẳng
bị chặn của đường thẳng; ε
i
là đại diện cho sự khác biệt giữa điểm số dự báo tuyến
tính cho đối tượng và điểm số mà đối tượng chắc chắn thu được thường là số hạng còn
dư lại. Trong phân tích hồi quy ước lượng hồi quy đường thẳng mang lại giá trị dự
báo. Nếu quan sát tất cả giá trị giảm của dự báo tuyến tính. Không có những sự khác
biệt giữa dự báo và giá trị còn dư như thể hiện hình 11.1
Ví dụ:
Giả sử một thương nhân xe hơi tập hợp dữ liệu của 6 tháng với 4 biến: Quảng
cáo TV, quảng cáo chữ in, quảng cáo người cạnh tranh và bán hàng.Y là thương nhân
xe hơi mong đợi việc bán xe hơi tương quan với quảng cáo TV và quảng cáo chữ in.
Mối tương quan giữa bán xe hơi và đối thủ cạnh tranh quảng cáo hầu như chắc chắn là
không. Nhưng nếu quảng cáo của đối thủ cạnh tranh mở rộng toàn bộ trên thị trường
15
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
hơn là hay thay đổi thị trường thị phần, mối tương quan có thể là dương. Giá trị của 4
biến được thể hiện trong bảng 11.2
Bảng 11.2 Ma trận dữ liệu
Hàng QC TV QC chữ in Đối thủ cạnh tranh QC Bán xe hơi
1 0 1 2 1
2 1 0 0 1
3 2 2 4 2
4 2 3 6 3
5 3 3 3 4
6 4 3 0 4
Bảng 11.3 Trung bình hồi quy giản đơn:
Predictor Coef St. dev t-radio p
Constant 0.70000 0.4453 1.57 0.191
TV-Ads 0.90000 0.1871 4.81 0.009
S= 0.5916 R-sp=0.85.3% R-sq(adj)=81.6%
Sự cân bằng của hồi quy
CarSale = 0.7000 + 0.9000 TV-Ads
Đầu tiên, chúng ta giải thích sự hữu ích của phương trình hồi quy tuyến tính
bằng việc dự kiến chỉ có quảng cáo trên T.V và Carsales là được theo dõi. Chúng ta
xem Carsales như là biến phụ thuộc và quảng cáo T.V là biến độc lập. Tiếp theo,
chúng ta ước tính hàm số theo phương pháp quy hồi tuyến tính giản đơn của Caresales
trên quảng cáo T.V. Được thể hiện như bảng 11.3 được in ra từ máy tính.
Thời kỳ liên tục 0.7000 chỉ rằng, nếu người kinh doanh không sử dụng hình
thức quảng cáo nào trên truyền hình ( nghĩa là chi phí quảng cáo = 0) thì giá trị dự
kiến của Carsale là 0.7 đơn vị, đó chính là 7 chiếc xe. Hệ số hồi quy ước tính ước tính
của doanh số trên quảng cáo T.V là 0.9000. Hệ số này chỉ rằng nếu biến quảng cáo
T.V được tăng lên 1 đơn vị thì giá trị dự kiến của Carsales tăng lên 0.9 đơn vị, điều đó
là 9 chiếc xe. Đây là những thông tin hữu ích đối với những nhà kinh doanh xe.
Nhưng người kinh doanh miễn cưỡng với việc tăng “polate”: điều này có nghĩa là
người kinh doanh không được sử dụng những thông tin có giá trị ngoài chương trình
16
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
quảng cáo trong khoảng từ 0 cho đến 4 mà nó đã thể hiện ở mẫu ( nhìn vào bảng
11.3).
Kết quả, hệ số tương quan ( R-sp). R
2
85,3% ( bình phương hệ số tương quan là
85,3%) hệ số này chỉ ra rằng việc xác định mẫu có hệ số tương quan R
2
ngang với giá
trị là 0.853. Nói một cách cụ thể, điều này có nghĩa mức độ biến đổi trong các biến ở
chương trình quảng cáo T.V được giải thích là 85,3 % của Carsales có thể biến đổi
trong mẫu của chúng tôi. Bình phương của mẫu là hệ số tương quan r. Giá trị P:
0.0009 là hệ số hồi quy, β là doanh số trên chương trình quảng cáo T.V nhỏ hơn an
pha 0.05, chúng tôi thừa nhận điều này theo quy ước chọn lựa của chúng tôi với mức
ý nghĩa. Có nghĩa là chúng tôi có thể loại bỏ giả thiết không có hiệu lực H
0
, tương ứng
với hệ số tương quan. β là ngang bằng với 0, là sử dụng được hai mặt. A
2
: β # 0 (sử
dụng hai mặt là sự mặc định của chương trình máy tính).
Tóm lại: Quảng cáo T. V và doanh số bán hàng có mối quan hệ ý nghĩa với
nhau. Từ đó nó có mối quan hệ là mật thiết không thể nào có chuyện gia tăng chí phí
quảng cáo mà dẫn đến kết quả là giảm doanh số bán ra, nó thật sự thích hợp cho việc
sử dụng một chiều, A
1
: β > 0. Điều đó có nghĩa là giá trị p được hệ thống sử lý của
máy tính chia làm 2 phần. Như thế giá trị có liên quan của p là (0.009/2) = 0.0045.
Đây là bằng chứng thiết thực cho kết quả là có mối quan hệ giữa quảng cáo T.V và
Carsales. Những trường hợp thiết thực này chúng ta chắc sẽ thấy sau này, một hệ số
có lẽ không tập hợp khi có sự khác biệt đáng kể từ 0 (zero) khi chúng ta sử dụng mối
liên hệ hai mặt, mặc dù nó đã được xác minh là có dấu hiệu khác biệt từ 0 ( zero) nếu
đã được trình bày là có mối liên hệ một mặt. Như vậy nó thật sự quan trọng trong việc
lực chọn một mặt trong điều kiện thích hợp ( xem phần 10.5 ). Biểu đồ ở bảng số 11.4
là mối liên hệ khác biệt cho vấn đề này.
Bảng 11.4 Những giá trị thặng dư và phù hợp
Hàng Kinh doanh
Quảng cáo
TV
Giá trị thặng
dư chuẩ
Thích hợp
Giá trị thặng
dư
1
2
3
4
5
1
1
2
3
4
0
1
2
2
3
0.77033
-1.18431
-0.92582
0.92582
1.18431
0.7
1.6
2.5
2.5
3.4
0.3
-0.6
-0.5
0.5
0.6
17
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
6 4 4 -0.77033 4.3 -0.3
Một biến là hữu ích nếu giá trị p của nó nhỏ hơn . Sử dụng thay thế một chiều
thay vì cách thức hai mặt là giá trị p thực tế sẽ giảm một nữa.
Sự phù hợp là ước tính dự kiến bán xe hơi hoặc doanh số bán xe hơi tương ứng
với các giá trị của biến độc lập quảng cáo truyền hình được tìm thấy trong mẫu. Phần
còn dư là độ lệch tương ứng từ ước lượng hồi quy đường thẳng. Chú ý rằng phương
trình thích hợp + giá trị thặng dư = Doanh số bán xe hơi là giá trị cho mỗi tháng ( mỗi
sự quan sát). Chúng ta thích sự để được gần gũi với doanh số bán hàng và gần gũi
quen thuộc với giá trị thặng dư để được gần với 0. Sau đó R
2
sẽ gần đến 1.
Giả định trong phân tích hồi quy.
Phân tích hồi quy là dựa trên một số giả định, bao gồm:
1. Giá trị kỳ vọng của sai số là không, E( = 0).
2. Phương sai của sai số cho mỗi x
i
là hằng số. Đây là được gọi là homo-
scedasticity. Nếu phương sai thay đổi theo x
i
được gọi là heteroscedasticity.
3. Sai sót cho các quan sát là không tương quan.
4. thường phân bổ cho mỗi x
i.
5. Các sai số không tương quan với x
i,
Corr( x
i
) = 0.
6. Nó cũng là một giả định phổ biến mà các mô hình hồi quy phải là tuyến tính
trong các tham số của nó.
Đó là thực hành các logic để kiểm tra các giả định. Kết quả của bạn của bạn có
thể hữu ích ngay cả khi tất cả các giải định tiêu chuẩn không đáp ứng, nhưng sau đó
kết quả thường không chắc chắn hơn so với số liệu thống kê cho thấy. Điều quan
trọng là bạn sử dụng logic phán đoán tất cả các giai đoạn mà bạn biết những gì bạn
đang làm.
Trong một thời gian ngắn chúng ta sẽ cho thấy kiểm tra một số giả định như thế
nào trong ví dụ của chúng ta. Nó nên được nhớ tới, tuy nhiên, chúng ta có quá ít quan
sát để có được một tình huống thực tế. Giả định của một mô hình tuyến tính có thể
18
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
kiểm tra bề ngoài bằng cách nhìn vào biểu đồ được cung cấp từ máy tính. Vài giả định
có thể có liên quan đến sự xáo lộn khó nhìn thấy được ước tính bằng giá trị thặng dư .
Giá trị thặng dư có thể biểu diễn theo nhiều cách – ví dụ tùy vào các biến độc lập.
Chúng ta có thể kiểm tra bề ngoài giả định của homo- scedasticity: nghĩa là, chúng ta
kiểm tra sự khác nhau của giới hạn xáo trộn không thay đổi khi giá trị của biến độc
lập thay đổi. Chúng ta thích nhìn thấy một bức tranh nơi mà biến thiên lên và xuống
trong biểu đồ là gần như nhau, nói, bên trái, ở giữa và một phần bên phải của biểu đồ.
Để có một vài ý tưởng cho sự phù hợp của các giả định của sự xáo lộn phân bổ
bình thường, nếu bạn có nhiều quan sát hơn chúng tôi, kết quả kiểm tra biểu đồ tần số
của giá trị thặng dư có một số trùng với mật độ bình thường, bạn cũng có thể sử dụng
biểu đồ sác xuất thông thường. Nếu kết quả các điểm trong biểu đồ của điểm bình
thường rơi khoảng trong một đường thẳng, giá trị thặng dư (và hy vọng cũng như sự
xáo trộn) dường như đến từ mật độ bình thường. Hệ số tương quan nói như thế nào về
một đường thẳng. Nếu cũng như dữ liệu ở đây là dữ liệu chuỗi thời gian, có thể tự
quan tự động trong các xáo trộn. Kiểm tra một sự thích hợp cho sự tự tương quan là 1.
Nếu số liệu thống kê D-W gần đến 2, cũng như ở đây, không có nguy cơ cho sự tương
quan tự động. Nếu như nó gần tới 0, có thể có sự tự tương quan tự động. Nếu như nó
gần tới 4, có thể có tương quan tiêu cực xảy ra (hiếm khi xảy ra). Một cuộc thảo luận
xuất sắc của kiểm tra phân tích hồi quy, xem Field 2000.
Lựa chọn của các biến
Nếu chúng ta muốn sử dụng hồi quy tuyến tính đơn giản, nhìn vào ví dụ, tuyến
tính Y trên x
1
, cũng như đã thực hiện. Nhưng chúng ta cũng có thể có hồi quy Y trên
x
2
hoặc hồi quy Y trên x
3
. Trong sự lựa chọn giữa hàm hồi quy khác nhau trong tình
huống như thế này nó rất hữu ích để xem xét các hệ số tương quan. Hệ số tương quan
được biểu diễn trong bảng 11.5.
Chúng ta chú ý rằng giữa ba biến độc lập, quảng cáo T.V là một trong những
cái mà trong đó sự tương quan mẫu là cao nhất với các biến bán hàng độc lập. Trước
đây chúng ta thấy hàm hồi quy tương ứng có vẻ là thỏa đáng trong tất cả các khía
cạnh. Vì vậy, nếu chúng ta quyết định chỉ sử dụng một biến độc lập, quảng cáo T.V là
được chọn. Xem xét kỹ lưỡng trên sự tương quan, chúng ta cũng nhìn thấy rằng quảng
19
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
cáo T.V tương quan mạnh với quảng cáo chữ in và quảng cáo chữ in tương quan mạnh
với kinh doanh. Hệ số tương quan cao giữa quảng cáo T.V và quảng cáo chữ in cho
thấy mức độ cao của đa cộng, là khả năng làm mờ các ước tính, cũng như chỉ ra rằng
biến này (quảng cáo chữ in) bao gồm biến phụ thuộc.
Đánh giá tốt sự thích hợp.
Làm thế nào để ước lượng mô hình hồi quy phù hợp với dữ liệu? (Điều này
được giới hạn “giải thích các biến”). Cũng như chú ý ở trên, bị chắn và hệ số hồi
quy có thể ước lượng.
Bảng 11.5 Tương quan hồi quy
Quảng cáo T.V Quảng cáo máy in Đối thủ cạnh tranh quảng cáo
Quảng cáo in 0.783
Đối thủ quảng cáo -0.060 0.472
Doanh số 0.923 0.918 0.155
Khi tổng kết tất cả i ở trên nó cũng có thể được biểu diễn:
TSS RSS ESS
Như chúng ta có thể nhìn thấy từ bình phương trên, chúng có tổng ở đây. Đầu
tiên, TTS là tổng số của các bình phương. Thứ hai, RSS là tổng hệ quy của các bình
phương, nó là những biến số trong những biến số độc lập được giải thích bởi những
mô hình hồi quy. Sau cùng, ESS là tổng bình phương của các sai số là tổng bình của
những giá trị thặng dư. Những phân số RSS/ TSS là một phần biến số trong biến số
độc lập được giải thích bởi những mô hình hồi quy, thường được cho là những hệ số
của biến số, R
2
như được đề cập ở trên.
Những tiêu chuẩn của hệ số hồi quy
Những hệ số hồi quy β
1
, như trình bày ở ví dụ trên thật là dễ dàng để giải thích
nếu như đo lường X và Y là có ý nghĩa. Điều này thường không phải là trường hợp
khó khăn để ước tính độ mạnh trong mối quan hệ tuyến tính khi chúng có các biến số
độc lập, đây cũng có thể là trường hợp đặc biệt. Trong các trường hợp chúng ta có thể
20
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
chuẩn hóa các hệ số hồi quy bởi sự tăng thêm của các hệ số hồi quy do độ lệch chuẩn
của phân số X vượt quá mức chuẩn của phân số Y.
2.3.2 Hồi quy bội số
Trong nhiều hồi quy hai hay nhiều biến độc lập được áp dụng để giải thích dự
đoán các biến phụ thuộc. Mục đích là để làm cho các mô hình thực tế hơn, kiểm soát
biến khác, và giải thích của phương sai trong biến phụ thuộc (và do đó để giảm dư).
Mô hình hồi quy chung nhiều có thể được viết như sau:
Y
i
= B
o
+ B
1
X
1
+ B
2
X
2
+ …+ E
i
So với (11.6) chúng ta thấy rằng sự khác biệt duy nhất là sự bao gồm của các
biến độc lập hơn.
Ví dụ : Các doanh nghiệp đều thường cũng quan tâm đến khai thác thương hiệu
của họ cũng như các thiết lập bằng cách mở rộng chúng thành các loại sản phẩm mới.
Nghiên cứu trước đây đã chỉ ra rằng sự thành công của chiến lược này bị ảnh hưởng
bởi, trong số những thứ khác, các yếu tố như danh tiếng của thương hiệu được mở
rộng và tương tự nhận thức của các loại sản phẩm mới và thương hiệu hiện có. Người
ta cũng tin rằng các yếu tố như kiến thức của người tiêu dùng về các nhóm sản phẩm
mới,và khả năng hậu quả tiêu cực trình tự cũng như sẵn sàng nhận thức không chắc
chắn nhiều người tiêu dùng ảnh hưởng để chấp nhận một phần mở rộng thương hiệu
(xemví dụ Keller, 1998). Một nhà sản xuất đã tiến hành một nghiên cứu để kiểm tra sự
sẵn sàng của người tiêu dùng chấp nhận một phần mở rộng thương hiệu(ACC). Chính
xác hơn, các nhà sản xuất kiểm tra năng giải thích của kiến thức về các loại sản phẩm
mới (PKNOW), hậu quả nhận thức (Phần kết luận) và sự không chắc chắn nhận thức
(UNCERT). Các nhà sản xuất cũng tin rằng kiến thức của người tiêu dùng có thể
tương tác với sự không chắc chắn nhận thức (tức là kiến thức của người tiêu dùng có
thể làm giảm sự không chắc chắn nhận thức được), UNCERT x PKNOW. Do đó,mô
hình được thử nghiệm là:
ACC = x
1
REP + x
2
SIM + x
3
CONC + x
4
UNCERT + x
5
PKNOW + x
6
UNCERT x PKNOW
Kết quả, theo báo cáo trong sản lượng máy tính SPSS, được trình bày trong
bảng 11.6, lần đầu tiên cho thấy một bản tóm tắt mô hình. Chúng tôi ở đây thấy rằng
các giải thích phương sai R
2
.
Bảng 11.6 Hồi quy bội số - xuất ra từ SPSS
21
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Mô hình tóm tắt
Mô hình R R
2
Điều chỉnh R
2
Std. Lỗi dự
toán
1 .620
a
.384 .372 1.0053
ANOVA
b
Mô hình
Tổng
bình
phương
df
Có nghĩa là
vuông
F Sig.
1. Hồi quy
Dư
Tổng
cộng
192.691
309.275
501.966
6
306
312
32.115
1.011
31.775 .000
a
Coefficients
c
Mô hình
Hệ số không tiêu chuẩn
Hệ số tiêu
chuẩn
t Sig.
B Std.Lỗi Beta
1. (Liên tục)
REP
SIM
CONC
UNCERT
UNCERT x
PKNOW
PKNOW
6.245E-02
.359
.516
6.796E-02
.106
-3.232E-02
7.496E-02
.475
.055
.050
.075
.103
.034
.141
.300
.481
.045
.103
111
.067
.132
6.491
10.291
.905
1.025
952
.532
.895
.000
.000
.366
.306
.342
.595
Là 0,384 và được điều chỉnh thấp hơn một chút 0.372. R
2
cho chúng ta biết bao
nhiêu của biến trongYchiếm bởi các mô hình hồi quy từ mẫu của chúng tôi, giá trị
điều chỉnh cho chúng ta biết bao nhiêu biến trongY được hạch toán nếu các mô hình
đã được bắt nguồn từ dân số mà từ đó mẫu đã được lấy. Tiếp theo, phân tích phương
sai (được biết đến từ phần11.2) được báo cáo. Khi trở lại (11.8) này là không đáng
ngạc nhiên. Phân tích hồi quy và phân tích phương sai có liên quan. Bằng việc tính
22
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
toán các phần của biến giải thích bằng mô hình hồi quy trên tổng phương sai, chúng
tôi có được 267.149/777.129=0,344.
Bằng cách kiểm tra mức độ quan trọng, chúng tôi cũng thấy rằng mô hình hồi
quy là rất quan trọng, chỉ ra rằng mô hình có sức mạnh giải thích, và giả thuyết, đó là,
mô hình hồi quy không cải thiện dự đoán, có thể bị từ chối. Phần cuối cùng của bảng
11.6 cho thấy các hệ số hồi quy ước lượng, sai số chuẩn của các ước tính, t - giá trị và
mức độ quan trọng. Hệ số chuẩn và không chuẩn đã được báo cáo. 6.245E-02 là
6.245x10-2, đó là 0.06245. Lưu ý rằng các phần bị chặn(β
0
) không được báo cáo khi
hệ số hồi quy chuẩn được ước tính. Kiểm tra các hệ số hồi quy chuẩn cho thấy SIM là
biến sở hữu sức mạnh giải thích cao nhất. Giá trị báo cáo(0,481) có nghĩa là một sự
thay đổi của một đơn vị tiêu chuẩn trong REP sẽ dẫn đến một sự thay đổi của
0,481đơn vị tiêu chuẩn trong các biến phụ thuộc.
2.3.3 Biến số giả
Biến tuyệt đối thường được bao gồm như là biến độc lập. Ví dụ, nhu cầu về
một sản phẩm hoặc dịch vụ có thể thay đổi theo mùa, chúng tôi có thể, ví dụ, chia
năm vào mùa hè, mùa thu, mùa đông và mùa xuân. Đây là một biến quy mô danh
nghĩa mà không thể được xếp hạng. Được áp dụng trong một hồi quy (và định lượng
khác) phân tích, mùa giải cần phải được con số được gán (xem bảng 11.7)
Kiểm tra bảng 11.7 cho thấy ba biến mới A, B và C. Chúng ta thấy rằng nếu
doanh số bán hàng trong mùa hè, 1 được mã hoá trong biến A, và số 0 trong biến B
và C. Bảng 11.7 cũng cho thấy bốn mùa có kết hợp khác nhau của số 0 và số 1. Giả
định rằng mô hình hồi quy sau đây để bán quần áo phụ nữ, mức giá cũng được bao
gồm, đã được ước tính:
Doanh số bán hàng = 1000 - 0.5 x đơn giá + 100A - 20B - 50C
Những phương trình cho chúng ta biết doanh số bán hàng cao nhất trong mùa
hè (A = 1, B = 0, C = 0)
Bảng 11.7 Mã hóa của biến giả
Mùa A B C
Mùa hè 1 0 0
Mùa thu 0 1 0
Mùa đông 0 0 1
Mùa xuân 0 0 0
23
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Sự thay đổi các đường hồi quy tuyến tính xảy ra bởi các biến số giả:Giả sử giá
là £200. Doanh số trong mùa hè là :
1000 – 0.5 x 200 + 200 x (1) – 20 x (0)– 50 x (0) = 100
Khi mức giá được giữ nguyên thì doanh số trong mùa thu là :
1000 – 0.5 x 200 + 200 x (0) – 20 x (1) – 80 x (0) = 880
2.3.4 Phân tích các biến số
Phân tích hồi quy áp dụng theo quy ước, đó là : các biến số độc lập trong một
khoảng thời gian hay là tỷ lệ quy mô. Tuy nhiên thường những biến số phụ thuộc là
tuyệt đối. Ví dụ: điều đáng quan tâm được giải thích tại sao là những công ty thành
công thì nó khác với những công ty không thành công với những sự phân biệt đối với
việc nuôi dưỡng và không nuôi dưỡng một sản phẩm mới…để phân tích các biến số là
tuyệt đối. Phân tích các biến số trong chủ thể là bắt nguồn từ sự thay đổi, sự kết hợp
tuyến tính của hai hay nhiều các biến số độc lập sẽ kết hợp tốt giữa hai hoặc nhiều
nhóm được xác định rõ ràng. Những biến số đạt được bởi sự thành lập của sự biến đổi
trọng lượng cho mỗi sự khác biệt để đạt được mức cao nhất giữa những nhóm biến đổi
liên quan tới những nhóm biến đổi khác. Việc kết hợp những tuyến tính cho một phân
tích biến số, nó được biết tới như một hàm số biến số, nó được bắt nguồn từ một
phương trình như sau :
Z
jk
= a + W
1
X
1k
+ W
2
X
2k
+ …. (11.9)
Trong đó :
Z
jk
= biến số Z mã hóa cho biến số hàm số j cho chủ thể k
a = đường thẳng
W
i
= biến số trọng lượng cho sự biến đổi độc lập i
X
ik
= biến đổi độc lập i cho chủ thể k.
Những biến số này thì tỷ lệ trung bình cho tất cả những biến số riêng lẻ với
từng nhóm đặc biệt, chúng đứng giũa mỗi nhóm và được nhắc tới như một trọng tâm.
Trọng lượng W
i
có thể được giải thích như những hệ số hồi quy β trong các phân tích
hồi quy. Hầu hết các chương trình báo cáo của máy tính bao gồm những biến số trọng
lượng chuẩn và không chuẩn. Khả năng biến số có thể được đánh giá như là sự cải
thiện đúng trong phân loại.
24
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Ví dụ :
Giả sử rằng nhà máy có khả năng kiểm soát một tài liệu nghiên cứu nếu như nó
có thể tìm ra những biến số người mua và người không mua sản phẩm. Chính xác hơn,
nhà máy này phải biết quan tâm tới độ tuổi và có khả năngđạt mức thu nhập. Biến số
phụ thuộc là xác định tuyệt đối (mua thì bằng 1, không mua thì =0) trong khi những
biến số độc lập là theo quy ước. Phân tích các biến số của hai nhóm được xuất ra trong
chương trình máy vi tính thì xem ở bảng 11.8. Sự kiểm soát là một phần trình bày của
28 trong 30 lần quan sát được áp dụng trong các phân tích và hai hai quan sát còn lại
là không có dữ liệu. Chúng cũng nhìn thấy dữ liệu nhóm 0 bao gồm 19 chủ thể và 9
chủ thể của nhóm khác. Từ phần (b) chúng ta nhìn thấy những dữ liệu phân tích thì
phải đặt tất cả các đơn vị vào những nhóm mà ở đó chúng phụ thuộc đúng. Trường
hợp này thường không bắt buộc.
Hai hàm của phương trình biến số thì được tính toán theo phần (d). Cho nhóm
0 là : F
0
= -18.27 + 0.225 tuổi + 0.120 thu nhập. Cho nhóm F
1
= - 31.758 + 0.052 tuổi
+ 0.203 thu nhập. Hai phương trình này được sử dụng để tiên đoán nếu như một người
với độ tuổi 54 và thu nhập với mức 250 thì sẽ mua sản phẩm P. Đơn giản chúng ta có
thể gắn hai số liệu này vào hai hàm số và đạt được f
0
(54.250)= 24.023 và
f
1
(54.250)=21.800. Khi đó f
0
(54.250) > f
1
(54.250), chúng ta dự đoán rằng những
người thuộc vào nhóm 0 thì người đó sẽ không mua được sản phẩm này.
Bảng 11.8 Phân tích biến số của hai nhóm.
(a) Trường hợp
Nhóm 0 1
Đếm 19 9
28 trường hợp được sử dụng 2 trường hợp không có giá trị
(b) Tổng hợp của các phân loại
Đặt vào Đúng Nhóm…
Nhóm 0 1
0 19 0
1 0 9
Tổng số N 19 9
N số đúng 19 9
25