Tải bản đầy đủ (.pdf) (28 trang)

(Tiểu luận) vận dụng phương pháp ca trong phân tích mối liên hệ giữa độtuổi và tần suất mua hàng của người tiêu dùng tại thị trường bánlẻ hoa quả tươi ở trung quốc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.89 MB, 28 trang )

Trường Đại Học Kinh Tế Quốc Dân
Khoa Thống Kê

BÀI TẬP NHĨM
HỌC PHẦN: PHÂN TÍCH DỮ LIỆU
ĐỀ TÀI:

Vận dụng phương pháp CA trong phân tích mối liên hệ giữa độ
tuổi và tần suất mua hàng của người tiêu dùng tại thị trường bán
lẻ hoa quả tươi ở Trung Quốc
Giảng viên hướng dẫn: PGS.TS. Trần Thị Bích
Lớp chuyên ngành : Thống kê Kinh tế 62B
Thành viên nhóm 11 :
Ngơ Thị Hiền Lương 11202378
Nguyễn Thanh Huyền
Lê Cẩm Minh
Trịnh Thu Hà
Hồ Thị Huyền Trang


LỜI MỞ ĐẦU
Khai phá dữ liệu đã và đang được nghiên cứu, ứng dụng nhiều trong các lĩnh vực khác nhau
và mang lại những lợi ích to lớn. Những vấn được quan tâm trong khai phá dữ liệu là phân
lớp, luật kết hợp, phân cụm dữ liệu,… Một trong những thuận lợi chính của những kỹ thuật
này là khả năng phân tích dữ liệu lớn và phức tạp, có nhiều biến và nhiều đơn vị thí
nghiệm.
Correspondence Analysis - CA là phương pháp phân tích dữ liệu phổ biến xuất hiện từ năm
1935 và được phát triển đến ngày nay. Phương pháp này nhằm phân tích mối liên hệ giữa
hai biến định tính và trực quan kết quả phân tích trên đồ thị. Việc trực quan kết quả trên đồ
thị giQp người phân tích có thể mơ tả chi tiết hơn mối liên hệ giữa hai biến. Đây là đặc điểm
nổi bâtVcủa CA so với các phương pháp phân tích mối liên hệ truyền thống.


Mục đích của phân tích tương ứng là phân tích tương quan giữa các thuộc tính của hai biến
định tính sử dụng bảng thống kê hai chiều tương tự như phương pháp kiểm định Khi bình
phương. Bên cạnh đó, CA sẽ định lượng các thuộc tính nhằm xác định toạ độ của các thuộc
tính giQp trực quan kết quả trên đồ thị, cho phZp bổ sung các biến phụ (gọi là biến bổ sung)
nhằm khai thác mối liên hệ của nhiều hơn hai biến định tính. Kết quả của CA là bản đồ các
điểm (Map of Points), trong đó các điểm biểu diễn cho các dịng và các cột. Các kết quả
giQp chQng ta phát hiện được mối liên hệ tiềm ẩn ảnh hưởng lẫn nhau của các yếu tố được
phân tích trong bảng.
Trong q trình nghiên cứu, nhóm chQng em nhận được sự hướng dẫn nhiệt tình từ PGS.TS
Trần Thị Bích và ứng dụng những kiến thức về mơn Phân tích dữ liệu. Tuy nhiên, với kiến
thức và thời gian có hạn, bài viết khơng tránh khỏi những sai sót. Do đó nhóm rất mong
nhận được sự đóng góp và nhận xZt từ cơ để hồn thiện bài nghiên cứu.
ChQng em xin chân thành cảm ơn cô!

2


A.
I.

PHẦN NGHIÊN CỨU
Nghiên cứu ảnh hưởng của sọc trắng trên miếng thịt ức
gà đến sự lựa chọn của người tiêu dùng

Tên đề tài: Consumer acceptance of visual appearance of broiler
breast meat with varying degrees of white striping
Tác giả: V. A. Kuttappan, Y. S. Lee , G. F. Erf , J.-F. C. Meullenet ,
S. R. McKee and C. M. Owens
Đơn vị đăng tải: Thư viện Y học Quốc gia Hoa Kỳ
Thời gian: Tháng 5 năm 2012

1. Giới thiệu
Tiêu thụ thịt gia cầm đã tăng lên trong vài thập kỷ qua. Kể từ năm
1970, mức tiêu thụ thịt gà bình quân đầu người ở Hoa Kỳ đã tăng từ 18
lên 38.5 kg, nhiều hơn so với thịt bò và thịt lợn (Theo Hội đồng Gà Quốc
gia, 2011).
Các yếu tố khác nhau như mối quan tâm về sức khỏe của người tiêu
dùng ngày càng tăng, nhu cầu về các sản phẩm tiện lợi, và sự thay đổi
tương đối về giá có thể dẫn đến nhu cầu gia tăng của người tiêu dùng
đối với thịt gia cầm (Davis và Stewart, 2002).
Theo khảo sát, hình thức bên ngồi là thuộc tính chính và quan trọng
nhất để người tiêu dùng đánh giá chất lượng của một sản phẩm thịt
được đóng gói sẵn. Do đó, bất kỳ điều kiện nào ảnh hưởng tiêu cực đến
hình thức bên ngồi của sản phẩm đều có thể ảnh hưởng đến quyết định
mua hàng, có khả năng dẫn đến tổn thất kinh tế.
Sọc trắng là một tình trạng đặc trưng bởi sự xuất hiện của các sọc trắng
trên miếng phi lê và đùi gà. Có thể có các mức độ khác nhau của đường
vân, và chúng được nhìn thấy song song với hướng của các sợi cơ. Vì nó
có thể dễ dàng xác định, nên điều quan trọng là phải biết phản ứng của
người tiêu dùng như thế nào về ảnh hưởng của sọc trắng đối với hình
thức bên ngồi của miếng phi lê ức khơng xương, khơng da. Mục tiêu
chính của nghiên cứu này là xác định liệu có bất kỳ sự khác biệt nào
trong sự chấp nhận và ý định mua của người tiêu dùng đối với phi lê ức
gà thịt với các mức độ sọc trắng khác nhau hay không.
2. Cơ sở lý thuyết
3


Phân tích tương ứng (CA) là một phương pháp phân tích mối liên hệ
giữa hai biến định tính và trực quan kết quả phân tích trên đồ thị. CA
được sử dụng để hình dung mối quan hệ giữa các bản sao của miếng phi

lê với các mức độ sọc trắng khác nhau và các thuật ngữ được sử dụng
để giải thích chúng. Ngồi ra, thử nghiệm Chi bình phương ( P < 0,05)
được sử dụng để đánh giá sự khác biệt về số lượng phản hồi trong mỗi
loại cho từng mức độ sọc trắng.
3. Nghiên cứu và phân tích.
a, Mẫu
- Phi lê từ gà thịt khoảng 6 đến 8 tuần tuổi, được xử lý tại Nhà máy Thí
điểm Chế biến Gia cầm của Đại học Arkansas, được đánh giá trong
khoảng thời gian 1 tháng để lấy các mẫu đại diện.
- Những miếng phi lê ức lọc xương được sàng lọc bằng mắt thường và
phân tách theo 3 mức độ sọc trắng: bình thường = NORM, trung bình
= MOD và dày đặc = SEV
+ Các miếng philê được phân loại là NORM khơng có bất kỳ đường màu
trắng rõ ràng nào.
+ Các miếng phi lê được phân loại là MOD có các đường màu trắng,
song song với các sợi cơ, thường dày < 1mm nhưng dễ dàng nhìn thấy
trên bề mặt miếng phi lê.
+ Các miếng phi lê được phân loại là SEV có các đường màu trắng, song
song với các sợi cơ, thường dày > 1mm và rất dễ nhìn thấy trên bề mặt
miếng phi lê.
- Phi lê được ủ ở 4°C trong 24 giờ trong các túi zip đóng gói riêng lẻ.
Người ta đặc biệt cẩn thận để chọn những bức ảnh có bề ngồi đồng
nhất về kích thước, hình dạng và màu sắc sao cho tình trạng sọc thực
tế là yếu tố chính tạo nên sự khác biệt giữa các bức ảnh.
b, Phân tích cảm quan
- Nghiên cứu này sử dụng 75 đối tượng, trong đó tiêu chí duy nhất để lựa
chọn là:
+ Những người tham gia nên mua phi lê gà theo thói quen ít nhất một
lần trong một tháng.
+ Các đối tượng tham gia hội thảo được phân thành 6 nhóm tuổi: 18 đến

24 (n = 10), 25 đến 35 (n = 16), 36 đến 45 (n = 16), 46 đến 54 (n = 10),
55 đến 65 (n = 18) và trên 65 (n = 5).

4


-

-

Tất cả các hình ảnh được hiển thị cho người tiêu dùng trên màn hình
máy tính, mỗi người tiêu dùng phải đánh giá tất cả 15 bức ảnh theo mơ
hình đơn nguyên liên tiếp (từng bức ảnh được đánh giá lần lượt)
Đối với từng miếng phi lê riêng lẻ, người tiêu dùng được phép bày tỏ sự
yêu thích của họ đối với hình thức bên ngồi của từng hình ảnh miếng
phi lê trên thang điểm 9 điểm (1 = cực kỳ khơng thích, 9 = cực kỳ thích)
và cũng được hỏi một câu hỏi mở để giải thích lý do họ thích hoặc khơng
thích về mỗi miếng phi lê. Mục đích mua của các hình ảnh gói khay
được đánh giá bằng thang điểm 5 (1 = chắc chắn sẽ không mua, 5 =
chắc chắn sẽ mua).
c, Phân tích dữ liệu
- Các kết quả từ ý thích tổng thể của người tiêu dùng trung bình và
tỷ lệ vùng trắng được thể hiện trong Bảng 1.
+ Các miếng phi lê được phân loại là NORM có điểm trung bình thị
hiếu cao hơn đáng kể (6.9) so với phi lê MOD (6.1), cũng cao hơn
đáng kể so với phi lê SEV (4.5)
+ Các miếng phi lê SEV có khả năng chấp nhận thấp nhất và thực tế
sẽ bị người tiêu dùng coi là khơng thích.
=> Điều này cho thấy rằng khi mức độ dày đặc của sọc trắng tăng lên,
thì mức độ chấp nhận của người tiêu dùng giảm xuống

Bảng 1. Thị hiếu của người tiêu dùng, tỷ lệ phần trăm của vùng trắng
và điểm ý định mua hàng có ý nghĩa đối với 3 mức độ sọc trắng

-

Bảng 2 cho thấy sự khác biệt về tần số của các phản hồi khác
nhau trong thị hiếu người tiêu dùng với 3 mức độ sọc trắng.

5


+ Các miếng phi lê NORM có tỷ lệ phản hồi thích rất nhiều và cực kỳ
thích (xếp hạng theo thang điểm thị hiếu ≥8) cao hơn đáng kể so
với các miếng phi lê MOD và SEV.
+ Các miếng phi lê SEV có tỷ lệ phần trăm phản hồi khơng thích
cao hơn đáng kể so với các miếng phi lê NORM (thang điểm thị
hiếu ≤ 4) hoặc MOD (thang điểm thị hiếu ≤ 3).
+ Trên thực tế, hơn 50% người tiêu dùng báo cáo rằng họ khơng
thích hình thức bên ngoài của những miếng phi lê được phân loại
là SEV, trong khi tỷ lệ khơng thích MOD và NORM lần lượt là
khoảng 22 và 11%.
Bảng 2. Bảng tần suất (%) phản hồi của người tiêu dùng đối với thang
đo thị hiếu và ý định mua đối với 3 mức độ sọc trắng

Điều quan trọng là xác định lý do khiến người tiêu dùng thích hoặc
khơng thích sản phẩm; do đó, các nhận xét mở đã được đưa vào bảng
cảm quan. Các câu trả lời mở từ nghiên cứu hiện tại đã được đánh giá
và phân tích bằng cách sử dụng phương pháp CA để lấy thơng tin có giá
trị từ dữ liệu định tính, bổ sung cho các phát hiện định lượng.
Nội dung các câu hỏi mở có liên quan đến độ béo, màu sắc, độ tươi, kết

cấu bên ngoài, đường trắng, kích thước và độ đồng đều, và hình thức
của miếng phi lê
(Bảng 3). Phân tích khi bình phương với số lượng câu trả lời trong mỗi
danh mục cho thấy có một số khác biệt đáng kể về mức độ sọc trắng.
Nói chung, các mẫu SEV có nhiều nhận xét tiêu cực hơn, trong khi các
mẫu NORM có nhiều nhận xét tích cực hơn.

6


Document continues below
Discover more
Principles of
from:
Data mining
Đại học Kinh tế…
24 documents

Go to course

Phân lớp dữ liệu 12

Description
Principles of
Data mining

None

Data and model 3


Data equation…
Principles of
Data mining

None

Bảng điểm nhóm 6 1

đemnkcd
Principles of
Data mining

None

Cơ sở lý thuyết 8

đeff
Principles of
Data mining

None

Label food - bvh hbh
10

Principles of
Data mining

None



Chuong 1 Unofficial
Principles of
Data
Bảng 3. Danh mục thuật ngữ, mẫu của câu hỏi mở và
tần mining
suất xuất
52

None

hiện đối với từng mức độ sọc trắng

Biểu đồ từ phân tích tương ứng (Hình 3) cung cấp một cách tốt hơn để
xác định mối quan hệ giữa các thuật ngữ được sử dụng và các bản sao
của miếng phi lê có 3 độ sọc trắng.
+ 2 thành phần C1 và C2 lần lượt giải thích được 67,1 và 15,9% mức
độ biến thiên của dữ liệu. Các điểm trên đồ thị được chiếu lên trục
để xác định các yếu tố thúc đẩy sự yêu thích của người tiêu dùng.
Hướng của vectơ biểu thị hướng tăng mức độ yêu thích của người
tiêu dùng.
+ Trong nghiên cứu hiện tại, các mẫu NORM và SEV đã được nhìn
thấy ở hai đầu đối diện của vectơ, với các mẫu NORM hướng về
phía tăng mức độ ưa thích. Các mẫu MOD đã được nhìn thấy trải
rộng giữa NORM và SEV.
+ Hơn nữa, các mẫu NORM có tỷ lệ phản hồi thích cao nhất và tỷ lệ
phản hồi khơng thích thấp nhất (Bảng 2). Điều này cho thấy rằng
các thuật ngữ liên quan đến các mẫu NORM có thể là yếu tố thúc
đẩy sở thích của người tiêu dùng. Trong khi đó, các cụm từ liên
quan đến mẫu SEV (có tỷ lệ phản hồi thích thấp nhất và tỷ lệ phản

hồi khơng thích cao nhất) có thể là yếu tố khiến người tiêu dùng
khơng thích.

7


Hình 3. Phân tích tương ứng của các thuật ngữ được sử dụng trong các
câu trả lời mở cho 3 mức độ sọc trắng (■ = lặp lại với 3 mức độ sọc
trắng; ♦ = các loại thuật ngữ được sử dụng trong nhận xét kết thúc
mở), C1 và C2 = thành phần 1 và 2 tương ứng.
=> Nhận Xét:
+ Việc khơng có các đường trắng và miếng phi lê có ít chất béo là
những lý do chính khiến người tiêu dùng thích miếng phi lê ức gà
thịt trong nghiên cứu này. Trong khi đó, lượng chất béo cao và sự
hiện diện của các vạch trắng là 2 lý do chính dẫn đến việc khơng
thích.
+ Người tiêu dùng thích màu sắc của các mẫu NORM, điều này có
thể gián tiếp là do khơng có các sọc trắng cản trở màu sắc bình
thường của các mẫu thịt. Người tiêu dùng phản hồi rằng mẫu SEV
có kết cấu bên ngồi xấu, điều này có thể ngụ ý rằng nó có vẻ
cứng hơn.
+ Cuối cùng, các sọc trắng xuất hiện đối với một số người tiêu dùng
có thể là dấu hiệu của sự hư hỏng, dẫn đến cảm giác giảm độ tươi
trong các mẫu SEV.
8


+ Tương tự, các thuật ngữ liên quan đến hình thức khơng đẹp, kích
thước và độ đồng đều đẹp, cũng như kích thước và độ đồng đều
xấu xuất hiện gần điểm gốc của cả hai trục, điều này cho thấy

rằng các thuật ngữ này được sử dụng gần như bằng nhau cho cả 3
độ sọc trắng và khơng đóng góp nhiều vào việc thích hay khơng
thích sản phẩm.
4. Kết quả bài nghiên cứu và tính ứng dụng trong thực tiễn
Dựa trên kết quả của nghiên cứu này, có thể kết luận rằng sự hiện diện
của sọc trắng (và mức độ phân bố dày đặc ngày càng tăng) làm giảm
khả năng chấp nhận của người tiêu dùng dựa trên hình thức bên ngoài
của miếng phi lê ức gà thịt,. Hơn 50% người tiêu dùng cho biết họ có
thể sẽ khơng hoặc chắc chắn khơng mua phi lê có sọc trắng ở bất kỳ
mức độ nào. Một trong những lý do chính khiến người tiêu dùng khơng
thích là những miếng phi lê có sọc trắng SEV trơng béo (nghĩa là nhiều
chất béo). Vì hàm lượng chất béo thấp là một thuộc tính quan trọng góp
phần làm tăng nhu cầu của người tiêu dùng đối với thịt gà, nên sự xuất
hiện của sọc trắng có thể dẫn đến việc sản phẩm bị từ chối.
=> Ứng dụng thực tiễn: Tìm ra đặc điểm nào của sản phẩm được ưa
chuộng nhất và các nguyên nhân làm giảm ý định mua hàng của người
tiêu dùng. Từ đó, để giữ vững thị trường thì việc sản xuất ra những sản
phẩm chất lượng, đáp ứng được nhu cầu của khách hàng là điều quan
trọng, được ưu tiên hàng đầu.
=> Đánh giá điểm yếu:
Việc phân tích các nhận xét mở có thể cung cấp thơng tin quan trọng
liên quan đến nhận thức của người tiêu dùng. Tuy nhiên, nhược điểm
chính là thơng tin thu được là chủ quan và dữ liệu được phân tích với số
lượng phản hồi, khơng dựa trên bất kỳ thang đo cường độ tiêu chuẩn
hóa nào

II.

Phân tích tương ứng về việc khám phá mối liên hệ giữa
nguyên nhân hỏa hoạn và các yếu tố ảnh hưởng.

Tên đề tài: Correspondence analysis on exploring the association
between fire
causes and influence factors
Tác giả: Guohui Li, Song Lu, Heping Zhang, Siuming Lo
Đơn vị đăng tải: Procedia Engineering 62 (2013) 581 - 591
9


-

Năm: 2013
1. Giới thiệu
Nghiên cứu này nhằm mục đích tìm hiểu xem mối quan hệ giữa
nguyên nhân vụ cháy và các yếu tố ảnh hưởng từ đó để ngăn các
đám cháy xảy ra tại Trung Quốc từ 2006-2011.
Chứng minh rằng CA có thể cung cấp một góc nhìn mới về việc
khám phá thơng tin bằng cách phân tích dữ liệu thống kê về hỏa
hoạn.
2. Dữ liệu và phương pháp nghiên cứu
- Dữ liệu được lấy từ China Fire Services (2006-2011). Dữ liệu bao
gồm 5 yếu tố ảnh hưởng và 9 nguyên nhân gây ra hỏa hoạn.
- Phương pháp nghiên cứu: Áp dụng phương pháp phân tích tương
ứng (CA).
3. Kết quả bài nghiên cứu và thảo luận

10


Kết luận về mối quan hệ giữa nguyên nhân và các yếu tố
- Về tỉnh: Hầu hết các tỉnh đều liên quan đến cháy do điện, hoạt

động sản xuất, tự bốc cháy và các nguyên nhân khác. . Các tỉnh
phát triển như Quảng Đông, Phúc Kiến, Giang Tô, Thượng Hải,
Chiết Giang và Trùng Khánh có mối quan hệ chặt chẽ hơn với lửa
điện, hoạt động sản xuất và tự cháy. So với các phương pháp khác,
kết quả định tính hoặc bán định tính của CA ngắn gọn, rõ ràng và
dễ hiểu.
11


-

Về tháng: Tháng 2 và tháng 1 có mối liên hệ chặt chẽ với việc chơi
với lửa hơn bất kỳ tháng nào khác. Các tháng (tháng 3, tháng 4,
tháng 5, tháng 10, tháng 11 và tháng 12) có xu hướng liên quan
đến đốt phá, bất cẩn với lửa, không xác định, hút thuốc, cháy điện
và những thứ khác, trong khi các tháng (tháng 6, tháng 7, tháng 8
và tháng 9) có xu hướng liên quan đến tự cháy và vận hành sản
xuất.
- Về khung giờ: Kết quả chỉ ra rằng giờ có thể được chia thành hai
nhóm: nhóm ban ngày (06~20h) và nhóm ban đêm (20~06h). Mỗi
nhóm có hồ sơ nguyên nhân hỏa hoạn tương tự nhau. Rõ ràng là xu
hướng của nhóm ban ngày có liên quan đến việc hút thuốc, bất
cẩn với lửa, vận hành sản xuất và nghịch lửa, trong khi xu hướng
của nhóm ban đêm có liên quan đến đốt phá, không xác định,
khác, cháy điện và tự bốc cháy.
- Về kiểu nhà: Các xu hướng ngầm có liên quan đến đốt phá, khơng
xác định, vận hành sản xuất và tự bốc cháy. Xu hướng nhà cao
tầng gắn liền với việc đùa với lửa, bất cẩn với lửa và đốt phá. Rõ
ràng là xu hướng nhà một tầng có liên quan đến việc đốt phá, bất
cẩn với lửa và những điều chưa biết. Từ bản đồ CA, rõ ràng chúng

ta có thể thấy rằng nhà nhiều tầng rất gần với lửa điện, điều này
cho thấy tồn tại mối quan hệ rất chặt chẽ giữa chúng.
- Về địa điểm: hầu hết những nơi tập trung đông người đều ở gần
nhau và những nơi này có liên quan đến các nguyên nhân gây hỏa
hoạn do bất cẩn với lửa, nghịch lửa, hút thuốc, đốt phá, không xác
định, chập điện và các nguyên nhân khác. Do những nơi này có
mật độ cư trú cao, nhiều thiết bị điện, tải trọng đám cháy lớn nên
khi xảy ra cháy ở những nơi này sẽ gây thiệt hại nặng nề về người
và của. Nhà xưởng, hóa dầu đang có xu hướng gắn liền với vận
hành sản xuất, tự cháy và cháy do điện.
4. Đánh giá bài nghiên cứu
Bằng cách phân tích số liệu thống kê về hỏa hoạn của lục địa Trung
Quốc từ năm 2005 đến 2010 (kết quả được thể hiện trong Bảng 6),
hướng dẫn hữu ích có thể được cung cấp cho việc phát triển chiến lược
phòng cháy chữa cháy.
Nghiên cứu chính tập trung vào mối liên hệ giữa chín nguyên nhân hỏa
hoạn và năm yếu tố ảnh hưởng. CA đã được sử dụng và kết quả cho thấy
nguyên nhân cháy có quy luật phân bố đặc biệt nào đó dưới ảnh hưởng
của tỉnh, tháng, giờ, loại cơng trình và địa điểm. Các kết quả chỉ ra rằng
12


phân phối đám cháy điện là rất rộng. Hầu hết các tỉnh ven biển, hầu hết
các tháng và những nơi tập trung đơng người đều có xu hướng cháy nổ
do chập điện. Để ngăn ngừa xảy ra hỏa hoạn, các biện pháp chữa cháy
nên được thực hiện bằng cách xem xét các yếu tố ảnh hưởng khác nhau.
Nghiên cứu này đã chứng minh rằng cần phải xem xét các yếu tố ảnh
hưởng khi triển khai thêm công tác PCCC. Phân tích tương ứng có thể
phát hiện ra mối quan hệ giữa các biến phân loại và tạo ra kết quả cho
nghiên cứu trong tương lai. Nghiên cứu này đã tiết lộ mối quan hệ sâu

sắc giữa nguyên nhân hỏa hoạn và các yếu tố ảnh hưởng. Các tác giả tin
rằng CA là một kỹ thuật chưa được sử dụng đúng mức và nó có thể đóng
vai trị bổ sung trong việc phân tích dữ liệu cháy.
III.

Phân tích tương ứng giữa mối quan hệ giữa màu sắc cảm xúc
Tên đề tài: Correspondence analysis of color-emotion
associations
Tác giả: Mitsuhiko Hanada
Đơn vị đăng tải:
Thời gian: Năm 2017
1. Giới thiệu
Nghiên cứu này điều tra giả thuyết rằng cảm xúc có liên quan đến
màu sắc thơng qua sự tương ứng giữa vòng tròn màu sắc và mơ
hình cảm xúc/ảnh hưởng bao quanh. Nó được thử nghiệm theo mơ
hình tổng thể với dữ liệu về sự liên kết trực tiếp giữa màu sắc và
cảm xúc bằng cách sử dụng phương pháp trực quan hóa dữ liệu,
phân tích tương ứng.
2. Dữ liệu và phương pháp nghiên cứu
- Dữ liệu: 47 sinh viên đại học và sau đại học Nhật Bản đã tham
gia (tuổi: 19–23; 39 nam; 8 nữ).
- Phương pháp nghiên cứu: ứng dụng phương pháp phân tích
tương ứng (CA) nhằm phân tích mối liên hệ giữa màu sắc và cảm
xúc .
3. Kết quả bài nghiên cứu và thảo luận

13


Các ơ (A)–(D) là các hình chiếu lên mặt phẳng có kích thước lần lượt là

1–2, 3–4, 5–6 và 7–8. Trong (A), sáu cảm xúc cơ bản được viết bằng màu
đỏ. Chỉ những từ cảm xúc có tọa độ tuyệt đối lớn hơn 1,0 trên trục
ngang hoặc trục dọc mới được hiển thị trong (B)–(D).
Các từ cảm xúc cũng được định vị dọc theo quỹ đạo hình chữ U.
“Niềm đam mê”, “sự tức giận”, “sự nhiệt tình”, “động lực”, “sự phấn
khích” và “cơn thịnh nộ” được đặt ở phía trên bên trái, gần các màu đỏ.
“Tình yêu”, “sự mềm mại” và “eros” được đặt gần các màu hồng nhạt.
Những từ tích cực như “hạnh phúc”, “niềm vui”, “độ sáng” và “niềm
vui” cũng như “bất ngờ” và “dự đoán” được đặt từ phía trên bên trái
xuống phía dưới chính giữa, gần các màu cam và vàng.
“Sự bình tĩnh”, “sự yên tĩnh”, “cảm giác an toàn” và “sự nhẹ nhõm”
được đặt gần các màu xanh lục. Các từ cảm xúc tiêu cực như “buồn bã”,
“lo lắng”, “hối tiếc” và “trầm cảm” nằm ở phía trên bên phải gần màu
xanh lam và tím.
"Sợ hãi" và "ghen tị" nằm ở trung tâm phía trên gần các màu tía. Thứ tự
các cảm xúc cơ bản dọc theo quỹ đạo hình chữ U là “giận dữ”–“hạnh
phúc”–“ngạc nhiên”–“buồn bã”–“ghê tởm”–“sợ hãi”.
14


Tóm lại, vịng trịn màu sắc gần như phù hợp với thứ tự quang phổ,
nhưng thứ tự cảm xúc dọc theo vịng màu sắc khơng tương ứng với thứ
tự cảm xúc của mơ hình vịng trịn. Điều này khơng ủng hộ giả thuyết
rằng vòng tròn màu sắc tương ứng với vịng trịn cảm xúc.
4. Đánh giá bài nghiên cứu
Có một số hạn chế liên quan đến việc khái quát hóa các kết quả trong
nghiên cứu này. Tất cả những người tham gia đều là sinh viên đại học
Nhật Bản và khơng biết liệu kết quả có thể được khái qt hóa cho các
nhóm dân số khác có nền tảng văn hóa khác nhau hay khơng. Ngồi ra,
có nhiều nam giới tham gia hơn nữ giới, mặc dù sự khác biệt giới tính

trong sở thích màu sắc đã được báo cáo.
Mặc dù giả thuyết này không được ủng hộ, nhưng một giả thuyết mới
cho rằng mối liên hệ cơ bản giữa màu sắc và cảm xúc được trung gian
bởi nhiệt độ cảm nhận đã được đề xuất. Giả thuyết mới này phù hợp với
sự thể hiện của các mối liên hệ màu sắc-tâm trạng trong âm nhạc và
sân khấu trong nghiên cứu trước đây với nền tảng văn hóa khác với
Nhật Bản, cho thấy rằng các mối liên hệ chính này đã được quan sát
rộng rãi trên các nền văn hóa khác nhau. Vì vậy, nó sẽ có giá trị điều tra
thêm.

B.

PHẦN NGHIÊN CỨU

Vận dụng phương pháp CA trong phân tích mối liên hệ giữa độ tuổi và tần suất
mua hàng của người tiêu dùng tại thị trường bán lẻ hoa quả tươi ở Trung Quốc

1. Giới thiệu chung:
Bối cảnh

Trong đại dịch COVID-19, ngành siêu thị bán lẻ hoa quả tươi chịu tổn thất nghiêm trọng.
Sau COVID-19, họ đã phục hồi ở một mức độ nào đó. Vào năm 2021, Bain & Company đã
thực hiện một cuộc khảo sát để thu thập câu trả lời từ cơng chQng nhằm tìm hiểu thêm về
thị trường bán lẻ trái cây tại Trung Quốc.
1.1. Lý do chọn đề tài
Vận dụng phương pháp CA để phân tích tương ứng giữa độ tuổi và tần suất mua hàng là
một đề tài thQ vị và có tính ứng dụng cao trong lĩnh vực kinh doanh. Phương pháp CA để
phân tích sự liên quan của 2 biến độ tuổi và tần suất mua hàng giQp các doanh nghiệp hiểu
rõ hơn về hành vi tiêu dùng của khách hàng, định hướng chiến lược kinh doanh, nghiên cứu
thị trường và cải thiện trải nghiệm của khách hàng.

15


1.2. Mục đích nghiên cứu
Vận dụng các kiến thức, phương pháp phân tích tương ứng CA để đánh giá mối liên hệ
tương quan giữa độ tuổi và tần suất mua hàng. Từ đó, góp phần giQp doanh nghiệp cải thiện
chiến lược kinh doanh, tối ưu hóa chiến lược tiếp thị, tăng cường khả năng cạnh tranh và
nâng cao trải nghiệm khách hàng thông qua việc hiểu rõ hơn về mối quan hệ giữa độ tuổi
và tần suất mua hàng của khách hàng.
1.3. Phạm vi và đối tượng nghiên cứu
Đối tượng nghiên cứu: người tiêu dùng trái cây (253 tình nguyện viên Trung Quốc)
Phạm vi nghiên cứu:
 Về thời gian: năm 2021.
 Về khơng gian: 253 tình nguyện viên là người tiêu dùng trái cây.
1.4. Phương pháp nghiên cứu
a. Phương pháp thu thập và tổng hợp dữ liệu
Với mục đích nghiên cứu của đề tài, để phục vụ cho tính tốn và phân tích tương
ứng giữa tần suất mua hàng và độ tuổi của khách hàng bằng bảng hỏi và sau đó đánh
giá dựa trên kết quả đã thu được.
Dữ liệu sau khi thu thập được từ các đối tượng nghiên cứu sẽ được làm sạch và tổng
hợp bằng Excel. Song, số liệu sẽ được phân tích, xử lý bằng phần mềm R.
b. Phương pháp phân tích dữ liệu
 Phương pháp phân tích định lượng : phân tích và xử lý số liệu từ DL thô ban đầu
 Phương pháp phân tích tương ứng (CA): đánh giá kết quả phân tích và diễn giải các
nhóm khách hàng, xem liệu có sự khác biệt về tần suất mua hàng giữa các nhóm
khách hàng khác nhau và có thể rút ra các kết luận về mối quan hệ giữa độ tuổi và
tần suất mua hàng.

1.


Vận dụng phương pháp CA
2.1. Giới thiệu dữ liệu
 Bộ dữ liệu sử dụng gồm 2 biến: Tần suất mua hàng và độ tuổi khách hàng.
 Biến tần suất mua hàng có các thuộc tính: Not regularly, Twice a month, Once a
week, Twice a week, Everyday, Other.
 Biến độ tuổi có các thuộc tính: Under 18, 18 to 30, 30 to 40, 40 to 60, Above 60.
Với 253 quan sát, dữ liệu được thống kê mô tả tổng hợp theo bảng dưới đây.

Not regularly

Under 18

18 to
30

2

13

30 to 40 40 to 60 Above 60 Tổng

9

13

16

3

40



Twice a month

0

1

13

9

2

25

Once a week

0

2

26

13

5

46


Twice a week

2

8

33

21

9

73

Everyday

2

0

26

15

4

47

Other


0

0

13

7

2

22

Tổng

6

24

120

78

25

253

Bảng 1 - Ma trận tần số
Under 18

18 to

30

30 to 40 40 to 60 Above 60 Tổng

Not regularly

0.01

0.05

0.04

0.05

0.01

0.16

Twice a month

0.00

0.00

0.05

0.04

0.01


0.10

Once a week

0.00

0.01

0.10

0.05

0.02

0.18

Twice a week

0.01

0.03

0.13

0.08

0.04

0.29


Everyday

0.01

0.00

0.10

0.06

0.02

0.19

Other

0.00

0.00

0.05

0.03

0.01

0.09

Tổng


0.02

0.09

0.47

0.31

0.10

1.00

Bảng 2. Ma trận tần suất
2.2 Tiến hành phân tích tương ứng (CA)
2.2.1 Kiểm định và đánh giá mức độ chặt chẽ của mối liên hệ giữa 2 biến
Under 18 18 to 30 30 to 40 40 to 60 Above 60 Trung bình
Not regularly

33.33

54.17

7.50
17

16.67

12.00

15.81



Twice a month

0.00

4.17

10.83

11.54

8.00

9.88

Once a week

0.00

8.33

21.67

16.67

20.00

18.18


Twice a week

33.33

33.33

27.50

26.92

36.00

28.85

Everyday

33.33

0.00

21.67

19.23

16.00

18.58

Other


0.00

0.00

10.83

8.97

8.00

8.70

Tổng

100.00

100.00

100.00

100.00

100.00

100.00

Bảng 3 – Masses column profile

Under 18 18 to 30 30 to 40 40 to 60 Above 60


Tổng

Not regularly

5.00

32.50

22.50

32.50

7.50

100.00

Twice a month

0.00

4.00

52.00

36.00

8.00

100.00


Twice a week

2.74

10.96

45.21

28.77

12.33

100.00

Once a week

0.00

4.35

56.52

28.26

10.87

100.00

Everyday


4.26

0.00

55.32

31.91

8.51

100.00

Other

0.00

0.00

59.09

31.82

9.09

100.00

Trung bình

2.37


9.49

47.43

30.83

9.88

100.00

Bảng 4. Masses row profile
Kiểm định Khi bình phương:
18


Với cặp giả thuyết:
H0: Khơng có mối liên hệ phụ thuộc giữa độ tuổi khách hàng và tần suất mua hàng
H1: Có mối liên hệ phụ thuộc giữa độ tuổi khách hàng và tần suất mua hàng
Kết quả tính Khi bình phương được tính bằng:
2 = ij(nij-nij)2nij = 44.1
Kết quả được tính từ Bảng 3 với mỗi ơ của bảng phản ánh giá trị (nij-nij)2nij, trong đó
nij=ninjn là tần số lý thuyết được tính trên cơ sở H0 đQng.

Bảng 5 – Bảng tính Khi bình phương

Under 18

18 to
30


Above
60

Tổng

Not regularly

1.17

22.33

5.24

0.04

0.23

29.01

Twice a month

0.59

0.79

0.11

0.22

0.09


1.80

Once a week

1.09

1.28

0.80

0.10

0.05

3.32

Twice a week

0.04

0.17

0.08

0.10

0.44

0.83


Everyday

0.70

4.46

0.62

0.02

0.09

5.89

Other

0.52

2.09

0.63

0.01

0.01

3.26

Tổng


4.12

31.12

7.48

0.48

0.91

44.10

30 to 40 40 to 60

Giá trị Khi bình phương được tính bên trên là lớn. Tương tự, kết quả từ phần mềm R cho
giá trị p-value=0.00146.

19



×