Tải bản đầy đủ (.docx) (36 trang)

ĐỀ TÀI ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN CHÍNH (PCA)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.49 MB, 36 trang )

TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN
KHOA THỐNG KÊ

BÀI TẬP NHĨM

ĐỀ TÀI: ỨNG DỤNG PHÂN TÍCH
THÀNH PHẦN CHÍNH (PCA)
Giảng viên hướng dẫn : PGS.TS.Trần Thị Bích
Lớp chuyên ngành

: Thống Kê Kinh Tế 62B

Thành viên nhóm 3

:
Bùi Quốc Tuấn

:11208289

Nguyễn Minh Hiếu

:11201490

Nguyễn Thị Thanh Hiền :11205252
Nguyễn Đình Trị

:11208192

Nguyễn Minh Khơi

:11201960



HÀ NỘI – 2023

1|Page


Mục Lục
Mục Lục .........................................................................................................................................2
LỜI MỞ ĐẦU................................................................................................................................4
PHẦN A: TÓM TẮT CÁC NGHIÊN CỨU ...............................................................................5
I.

ĐÁNH GIÁ CẢM QUAN NƯỚC ÉP GẤC – CHANH DÂY .........................................5
1. Giới thiệu ...........................................................................................................................5
2. Cơ sở lý thuyết...................................................................................................................5
3. Nghiên cứu và phân tích....................................................................................................6
4. Tính ứng dụng của phương pháp PCA đối với thực tiễn nghiên cứu................................9

II.

NHẬN DẠNG KHUÔN MẶT CÓ BIẾN ĐỔI VỀ SẮC THÁI...................................9

1. Đặt vấn đề........................................................................................................................10
2. Mục đích nghiên cứu .......................................................................................................10
3. Dữ liệu và phương pháp nghiên cứu ...............................................................................10
4. Kết quả bài nghiên cứu và thảo luận ...............................................................................11
5. Đánh giá bài nghiên cứu..................................................................................................13
III.

ĐÁNH GIÁ CẢM QUAN SẢN PHẨM HÀNH TÍM CHIÊN CHÂN KHƠNG......14


1. Giới thiệu ........................................................................................................................14
2. Cơ sở lí thuyết ................................................................................................................14
3. Nghiên cứu và phân tích thực tế...................................................................................15
4. Tính ứng dụng của phương pháp PCA đối với thực tiễn nghiên cứu ......................17
PHẦN B: ỨNG DỤNG PHƯƠNG PHÁP PHÂN TÍCH THÀNH PHẦN CHÍNH (PCA) ĐỂ
PHÂN TÍCH NHỮNG ĐẶC ĐIỂM TRONG TÍNH CÁCH MỖI CÁ NHÂN SẼ ẢNH
HƯỞNG NHƯ THẾ NÀO ĐẾN MỨC CĂNG THẲNG VỀ TÂM LÝ VÀ SỰ TỰ TIN
VÀO NĂNG LỰC BẢN THÂN TRONG THỜI GIAN CÁCH LY VÌ COVID-19 ..............19
I.

Tổng quan về nghiên cứu .................................................................................................19
1. Lý do chọn đề tài .............................................................................................................19
2. Mục đích nghiên cứu .......................................................................................................19

II.
Phân tích những đặc điểm trong tính cách mỗi cá nhân sẽ ảnh hưởng như thế nào
đến mức căng thẳng về tâm lý và sự tự tin vào năng lực của bản thân trong thời gian
cách ly vì Covid-19 bằng phương pháp PCA ........................................................................20
2|Page


1. Giới thiệu bộ dữ liệu........................................................................................................20
2. Kết quả phân tích.............................................................................................................21
III.

Kết luận và khuyến nghị ...............................................................................................34

Danh mục tham khảo..................................................................................................................36


3|Page


LỜI MỞ ĐẦU
Với sự biến đổi mạnh mẽ trong các mối liên hệ và sự vận động không ngừng trong sự việc
đời sống, từ xã hội đến kinh tế, từ vi mô tới vĩ mô,… việc thấu hiểu bản chất của mọi tương quan
là điều cần thiết không chỉ đối với từng cá nhân mà còn quan trọng hơn cả với các nhà cầm
quyền. Chính vì thế, một cơng cụ để phân tích và làm rõ vấn đề này là điều cần có. Phương
pháp phân tích PCA (Principal Component Analysis) là một trong những công cụ chủ yếu được
sử dụng để phân tích những mối liên hệ đó. Đặc biệt dưới góc độ nhà quản lý, nó góp phần đánh
giá tác động của các yếu tố ảnh hưởng đến chính sách kinh tế xã hội và dự án phát triển, đồng
thời có vai trị quan trọng trong việc thiết kế và điều chỉnh các chính sách để đạt được hiệu quả
cao nhất.
Vì thế, trong bài tìm hiểu này, chúng em phân tích chun sâu về vai trị của PCA qua bài
nghiên cứu của tác giả Nguyễn Minh Thủy với đề tài “Ứng dụng phương pháp phân tích thành
phần chính và hồi quy Logistic trong đánh giá cảm quan nước ép gấc – chanh leo”. Bên cạnh đó,
để kiểm nghiệm tính ứng dụng phương pháp phân tích thành phần chính, nhóm chúng em đã tiến
hành phân tích những đặc điểm trong tính cách mỗi cá nhân sẽ ảnh hưởng như thế nào đến mức
căng thẳng về tâm lý và sự tự tin vào năng lực bản thân trong thời gian cách ly vì Covid-19.
Để hồn thiện bài viết này, nhóm chúng em nhận được sự hướng dẫn nhiệt tình từ giảng
viên hướng dẫn PGS.TS Trần Thị Bích và những kiến thức từ mơn Phân tích dữ liệu. Tuy nhiên,
với kiến thức và thời gian có hạn, bài viết khơng tránh khỏi những sai sót. Do đó, nhóm chúng em
rất mong có được sự nhận xét, đánh giá và giúp đỡ từ cô.
Chúng em xin chân thành cảm ơn.

4|Page


PHẦN A: TÓM TẮT CÁC NGHIÊN CỨU
I. ĐÁNH GIÁ CẢM QUAN NƯỚC ÉP GẤC – CHANH DÂY

-

Tên đề tài: Ứng dụng phương pháp phân tích thành phần chính và hồi quy Logistic
trong đánh giá cảm quan nước ép gấc – chanh leo

-

Tác giả đề tài: Nguyễn Minh Thủy – Trường đại học Cần Thơ

-

Đơn vị đăng bài: Tạp chí khoa học Trường đại học Cần Thơ

-

Thời gian: 27/02/2018

1. Giới thiệu
Sản xuất nước ép trái cây ngày càng trở nên quan trọng đối với thị trường trong nước do
nhu cầu sử dụng sản phẩm tiện lợi và dinh dưỡng. Nước ép gấc – Chanh dây kết hợp sẽ làm tăng
giá trị dinh dưỡng và cải thiện mùi vị thơm ngon cho các sản phẩm. Tuy vậy, sản phẩm cần có
thêm các bước nghiên cứu để đánh giá cảm quan của người tiêu dùng để xác nhận kết quả của
nghiên cứu và đảm bảo được tiềm năng của sản phẩm mới trên thị trường.
Phân tích cảm quan cung cấp cho các nhà tiếp thị hiểu về chất lượng sản phẩm thực phẩm,
hướng đến chất lượng sản phẩm tốt và cải tiến được sản phẩm theo quan điểm của người tiêu
dùng (Lawless and Heymann, 1998). Phương pháp phân tích thành phần chính (PCA) đã được sử
dụng và xem xét bởi các nhà nghiên cứu cho các ứng dụng đánh giá cảm quan cho các sản phẩm
thực phầm khác nhau. PCA có thể được áp dụng cho việc điều tra dữ liệu ưa thích, do đó có thể
tạo ra một khơng gian sản phầm, người tiêu dùng dựa trên dữ liệu chấp nhận (Hough et al.,
1992; Greenhooff and McFie, 1994) Đây cũng là một công cụ để miêu tả sự khác biệt giữa các

thuộc tính cảm quan của các sản phẩm thực phẩm ( Powers, 1984). Mối quan hệ giữa người tiêu
dùng và dữ liệu mô tả, cũng như dữ liệu thu nhận được từ cảm quan và các cơng cụ đo có thể
được sử dụng một các rõ ràng bởi PCA. PCA cũng được sử dụng để cung cấp cácH hình dung
mối quan hệ giữa các sản phẩm và thuộc tính.
Mục tiêu của nghiên cứu này là áp dụng phương pháp phân tích thành phần chính (PCA)
và phương pháp hồi quy Logistic để mơ tả các thuộc tính cảm quan của các nước ép gấc- chanh
dây được chuẩn bị với sự kết hợp của các hàm lượng thay đổi (so với gấc) và tỷ lệ pha loãng với
nước để chọn ra sản phẩm có giá trị cảm quan cao và phù hợp với sở thích của người tiêu dùng.
2. Cơ sở lý thuyết
5|Page


Phân tích thành phần chính (PCA) là một kĩ thuật thống kê phân tích đa biến được sử dụng
rộng rãi có thể áp dụng cho dữ liệu QDA( chuẩn bị thuộc tính với các điểm mơ tả thuộc tính) để
giảm tập hợp các biến phụ thuộc gọi là thuộc tính đến một tập hợp dữ liệu nhỏ hơn của các biến
cơ bản gọi là yếu tố dựa trên mơ hình của tương quan giữa các biến ban đầu. Dữ liệu thu thập từ
các cảm quan viên, sau khi cho điểm theo cường độ thuộc tính (QDA). Các dữ liệu của các thuộc
tính khác nhau hoặc đã nêu được sắp xếp theo thứ tự tăng hoặc giản dần. Sau đó, dữ liệu được
giảm bằng cách phân tích dữ liệu, các biến độc lập và phụ thuộc được lựa chọn và đồ thị 2 trục
của các mẫu thu nhận.
3. Nghiên cứu và phân tích
Bộ số liệu sử dụng 10 cảm quan viên để đánh giá cảm quan nước ép hỗn hợp gấc – chanh
dây được huấn luyện tại Bộ môn Công nghệ thực phẩm, Trường đại học Cần Thơ để đánh giá các
mẫu. Các cảm quan viên được hướng dẫn theo cường độ mô tả về mùi vị, màu sắc và trạng thái
theo thang điểm 5 của phương pháp phân tích định lượng QDA. Phương pháp đánh giá cảm quan
về sự chấp nhận sản phẩm sử dụng thanh đo nhị thức với số cảm quan viên là 50 người.
Phương pháp phân tích thành phần chính xác định số lượng thành phần chính cần thiết để
biểu diễn dữ liêu. Scree plot thể hiện thứ tự giảm dần về độ lớn của các giá trị riêng (eigenvalue)
và giá trị phần trăm tích lũy của phương sai. Trong phương diện phân tích nhân tố hoặc phân tích
thành phần chủ yếu, Scree plot giúp nhà phân tích hình dung được tầm quan trọng tương đối của

các thành phần. Thành phần thứ 3 và thứ 4 (F3 và F4) có tác động rất nhỏ so với biến, có thể nhận
biết qua đường cong tích lũy phương sai khơng có sự thay đổi nhiều. Bên cạnh đó, có sự giảm
mạnh độ lớn của giá trị riêng thành phần thứ 3 và thứ 4 (F3 và F4). Độ lớn của thành phần thứ 3
đến thứ 7 (F3 đến F7) rất nhỏ so với thành phần thứ 1 và thứ 2 (F1 và F2), do đó khơng cần sử
dụng các thành phần từ thành phần thứ 3 (F3) trở đi để trình bày tập hợp số liệu cảm quan đã thu
thập.

6|Page


Dựa vào sự phân bố các thuộc tính cảm quan có thể chia các thuộc tính này thành 2 vùng
riêng biệt. thuộc tính đồng nhất nằm xa trục F1 thành phân chính thứ nhất nên thuộc tính này ít
ảnh hướng đến thành phần chính thứ nhất. Thuộc tính mùi chanh dây nằm cạnh trục F2 (thành
phần chính thứ 2) nên thành phần chính thứ 2 phụ thuộc nhiều vào thuộc tính mùi chanh dây.
Ngồi ra, các thuộc tính như mùi gấc, mùi chanh dây, độ sánh và màu đỏ cam gần trục F1. Như
vậy, thành phần chính thứ 1 chịu ảnh hưởng nhiều nhất bởi thuộc tính mùi gấc, mùi chanh dây và
độ sánh. Bên cạnh đó, các thuộc tính nằm gần nhau có mối liên hệ thuận với nhau (như thuộc tính
mùi gấc và mùi chanh dây), nhóm thuộc tính nằm khác phía nhau (180o) có mối liên hệ nghịch
đảo với nhau và các thuộc tính nằm cách nhau 90o thì khơng có liên hệ với nhau.

7|Page


Khi thể hiện các mẫu nước ép gấc-chanh dây và các thuộc tính cảm quan trên đồ thị, các
mẫu nước ép gấc-chanh dây có vị trí gần nhau thì có thuộc tính cảm quan tương tự nhau. Sự phân
tán mẫu trên đồ thị Hình 3 cho thấy các mức độ tỷ lệ phối chế với các mức khối lượng dịch quả
chanh dây bổ sung khác nhau có ảnh hưởng rất lớn đối với tính chất cảm quan của sản phẩm.
Nhóm mẫu có khối lượng dịch chanh dây bổ sung 50g được đánh giá là có độ sánh cao, khơng có
vị ngọt hay vị chua. Đây là nhóm mẫu có tỷ lệ phối chế với hàm lượng gấc cao hơn hàm lượng
chanh dây rất nhiều. Nhóm các mẫu có lượng dịch chanh dây phối chế là 150g là nhóm được đánh

giá có vị chua ngọt hài hịa và mùi chanh dây vừa phải đặc trưng cho sản phẩm. Đây là nhóm sản
phẩm được các cảm quan viên ưa thích.

8|Page


4. Tính ứng dụng của phương pháp PCA đối với thực tiễn nghiên cứu
Đánh giá cảm quan phân tích mơ tả và nghiên cứu sự yêu thích của người tiêu dùng là yếu
tố then chốt cho việc giới thiệu thành công các sản phẩm thực phẩm mới và giám sát đáng tin cậy
các sản phẩm thực phẩm hiện có trên thị trường. Từ nghiên cứu này, các thuộc tính cảm quan
quan trọng quyết định chất lượng của nước ép gấc- chanh dây là trạng thái (độ sánh và độ đồng
nhất), màu sắc (đỏ cam) và mùi vị (mùi gấc, mùi chanh dây). Kết hợp các phương pháp thống kê
PCA và hồi quy Logistic các dữ liệu yêu thích sản phẩm cho thấy tiện ích của chúng trong xác
định các thuộc tính cảm quan của sản phẩm nước ép gấc – chanh dây có giá trị cảm quan và hàm
lượng các hợp chất sinh học cao nhất
II. NHẬN DẠNG KHUÔN MẶT CÓ BIẾN ĐỔI VỀ SẮC THÁI

9|Page

-

Tên đề tài: Đánh giá hiệu năng của phương pháp phân tích thành phần chính PCA
trong nhận dạng khn mặt có biến đổi về sắc thái.

-

Tác giả đề tài: Dương Ngọc Vân Khanh, Nguyễn Bảo Ân – Trường đại học Trà
Vinh.

-


Đơn vị đăng bài: Tạp chí khoa học trường Đại học Trà Vinh số 30

-

Thời gian: Tháng 6 năm 2018


-

Nội dung đề tài: Bài báo này trình bày một số đánh giá dựa trên phương pháp nhận
dạng toàn phần trên mặt người có biến đổi về sắc thái, sử dụng phương pháp rút
gọn số chiều PCA và các thuật tốn phân lớp.

1. Đặt vấn đề
Nhận dạng khn mặt (facial recognition) là một bài toán tiêu biểu của học máy (machine
learning) và nhận dạng mẫu (pattern recognition). Thao tác nhận dạng thường được cài đặt bằng
một thuật toán phân lớp (classification) dưới mơ hình học có giám sát (supervised learning). Một
cách tổng quát, ảnh đầu vào luôn chịu ảnh hưởng bởi một hoặc nhiều sự biến đổi so với ảnh được
lưu trong cơ sở dữ liệu. Một số biến đổi có thể kể đến là điều kiện ánh sáng (illumination
variation – trong đó bao gồm hướng và cường độ của nguồn sáng), góc chụp (pose variation),
trang điểm (make-up), tuổi tác (aging), biểu cảm của khuôn mặt (facial expression), … Các
nghiên cứu nhận dạng mặt người đều cố gắng thích nghi với nhiều sự biến đổi nhất có thể. Bài
báo này trình bày kết quả việc ứng dụng phương pháp phân tích thành phần chính (PCA) trong
rút gọn số chiều dữ liệu để nhận dạng khn mặt người có biến đổi về sắc thái với nhiều thuật
toán phân lớp khác nhau. Kết quả cho thấy khi xử lí rút gọn số chiều bằng PCA, thuật toán
phân lớp K-nearest neighbors (KNN) (với k=1) cho kết quả trong tập dữ liệu kiểm thử tốt
hơn so với thuật toán Support Vector Machine (SVM) trong hầu hết thí nghiệm.
2. Mục đích nghiên cứu
Bài báo này nhằm đánh giá hiệu năng của phương pháp PCA và so sánh giữa thuật toán

KNN và SVM trong phân lớp dữ liệu mặt người có biến đổi sắc thái trong một số kịch bản khác
nhau.
3. Dữ liệu và phương pháp nghiên cứu
-

10 | P a g e

Dữ liệu: Dữ liệu thử nghiệm được lấy từ bộ dữ liệu Face Expression Database
(CMU AMP Lab) [9] bao gồm ảnh gương mặt của 13 người khác nhau với nhiều
nét biểu cảm khác nhau, mỗi người có 74 ảnh với kích thước 64×64 pixels (Hình
2).


-

Phương pháp nghiên cứu: ứng dụng phương pháp phân tích thành phần chính
Principal Component Analysis (PCA) trong rút gọn số chiều dữ liệu để nhận dạng
khn mặt người có biến đổi về sắc thái với nhiều thuật toán phân lớp khác nhau.

4. Kết quả bài nghiên cứu và thảo luận
a. Lựa chọn số eigen vector tối ưu cho PCA
Để chọn số eigenvector tối ưu cho PCA, bài nghiên cứu đã thử nghiệm thay đổi số
eigenvectors từ 2 đến 30 và sử dụng hai thuật toán KNN và SVM để phân lớp và được kết quả
như trong Hình 5. Thực nghiệm cho thấy PCA không cần quá nhiều eigenvectors để tái tạo dữ
liệu nhưng vẫn đảm bảo tính chính xác của phép phân lớp. Trong tất cả 64 eigenvector có được
từ bộ dữ liệu đào tạo, với thuật toán KNN, ta chỉ cần sử dụng 4 vectors để có được kết quả tốt
nhất, tuy nhiên với thuật toán SVM khi tăng số eigenvector lên trên 10 vectors, hiệu năng phân
lớp sẽ giảm dần.

11 | P a g e



a. Các đánh giá hiệu năng trên tập dữ liệu không đầy đủ
Để đánh giá hiệu năng của PCA trên các bộ dữ liệu khn mặt khơng hồn chỉnh và với
các thuật toán phân lớp khác nhau, bài nghiên cứu tạo các bộ dữ liệu khuôn mặt mới dựa vào tập
dữ liệu AMP. Trong đó, tất cả các ảnh sẽ được che một phần bằng màu đen hoặc thêm nhiễu ngẫu
nhiên theo cả hai hướng đứng và ngang, tên và ví dụ các bộ dữ liệu được thể hiện trong Hình 6a
(con số trong tên bộ dữ liệu thể hiện số cột/dòng bị che). Sau khi tạo bộ dữ liệu khơng hồn
chỉnh, chúng tơi thực hiện theo quy trình đã mô tả ở trên và phân lớp theo bằng cả hai thuật tốn
KNN (k=1) và SVM. Độ chính xác của các thao tác thể hiện ở Hình 6. Đối với ảnh bị che theo
chiều ngang, trong cả hai trường hợp khi bị che khoảng 30% phía trên, cả hai thuật tốn đều cho
kết quả trên 90%. Khi tăng phần khn mặt bị che lên đến 50%, độ chính xác của bộ ảnh bị
che bằng nhiễu ngẫu nhiên giảm đi đáng kể, đặc biệt là với thuật tốn SVM. Cịn đối với bộ ảnh
bị che theo chiều dọc bên trái, khi phần bị che lên đến 25%, thuật toán KNN vẫn cho độ chính xác
trên 90%, trong khi SVM chỉ cho độ chính xác khoảng 80%. Nhìn chung, kết quả thực nghiệm
cho thấy thuật toán KNN cho hiệu năng phân lớp khuôn mặt tốt nhất khi k=1 và trong phần lớn
trường hợp KNN đều cho kết quả tốt hơn SVM. Đối với các bộ dữ liệu khn mặt khơng hồn
chỉnh, dễ thấy trường hợp khuôn mặt bị che theo chiều dọc ảnh hưởng lớn đến khả năng phân
lớp hơn trường
12 | P a g e


hợp vùng khuôn mặt bị che theo chiều ngang và vùng bị che bằng nhiễu ngẫu nhiên sẽ ảnh hưởng
lên hiệu năng phân lớp lớn hơn so với bị che bằng màu đen.

5. Đánh giá bài nghiên cứu
Bài báo này trình bày một phương pháp hữu hiệu để nhận dạng khn mặt có độ chính xác
đáng kể khi thực thi trên bộ dữ liệu khn mặt có biến đổi về sắc thái. Thực nghiệm chứng tỏ khi
sử dụng PCA để rút gọn số chiều và đưa dữ liệu gốc về một khơng gian ít chiều hơn, phân bố của
dữ liệu vẫn đảm bảo tính biến thiên như kỳ vọng. Đặc biệt với bộ dữ liệu ảnh có biến đổi về sắc

thái khuôn mặt, dữ liệu được rút gọn thuộc các lớp khác nhau phân bố ở các cụm rất rõ ràng và
tách biệt trong không gian mới, điều này giúp tăng hiệu quả phân lớp so với trong không gian
gốc. Khi tiến hành phân lớp với hai thuật toán KNN và SVM, thuật toán KNN với k =1 cho kết
quả tốt trong hầu hết trường hợp. Sau khi thực hiện PCA, độ phức tạp tính tốn giảm đi đáng kể
(với bộ dữ liệu thử nghiệm, có thể giảm từ 4096 chiều về ba chiều), nhờ đó có thể dễ dàng cài
đặt ở các thiết bị có hiệu năng tính tốn thấp và cần thời gian đáp ứng nhanh. Tuy hiệu năng phân
lớp ở các
13 | P a g e


trường hợp dữ liệu khơng hồn chỉnh vẫn chưa cao nhưng sự kết hợp giữa PCA và KNN vẫn là
một cách tiếp cận rất đáng quan tâm nghiên cứu như một mơ hình tham chiếu trong các nghiên
cứu nhận dạng mặt người.
III.

ĐÁNH GIÁ CẢM QUAN SẢN PHẨM HÀNH TÍM CHIÊN CHÂN KHÔNG
- Tên đề tài: Ứng dụng phương pháp phân tích thành phần chính, giản đồ yêu thích
và cata trong đánh giá cảm quan sản phẩm hành tím chiên chân không
-

Tác giả đề tài: Ngô Văn Tài và Nguyễn Minh Thủy

-

Đơn vị đăng bài: Tạp chí khoa học Trường Đại học Cần Thơ

-

Thời gian: 16/4/2018


1. Giới thiệu
Trong nghiên cứu này sử dụng phương pháp nghiên cứu phân tích thành phần chính PCA,
lập giản đồ yêu thích của người tiêu dùng, kết hợp các phương pháp xử lí số liệu CATA (check
all that apply) để mơ tả các thuộc tính cảm quan của sản phẩm hành tím chiên chân khơng. Lát
hành được chiên ở nhiệt động 100-130 độ C trong khoảng thời gian 6-10 phút áp suất 620mmHg.
Chín sản phẩm chiên ở các điều kiện khác nhau được đánh giá bởi 50 người tiêu dùng với 8 thuộc
tính cảm quan về màu, mùi và vị. Dữ liệu được phân tích bằng phương pháp PCA đã xác định tám
thành phần chính quan trọng chiếm hơn 90% tích lũy phương sai. Hành tím chiên ở 120 độ trong
10 phút được đánh giá cảm quan tốt hơn các mẫu khác. Câu hỏi trong phương pháp CATA bao
gồm các hiểu biết về đặc tính cảm quan và độ yêu thích sản phẩm. Kết quả cho thấy tiện ích của
các sản phẩm phân tích để xác định các thuộc tính cảm quan của sản phẩm là rất quan trọng cho
sự chấp nhận của người tiêu dùng và xác định nhóm khách hàng tiềm năng
2. Cơ sở lí thuyết
Phân tích mơ tả định lượng (QDA - Quantitative Descriptive Analysis) là một kỹ thuật
phân tích hiệu quả để đánh giá và mơ tả các đặc tính cảm quan của thực phẩm theo phương pháp
QDA, các thuộc tính sản phẩm được mô tả với cường độ cụ thể cho sản phẩm và được xác định
bằng cách sử dụng cảm giác của các giác quan bởi các cảm quan viên (Murray et al., 2001). Phân
tích thành phần chính (PCA) là một trong những phương pháp phân tích dữ liệu đa biến đơn giản
nhất và là một công cụ được sử dụng rộng rãi trong đánh giá cảm quan (Borgognone et al., 2001).
QDA và PCA đã được sử dụng để mô tả các thuộc tính cảm quan với mức độ thành công lớn
trong nhiều sản phẩm thực phẩm. Áp dụng CATA để đánh giá việc chấp nhận sản phẩm, xác
định các thuộc tính cảm quan liên quan đến sở thích chung của người tiêu dùng với mơ hình biến
phụ thuộc là biến nhị phân (chấp nhận hoặc không được chấp nhận). Nghiên cứu đã áp dụng
PCA, CATA cho việc phân tích giá trị cảm quan quan trọng và các sở thích của người tiêu
dùng đối với sản phẩm hướng đến phát triển cơng thức tối ưu và sự hài lịng của khách hàng.
14 | P a g e


Phân tích thành phần chính (PCA) là một kỹ thuật thống kê phân tích đa biến được sử dụng
rộng rãi mà có thể áp dụng cho dữ liệu QDA (chuẩn bị thuộc tính với các điểm mơ tả thuộc tính)

để giảm tập hợp các biến phụ thuộc (gọi là thuộc tính) đến một tập hợp dữ liệu nhỏ hơn của các
biến cơ bản (gọi là yếu tố) dựa trên mô hình của tương quan giữa các biến ban đầu.
3. Nghiên cứu và phân tích thực tế
Sản phẩm hành tím chiên chân khơng được đánh giá các thuộc tính như màu trắng, màu
tím, màu vàng, độ giịn, mùi hăng cay, mùi thơm hành. Sản phẩm được đánh giá theo phương
pháp mô tả định lượng (QDA), và được phân tích theo phương pháp phân tích thành phần chính
(PCA). PCA xác định số lượng thành phần chính cần thiết để biểu diễn dữ liệu. Từ kết quả phân
tích cho thấy sản phẩm có thể được biểu diễn qua 8 thành phần chính (từ F1 đến F8). Tuy nhiên,
biểu đồ “Srcee plot” thể hiện thứ tự giảm dần về độ lớn của các giá trị riêng (Eigenvalue) và giá
trị phần trăm tích lũy của phương sai. Các thành phần cần phải mô tả được ít nhất 80% phần trăm
tích lũy của phương sai (Shi et al., 2002). Trong trường hợp này, hai thành phần 1 và 2 có giá trị
riêng lớn hơn 1 và chiếm 80,71% tích lũy phương sai.

Thành phần thứ 3 và 4 có tương tác rất nhỏ so với biến, có thể nhận biết qua đường cong tích lũy
phương sai khơng có sự thay đổi nhiều. Bên cạnh đó, có sự giảm mạnh độ lớn của giá trị riêng
thành phần thứ 3 và thành phần thứ 4. Độ lớn của thành phần thứ 3 đến thành phần thứ 8 rất nhỏ
so với thành phần thứ 1 và thành phần thứ 2, do đó khơng cần sử dụng các thành phần từ thành
phần thứ 3 trở đi để trình bày tập hợp số liệu cảm quan đã thu thập.

15 | P a g e


Từ kết quả thu được, thành phần chính thứ 1 (F1) và thứ 2 (F2) được xây dựng trên tương
tác với các thuộc tính cảm quan và thể hiện ở phương trình 1 và 2. F1 = –0,043 Độ giịn – 0,439
Màu tím – 0,434 Màu trắng + 0,429 Màu vàng – 0,229 Mùi hăng cay + 0,330 Mùi thơm hành
chiên + 0,447 Vị đắng – 0,268; Vị ngọt (1) F2= = –0,675 Độ giịn – 0,075 Màu tím – 0,106 Màu
trắng – 0,172 Màu vàng + 0,516 Mùi hăng cay – 0,131 Mùi thơm hành chiên + 0,007 Vị đắng –
0,463 Vị ngọt (2) Mối liên hệ giữa các thuộc tính và các thành phần các thuộc tính cảm quan
được thể hiện ở hình trên. Dựa vào sự phân bố các thuộc tính cảm quan, có thể chia các thuộc tính
này thành 3 vùng riêng biệt. Vùng 1 có thuộc tính mùi hăng cay và vị ngọt nằm xa trục X (thành

phần chính thứ nhất) nên thuộc tính này ít có ảnh hưởng đến thành phần chính thứ nhất. Vùng
2 có thuộc tính độ giịn nằn cạnh trục Y (thành phần chính thứ 2) nên thành phần chính thứ 2 phụ
thuộc nhiều vào thuộc tính độ giịn.

16 | P a g e


Vùng 2 bao gồm các thuộc tính vị đắng, mùi thơm hành chiên, màu tím, màu trắng và màu
vàng gần trục X. Trong đó, trạng thái màu tím và màu trắng có giá trị nhỏ hơn so với thuộc tính
vị đắng, mùi thơm hành chiên và màu vàng. Như vậy, thành phần chính thứ 1 chịu ảnh hưởng
nhiều nhất bởi thuộc tính màu vàng, vị đắng và mùi thơm hành chiên. Bên cạnh đó, các thuộc tính
nằm gần nhau có mối liên hệ thuận với nhau (như thuộc tính mùi thơm hành chiên và màu vàng),
nhóm thuộc tính nằm khác phía nhau (180°) có mối liên hệ nghịch đảo với nhau và các thuộc tính
nằm cách nhau 90° thì khơng có liên hệ với nhau (Cequeet al., 2015). Khi thể hiện các mẫu
hành tím chiên chân khơng và các thuộc tính cảm quan trên đồ thị, các mẫu hành tím chiên có vị
trí gần nhau thì có thuộc tính cảm quan tương tự nhau. Sự phân tán mẫu trên đồ thị Hình 3 cho
thấy các chế độ chiên với các mức thời gian chiên khác nhau có ảnh hưởng rất lớn đối với tính
chất cảm quan của sản phẩm. Nhóm mẫu 15 và 16 được đánh giá là có màu vàng nâu, có vị hơi
đắng có mùi thơm của hành chiên và sản phẩm có độ giịn. Đây là nhóm mẫu có thời gian chiên
dài và có nhiệt độ chiên cao. Mẫu 6 (chiên ở nhiệt độ thấp hơn và thời gian ngắn) gần với thuộc
tính có mùi hăng cay, cho thấy mẫu này vẫn còn mùi hăng cay của hành đây là thuộc tính khơng
mong muốn.
4. Tính ứng dụng của phương pháp PCA đối với thực tiễn nghiên cứu
Sử dụng phương pháp PCA và các phương pháp khác cho thấy tiện ích của chúng trong
xác định các thuộc tính cảm quan quan trọng của sản phẩm hành tím chiên chân không và sự chấp
nhận của người tiêu dùng. Kết quả đạt được có thể giúp doanh nghiệp, người lãnh đạo tổ chức xây
17 | P a g e


dựng được cơng thức chế biến sản phẩm hành tím chiên chân không tốt hơn trong các giai đoạn

nghiên cứu kế tiếp.

18 | P a g e


PHẦN B: ỨNG DỤNG PHƯƠNG PHÁP PHÂN TÍCH THÀNH PHẦN CHÍNH (PCA) ĐỂ
PHÂN TÍCH NHỮNG ĐẶC ĐIỂM TRONG TÍNH CÁCH MỖI CÁ NHÂN SẼ ẢNH
HƯỞNG NHƯ THẾ NÀO ĐẾN MỨC CĂNG THẲNG VỀ TÂM LÝ VÀ SỰ TỰ TIN VÀO
NĂNG LỰC BẢN THÂN TRONG THỜI GIAN CÁCH LY VÌ COVID-19
I.

Tổng quan về nghiên cứu

1. Lý do chọn đề tài
Đã hơn 3 năm kể từ khi cái tên “Đại dịch Covid-19” bắt đầu xuất hiện và trở thành nỗi
khiếp sợ đối với toàn nhân loại. Do mức độ lây lan nhanh chóng, diễn biến khó lường và tỉ lệ tử
vong của bệnh nhân vô cùng lớn, Covid-19 đã buộc mọi người trên khắp thế giới phải ở nhà và tự
cách ly với xã hội. Với đặc thù là một loài sử dụng khả năng giao tiếp xã hội để phát triển bản
thân, việc ở quá lâu trong một không gian nhỏ và gị bó đã kéo theo một số hậu quả tâm lý vô
cùng tiêu cực đối với mỗi cá thể lồi người.
Để ngăn chặn những hệ quả khơng mong muốn đó tái diễn, nhóm chúng em đã lựa chọn
bộ dữ liệu và phân tích đề tài “Ứng dụng phương pháp phân tích thành phần chính (pca) để phân
tích những đặc điểm trong tính cách mỗi cá nhân sẽ ảnh hưởng như thế nào đến mức căng thẳng
về tâm lý và sự tự tin vào năng lực của bản thân trong thời gian cách ly vì covid-19” nhằm bảo vệ
và phát triển các điểm mạnh trong tính cách để duy trì sức khỏe tinh thần và sự tự tin vào năng
lực bản thân để đề phịng và đối phó với những tình huống tương tự trong tương lai.
2. Mục đích nghiên cứu
Vận dụng các kiến thức, mơ hình và các yếu tố thực tế, kết quả phân tích sẽ cho thấy
những yếu tố nào tác động nhiều nhất đến tâm lý mỗi cá nhân, từ các đặc điểm trong tính cách.
Qua đó, đưa ra những đánh giá để phát triển điểm mạnh, khắc phục điểm yếu từ bên trong suy

nghĩ mỗi con người trước các vấn đề về tâm lý.
3. Đối tượng và phạm vi nghiên cứu
-

Đối tượng nghiên cứu:

o Đặc điểm trong tính cách mỗi cá nhân
o Mức căng thẳng về tâm lý
o Sự tự tin vào năng lực của bản thân
19 | P a g e

Phạm vi nghiên cứu


o Khơng gian: Người dân Italia (tuổi trung bình = 37,24 tuổi)
o Thời gian: Một tháng sau khi lệnh phong toả toàn quốc bắt đầu từ 10/3/2020
4. Phương pháp nghiên cứu

II.

-

Phương pháp định lượng: Sử dụng công cụ nghiên cứu (phần mềm R), thực hiện
phân tích thành phần chính (PCA) và kiểm định các tham số trong các mơ hình để
kiểm tra độ phù hợp của những mơ hình ước lượng. Sau khi kiểm định bằng phần
mềm hoàn tất, tiến hành đưa ra đánh giá và kiến nghị.

-

Phương pháp mô tả bảng biểu, sơ đồ: Sử dụng các loại bảng biểu, sơ đồ nhằm biểu

diễn các kết quả nghiên cứu.

Phân tích những đặc điểm trong tính cách mỗi cá nhân sẽ ảnh hưởng như thế nào
đến mức căng thẳng về tâm lý và sự tự tin vào năng lực của bản thân trong thời
gian cách ly vì Covid-19 bằng phương pháp PCA

1. Giới thiệu bộ dữ liệu
Gồm 944 quan sát với 27 biến, được thu thập qua khảo sát trực tuyến bằng bảng hỏi
Biến

Ý nghĩa

Ký hiệu

Appreciation_of_beauty Khả năng nhận định về vẻ đẹp

b1

Bravery

Sự dũng cảm

b2

Creativity

Sự sáng tạo

b3


Curiosity

Trí tị mị

b4

Fairness

Sự cơng bằng trong xử lý các vấn đề

b5

Forgiveness

Lòng vị tha

b6

Gratitude

Lòng biết ơn

b7

Honesty

Tính trung thực

b8


Hope

Sự kỳ vọng

b9

Humilty

Tính khiêm tốn

b10

20 | P a g e



×