Tiểu luận môn phương pháp nghiên cứu khoa học ứng dụng partial least squares (PLS) vào phân tích đa nhóm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (279.22 KB, 14 trang )

ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Khoa Khoa Học và Kỹ Thuật Máy Tính

Ứng dụng Partial Least Squares (PLS) vào
phân tích đa nhóm

GVHD: TS. Nguyễn Văn Minh Mẫn
SVTH: Nguyễn Thiện Khánh – 7140241
Đỗ Duy Quốc – 7140255
Hoàng Quốc Nam – 7140247

TP.HỒ CHÍ MINH, THÁNG 5/2015

Mục lục

I

Tóm tắt nội dung.
Bài viết tập trung vào các ứng dụng của một vấn đề nghiên cứu rất phổ biến

trong marketing: phân tích sự khác biệt giữa các nhóm cấu trúc quan hệ. PLS path
modeling có một số ưu điểm so với covariance-based structural equation modeling
(CBSEM) liên quan đến loại vấn đề nghiên cứu - đặc biệt là trong sự hiện diện của các
chỉ số hình thành, vài sự công bố sử dụng phương pháp này. Do đó báo này trình bày
một mô hình điển hình để kiểm tra hiệu quả của các hoạt động corporate-level
marketing trên danh tiếng doanh nghiệp như là một xây dựng trung gian và cuối cùng,
về lòng trung thành của khách hàng. Được dùng để kiểm tra thực nghiệm sự khác biệt
giữa các bên liên quan trong một mẫu từ ngành công nghiệp truyền thông di động của

Đức.
I.

Động cơ nghiên cứu
Sự cạnh tranh tăng cao trên thị trường toàn cầu đã buộc các công ty trên khắp

tất cả các ngành công nghiệp phân tích (tiềm năng) cơ sở khách hàng của họ. Việc áp
dụng các chiến lược khác biệt đã xuất hiện như một khả năng đem lại thành công tại
các thị trường bão hòa (Markwick và Fill 1997). Phương pháp tiếp cận phân khúc
khách hàng đã lấy cảm hứng từ nghiên cứu thị trường để phát triển các phương pháp
định lượng để xác định phân khúc khách hàng. Đồng thời, một luồng phát triển của
nghiên cứu đã nhằm mở rộng sự hiểu biết về các yếu tố thành công của tổ chức theo
sản phẩm và định hướng khách hàng (Hall 1992; Markwick và Fill 1997; Wilson
1985; Weigelt và Camerer 1988). Danh tiếng của công ty là một trong những tài sản
vô hình thú vị nhất. Mục đích của bài viết này là để cho thấy rằng mô hình con đường
PLS có thể là một công cụ hữu ích khi câu hỏi là liệu người ta cũng nên phân khúc các
bên liên quan có liên quan trong lĩnh vực quản lý uy tín.
II.

Tổng quan về danh tiếng
1. Khái niệm danh tiếng
Danh tiếng là sự tin cậy của một doanh nghiệp, là một trong những tài sản vô

hình và vô cùng khó khăn để bắt chước. Các công ty phải mất nhiều năm để xây dựng
danh tiếng, nhưng có thể hủy hoại nó chỉ trong chốc lát. Công ty Enron, ngành công
nghiệp kế toán kiểm toán sau vụ Andersen, Wall Street… là những ví dụ nổi bật. Chỉ
3

sau khi quỵ ngã từ đỉnh cao danh vọng, những tổ chức này mới kinh ngạc nhận ra rằng

không gì quý giá hơn một danh tiếng tốt, và không gì phù du hơn một danh tiếng tốt.
2. Ảnh hưởng danh tiếng
Mục tiêu dài hạn của một doanh nghiệp thường không hoàn toàn theo định
hướng tài chính, do đó ảnh hưởng đến một tập hợp các bên liên quan. Uy tín của công
ty là một trong những tài sản vô hình điều đó là vô cùng khó khăn để bắt chước (Hunt
và Morgan 1995). Các tài liệu quy cho nhiều lợi ích tiềm năng của công ty để danh
tiếng "tốt" : Đối với người tiêu dùng (Shapiro 1983; Zeithaml 1988), thì các hàm danh
tiếng như là một cơ chế làm giảm nguy cơ, dẫn đến sự hài lòng của sản phẩm cao hơn
(Aaker 1991 (Kotha et al 2001). ), và cuối cùng là làm tăng lòng trung thành
(Rogerson 1983).
3. Các bên liên quan Quản lý danh tiếng
Việc phân tích các hệ số trong mô hình dự kiến cho phép một ưu tiên chi tiết về
các hoạt động tiếp thị “đòn bẩy trên bốn cấu trúc điều khiển” cấp độ tổng thể cũng như
mức độ chi tiết hơn về các chỉ số hình thành được sử dụng để thực thi các cấu trúc. Vì
nó là bản chất của các bên liên quan để có các lợi ích khác nhau đối với một công ty,
có thể là một số bên liên quan sẽ có xu hướng để cân nhắc các khía cạnh khác nhau
của một công ty (có danh tiếng tốt) và hành vi khác nhau. Hơn nữa, nó có thể là bằng
cách đánh giá các công ty chuyên nghiệp, và do đó trên cơ sở nhận thức nhiều hơn, các
thành phần nhận thức của khía cạnh danh tiếng sẽ có một ảnh hưởng sự thống trị tương
đối về sự hài lòng của khách hàng và lòng trung thành. Tầm quan trọng tương đối ảnh
hưởng của chiều hướng nhận thức danh tiếng so với chiều tác động của nó là chìa khóa
giải thích của mô hình. Điều này là do tầm quan trọng của ảnh hưởng, gây ra một sự
lựa chọn của một số đòn bẩy tiếp thị hơn những cái khác. Nếu các nhóm liên quan
phản ứng khác nhau đối với hoạt động của công ty, điều này hàm ý rằng một công ty
có thể hành động một cách khác biệt và phân khúc cụ thể. Do đó, nhóm các bên liên
quan nên được hiểu như một biến điều hành rời rạc. Điều hành này có thể giải thích
cho sự khác biệt về sức mạnh danh tiếng đòn bẩy '. Việc phân tích sự khác biệt nhóm
thực hiện trong nghiên cứu này tìm cách trả lời hai câu hỏi có tính chất thăm dò:
(1) Trình điều khiển của danh tiếng và sự hài lòng khác nhau tùy thuộc vào các
bên liên quan?

4

(2) Đây có phải là một vấn đề đối với tất cả các bên liên quan và tất cả các
đường trong các mô hình giả thuyết, hoặc là có một số đòn bẩy để quản lý danh tiếng
mà nên được sử dụng chỉ trong các phân nhóm?
4. Sự vận hành và các biện pháp.
Sự vận hành của bốn yếu tố ngoại sinh dẫn tới danh tiếng (“chất lượng” , “hiệu
suất”, “sự hấp dẫn”, và “trách nhiệm cộng đồng”) dựa trên nghiên cứu trước đây của
Schwaiger (2004) cũng như Eberl và Schwaiger (2005), trong đó một thủ tục tương tự
như phương pháp tiếp cận của Rossiter C-OAR-SE đã được áp dụng (Rossiter 2002)..
Trong các bài phỏng vấn với các chuyên gia đến từ nhiều lĩnh vực, danh tiếng của
công ty đã được định nghĩa một cách ngắn gọn và thảo luận, đảm bảo một sự hiểu biết
chung về danh tiếng và các cấu trúc chất lượng, hiệu suất, sự hấp dẫn và trách nhiệm
cộng đồng. Các chuyên gia sau đó được yêu cầu phải có một tầm nhìn rộng về tổ chức
môi trường và nghĩ về những khía cạnh có thể đưa danh tiếng công ty của họ đạt được
bốn yếu tố về chất lượng tổ chức, khía cạnh hiệu suất, sự hấp dẫn của công ty, và hành
vi trách nhiệm của mình. Sau khi tìm thấy 21 mục trong 4 mục tiêu cần xây dựng,
người ta thấy rằng 21 chỉ số phải được chỉ rõ yếu tố cấu thành. Không có gì đáng ngạc
nhiên, vì mục tiêu của bài phỏng vấn chuyên gia là để xác định hướng đi. Điều này
cũng là phù hợp với mục tiêu mô hình chất lượng, hiệu suất, sức hấp dẫn và trách
nhiệm xã hội hướng tới xây dựng danh tiếng cho đoàn thể và cuối cùng là để xác định
ra đòn bẩy quan trọng (tức là các chỉ số). Do đó các biện pháp nắm bắt đánh giá của
các bên liên quan của 21 đòn bẩy cho các hoạt động tiếp thị của công ty và có thể được
sử dụng như các biến đầu vào đối với quản lý danh tiếng và kiểm soát.
Một cách trực giác, một công ty có thể thẳng thắn trong việc công khai thông
tin cho công chúng, đồng thời không nhất thiết phải hành xử một cách có ý thức xã hội
(trong mắt các bên liên quan). Vì vậy những chỉ số cần không nhất thiết phải tương
quan từ một quan điểm lý thuyết. Lập luận tương tự áp dụng cho phần còn lại của các
chỉ số.

Tất cả các mục trong nghiên cứu được đánh giá trong thang điểm 7. Tuy nhiên,
đánh giá lại các đặc điểm kỹ thuật của các cấu trúc sự yêu mến, năng lực, sự hài lòng
của khách hàng, và lòng trung thành thông qua các cuộc phỏng vấn chuyên gia không
thể xác minh rằng các biện pháp phải được quy định trong một mô hình cấu tạo.

5

III.

Tổng quan về Partial Least Squares (PLS)
1 Khái niệm partial least squares
Partial Least Squares là một kỹ thuật được sử dụng rộng rãi trong lĩnh vực hóa

học, đặc biệt là trong trường hợp mà số lượng các biến độc lập lớn hơn nhiều so với số
lượng dữ liệu. PLS được phát triển vào năm 1960 bởi Herman Wold là một kỹ thuật
kinh tế lượng. PLS đã được áp dụng để giám sát và kiểm soát quá trình công nghiệp.
Là một phương pháp tối ưu hóa để lựa chọn một đường khớp nhất cho một dải
dữ liệu ứng với cực trị của tổng các sai số thống kê (error) giữa đường khớp và dữ
liệu.
Phương pháp này giả định các sai số (error) của phép đo đạc dữ liệu phân phối
ngẫu nhiên. Định lý Gauss-Markov chứng minh rằng kết quả thu được từ phương pháp
bình phương tối thiểu không thiên vị và sai số của việc đo đạc dữ liệu không nhất thiết
phải tuân theo.
5. Các ký hiệu và thuật ngữ
Định nghĩa 1: Cho X = [x1 … xm] là ma trận n x m. Ta có
Với là giá trị trung bình của xi.
Định nghĩa 2: Cho X là một ma trận trung bình n x m và Y là một ma trận trung
bình n x p. Ma trận hiệp phương sai được xác đinh như sau:
Giá trị phương sai X được xác định như sau

Sự tương quan giữa hai ma trận X và Y được định nghĩa bởi công thức sau
(1)
6. Vấn đề với Ordinary Least Squares (OLS)
Để hiểu rõ động lực vì sao PLS được sử dụng trên dữ liệu nhiều chiều trong
lĩnh vực nghiên cứu hóa học, điều quan trọng là phải hiểu được bằng cách nào và tại
sao phương pháp bình phương tối thiểu (Ordinary Least Squares - OLS) thất bại trong
trường hợp chúng ta có một số lượng lớn các biến độc lập và chúng có mối tương quan
cao. Sau đây ta sẽ tìm hiều chi tiết về phương pháp OLS.
Cho ma trận X và vector kết quả y, giá trị ước lượng bình phương tối thiểu cho
bộ thông số β trong mô hình tuyến tính
được cho bởi phương trình tiêu chuẩn sau
6

(2)
Cho 2 vector u và v được gọi là trực giao nếu <u,v> = 0. Một tập hợp các vector
được gọi là trực giao nếu tất cả các cặp vector trong tập đó là trực giao. Một ma trận
được gọi là trực giao nếu tập hợp các cột vector của nó là trực giao.
Cho ma trận trực giao X, ta có
Trực giao hóa một ma trận X = [x1 x2 … xm] có thể được thực hiện bằng cách sử
dụng quá trình Gram-Schmidt

Thủ tục biến đổi X vào trong ma trận trực giao U = [u1 u2 … um ] bằng các bước sau

…

Quá trình Gram-Schmidt cũng cho chúng ta thừa số QR của ma trận X, với Q
được tạo thành từ các vector trực giao u i được chuẩn hóa từ các vector đơn vị, và ma
trận tam giác trên R có được từ hệ số projui(xj).
Nếu các cột vector của ma trận X = [x1 x2 … xm] dưới dạng tập trực giao, và nó

tuân theo công thức (2)
(3)
Vì . Nói cách khác được tạo thành từ các ước lượng đơn biến. Các giá trị trung
bình này khi được đưa vào các biến đã trực giao, chúng sẽ không có hiệu lực trên ước
lượng tham số của nhau trong mô hình.
Một cách để thực hiện hồi quy được gọi là thủ tục Gram-Schmidt cho đa hồi
quy là đầu tiên phân hoạch ma trận X thành X = , với U = [u1 u2 … um] là ma trận trực
giao có được từ thủ tục Gram-Schmidt, and là ma trận tam giác trên được định nghĩa
bởi
và
Với l < j, và sau đó giải quyết các vấn đề hồi quy liên quan bằng công thức (3).
Dưới đây cho thấy mối quan hệ giữa α và β trong Xβ = y:
vì , ta có
(4)

7

Vì bất kỳ xj nào cũng có thể được chuyển vào vị trí cuối trong ma trận X, đẳng
thức (4) cho ta vài thông tin hữu ích: hệ số hồi quy β(j) của x j là ước lượng đơn biến
của hồi quy y trên phần còn lại của hồi quy x j trên x1, x2, …, xj - 1, xj + 1, …, xn. Bằng
trực quan, β(j) đại diện cho sự đóng góp thêm của x j trên y, sau khi xj đã được hiệu
chỉnh cho x1, x2, …, xj - 1, xj + 1, …, xn. Từ những điều trên, chúng ta có thể thấy bằng
cách nào đa hồi quy tuyến tính có thể bị thất bại trong thực tế. Nếu x n có mối tương
quan cao với một vài x k khác, các vector un còn lại sẽ tiến về 0 và từ công thức (4), hệ
số hồi quy β(m) sẽ không ổn định. Thật vậy, điều này là đúng đối với tất cả các biến
trong tập tương quan.
7. Partial Least Squares
Với ma trận X là ma trận đầu vào mà ma trận Y là ma trận kết quả, phân hoạch
ma trận X và Y ta được như sau

(5)

,

Và sau đó tiến hành hồi quy giữa T và U. Nếu chúng ta làm các phép phân tách
trên X và Y một cách độc lập sử dụng NIPALS, chúng ta nhận được hai bộ quy tắc cập
nhật sau:
t := xj for some j
loop
p := XTt/|XTt|
t := Xp
Until t stop changing

u := yj for some j
loop
q := YTu/|YTu|
u := Yq
Until u stop changing

Ý tưởng của PLS là muốn sự phân tách trên X và Y được hoàn thành bằng cách
lấy thông tin lẫn nhau trong khi tính toán. Một cách trực quan để đạt được điều đó là
hoán đổi t và u trong lúc cập nhật cho p và q ở trên và kết hợp 2 luật cập nhật vào
trong một vòng lặp, ta được kết quả như sau
u := yj for some j
loop
p := XTu/|XTu|
t := Xp
q := YTt/|YTt|
u := Yq
Until t stop changing

8

Trong trường hợp khi khối Y chỉ có một biến, chúng ta có thể gán q = 1 và 2
bước cuối cùng của vòng lặp có thể được bỏ qua.
Đối với các thành phần tiếp theo và các vector, đặt
X := X - tpT
Y := Y - uqT
Và sau đó lặp lại tương tự các bước. Sau khi thực hiên l bước, chúng ta có được
hai ma trận T và U kích thước n x l và ma trận P và Q liên hệ với công thức (5). Để có
được một mô hình hồi quy quan hệ giữa X và Y, chúng ta tìm β thích hợp sao cho
U = Tβ
Thay thế kết quả của mô hình vào công thức (5) chúng ta có
Y = UQT = TβQT = XPβQT
Cho bất kỳ giá trị x, chúng ta có thể sử dung P, Q và β để tính toán giá trị y
tương ứng một cách dễ dàng.
Tiếp theo ta có

Với là ma trận hiệp phương sai của Y TX, và U là các vector riêng của nó, và D =
diag(λ1 … λm) là các giá trị riêng của nó như sau λ 1 > λ2 > … > λm. Chúng ta thấy rằng
ma trận P trong công thức (5) được chọn sao cho
cov(YTXP, YTXP) = D.
Chúng ta có thể thấy rằng q là một vector riêng của (X TY)T XTY và tất cả ma trận Q
trong công thức 11 được chọn sao cho
cov(XTYQ, XTYQ) = D’,
với D’ = diag(λ1’ …. λk’), λ1’ > λ2’ > …. > λk’ là các giá trị riêng của ma trận hiệp
phương sai của XTY.

9

8. PLS Path Modeling
PLS Path Modeling là một quy trình ước lượng dựa trên phương pháp tiếp cận
từng phần để mô hình hóa phương trình cấu trúc.
PLS Path Modeling bao gồm hai mô hình con: mô hình đo lường và mô hình
cấu trúc. Mô hình đo lường biểu diễn cho mối quan hệ giữa các dữ liệu quan sát và
các biến tiềm ẩn . Mô hình cấu trúc biểu diễn cho mối quan hệ giữa các biến tiềm ẩn.
Một thuật toán lặp giải quyết các mô hình phương trình cấu trúc bằng các ước
lượng các biến ẩn bằng cách sử dụng các phép đo và mô hình cấu trúc trong các bước
xen kẽ, đo dó thủ tục này có tên gọi là “Từng phần”. Các mô hình đo lường ước tính
các biến ẩn như một tổng trọng số của các biến thể hiện của nó. Các mô hình cầu trúc
ước tính các biến ẩn bằng ý nghĩa của mô hình hồi quy tuyến tính đơn hay đa chiều
giữa các biến ẩn đươch ước tính bởi mô hình đo lường. Thuật toán này được lặp đi
lặp lại đạt được giá trị hội tụ.
9. PLS Path Regression
Mô hình hồi quy bình phương tối thiểu từng phần là một phương pháp thông
kê mà có một số mối quan hệ với hồi quy thành phần chính. Thay vì tìm siêu phăng
phương sai tối thiểu giữa các kết quả và các biến độc lập, nó tìm một mô hình hồi quy
tuyến tính bằng cách chiếu các biện dự báo và các biến quan sát vào một không gian
mới. Bởi vì cả dữ liệu X và Y đều được chiếu vào không gian mới, các phương pháp
PLS được gọi là mô hình nhân tố bilinear. PLS hồi quy đặc biệt phù hợp khi ma trận
của các yếu tố dự báo có nhiều biến hơn so với quan sát, và khi có đa cộng tuyến giữa
các giá trị X.

Hình 1. Minh họa về mô hình phân tích hồi quy.
10

IV.

Ứng dụng PLS vào phân tích đa nhóm
1 Thị trường truyền thông di động của Đức
Mô hình này đã được thử nghiệm trên thị trường truyền thông di động ở Đức

trên bốn nhà cung cấp dịch vụ lớn. Cùng với nhau, họ có hơn 71 triệu khách hàng với
tỷ lệ thâm nhập thị trường trong năm 2004 là khoảng 82%. Thị trường trở nên bảo hòa.
Đã có một sự suy giảm giá mạnh kể từ đầu năm 2003. Khả năng cạnh tranh của thị
trường tăng vì vậy lòng trung thành của khách hàng là một vấn đề quan trọng trong
ngành công nghiệp này. Đổi mới sản phẩm và lợi thế cạnh tranh dựa trên sản phẩm là
điều rất khó. Vì vậy, hoạt động của công ty cấp là một khả năng quan trọng cho sự
khác biệt. Các công ty trên thị trường do đó phải đối mặt với những câu hỏi về cách
thức hoạt động khác nhau mà họ có thể thực hiện có thể ảnh hưởng đến các nhóm liên
quan khác nhau.
10. Mẫu số liệu thống kê
Dữ liệu được thu thập bằng các cuộc bài phỏng vấn CATI vào tháng 2 năm
2005. Các đối tượng đánh giá các chỉ số của danh tiếng (ví dụ năng lực và sự yêu
thích) và các cấu trúc điều khiển của 4 nhà cung cấp dịch vụ trên thang 7 điểm. Mỗi
người được phỏng vấn được hỏi về sự hài lòng của mình với lòng trung thành đối với
nhà cung cấp dịch vụ của mình. Khách hàng được lựa chọn ngẫu nhiên từ cộng đồng,
trong khi các nhóm liên quan khác được lựa chọn ngẫu nhiên từ các cơ sở dữ liệu
ngành công nghiệp. Số liệu này bao gồm tổng cộng 352 người đại diện cho bốn nhóm
chủ thể quan trọng nhất được xác định bởi: các đại diện của phương tiện truyền thông
(n = 34, 9.7%), chính trị gia (n = 58; 16,5%), cộng đồng tài chính (n = 50; 14,2%), và
những nguời được lựa chọn ngẫu nhiên đại diện cho công chúng và khách hàng (n =
210; 59,7%).
11. Kết quả cho mô hình tổng thê
Giá trị R2 phản ánh trong việc xây dựng lòng trung thành của khách hàng là
chấp nhận được đối với mô hình tổng thể, cũng như đối với từng mẫu con. Bảng 21.2
Hiển thị danh sách đầy đủ của tất cả các cấu trúc nội sinh và giá trị R 2 của mô hình con
trong các cuộc thảo luận về sự khác biệt giữa các nhóm con. Kết quả cho thấy rằng

quy mô danh tiếng của công ty là những dự báo thực sự tốt của biến ẩn lòng trung

11

thành của khách hàng. Hình 21.2 trình bày các kết quả của mô hình tổng thể con
đường.
Các kết quả của mô hình này cho thấy rằng nhiều hứa hẹn cho các công ty để
tiến hành các hoạt động tiếp thị của công ty cấp với mục đích tối đa hóa sự yêu thích
của khách hàng thay vì năng lực của công ty.

V.

Kết luận và hướng nghiên cứu tiếp
Kết quả của mô hình tổng thể tạo ra một trường hợp tốt cho hiệu quả quản lý

danh tiếng công ty trong giới hạn của mục tiêu khách hàng cụ thể: danh tiếng công ty
có một tác động tích cực vào sự hài lòng và lòng trung thành của khách hàng. Do đó
đóng một vai trò quan trọng trong sự khác biệt. Chúng ta có thể củng cố các giả định
lý thuyết liên quan đến những ảnh hưởng tích cực của danh tiếng bằng những phát
12

hiện thực nghiệm. Ngành công nghiệp truyền thông di động là một chủ đề ở mức độ
lớn hơn đến các khía cạnh nhạy cảm của danh tiếng. Một danh tiếng bền vững có thể
cung cấp các phương tiện nào đó để làm giảm bớt những ảnh hưởng từ một cuộc
khủng hoảng lên danh tiếng. Các công ty tìm kiếm đòn bẩy điều khiển cần phải biết
đòn bẩy nào có thể được sử dụng để đạt được điều này. Nghiên cứu này có thể trả lời
câu hỏi này thông qua các ví dụ về các ngành công nghiệp truyền thông di động.
PLS mô hình con đường đã được chứng minh là một công cụ rất mạnh mẽ và

đáng tin cậy cho các loại hình câu hỏi nghiên cứu và nó cho phép một phân tích được
thực hiện về những khác biệt giữa nhóm thậm chí các mẫu tương đối nhỏ.
VI.

Tài liệu tham khảo
- Handbook of Partial Least Squares - Vincenzo Esposito Vinzi, WynneW.

Chin, Jorg Henseler, and HuiwenWang.
- />- />
13

Tiểu luận môn phương pháp nghiên cứu khoa học ứng dụng partial least squares (PLS) vào phân tích đa nhóm

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về