1
LỜI MỞ ĐẦU
2
hướng ứng dụng công nghệ thông tin trong ngành du lịch cũng
đã có những chuyển biến mạnh mẽ với sự xuất hiện các cơng ty
1. Cơ sở hình thành đề tài
kinh doanh dịch vụ du lịch trực tuyến, các ứng dụng đặt tour trên
a) Bối cảnh chung
nền tảng di động và nhiều website, diễn đàn, cổng thông tin xã
Kiểm soát chất lượng đã trở nên quan trọng trong hệ thống quản
hội,... nhằm trao đổi, chia sẻ các chủ đề về du lịch (như
trị doanh nghiệp (Becser và Zoltay-Paprika, 2003). Hiện nay,
TripAdvisor.com.vn, Agoda.com, Booking.com,...). Những áp
việc theo dõi và đánh giá chất lượng thường dựa trên việc khảo
lực cạnh tranh mới trong kỷ nguyên số khiến cho vấn đề kiểm
sát thông tin khách hàng, và được thực hiện bằng những cách
soát và đánh giá chất lượng dịch vụ du lịch càng trở nên quan
thức như: phỏng vấn trực tiếp, phỏng vấn qua điện thoại, thảo
trọng đối với các doanh nghiệp. Tuy nhiên, thực trạng đánh giá
luận nhóm, khảo sát qua thư, khảo sát trực tuyến (tiêu chuẩn ISO
chất lượng dịch vụ du lịch vẫn được thực hiện bằng những cách
10004). Ngày nay, những tiến bộ của công nghệ đã làm thay đổi
thức truyền thống theo hướng dẫn của tiêu chuẩn chất lượng ISO
cách thức truyền thông giúp cho khách hàng dễ dàng truy cập
10004. Những phương pháp này không thể giám sát sự hài lịng
thơng tin và trao đổi ý kiến về sản phẩm và dịch vụ trên một quy
của khách hàng một cách liên tục, và khơng có khả năng theo dõi
mô lớn trong thời gian thực. Với sự bùng nổ của dữ liệu lớn, các
xu hướng chất lượng dịch vụ trong dài hạn (Yussupova và cộng
ý kiến đánh giá của khách hàng trên các nền tảng trực tuyến cần
sự, 2016).
được thu thập, khai thác, phân tích một cách tự động dưới sự hỗ
c) Tình hình nghiên cứu và ứng dụng
trợ của các hệ thống thông tin, cho phép các nhà kinh doanh có
Nghiên cứu xây dựng các hệ thống hỗ trợ ra quyết định trong lĩnh
thể dễ dàng theo dõi hành vi mua sắm, sở thích và đánh giá sự
vực du lịch đã được quan tâm nhiều bởi cộng đồng các nhà khoa
hài lòng của khách hàng về chất lượng sản phẩm và dịch vụ.
học và đã có nhiều hệ thống được đề xuất và sử dụng tại doanh
b) Bối cảnh thực tiễn ngành du lịch
nghiệp trong ngành du lịch. Tuy nhiên, có ít bằng chứng khoa
Sự phát triển của Internet đã cung cấp nhiều phương thức mới để
học cho thấy có những nghiên cứu xây dựng hệ thống hỗ trợ ra
kinh doanh dịch vụ du lịch và quảng bá các sản phẩm cho du
quyết định giúp cho nhà quản trị có thể theo dõi, kiểm sốt và cải
khách. Việc ứng dụng công nghệ thông tin vào du lịch ngày càng
tiến chất lượng dịch vụ du lịch tốt hơn.
mang đến những cơ hội chiến lược và các công cụ mạnh mẽ cho
Những năm gần đây, cộng đồng các nhà khoa học cũng như các
tăng trưởng kinh tế, phân phối lại của cải và phát triển công bằng
nhà quản trị doanh nghiệp đã quan tâm nhiều đến khai thác ý kiến
trên toàn cầu (Masron và cộng sự, 2016). Tại Việt Nam, xu
dựa trên những phản hồi của khách hàng về các chủ đề du lịch
3
nhằm giúp cho nhà quản trị có thể phân tích các khía cạnh dịch
vụ du lịch. Kết quả tổng quan tình hình nghiên cứu cũng đã cho
thấy chưa có nhiều nghiên cứu đi sâu vào ứng dụng của khai thác
4
4) Thực nghiệm xây dựng hệ thống hỗ trợ người dùng đánh
giá và cải tiến chất lượng dịch vụ du lịch.
3. Câu hỏi nghiên cứu
ý kiến để giải quyết các mối quan tâm của doanh nghiệp kinh
1) Những thành phần chức năng đặc trưng của mơ hình hệ
doanh dịch vụ du lịch; và cũng có rất ít bằng chứng khoa học cho
thống hỗ trợ đánh giá chất lượng dịch vụ du lịch dựa trên
thấy có nghiên cứu tiếp cận theo hướng xây dựng hệ thống hỗ trợ
phương pháp khai thác ý kiến cần phải có là gì?
ra quyết định dựa trên ứng dụng phương pháp khai thác ý kiến
2) Các phương pháp khai thác ý kiến nào là phù hợp để sử
của khách hàng từ cộng đồng trực tuyến để hỗ trợ nhà quản trị
dụng trong việc đánh giá chất lượng dịch vụ du lịch dựa
trong việc theo dõi, đánh giá chất lượng dịch vụ du lịch.
Xuất phát từ bối cảnh chung, bối cảnh thực tiễn của ngành du
lịch, tình hình nghiên cứu và ứng dụng như đã trình bày bên trên,
nghiên cứu sinh chọn hướng nghiên cứu Xây dựng hệ thống hỗ
trên bộ dữ liệu thu thập được?
3) Các phương pháp nào để tư vấn cho khách hàng lựa chọn
dịch vụ du lịch là phù hợp?
4) Cần phải làm những gì để xây dựng hệ thống hỗ trợ
trợ đánh giá chất lượng dịch vụ du lịch dựa trên phương
người dùng đánh giá và cải tiến chất lượng dịch vụ du
pháp khai thác ý kiến khách hàng trực tuyến làm đề tài nghiên
lịch?
cứu trong luận án này.
4. Đối tượng và phạm vi nghiên cứu
2. Mục tiêu nghiên cứu
Đối tượng nghiên cứu của luận án là hệ thống hỗ trợ đánh giá
1) Nghiên cứu và đề xuất mơ hình kiến trúc của hệ thống
chất lượng dịch vụ du lịch. Đối tượng nghiên cứu bao gồm ba
hỗ trợ ra quyết định trong đánh giá chất lượng dịch vụ
yếu tố chính là: (i) Bài toán đánh giá chất lượng dịch vụ du lịch;
du lịch, tiếp cận dựa trên phương pháp khai thác ý kiến
(ii) Phương pháp khai thác ý kiến khách hàng trực tuyến; và (iii)
khách hàng trực tuyến.
2) Nghiên cứu và đề xuất phương pháp khai thác ý kiến, hỗ
Mơ hình kiến trúc và các giải pháp kỹ thuật để xây dựng hệ thống
hỗ trợ đánh giá chất lượng dịch vụ du lịch.
trợ cho nhà quản trị trong việc đánh giá chất lượng dịch
Phạm vi nghiên cứu của luận án được giới hạn tập trung vào
vụ du lịch.
loại hình dịch vụ khách sạn. Dữ liệu phục vụ cho nghiên cứu là
3) Nghiên cứu và đề xuất phương pháp tư vấn, hỗ trợ cho
những ý kiến bình luận bằng tiếng Việt của khách du lịch về các
khách hàng lựa chọn dịch vụ dựa trên ứng dụng kết quả
khách sạn tại các tỉnh và thành phố lớn tại Việt Nam. Dữ liệu
khai thác ý kiến.
được thu thập tự động trên trang web Agoda.com.
5
6
5. Phương pháp nghiên cứu
dịch vụ và các công nghệ hỗ trợ hiện tại. Cơ sở tri thức là các lý
Luận án này tiếp cận nghiên cứu theo phương pháp kỹ thuật hệ
thuyết nền tảng, phương pháp luận và các công cụ hỗ trợ cho việc
thống (System Engineering Methodology). Quy trình nghiên cứu
thực hiện luận án. Hoạt động nghiên cứu được thực hiện bao
được thực hiện theo các bước của phương pháp khai thác dữ liệu
gồm: (i) xác định các bài toán liên quan đến khai thác ý kiến
theo chuẩn công nghiệp CRISP-DM (Cross Industry Standard
khách hàng trong đánh giá và tư vấn dịch vụ du lịch; (ii) phát
Process for Data Mining) của Chapman và cộng sự (1999).
triển mơ hình kiến trúc và các giải pháp kỹ thuật để xây dựng hệ
6. Khung nghiên cứu tổng quát
thống hỗ trợ đánh giá chất lượng dịch vụ; (iii) thực nghiệm xây
Trong khung nghiên cứu tổng quát, các khoảng trống nghiên cứu
dựng hệ thống, đánh giá và điều chỉnh cho phù hợp. Các kết quả
được nhận dạng, mục tiêu nghiên cứu và câu hỏi nghiên cứu được
nghiên cứu của luận án được đề xuất áp dụng trong thực tiễn
đặt ra trên cơ sở rút trích từ thực trạng việc đánh giá chất lượng
ngành du lịch và đóng góp thêm vào cơ sở tri thức liên quan.
7. Những đóng góp mới của luận án
Đóng góp thứ nhất: Luận án đã góp phần luận giải trên cơ sở
khoa học và thực tiễn về vai trò và sự cần thiết của một hệ thống
hỗ trợ đánh giá chất lượng dịch vụ du lịch dựa trên những tiến bộ
của phương pháp và nền tảng mới của công nghệ thơng tin.
Đóng góp thứ hai: Luận án đã đóng góp vào khung lý thuyết về
hệ thống hỗ trợ ra quyết định, đó là tiếp cận mới dựa trên khai
thác ý kiến trong xây dựng các hệ thống hỗ trợ ra quyết định.
Đóng góp thứ ba: Luận án đã đề xuất một mơ hình kiến trúc cùng
với các giải pháp xây hệ thống hỗ trợ đánh giá chất lượng dịch
vụ dựa trên phương pháp khai thác ý kiến khách hàng trực tuyến.
Đóng góp thứ tư: Luận án đã xây dựng bản thử nghiệm hệ thống
hỗ trợ cho doanh nghiệp trong việc theo dõi, đánh giá và cải tiến
chất lượng dịch vụ du lịch tại Việt Nam. Bên cạnh đó, hệ thống
cịn giúp tư vấn cho du khách có cơ sở để lựa chọn những dịch
Hình 3: Khung nghiên cứu tổng quát
vụ du lịch được đánh giá tốt, phù hợp với nhu cầu.
7
8
CHƯƠNG 1: TỔNG QUAN NGHIÊN CỨU VỀ
HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNH VÀ
KHAI THÁC Ý KIẾN TRONG DU LỊCH
định trong lĩnh vực du lịch đã được quan tâm rất nhiều, hướng
1.1. Tổng quan nghiên cứu về hệ thống hỗ trợ ra quyết định
quyết nhiều vấn đề liên quan đến du lịch. Tuy vậy, gần như chưa
1.3. Nhận định các khoảng trống nghiên cứu
Nhận định thứ nhất: Các nghiên cứu về hệ thống hỗ trợ ra quyết
tiếp cận đa dạng cả về công nghệ lẫn ứng dụng để hỗ trợ giải
trong du lịch
tìm thấy có nghiên cứu nào trong và ngoài nước đề cập đến ứng
Nghiên cứu về hệ thống hỗ trợ ra quyết định trong lĩnh vực du
dụng trong hỗ trợ đánh giá chất lượng dịch vụ du lịch.
lịch đã được cộng đồng các nhà nghiên cứu quan tâm rất nhiều,
Nhận định thứ hai: Hướng tiếp cận nghiên cứu phương pháp
đa dạng về hình thức, tiếp cận cả về công nghệ lẫn ứng dụng để
khai thác ý kiến cho thấy có rất nhiều kỹ thuật và cơng cụ hỗ trợ
hỗ trợ giải quyết nhiều vấn đề liên quan đến du lịch. Tuy nhiên,
đã được áp dụng trong các nghiên cứu. Câu hỏi đặt ra là phương
hướng nghiên cứu này vẫn có khía cạnh chưa khai thác hết, cần
pháp nào được xem là tốt nhất để sử dụng làm giải pháp cho đề
cải tiến nhằm hướng đến các ứng dụng hệ thống hỗ trợ đánh giá
tài nghiên cứu?
chất lượng dịch vụ du lịch thông qua cách tiếp cận khai thác ý
Nhận định thứ ba: Hướng tiếp cận nghiên cứu khai thác ý kiến
kiến khách hàng trực tuyến.
nhằm ứng dụng kết quả khai thác ý kiến trong phân tích hành vi
1.2. Tổng quan nghiên cứu khai thác ý kiến trong du lịch
và phân tích hiệu quả hoạt động kinh doanh của doanh nghiệp
Đối với các nghiên cứu về khai thác ý kiến trong du lịch có hai
cũng rất đa dạng về chủ đề nghiên cứu. Tuy nhiên, các nghiên
hướng nghiên cứu phổ biến: (i) các nghiên cứu về phương pháp
cứu khai thác ý kiến ứng dụng trong phân tích thái độ, sở thích,
phân loại và tổng hợp ý kiến thường tập trung vào việc xây dựng,
quá trình ra quyết định chọn dịch vụ và đánh giá chất lượng dịch
áp dụng hoặc so sánh giữa các phương pháp tính tốn nhằm tìm
vụ du lịch dựa trên dữ liệu lớn là một hướng nghiên cứu chưa
ra phương pháp tốt nhất trong việc khai thác, phân tích và tổng
được khai thác triệt để.
hợp ý kiến; và (ii) các nghiên cứu tác động của khai thác ý kiến
Nhận định thứ tư: Hướng nghiên cứu phương pháp khai thác ý
đối với hoạt động kinh doanh thường tiếp cận theo phân tích hành
kiến (đa phần là các nghiên cứu thuộc ngành khoa học máy tính)
vi, dựa trên các lý thuyết hành vi dự định và các mô hình định
và hướng nghiên cứu ứng dụng kết quả khai thác ý kiến (đa phần
lượng để phân tích xu hướng hoặc đo lường tác động của các ý
là các nghiên cứu thuộc ngành kinh tế xã hội) thường rất tách
kiến đánh giá của khách hàng trực tuyến đối với hiệu quả hoạt
biệt. Trong khi hướng nghiên cứu thứ nhất thường dừng lại ở việc
động kinh doanh của doanh nghiệp trong ngành du lịch.
phân loại và tổng hợp ý kiến, thiếu bài tốn áp dụng, cịn ở hướng
9
10
nghiên cứu thứ hai thường khai thác ý kiến dưới dạng tường
hợp để cải tiến chất lượng sản phẩm. Tuy nhiên, các nhà quản lý
minh, dựa vào điểm đánh giá sẵn có trong tập dữ liệu, khơng đi
của các doanh nghiệp cung cấp dịch vụ thường dựa vào trực giác
sâu vào khai thác các ý kiến dưới dạng văn bản phi cấu trúc và
khi ra các quyết định mang tính chiến lược liên quan đến chất
do đó sẽ bỏ qua những nhân tố ẩn chứa trong dữ liệu bình luận
lượng. Mơ hình PDCA (Plan-Do-Check-Act) của Ishikawa
của khách hàng.
(1985) thường được áp dụng cho quá trình ra quyết định của
Nhận định thứ năm: Có rất ít bằng chứng thực nghiệm cho thấy
doanh nghiệp về cải tiến chất lượng.
có nghiên cứu thực hiện khai thác ý kiến đối với ngôn ngữ tiếng
2.1.2. Chất lượng dịch vụ du lịch
Việt. Phải chăng khai thác ý kiến trên ngôn ngữ tiếng Việt là một
Theo Luật Du lịch Việt Nam, “dịch vụ du lịch là việc cung cấp
thách thức đối với cộng đồng các nhà nghiên cứu Việt Nam? Vấn
các dịch vụ về lữ hành, vận chuyển, lưu trú, ăn uống, vui chơi
đề này cũng cần được làm sáng tỏ thêm trong đề tài nghiên cứu.
giải trí, thơng tin, hướng dẫn và những dịch vụ khác nhằm đáp
Nhận định thứ sáu: Có thể khẳng định về mặt nghiên cứu thực
ứng nhu cầu của khách du lịch”.
nghiệm, tại Việt Nam gần như ít có bằng chứng khoa học cho
2.1.3. Phương pháp đánh giá chất lượng dịch vụ du lịch
thấy có nghiên cứu về hệ thống hỗ trợ ra quyết định trong đánh
Trong lĩnh vực du lịch, mô hình đánh giá chất lượng dịch vụ của
giá chất lượng dịch vụ du lịch dựa trên phương pháp khai thác ý
Gronroos (1984) và mơ hình khoảng cách chất lượng dịch vụ của
kiến khách hàng trực tuyến.
CHƯƠNG 2: CƠ SỞ LÝ LUẬN VỀ ĐÁNH GIÁ
CHẤT LƯỢNG DỊCH VỤ DU LỊCH, HỆ THỐNG HỖ
TRỢ RA QUYẾT ĐỊNH VÀ PHƯƠNG PHÁP
KHAI THÁC Ý KIẾN
Parasuraman và cộng sự (1985) cùng với thang đo chất lượng
dịch vụ SERVQUAL (Parasuraman và cộng sự, 1988) được sử
dụng phổ biến.
2.2. Hệ thống hỗ trợ ra quyết định
2.2.1. Quá trình ra quyết định
Theo Simon (1960), Shim và cộng sự (2002) (được trích bởi
Felsberger và cộng sự, 2016), một quá trình ra quyết định bao
2.1. Đánh giá chất lượng dịch vụ du lịch
gồm 6 bước: Xác định vấn đề, Xác định các giải pháp, Phát triển
2.1.1. Quan điểm về quản trị chất lượng
mơ hình ra quyết định, Phân tích các giải pháp, Lựa chọn một
Quản trị chất lượng đã trở thành một phần quan trọng trong hệ
giải pháp và Triển khai giải pháp.
thống quản lý của doanh nghiệp (Becser và Zoltay-Paprika,
2003). Đối với doanh nghiệp hoạt động sản xuất, nhà quản lý
thường sử dụng các mơ hình trong việc lựa chọn hướng đi phù
11
12
2.2.2. Các khái niệm về hệ thống hỗ trợ ra quyết định
based), dựa vào nhân khẩu học và ngữ cảnh (demographic and
Theo Keen và Scott-Morton (1978), “Hệ thống hỗ trợ quyết định
context-based); và kỹ thuật lai (hybrid methods).
là hệ thống kết hợp tri thức của con người và năng lực của máy
2.3. Phương pháp khai thác ý kiến
tính để nâng cao chất lượng quyết định. Đây là một hệ thống dựa
2.3.1. Ý kiến, quan điểm của khách hàng
trên máy tính, giúp nhà quản trị giải quyết các vấn đề có tính chất
Ngày nay, khách hàng có thể dễ dàng truy cập thông tin và trao
bán cấu trúc”.
đổi ý kiến về công ty, sản phẩm và dịch vụ trên một quy mô lớn,
2.2.3. Kiến trúc hệ thống hỗ trợ ra quyết định
trong thời gian thực. Sự bùng nổ của thế hệ Web 2.0, và chuyển
Kiến trúc của một hệ thống hỗ trợ quyết định thường có 3 thành
sang nền tảng di động, sau đó là sự ra đời của một số lượng lớn
phần chính (Galipalli và Madyala, 2012; Borissova và
các nền tảng đánh giá sản phẩm trực tuyến (TripAdvisor,
Mustakerov, 2012): Hệ quản trị cơ sở dữ liệu, Hệ quản trị cơ sở
Yelp.com, Amazon,…). Những nền tảng này cho phép khách
mơ hình, Giao diện người dùng.
hàng có cơ hội đăng bài đánh giá sản phẩm với nội dung dưới
2.2.4. Phân loại hệ thống hỗ trợ ra quyết định
dạng điểm số và các ý kiến về sản phẩm. Ý kiến từ mạng xã hội
Dựa vào cơ chế hỗ trợ ra quyết định, theo tổng hợp các nghiên
và các website không chỉ tác động đến quá trình ra quyết định
cứu của Felsberger và cộng sự (2016) và Borissova và
mua sắm của khách hàng mà cịn hướng dẫn các nhà kinh doanh
Mustakerov (2012), có 5 kiểu hệ thống hỗ trợ quyết định, bao
trong việc đưa ra các quyết định chiến lược (Piccoli và Pigni,
gồm: dựa trên mơ hình (Model driven), dựa trên dữ liệu (Data
2013).
driven), dựa trên giao tiếp (Communication driven), dựa trên tài
2.3.2. Khái quát về phương pháp khai thác ý kiến
liệu (Document driven) và dựa trên tri thức (Knowledge driven).
Khai thác ý kiến (opinion mining), hay cịn có một tên gọi khác
2.2.5. Hệ thống tư vấn thơng tin
là phân tích cảm xúc (sentiment analysis), là một lĩnh vực nghiên
Hệ thống tư vấn là một dạng hệ thống hỗ trợ ra quyết định, hướng
cứu nhằm phân tích, đánh giá nhận định của con người về các đối
đến hỗ trợ cho người dùng giải quyết vấn đề quá tải thông tin
tượng như: sản phẩm, dịch vụ, tổ chức, cá nhân, sự kiện, chủ đề
(Hashler, 2012). Theo tổng hợp của Burke (2007) và Van
và các thuộc tính của đối tượng (Pang và Lee, 2008; Liu, 2012).
Capelleveen và cộng sự (2019), kỹ thuật tư vấn thông tin được
Một quy trình khai thác ý kiến thường gồm ba bước chính: (i)
chia ra làm 5 loại chính: dựa trên nội dung (content-based), lọc
Thu thập ý kiến (opinion retrieval), (ii) Phân loại ý kiến (opinion
cộng tác (collaborative filtering), dựa trên tri thức (knowledge-
classification) và (iii) Tổng hợp ý kiến (opinion summarization)
(Ali, 2015; Kumar và Reddy, 2016). Trong đó, phân loại ý kiến
13
14
được xem là bước quan trọng nhất nhằm mục đích phân lớp ý
CHƯƠNG 3: ĐỀ XUẤT MƠ HÌNH HỆ THỐNG HỖ
TRỢ ĐÁNH GIÁ CHẤT LƯỢNG DỊCH VỤ DU LỊCH
DỰA TRÊN PHƯƠNG PHÁP KHAI THÁC Ý KIẾN
KHÁCH HÀNG TRỰC TUYẾN
kiến theo các quan điểm: lạc quan, tích cực (positive); bi quan,
tiêu cực (negative) và trung lập (neutral).
2.3.3. Kỹ thuật phân loại ý kiến
Có hai cách tiếp cận phổ biến trong phân loại ý kiến: dựa vào
phương pháp máy học (Machine learning), dựa vào từ vựng
3.1. Mơ hình nghiên cứu đề xuất
(Lexicon based) (Medhat và cộng sự, 2014; Dhokrat và cộng sự,
3.1.1. Mơ hình lý thuyết
2015; Yadav, 2015; Sun và cộng sự, 2017). Ngoài ra, để gia tăng
Nghiên cứu đề xuất xây dựng mơ hình hệ thống như hình 3.1:
hiệu suất của việc phân loại ý kiến, các nghiên cứu đã dùng
phương pháp lai kết hợp hai phương pháp máy học và từ vựng.
2.3.4. Đánh giá tính hiệu quả của phân loại ý kiến
Hệu quả của phân loại ý kiến thường được đánh giá dựa trên 4
chỉ số: Accuracy, Precision, Recall và F1.
Bảng 2.3: Ma trận sai lầm
Dự báo: Positive
Dự báo: Negative
Thực tế: Positive
True Positive (TP)
False Negative (FN)
Thực tế: Negative
False Positive (FP)
True Negative (TN)
Các chỉ số được xác định bằng các công thc sau:
ã =
ã
ã
ã
=
ì ì
1 =
=
Hỡnh 3.1: Mơ hình nghiên cứu đề xuất
3.1.2. Mơ hình kiến trúc hệ thống
Hệ thống bao gồm ba phân hệ chính: (1) Phân hệ thu thập dữ liệu,
(2) Phân hệ phân tích dữ liệu, và (3) Giao diện người dùng.
15
16
bằng tiếng Việt. Nghiên cứu tiến hành tiền xử lý dữ liệu bằng
cách loại bỏ những dữ liệu khuyết, những bình luận khơng chứa
đựng thơng tin cần thiết để tiến hành bước xử lý tiếp theo.
3.2.2. Thử nghiệm mơ hình phân loại ý kiến
Trình tự thử nghiệm mơ hình phân loại ý kiến:
•
Gán nhãn dữ liệu (Data Labeling)
•
Làm sạch dữ liệu (Data Cleaning)
•
Tách từ (Words Segmentation)
•
Trích xuất đặc trưng (Feature Extraction)
•
Huấn luyện (Training)
•
Đánh giá mơ hình (Validation)
3.2.3. Xây dựng phương pháp hỗ trợ đánh giá chất lượng dịch vụ
3.2.3.1. Phương pháp xếp hạng dịch vụ
Việc tổng hợp và xếp hạng dịch vụ du lịch theo quan điểm của
Hình 3.2: Mơ hình kiến trúc hệ thống
3.2. Thiết kế nghiên cứu
Quy trình thực nghiệm gồm các bước: (1) Thu thập và Tiền xử
lý dữ liệu, (2) Thử nghiệm mơ hình phân loại ý kiến, (3) Xây
dựng phương pháp hỗ trợ đánh giá chất lượng dịch vụ, (4) Xây
dựng phương pháp tư vấn hỗ trợ lựa chọn dịch vụ, và (5) Xây
dựng giao diện người dùng.
3.2.1. Thu thập và tiền xử lý dữ liệu
Nghiên cứu này tiến hành thu thập dữ liệu bằng chương trình tự
động, dữ liệu lấy từ trang web agoda.com. Với đối tượng và phạm
vi nghiên cứu hướng đến là ngôn ngữ tiếng Việt, kỹ thuật khai
phá dữ liệu sử dụng để lọc chọn những bình luận của khách hàng
du khách có thể dựa vào cơng thức:
் ି ்ே
ܪ = ்ோ
Trong đó:
(3.1)
•
Hi: là điểm xếp hạng của khách sạn thứ i
•
TPi: là số bình luận được đánh giá là “tích cực” của
•
TNi: là số bình luận được đánh giá là “tiêu cực” của
•
TRi: là tổng số bình luận nhận được của khách sạn thứ i
khách sạn thứ i
khách sạn thứ i
Ngồi ra, có thể chuẩn hóa theo thang đo khác tùy thuộc vào mục
đích so sánh, đánh giá khách sạn:
R′ = ܽ +
ሺு ିெሼுభ ,ுమ ,…,ு ሽሻ×ሺିሻ
ெ௫ሼுభ ,ுమ ,…,ு ሽିெሼுభ ,ுమ ,…,ு ሽ
(3.2)
17
18
Trong đó:
Chuẩn hóa STD_scorei sẽ tính được mức độ quan trọng tương
•
R’i: điểm xếp hạng của khách sạn thứ i đã chuẩn hóa
•
a và b là cận dưới và cận trên của thang đo (ví dụ nếu
muốn đưa về thang đo 1-5 điểm, lúc này a = 1, b = 5)
RI =
đối (Relative importance) RIi của mỗi khía cạnh ai:
ௌ்_௦ ିெሼௌ்_௦భ ,ௌ்_௦మ ,…,ௌ்_௦ ሽ
ெ௫ሼௌ்_௦భ ,ௌ்_௦మ ,…,ௌ்_௦ ሽିெሼௌ்_௦భ ,ௌ்_௦మ ,…,ௌ்_௦ ሽ
(3.7)
3.2.3.2. Phương pháp xếp hạng thuộc tính dịch vụ
Nghiên cứu này sử dụng phương pháp xếp hạng khía cạnh dịch
3.2.4. Xây dựng phương pháp tư vấn hỗ trợ lựa chọn dịch vụ
vụ của Marrese-Taylor và cộng sự (2014), được mô tả như sau:
Trình tự thực hiện được tiến hành như sau:
Gọi Pi và Ni là số quan điểm tích cực (positive) và số quan điểm
•
Bước 1: Xác định độ tương tự của khách hàng mới so
•
Bước 2: Dự đốn mức độ ưa thích khách sạn của khách
với khách hàng đã có trong hệ thống
tiêu cực (negative) của khía cạnh (thuộc tính) ai.
P_scorei và N_scorei là giá trị chuẩn hóa của Pi và Ni theo qui tắc
Min-Max, P_scorei và N_scorei sẽ nhận giá trị từ 0 đến 1, như
công thức sau:
ܲ_݁ݎܿݏ =
ܰ_݁ݎܿݏ =
⎧ 0,
⎪
ܲ = 0
kỹ thuật dự đoán phổ biến thuộc phương pháp lọc cộng tác, bao
⎨
ିெሼభ ,మ ,…, ሽ
⎪
, ܲ ≠ 0
⎩ ெ௫ሼభ,మ,…, ሽିெሼభ,మ,…, ሽ
(3.3)
⎨
ே ିெሼேభ ,ேమ ,…,ே ሽ
⎪
, ܰ ≠ 0
⎩ ெ௫ሼேభ,ேమ,…,ே ሽିெሼேభ,ேమ,…,ே ሽ
(3.4)
⎧ 0,
⎪
hàng trong hệ thống bằng phương pháp lọc cộng tác.
Nghiên cứu này sẽ tiến hành huấn luyện và thử nghiệm một số
gồm: Phân phối chuẩn ND (Normal Distribution), Thuật toán
KNN (K-Nearest Neighbors), Đồng phân cụm CC (CoClustering), Kỹ thuật phân rã ma trận MF (Matrix Factorization).
ܰ = 0
3.2.5. Xây dựng giao diện người dùng
Màn hình giao diện hệ thống hỗ trợ người dùng đánh giá chất
lượng dịch vụ khách sạn được xây dựng trên cơ sở tổng hợp các
Độ lệch chuẩn điểm số của khía cạnh ai được tính bằng cơng thức
xử lý, tính tốn, phân tích để người dùng có thể tự động hóa quy
bên dưới, trong đó AV_scorei là điểm trung bình và STD_scorei
trình đánh giá và cải tiến chất lượng.
là độ lệch chuẩn:
݁ݎܿݏ_ܸܣ =
ܵܶ݁ݎܿݏ_ܦ = ට
_௦ ାே_௦
ଶ
(3.5)
ሺ_௦ ି _௦ ሻమ ାሺே_௦ ି _௦ ሻమ
ଶ
(3.6)
19
CHƯƠNG 4: KẾT QUẢ THỰC NGHIỆM XÂY DỰNG
HỆ THỐNG HỖ TRỢ ĐÁNH GIÁ CHẤT LƯỢNG
DỊCH VỤ DU LỊCH DỰA TRÊN PHƯƠNG PHÁP
KHAI THÁC Ý KIẾN KHÁCH HÀNG TRỰC TUYẾN
20
luyện lại. Kết quả nghiên cứu này đã giúp xác định phương pháp
và công cụ phân loại ý kiến phù hợp.
4.1.3. Kết quả hỗ trợ đánh chất lượng dịch vụ
4.1.3.1. Kết quả xếp hạng khách sạn
Việc xếp hạng khách sạn theo quan điểm của du khách được thực
4.1. Kết quả thực nghiệm nghiên cứu
hiện như trong công thức (3.1) và (3.2). Nghiên cứu này sử dụng
4.1.1. Kết quả thu thập và tiền xử lý dữ liệu
thang điểm từ 1 đến 5 và thực hiện làm tròn điểm số. Kết quả cho
Kết quả thu thập dữ liệu được 39.976 bình luận bao gồm cả tiếng
thấy khách sạn được đánh giá 4 điểm chiếm số lượng cao nhất
Anh và tiếng Việt, trong khoảng thời gian từ năm 2010 đến năm
(209 khách sạn) và khách sạn được đánh giá 1 điểm chiếm số
2019. Sau khi lọc bỏ các bình luận bằng tiếng Anh, chỉ giữ lại
lượng thấp nhất (12 khách sạn).
các bình luận bằng Tiếng Việt, dữ liệu còn lại để tiến hành thực
4.1.3.2. Kết quả trích xuất khía cạnh dịch vụ
nghiệm là 14.559 bình luận của 521 khách sạn ở 40 tỉnh thành
Nghiên cứu này dùng phương pháp TF-IDF để trích xuất ra
trên cả nước.
khoảng 200 danh từ và cụm danh từ có chỉ số TF-IDF cao nhất
4.1.2. Kết quả thử nghiệm mơ hình phân loại ý kiến
trong tập dữ liệu. Sau khi xem xét về ngữ nghĩa và tham khảo các
Nghiên cứu này tiến hành thử nghiệm bằng 6 thuật toán, bao
chuyên gia, kết quả giữ lại 40 khía cạnh có ý nghĩa trong lĩnh vực
gồm: Naïve Bayes (NB), Support Vector Machines (SVM),
khách sạn. Kết quả thực nghiệm tính tốn với cơng thức (3.7) đã
Logistic Regression (LR), Neural Network (NN), DecisionTree
xác định được mức độ quan trọng tương đối của các khía cạnh
(DT), RandomForest (RF). Kết quả thử nghiệm cho thấy các mô
dịch vụ khách sạn, và được xem như bộ tiêu chí có trọng số cho
hình LR, SVM và NN có độ chính xác khá cao (lần lượt là 0,79;
các yếu tố chất lượng dịch vụ khách sạn, làm cơ sở cho nhà kinh
0,78 và 0,79). Nghĩa là các mơ hình này tương đối phù hợp với
doanh dịch vụ du lịch xem xét, đánh giá và so sánh chất lượng
tập dữ liệu huấn luyện. Tuy nhiên, nếu xét thêm yếu tố thời gian
dịch vụ giữa các khách sạn trong cùng một tỉnh thành hoặc giữa
thì chỉ nên chọn mơ hình LR và SVM là tốt nhất. Do đó, các ứng
các tỉnh thành khác nhau.
dụng tiếp theo có thể dùng hai mơ hình này như một công cụ để
4.1.4. Kết quả tư vấn hỗ trợ lựa chọn dịch vụ
phân loại ý kiến cho các dữ liệu bình luận chưa được phân loại
Kết quả trên cho thấy phương pháp MF có sai số thấp nhất là
hoặc các dữ liệu bình luận mới phát sinh mà không cần phải huấn
0,4373; kế đến là phương pháp KNN có sai số 0,4408; thứ ba là
CC với sai số 0,456 và cuối cùng là ND có sai số cao nhất là
21
22
0,5712. Do chênh lệch về thời gian xử lý giữa các phương pháp
4.2. Các khuyến nghị từ kết quả thực nghiệm nghiên cứu
không đáng kể nên nghiên cứu này quyết định chọn phương pháp
4.2.1. Về phạm vi triển khai hệ thống
MF làm giải pháp để xây dựng chức năng tư vấn dịch vụ.
Các doanh nghiệp có thể: (i) xây dựng và triển khai hệ thống theo
4.1.5. Giao diện hỗ trợ người dùng
dạng tích hợp vào hệ thống CRM của doanh nghiệp để đánh giá
chất lượng dịch vụ của chính doanh nghiệp đó; (ii) xây dựng và
triển khai như một hệ thống độc lập, có thể khai thác các nguồn
dữ liệu trên mạng để đánh giá chất lượng dịch vụ của nhiều doanh
nghiệp khác nhau trong ngành du lịch.
4.2.2. Về công nghệ lưu trữ và xử lý dữ liệu
Khi triển khai thực tế, doanh nghiệp cần tính đến ứng dụng các
cơng nghệ lưu trữ dữ liệu lớn, bên cạnh đó là xem xét khả năng
trang bị hệ thống tính tốn hiệu suất cao. Tuy nhiên, vấn đề này
Hình 4.7: Màn hình dành cho nhà quản trị
cũng cần phải đánh giá tính khả thi của dự án, giữa chi phí đầu
tư hạ tầng cơng nghệ thơng tin và lợi ích kỳ vọng mà hệ thống
này mang lại.
4.2.3. Về quy trình vận hành hệ thống
Các chức năng thu thập dữ liệu, tiền xử lý dữ liệu, huấn luyện lại
các mơ hình phân loại ý kiến và tư vấn lựa chọn dịch vụ cũng nên
được thực hiện một cách định kỳ. Bên cạnh đó cũng tùy thuộc
vào tốc độ tăng trưởng và biến động của nguồn dữ liệu bình luận
của khách hàng trên các trang mạng và các nền tảng xã hội.
4.2.4. Về người sử dụng hệ thống
Ngồi đối tượng sử dụng chính của hệ thống là nhà quản trị doanh
Hình 4.8: Màn hình dành cho khách hàng
nghiệp và khách hàng, các chức năng thu thập dữ liệu, tiền xử lý
dữ liệu, huấn luyện, đánh giá và lựa chọn các mơ hình phân loại
23
24
ý kiến nên được thực hiện bởi các chuyên gia tri thức, đặc biệt là
khách hàng trực tuyến. Về mặt giải pháp, nghiên cứu đã đề xuất
là các chuyên gia về khoa học dữ liệu.
ứng dụng phương pháp khai thác ý kiến khách hàng trực tuyến,
4.2.5. Về khả năng mở rộng hệ thống
đặc biệt là phương pháp máy học có giám sát. Đồng thời, nghiên
Hệ thống có thể mở rộng thu thập thêm dữ liệu bình luận về
cứu đã đề xuất phương pháp xếp hạng các thực thể, đối tượng và
khách sạn trên các trang như Booking, Tripadvisor, hoặc mạng
thuộc tính của đối tượng dựa trên khai thác ý kiến khách hàng.
xã hội. Tuy nhiên, nghiên cứu sẽ gặp một thách thức lớn trong
Bên cạnh đó, nghiên cứu cũng đã đề xuất phương pháp tư vấn
việc hợp nhất các nguồn dữ liệu khác nhau.
khách hàng lựa chọn dịch vụ, trong đó kết hợp lai phương pháp
lọc cộng tác và kết quả xếp hạng đối tượng có được từ khai thác
ý kiến khách hàng trực tuyến. Các kết quả đạt được về cơ bản đã
KẾT LUẬN
trả lời các câu hỏi nghiên cứu đặt ra trong phần mở đầu. Trên cơ
Nghiên cứu trong luận án này được tiến hành nhằm xây dựng hệ
áp dụng hệ thống này trong thực tiễn. Đây là bản tham chiếu cho
thống hỗ trợ đánh giá chất lượng dịch vụ du lịch dựa trên phương
các nhà nghiên cứu và các nhà quản trị doanh nghiệp khơng chỉ
sở đó, nghiên cứu đưa ra một số khuyến nghị để có thể triển khai
pháp khai thác ý kiến khách hàng trực tuyến. Trên cơ sở tổng
trong lĩnh vực du lịch mà cịn có thể mở rộng cho các lĩnh vực
quan tình hình nghiên cứu trong và ngồi nước liên quan đến đề
kinh doanh khác. Tuy nhiên, do điều kiện thời gian và sự phức
tài, và lý luận dựa trên các lý thuyết nền tảng, nghiên cứu này
tạp của các giải pháp cơng nghệ, nghiên cứu này cịn nhiều hạn
một lần nữa khẳng định sự cần thiết của đề tài nghiên cứu bằng
chế, tạo ra khoảng trống để tiếp tục nghiên cứu, phát triển trong
khung phân tích khái niệm nghiên cứu, đồng thời cũng đề xuất
tương lai.
mơ hình nghiên cứu tổng qt. Nghiên cứu đã sử dụng phương
pháp luận tiếp cận theo kỹ thuật hệ thống, quy trình nghiên cứu
được thực hiện theo các bước của phương pháp khai thác dữ liệu
theo chuẩn cơng nghiệp CRISP-DM. Dữ liệu là các bình luận
bằng tiếng Việt của du khách về các khách sạn tại Việt Nam,
được thu thập trên trang web Agoda. Về mặt kiến trúc hệ trúc hệ
thống, nghiên cứu đã đề xuất một mơ hình hệ thống hỗ trợ đánh
giá chất lượng dịch vụ dựa trên khai thác ý kiến và thông tin của