Tải bản đầy đủ (.pdf) (12 trang)

Nghiên cứu xây dựng hệ thống hỗ trợ đánh giá chất lượng dịch vụ du lịch dựa trên phương pháp khai thác ý kiến khách hàng trực tuyến TT

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (700.9 KB, 12 trang )

1

LỜI MỞ ĐẦU

2
hướng ứng dụng công nghệ thông tin trong ngành du lịch cũng
đã có những chuyển biến mạnh mẽ với sự xuất hiện các cơng ty

1. Cơ sở hình thành đề tài

kinh doanh dịch vụ du lịch trực tuyến, các ứng dụng đặt tour trên

a) Bối cảnh chung

nền tảng di động và nhiều website, diễn đàn, cổng thông tin xã

Kiểm soát chất lượng đã trở nên quan trọng trong hệ thống quản

hội,... nhằm trao đổi, chia sẻ các chủ đề về du lịch (như

trị doanh nghiệp (Becser và Zoltay-Paprika, 2003). Hiện nay,

TripAdvisor.com.vn, Agoda.com, Booking.com,...). Những áp

việc theo dõi và đánh giá chất lượng thường dựa trên việc khảo

lực cạnh tranh mới trong kỷ nguyên số khiến cho vấn đề kiểm

sát thông tin khách hàng, và được thực hiện bằng những cách

soát và đánh giá chất lượng dịch vụ du lịch càng trở nên quan



thức như: phỏng vấn trực tiếp, phỏng vấn qua điện thoại, thảo

trọng đối với các doanh nghiệp. Tuy nhiên, thực trạng đánh giá

luận nhóm, khảo sát qua thư, khảo sát trực tuyến (tiêu chuẩn ISO

chất lượng dịch vụ du lịch vẫn được thực hiện bằng những cách

10004). Ngày nay, những tiến bộ của công nghệ đã làm thay đổi

thức truyền thống theo hướng dẫn của tiêu chuẩn chất lượng ISO

cách thức truyền thông giúp cho khách hàng dễ dàng truy cập

10004. Những phương pháp này không thể giám sát sự hài lịng

thơng tin và trao đổi ý kiến về sản phẩm và dịch vụ trên một quy

của khách hàng một cách liên tục, và khơng có khả năng theo dõi

mô lớn trong thời gian thực. Với sự bùng nổ của dữ liệu lớn, các

xu hướng chất lượng dịch vụ trong dài hạn (Yussupova và cộng

ý kiến đánh giá của khách hàng trên các nền tảng trực tuyến cần

sự, 2016).

được thu thập, khai thác, phân tích một cách tự động dưới sự hỗ


c) Tình hình nghiên cứu và ứng dụng

trợ của các hệ thống thông tin, cho phép các nhà kinh doanh có

Nghiên cứu xây dựng các hệ thống hỗ trợ ra quyết định trong lĩnh

thể dễ dàng theo dõi hành vi mua sắm, sở thích và đánh giá sự

vực du lịch đã được quan tâm nhiều bởi cộng đồng các nhà khoa

hài lòng của khách hàng về chất lượng sản phẩm và dịch vụ.

học và đã có nhiều hệ thống được đề xuất và sử dụng tại doanh

b) Bối cảnh thực tiễn ngành du lịch

nghiệp trong ngành du lịch. Tuy nhiên, có ít bằng chứng khoa

Sự phát triển của Internet đã cung cấp nhiều phương thức mới để

học cho thấy có những nghiên cứu xây dựng hệ thống hỗ trợ ra

kinh doanh dịch vụ du lịch và quảng bá các sản phẩm cho du

quyết định giúp cho nhà quản trị có thể theo dõi, kiểm sốt và cải

khách. Việc ứng dụng công nghệ thông tin vào du lịch ngày càng

tiến chất lượng dịch vụ du lịch tốt hơn.


mang đến những cơ hội chiến lược và các công cụ mạnh mẽ cho

Những năm gần đây, cộng đồng các nhà khoa học cũng như các

tăng trưởng kinh tế, phân phối lại của cải và phát triển công bằng

nhà quản trị doanh nghiệp đã quan tâm nhiều đến khai thác ý kiến

trên toàn cầu (Masron và cộng sự, 2016). Tại Việt Nam, xu

dựa trên những phản hồi của khách hàng về các chủ đề du lịch


3
nhằm giúp cho nhà quản trị có thể phân tích các khía cạnh dịch
vụ du lịch. Kết quả tổng quan tình hình nghiên cứu cũng đã cho
thấy chưa có nhiều nghiên cứu đi sâu vào ứng dụng của khai thác

4
4) Thực nghiệm xây dựng hệ thống hỗ trợ người dùng đánh
giá và cải tiến chất lượng dịch vụ du lịch.
3. Câu hỏi nghiên cứu

ý kiến để giải quyết các mối quan tâm của doanh nghiệp kinh

1) Những thành phần chức năng đặc trưng của mơ hình hệ

doanh dịch vụ du lịch; và cũng có rất ít bằng chứng khoa học cho


thống hỗ trợ đánh giá chất lượng dịch vụ du lịch dựa trên

thấy có nghiên cứu tiếp cận theo hướng xây dựng hệ thống hỗ trợ

phương pháp khai thác ý kiến cần phải có là gì?

ra quyết định dựa trên ứng dụng phương pháp khai thác ý kiến

2) Các phương pháp khai thác ý kiến nào là phù hợp để sử

của khách hàng từ cộng đồng trực tuyến để hỗ trợ nhà quản trị

dụng trong việc đánh giá chất lượng dịch vụ du lịch dựa

trong việc theo dõi, đánh giá chất lượng dịch vụ du lịch.
Xuất phát từ bối cảnh chung, bối cảnh thực tiễn của ngành du
lịch, tình hình nghiên cứu và ứng dụng như đã trình bày bên trên,
nghiên cứu sinh chọn hướng nghiên cứu Xây dựng hệ thống hỗ

trên bộ dữ liệu thu thập được?
3) Các phương pháp nào để tư vấn cho khách hàng lựa chọn
dịch vụ du lịch là phù hợp?
4) Cần phải làm những gì để xây dựng hệ thống hỗ trợ

trợ đánh giá chất lượng dịch vụ du lịch dựa trên phương

người dùng đánh giá và cải tiến chất lượng dịch vụ du

pháp khai thác ý kiến khách hàng trực tuyến làm đề tài nghiên


lịch?

cứu trong luận án này.

4. Đối tượng và phạm vi nghiên cứu

2. Mục tiêu nghiên cứu

Đối tượng nghiên cứu của luận án là hệ thống hỗ trợ đánh giá

1) Nghiên cứu và đề xuất mơ hình kiến trúc của hệ thống

chất lượng dịch vụ du lịch. Đối tượng nghiên cứu bao gồm ba

hỗ trợ ra quyết định trong đánh giá chất lượng dịch vụ

yếu tố chính là: (i) Bài toán đánh giá chất lượng dịch vụ du lịch;

du lịch, tiếp cận dựa trên phương pháp khai thác ý kiến

(ii) Phương pháp khai thác ý kiến khách hàng trực tuyến; và (iii)

khách hàng trực tuyến.
2) Nghiên cứu và đề xuất phương pháp khai thác ý kiến, hỗ

Mơ hình kiến trúc và các giải pháp kỹ thuật để xây dựng hệ thống
hỗ trợ đánh giá chất lượng dịch vụ du lịch.

trợ cho nhà quản trị trong việc đánh giá chất lượng dịch


Phạm vi nghiên cứu của luận án được giới hạn tập trung vào

vụ du lịch.

loại hình dịch vụ khách sạn. Dữ liệu phục vụ cho nghiên cứu là

3) Nghiên cứu và đề xuất phương pháp tư vấn, hỗ trợ cho

những ý kiến bình luận bằng tiếng Việt của khách du lịch về các

khách hàng lựa chọn dịch vụ dựa trên ứng dụng kết quả

khách sạn tại các tỉnh và thành phố lớn tại Việt Nam. Dữ liệu

khai thác ý kiến.

được thu thập tự động trên trang web Agoda.com.


5

6

5. Phương pháp nghiên cứu

dịch vụ và các công nghệ hỗ trợ hiện tại. Cơ sở tri thức là các lý

Luận án này tiếp cận nghiên cứu theo phương pháp kỹ thuật hệ

thuyết nền tảng, phương pháp luận và các công cụ hỗ trợ cho việc


thống (System Engineering Methodology). Quy trình nghiên cứu

thực hiện luận án. Hoạt động nghiên cứu được thực hiện bao

được thực hiện theo các bước của phương pháp khai thác dữ liệu

gồm: (i) xác định các bài toán liên quan đến khai thác ý kiến

theo chuẩn công nghiệp CRISP-DM (Cross Industry Standard

khách hàng trong đánh giá và tư vấn dịch vụ du lịch; (ii) phát

Process for Data Mining) của Chapman và cộng sự (1999).

triển mơ hình kiến trúc và các giải pháp kỹ thuật để xây dựng hệ

6. Khung nghiên cứu tổng quát

thống hỗ trợ đánh giá chất lượng dịch vụ; (iii) thực nghiệm xây

Trong khung nghiên cứu tổng quát, các khoảng trống nghiên cứu

dựng hệ thống, đánh giá và điều chỉnh cho phù hợp. Các kết quả

được nhận dạng, mục tiêu nghiên cứu và câu hỏi nghiên cứu được

nghiên cứu của luận án được đề xuất áp dụng trong thực tiễn

đặt ra trên cơ sở rút trích từ thực trạng việc đánh giá chất lượng


ngành du lịch và đóng góp thêm vào cơ sở tri thức liên quan.
7. Những đóng góp mới của luận án
Đóng góp thứ nhất: Luận án đã góp phần luận giải trên cơ sở
khoa học và thực tiễn về vai trò và sự cần thiết của một hệ thống
hỗ trợ đánh giá chất lượng dịch vụ du lịch dựa trên những tiến bộ
của phương pháp và nền tảng mới của công nghệ thơng tin.
Đóng góp thứ hai: Luận án đã đóng góp vào khung lý thuyết về
hệ thống hỗ trợ ra quyết định, đó là tiếp cận mới dựa trên khai
thác ý kiến trong xây dựng các hệ thống hỗ trợ ra quyết định.
Đóng góp thứ ba: Luận án đã đề xuất một mơ hình kiến trúc cùng
với các giải pháp xây hệ thống hỗ trợ đánh giá chất lượng dịch
vụ dựa trên phương pháp khai thác ý kiến khách hàng trực tuyến.
Đóng góp thứ tư: Luận án đã xây dựng bản thử nghiệm hệ thống
hỗ trợ cho doanh nghiệp trong việc theo dõi, đánh giá và cải tiến
chất lượng dịch vụ du lịch tại Việt Nam. Bên cạnh đó, hệ thống
cịn giúp tư vấn cho du khách có cơ sở để lựa chọn những dịch

Hình 3: Khung nghiên cứu tổng quát

vụ du lịch được đánh giá tốt, phù hợp với nhu cầu.


7

8

CHƯƠNG 1: TỔNG QUAN NGHIÊN CỨU VỀ
HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNH VÀ
KHAI THÁC Ý KIẾN TRONG DU LỊCH


định trong lĩnh vực du lịch đã được quan tâm rất nhiều, hướng

1.1. Tổng quan nghiên cứu về hệ thống hỗ trợ ra quyết định

quyết nhiều vấn đề liên quan đến du lịch. Tuy vậy, gần như chưa

1.3. Nhận định các khoảng trống nghiên cứu
Nhận định thứ nhất: Các nghiên cứu về hệ thống hỗ trợ ra quyết
tiếp cận đa dạng cả về công nghệ lẫn ứng dụng để hỗ trợ giải

trong du lịch

tìm thấy có nghiên cứu nào trong và ngoài nước đề cập đến ứng

Nghiên cứu về hệ thống hỗ trợ ra quyết định trong lĩnh vực du

dụng trong hỗ trợ đánh giá chất lượng dịch vụ du lịch.

lịch đã được cộng đồng các nhà nghiên cứu quan tâm rất nhiều,

Nhận định thứ hai: Hướng tiếp cận nghiên cứu phương pháp

đa dạng về hình thức, tiếp cận cả về công nghệ lẫn ứng dụng để

khai thác ý kiến cho thấy có rất nhiều kỹ thuật và cơng cụ hỗ trợ

hỗ trợ giải quyết nhiều vấn đề liên quan đến du lịch. Tuy nhiên,

đã được áp dụng trong các nghiên cứu. Câu hỏi đặt ra là phương


hướng nghiên cứu này vẫn có khía cạnh chưa khai thác hết, cần

pháp nào được xem là tốt nhất để sử dụng làm giải pháp cho đề

cải tiến nhằm hướng đến các ứng dụng hệ thống hỗ trợ đánh giá

tài nghiên cứu?

chất lượng dịch vụ du lịch thông qua cách tiếp cận khai thác ý

Nhận định thứ ba: Hướng tiếp cận nghiên cứu khai thác ý kiến

kiến khách hàng trực tuyến.

nhằm ứng dụng kết quả khai thác ý kiến trong phân tích hành vi

1.2. Tổng quan nghiên cứu khai thác ý kiến trong du lịch

và phân tích hiệu quả hoạt động kinh doanh của doanh nghiệp

Đối với các nghiên cứu về khai thác ý kiến trong du lịch có hai

cũng rất đa dạng về chủ đề nghiên cứu. Tuy nhiên, các nghiên

hướng nghiên cứu phổ biến: (i) các nghiên cứu về phương pháp

cứu khai thác ý kiến ứng dụng trong phân tích thái độ, sở thích,

phân loại và tổng hợp ý kiến thường tập trung vào việc xây dựng,


quá trình ra quyết định chọn dịch vụ và đánh giá chất lượng dịch

áp dụng hoặc so sánh giữa các phương pháp tính tốn nhằm tìm

vụ du lịch dựa trên dữ liệu lớn là một hướng nghiên cứu chưa

ra phương pháp tốt nhất trong việc khai thác, phân tích và tổng

được khai thác triệt để.

hợp ý kiến; và (ii) các nghiên cứu tác động của khai thác ý kiến

Nhận định thứ tư: Hướng nghiên cứu phương pháp khai thác ý

đối với hoạt động kinh doanh thường tiếp cận theo phân tích hành

kiến (đa phần là các nghiên cứu thuộc ngành khoa học máy tính)

vi, dựa trên các lý thuyết hành vi dự định và các mô hình định

và hướng nghiên cứu ứng dụng kết quả khai thác ý kiến (đa phần

lượng để phân tích xu hướng hoặc đo lường tác động của các ý

là các nghiên cứu thuộc ngành kinh tế xã hội) thường rất tách

kiến đánh giá của khách hàng trực tuyến đối với hiệu quả hoạt

biệt. Trong khi hướng nghiên cứu thứ nhất thường dừng lại ở việc


động kinh doanh của doanh nghiệp trong ngành du lịch.

phân loại và tổng hợp ý kiến, thiếu bài tốn áp dụng, cịn ở hướng


9

10

nghiên cứu thứ hai thường khai thác ý kiến dưới dạng tường

hợp để cải tiến chất lượng sản phẩm. Tuy nhiên, các nhà quản lý

minh, dựa vào điểm đánh giá sẵn có trong tập dữ liệu, khơng đi

của các doanh nghiệp cung cấp dịch vụ thường dựa vào trực giác

sâu vào khai thác các ý kiến dưới dạng văn bản phi cấu trúc và

khi ra các quyết định mang tính chiến lược liên quan đến chất

do đó sẽ bỏ qua những nhân tố ẩn chứa trong dữ liệu bình luận

lượng. Mơ hình PDCA (Plan-Do-Check-Act) của Ishikawa

của khách hàng.

(1985) thường được áp dụng cho quá trình ra quyết định của


Nhận định thứ năm: Có rất ít bằng chứng thực nghiệm cho thấy

doanh nghiệp về cải tiến chất lượng.

có nghiên cứu thực hiện khai thác ý kiến đối với ngôn ngữ tiếng

2.1.2. Chất lượng dịch vụ du lịch

Việt. Phải chăng khai thác ý kiến trên ngôn ngữ tiếng Việt là một

Theo Luật Du lịch Việt Nam, “dịch vụ du lịch là việc cung cấp

thách thức đối với cộng đồng các nhà nghiên cứu Việt Nam? Vấn

các dịch vụ về lữ hành, vận chuyển, lưu trú, ăn uống, vui chơi

đề này cũng cần được làm sáng tỏ thêm trong đề tài nghiên cứu.

giải trí, thơng tin, hướng dẫn và những dịch vụ khác nhằm đáp

Nhận định thứ sáu: Có thể khẳng định về mặt nghiên cứu thực

ứng nhu cầu của khách du lịch”.

nghiệm, tại Việt Nam gần như ít có bằng chứng khoa học cho

2.1.3. Phương pháp đánh giá chất lượng dịch vụ du lịch

thấy có nghiên cứu về hệ thống hỗ trợ ra quyết định trong đánh


Trong lĩnh vực du lịch, mô hình đánh giá chất lượng dịch vụ của

giá chất lượng dịch vụ du lịch dựa trên phương pháp khai thác ý

Gronroos (1984) và mơ hình khoảng cách chất lượng dịch vụ của

kiến khách hàng trực tuyến.

CHƯƠNG 2: CƠ SỞ LÝ LUẬN VỀ ĐÁNH GIÁ
CHẤT LƯỢNG DỊCH VỤ DU LỊCH, HỆ THỐNG HỖ
TRỢ RA QUYẾT ĐỊNH VÀ PHƯƠNG PHÁP
KHAI THÁC Ý KIẾN

Parasuraman và cộng sự (1985) cùng với thang đo chất lượng
dịch vụ SERVQUAL (Parasuraman và cộng sự, 1988) được sử
dụng phổ biến.
2.2. Hệ thống hỗ trợ ra quyết định
2.2.1. Quá trình ra quyết định
Theo Simon (1960), Shim và cộng sự (2002) (được trích bởi
Felsberger và cộng sự, 2016), một quá trình ra quyết định bao

2.1. Đánh giá chất lượng dịch vụ du lịch

gồm 6 bước: Xác định vấn đề, Xác định các giải pháp, Phát triển

2.1.1. Quan điểm về quản trị chất lượng

mơ hình ra quyết định, Phân tích các giải pháp, Lựa chọn một

Quản trị chất lượng đã trở thành một phần quan trọng trong hệ


giải pháp và Triển khai giải pháp.

thống quản lý của doanh nghiệp (Becser và Zoltay-Paprika,
2003). Đối với doanh nghiệp hoạt động sản xuất, nhà quản lý
thường sử dụng các mơ hình trong việc lựa chọn hướng đi phù


11

12

2.2.2. Các khái niệm về hệ thống hỗ trợ ra quyết định

based), dựa vào nhân khẩu học và ngữ cảnh (demographic and

Theo Keen và Scott-Morton (1978), “Hệ thống hỗ trợ quyết định

context-based); và kỹ thuật lai (hybrid methods).

là hệ thống kết hợp tri thức của con người và năng lực của máy

2.3. Phương pháp khai thác ý kiến

tính để nâng cao chất lượng quyết định. Đây là một hệ thống dựa

2.3.1. Ý kiến, quan điểm của khách hàng

trên máy tính, giúp nhà quản trị giải quyết các vấn đề có tính chất


Ngày nay, khách hàng có thể dễ dàng truy cập thông tin và trao

bán cấu trúc”.

đổi ý kiến về công ty, sản phẩm và dịch vụ trên một quy mô lớn,

2.2.3. Kiến trúc hệ thống hỗ trợ ra quyết định

trong thời gian thực. Sự bùng nổ của thế hệ Web 2.0, và chuyển

Kiến trúc của một hệ thống hỗ trợ quyết định thường có 3 thành

sang nền tảng di động, sau đó là sự ra đời của một số lượng lớn

phần chính (Galipalli và Madyala, 2012; Borissova và

các nền tảng đánh giá sản phẩm trực tuyến (TripAdvisor,

Mustakerov, 2012): Hệ quản trị cơ sở dữ liệu, Hệ quản trị cơ sở

Yelp.com, Amazon,…). Những nền tảng này cho phép khách

mơ hình, Giao diện người dùng.

hàng có cơ hội đăng bài đánh giá sản phẩm với nội dung dưới

2.2.4. Phân loại hệ thống hỗ trợ ra quyết định

dạng điểm số và các ý kiến về sản phẩm. Ý kiến từ mạng xã hội


Dựa vào cơ chế hỗ trợ ra quyết định, theo tổng hợp các nghiên

và các website không chỉ tác động đến quá trình ra quyết định

cứu của Felsberger và cộng sự (2016) và Borissova và

mua sắm của khách hàng mà cịn hướng dẫn các nhà kinh doanh

Mustakerov (2012), có 5 kiểu hệ thống hỗ trợ quyết định, bao

trong việc đưa ra các quyết định chiến lược (Piccoli và Pigni,

gồm: dựa trên mơ hình (Model driven), dựa trên dữ liệu (Data

2013).

driven), dựa trên giao tiếp (Communication driven), dựa trên tài

2.3.2. Khái quát về phương pháp khai thác ý kiến

liệu (Document driven) và dựa trên tri thức (Knowledge driven).

Khai thác ý kiến (opinion mining), hay cịn có một tên gọi khác

2.2.5. Hệ thống tư vấn thơng tin

là phân tích cảm xúc (sentiment analysis), là một lĩnh vực nghiên

Hệ thống tư vấn là một dạng hệ thống hỗ trợ ra quyết định, hướng


cứu nhằm phân tích, đánh giá nhận định của con người về các đối

đến hỗ trợ cho người dùng giải quyết vấn đề quá tải thông tin

tượng như: sản phẩm, dịch vụ, tổ chức, cá nhân, sự kiện, chủ đề

(Hashler, 2012). Theo tổng hợp của Burke (2007) và Van

và các thuộc tính của đối tượng (Pang và Lee, 2008; Liu, 2012).

Capelleveen và cộng sự (2019), kỹ thuật tư vấn thông tin được

Một quy trình khai thác ý kiến thường gồm ba bước chính: (i)

chia ra làm 5 loại chính: dựa trên nội dung (content-based), lọc

Thu thập ý kiến (opinion retrieval), (ii) Phân loại ý kiến (opinion

cộng tác (collaborative filtering), dựa trên tri thức (knowledge-

classification) và (iii) Tổng hợp ý kiến (opinion summarization)
(Ali, 2015; Kumar và Reddy, 2016). Trong đó, phân loại ý kiến


13

14

được xem là bước quan trọng nhất nhằm mục đích phân lớp ý


CHƯƠNG 3: ĐỀ XUẤT MƠ HÌNH HỆ THỐNG HỖ
TRỢ ĐÁNH GIÁ CHẤT LƯỢNG DỊCH VỤ DU LỊCH
DỰA TRÊN PHƯƠNG PHÁP KHAI THÁC Ý KIẾN
KHÁCH HÀNG TRỰC TUYẾN

kiến theo các quan điểm: lạc quan, tích cực (positive); bi quan,
tiêu cực (negative) và trung lập (neutral).
2.3.3. Kỹ thuật phân loại ý kiến
Có hai cách tiếp cận phổ biến trong phân loại ý kiến: dựa vào
phương pháp máy học (Machine learning), dựa vào từ vựng

3.1. Mơ hình nghiên cứu đề xuất

(Lexicon based) (Medhat và cộng sự, 2014; Dhokrat và cộng sự,

3.1.1. Mơ hình lý thuyết

2015; Yadav, 2015; Sun và cộng sự, 2017). Ngoài ra, để gia tăng

Nghiên cứu đề xuất xây dựng mơ hình hệ thống như hình 3.1:

hiệu suất của việc phân loại ý kiến, các nghiên cứu đã dùng
phương pháp lai kết hợp hai phương pháp máy học và từ vựng.
2.3.4. Đánh giá tính hiệu quả của phân loại ý kiến
Hệu quả của phân loại ý kiến thường được đánh giá dựa trên 4
chỉ số: Accuracy, Precision, Recall và F1.
Bảng 2.3: Ma trận sai lầm
Dự báo: Positive

Dự báo: Negative


Thực tế: Positive

True Positive (TP)

False Negative (FN)

Thực tế: Negative

False Positive (FP)

True Negative (TN)

Các chỉ số được xác định bằng các công thc sau:

ã =
ã
ã
ã





=

ì ì
1 =

=


Hỡnh 3.1: Mơ hình nghiên cứu đề xuất

3.1.2. Mơ hình kiến trúc hệ thống
Hệ thống bao gồm ba phân hệ chính: (1) Phân hệ thu thập dữ liệu,
(2) Phân hệ phân tích dữ liệu, và (3) Giao diện người dùng.


15

16
bằng tiếng Việt. Nghiên cứu tiến hành tiền xử lý dữ liệu bằng
cách loại bỏ những dữ liệu khuyết, những bình luận khơng chứa
đựng thơng tin cần thiết để tiến hành bước xử lý tiếp theo.
3.2.2. Thử nghiệm mơ hình phân loại ý kiến
Trình tự thử nghiệm mơ hình phân loại ý kiến:


Gán nhãn dữ liệu (Data Labeling)



Làm sạch dữ liệu (Data Cleaning)



Tách từ (Words Segmentation)




Trích xuất đặc trưng (Feature Extraction)



Huấn luyện (Training)



Đánh giá mơ hình (Validation)

3.2.3. Xây dựng phương pháp hỗ trợ đánh giá chất lượng dịch vụ
3.2.3.1. Phương pháp xếp hạng dịch vụ
Việc tổng hợp và xếp hạng dịch vụ du lịch theo quan điểm của
Hình 3.2: Mơ hình kiến trúc hệ thống

3.2. Thiết kế nghiên cứu
Quy trình thực nghiệm gồm các bước: (1) Thu thập và Tiền xử
lý dữ liệu, (2) Thử nghiệm mơ hình phân loại ý kiến, (3) Xây
dựng phương pháp hỗ trợ đánh giá chất lượng dịch vụ, (4) Xây
dựng phương pháp tư vấn hỗ trợ lựa chọn dịch vụ, và (5) Xây
dựng giao diện người dùng.
3.2.1. Thu thập và tiền xử lý dữ liệu
Nghiên cứu này tiến hành thu thập dữ liệu bằng chương trình tự
động, dữ liệu lấy từ trang web agoda.com. Với đối tượng và phạm
vi nghiên cứu hướng đến là ngôn ngữ tiếng Việt, kỹ thuật khai
phá dữ liệu sử dụng để lọc chọn những bình luận của khách hàng

du khách có thể dựa vào cơng thức:
்௉ ି ்ே
‫ܪ‬௜ = ೔்ோ ೔



Trong đó:

(3.1)



Hi: là điểm xếp hạng của khách sạn thứ i



TPi: là số bình luận được đánh giá là “tích cực” của



TNi: là số bình luận được đánh giá là “tiêu cực” của



TRi: là tổng số bình luận nhận được của khách sạn thứ i

khách sạn thứ i
khách sạn thứ i
Ngồi ra, có thể chuẩn hóa theo thang đo khác tùy thuộc vào mục
đích so sánh, đánh giá khách sạn:
R′௜ = ܽ +

ሺு೔ ିெ௜௡ሼுభ ,ுమ ,…,ு೙ ሽሻ×ሺ௕ି௔ሻ
ெ௔௫ሼுభ ,ுమ ,…,ு೙ ሽିெ௜௡ሼுభ ,ுమ ,…,ு೙ ሽ


(3.2)


17

18

Trong đó:

Chuẩn hóa STD_scorei sẽ tính được mức độ quan trọng tương



R’i: điểm xếp hạng của khách sạn thứ i đã chuẩn hóa



a và b là cận dưới và cận trên của thang đo (ví dụ nếu
muốn đưa về thang đo 1-5 điểm, lúc này a = 1, b = 5)

RI௜ =

đối (Relative importance) RIi của mỗi khía cạnh ai:
ௌ்஽_௦௖௢௥௘೔ ିெ௜௡ሼௌ்஽_௦௖௢௥௘భ ,ௌ்஽_௦௖௢௥௘మ ,…,ௌ்஽_௦௖௢௥௘೙ ሽ

ெ௔௫ሼௌ்஽_௦௖௢௥௘భ ,ௌ்஽_௦௖௢௥௘మ ,…,ௌ்஽_௦௖௢௥௘೙ ሽିெ௜௡ሼௌ்஽_௦௖௢௥௘భ ,ௌ்஽_௦௖௢௥௘మ ,…,ௌ்஽_௦௖௢௥௘೙ ሽ

(3.7)


3.2.3.2. Phương pháp xếp hạng thuộc tính dịch vụ
Nghiên cứu này sử dụng phương pháp xếp hạng khía cạnh dịch

3.2.4. Xây dựng phương pháp tư vấn hỗ trợ lựa chọn dịch vụ

vụ của Marrese-Taylor và cộng sự (2014), được mô tả như sau:

Trình tự thực hiện được tiến hành như sau:

Gọi Pi và Ni là số quan điểm tích cực (positive) và số quan điểm



Bước 1: Xác định độ tương tự của khách hàng mới so



Bước 2: Dự đốn mức độ ưa thích khách sạn của khách

với khách hàng đã có trong hệ thống

tiêu cực (negative) của khía cạnh (thuộc tính) ai.
P_scorei và N_scorei là giá trị chuẩn hóa của Pi và Ni theo qui tắc
Min-Max, P_scorei và N_scorei sẽ nhận giá trị từ 0 đến 1, như
công thức sau:
ܲ_‫݁ݎ݋ܿݏ‬௜ =

ܰ_‫݁ݎ݋ܿݏ‬௜ =

⎧ 0,



ܲ௜ = 0

kỹ thuật dự đoán phổ biến thuộc phương pháp lọc cộng tác, bao


௉೔ ିெ௜௡ሼ௉భ ,௉మ ,…,௉೙ ሽ

, ܲ௜ ≠ 0
⎩ ெ௔௫ሼ௉భ,௉మ,…,௉೙ ሽିெ௜௡ሼ௉భ,௉మ,…,௉೙ ሽ

(3.3)


ே೔ ିெ௜௡ሼேభ ,ேమ ,…,ே೙ ሽ

, ܰ௜ ≠ 0
⎩ ெ௔௫ሼேభ,ேమ,…,ே೙ ሽିெ௜௡ሼேభ,ேమ,…,ே೙ ሽ

(3.4)

⎧ 0,


hàng trong hệ thống bằng phương pháp lọc cộng tác.
Nghiên cứu này sẽ tiến hành huấn luyện và thử nghiệm một số
gồm: Phân phối chuẩn ND (Normal Distribution), Thuật toán
KNN (K-Nearest Neighbors), Đồng phân cụm CC (CoClustering), Kỹ thuật phân rã ma trận MF (Matrix Factorization).


ܰ௜ = 0

3.2.5. Xây dựng giao diện người dùng
Màn hình giao diện hệ thống hỗ trợ người dùng đánh giá chất
lượng dịch vụ khách sạn được xây dựng trên cơ sở tổng hợp các

Độ lệch chuẩn điểm số của khía cạnh ai được tính bằng cơng thức

xử lý, tính tốn, phân tích để người dùng có thể tự động hóa quy

bên dưới, trong đó AV_scorei là điểm trung bình và STD_scorei

trình đánh giá và cải tiến chất lượng.

là độ lệch chuẩn:
‫݁ݎ݋ܿݏ_ܸܣ‬௜ =
ܵܶ‫݁ݎ݋ܿݏ_ܦ‬௜ = ට

௉_௦௖௢௥௘೔ ାே_௦௖௢௥௘೔


(3.5)

ሺ௉_௦௖௢௥௘೔ ି ஺௏_௦௖௢௥௘೔ ሻమ ାሺே_௦௖௢௥௘೔ ି ஺௏_௦௖௢௥௘೔ ሻమ


(3.6)


19


CHƯƠNG 4: KẾT QUẢ THỰC NGHIỆM XÂY DỰNG
HỆ THỐNG HỖ TRỢ ĐÁNH GIÁ CHẤT LƯỢNG
DỊCH VỤ DU LỊCH DỰA TRÊN PHƯƠNG PHÁP
KHAI THÁC Ý KIẾN KHÁCH HÀNG TRỰC TUYẾN

20
luyện lại. Kết quả nghiên cứu này đã giúp xác định phương pháp
và công cụ phân loại ý kiến phù hợp.
4.1.3. Kết quả hỗ trợ đánh chất lượng dịch vụ
4.1.3.1. Kết quả xếp hạng khách sạn
Việc xếp hạng khách sạn theo quan điểm của du khách được thực

4.1. Kết quả thực nghiệm nghiên cứu

hiện như trong công thức (3.1) và (3.2). Nghiên cứu này sử dụng

4.1.1. Kết quả thu thập và tiền xử lý dữ liệu

thang điểm từ 1 đến 5 và thực hiện làm tròn điểm số. Kết quả cho

Kết quả thu thập dữ liệu được 39.976 bình luận bao gồm cả tiếng

thấy khách sạn được đánh giá 4 điểm chiếm số lượng cao nhất

Anh và tiếng Việt, trong khoảng thời gian từ năm 2010 đến năm

(209 khách sạn) và khách sạn được đánh giá 1 điểm chiếm số

2019. Sau khi lọc bỏ các bình luận bằng tiếng Anh, chỉ giữ lại


lượng thấp nhất (12 khách sạn).

các bình luận bằng Tiếng Việt, dữ liệu còn lại để tiến hành thực

4.1.3.2. Kết quả trích xuất khía cạnh dịch vụ

nghiệm là 14.559 bình luận của 521 khách sạn ở 40 tỉnh thành

Nghiên cứu này dùng phương pháp TF-IDF để trích xuất ra

trên cả nước.

khoảng 200 danh từ và cụm danh từ có chỉ số TF-IDF cao nhất

4.1.2. Kết quả thử nghiệm mơ hình phân loại ý kiến

trong tập dữ liệu. Sau khi xem xét về ngữ nghĩa và tham khảo các

Nghiên cứu này tiến hành thử nghiệm bằng 6 thuật toán, bao

chuyên gia, kết quả giữ lại 40 khía cạnh có ý nghĩa trong lĩnh vực

gồm: Naïve Bayes (NB), Support Vector Machines (SVM),

khách sạn. Kết quả thực nghiệm tính tốn với cơng thức (3.7) đã

Logistic Regression (LR), Neural Network (NN), DecisionTree

xác định được mức độ quan trọng tương đối của các khía cạnh


(DT), RandomForest (RF). Kết quả thử nghiệm cho thấy các mô

dịch vụ khách sạn, và được xem như bộ tiêu chí có trọng số cho

hình LR, SVM và NN có độ chính xác khá cao (lần lượt là 0,79;

các yếu tố chất lượng dịch vụ khách sạn, làm cơ sở cho nhà kinh

0,78 và 0,79). Nghĩa là các mơ hình này tương đối phù hợp với

doanh dịch vụ du lịch xem xét, đánh giá và so sánh chất lượng

tập dữ liệu huấn luyện. Tuy nhiên, nếu xét thêm yếu tố thời gian

dịch vụ giữa các khách sạn trong cùng một tỉnh thành hoặc giữa

thì chỉ nên chọn mơ hình LR và SVM là tốt nhất. Do đó, các ứng

các tỉnh thành khác nhau.

dụng tiếp theo có thể dùng hai mơ hình này như một công cụ để

4.1.4. Kết quả tư vấn hỗ trợ lựa chọn dịch vụ

phân loại ý kiến cho các dữ liệu bình luận chưa được phân loại

Kết quả trên cho thấy phương pháp MF có sai số thấp nhất là

hoặc các dữ liệu bình luận mới phát sinh mà không cần phải huấn


0,4373; kế đến là phương pháp KNN có sai số 0,4408; thứ ba là
CC với sai số 0,456 và cuối cùng là ND có sai số cao nhất là


21

22

0,5712. Do chênh lệch về thời gian xử lý giữa các phương pháp

4.2. Các khuyến nghị từ kết quả thực nghiệm nghiên cứu

không đáng kể nên nghiên cứu này quyết định chọn phương pháp

4.2.1. Về phạm vi triển khai hệ thống

MF làm giải pháp để xây dựng chức năng tư vấn dịch vụ.

Các doanh nghiệp có thể: (i) xây dựng và triển khai hệ thống theo

4.1.5. Giao diện hỗ trợ người dùng

dạng tích hợp vào hệ thống CRM của doanh nghiệp để đánh giá
chất lượng dịch vụ của chính doanh nghiệp đó; (ii) xây dựng và
triển khai như một hệ thống độc lập, có thể khai thác các nguồn
dữ liệu trên mạng để đánh giá chất lượng dịch vụ của nhiều doanh
nghiệp khác nhau trong ngành du lịch.
4.2.2. Về công nghệ lưu trữ và xử lý dữ liệu
Khi triển khai thực tế, doanh nghiệp cần tính đến ứng dụng các

cơng nghệ lưu trữ dữ liệu lớn, bên cạnh đó là xem xét khả năng
trang bị hệ thống tính tốn hiệu suất cao. Tuy nhiên, vấn đề này

Hình 4.7: Màn hình dành cho nhà quản trị

cũng cần phải đánh giá tính khả thi của dự án, giữa chi phí đầu
tư hạ tầng cơng nghệ thơng tin và lợi ích kỳ vọng mà hệ thống
này mang lại.
4.2.3. Về quy trình vận hành hệ thống
Các chức năng thu thập dữ liệu, tiền xử lý dữ liệu, huấn luyện lại
các mơ hình phân loại ý kiến và tư vấn lựa chọn dịch vụ cũng nên
được thực hiện một cách định kỳ. Bên cạnh đó cũng tùy thuộc
vào tốc độ tăng trưởng và biến động của nguồn dữ liệu bình luận
của khách hàng trên các trang mạng và các nền tảng xã hội.
4.2.4. Về người sử dụng hệ thống
Ngồi đối tượng sử dụng chính của hệ thống là nhà quản trị doanh

Hình 4.8: Màn hình dành cho khách hàng

nghiệp và khách hàng, các chức năng thu thập dữ liệu, tiền xử lý
dữ liệu, huấn luyện, đánh giá và lựa chọn các mơ hình phân loại


23

24

ý kiến nên được thực hiện bởi các chuyên gia tri thức, đặc biệt là

khách hàng trực tuyến. Về mặt giải pháp, nghiên cứu đã đề xuất


là các chuyên gia về khoa học dữ liệu.

ứng dụng phương pháp khai thác ý kiến khách hàng trực tuyến,

4.2.5. Về khả năng mở rộng hệ thống

đặc biệt là phương pháp máy học có giám sát. Đồng thời, nghiên

Hệ thống có thể mở rộng thu thập thêm dữ liệu bình luận về

cứu đã đề xuất phương pháp xếp hạng các thực thể, đối tượng và

khách sạn trên các trang như Booking, Tripadvisor, hoặc mạng

thuộc tính của đối tượng dựa trên khai thác ý kiến khách hàng.

xã hội. Tuy nhiên, nghiên cứu sẽ gặp một thách thức lớn trong

Bên cạnh đó, nghiên cứu cũng đã đề xuất phương pháp tư vấn

việc hợp nhất các nguồn dữ liệu khác nhau.

khách hàng lựa chọn dịch vụ, trong đó kết hợp lai phương pháp
lọc cộng tác và kết quả xếp hạng đối tượng có được từ khai thác
ý kiến khách hàng trực tuyến. Các kết quả đạt được về cơ bản đã

KẾT LUẬN

trả lời các câu hỏi nghiên cứu đặt ra trong phần mở đầu. Trên cơ


Nghiên cứu trong luận án này được tiến hành nhằm xây dựng hệ

áp dụng hệ thống này trong thực tiễn. Đây là bản tham chiếu cho

thống hỗ trợ đánh giá chất lượng dịch vụ du lịch dựa trên phương

các nhà nghiên cứu và các nhà quản trị doanh nghiệp khơng chỉ

sở đó, nghiên cứu đưa ra một số khuyến nghị để có thể triển khai

pháp khai thác ý kiến khách hàng trực tuyến. Trên cơ sở tổng

trong lĩnh vực du lịch mà cịn có thể mở rộng cho các lĩnh vực

quan tình hình nghiên cứu trong và ngồi nước liên quan đến đề

kinh doanh khác. Tuy nhiên, do điều kiện thời gian và sự phức

tài, và lý luận dựa trên các lý thuyết nền tảng, nghiên cứu này

tạp của các giải pháp cơng nghệ, nghiên cứu này cịn nhiều hạn

một lần nữa khẳng định sự cần thiết của đề tài nghiên cứu bằng

chế, tạo ra khoảng trống để tiếp tục nghiên cứu, phát triển trong

khung phân tích khái niệm nghiên cứu, đồng thời cũng đề xuất

tương lai.


mơ hình nghiên cứu tổng qt. Nghiên cứu đã sử dụng phương
pháp luận tiếp cận theo kỹ thuật hệ thống, quy trình nghiên cứu
được thực hiện theo các bước của phương pháp khai thác dữ liệu
theo chuẩn cơng nghiệp CRISP-DM. Dữ liệu là các bình luận
bằng tiếng Việt của du khách về các khách sạn tại Việt Nam,
được thu thập trên trang web Agoda. Về mặt kiến trúc hệ trúc hệ
thống, nghiên cứu đã đề xuất một mơ hình hệ thống hỗ trợ đánh
giá chất lượng dịch vụ dựa trên khai thác ý kiến và thông tin của



×