Tải bản đầy đủ (.pdf) (81 trang)

Ứng dụng công nghệ semantic web nhằm tăng thứ hạng của doanh nghiệp nam đặng hoàng trên môi trường công cụ tìm kiếm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.81 MB, 81 trang )

FPT EXECUTIVE MBA PROGRAM (FeMBA)
Chương trình Thạc sĩ Quản trị kinh doanh – Trường Đại học FPT

LUẬN VĂN TỐT NGHIỆP
ỨNG DỤNG CÔNG NGHỆ SEMANTIC WEB NHẰM TĂNG THỨ HẠNG
CỦA DOANH NGHIỆP “NAM ĐẶNG HỒNG” TRÊN MƠI TRƯỜNG
CƠNG CỤ TÌM KIẾM

i

0

0


FPT EXECUTIVE MBA PROGRAM (FeMBA)
Chương trình Thạc sĩ Quản trị kinh doanh – Trường Đại học FPT

Bài luận văn này được nộp cho
VIỆN QUẢN TRỊ KINH DOANH (FSB)
(TRƯỜNG ĐẠI HỌC FPT)

BẢN LUẬN VĂN LÀ MỘT PHẦN BẮT BUỘC
TRONG CHƯƠNG TRÌNH ĐÀO TẠO THẠC SĨ QUẢN TRỊ KINH DOANH

ii

0

0



Tháng 7, 2021
Phê duyệt của Chương trình Thạc sĩ Quản trị kinh doanh – Trường Đại học FPT

Chủ nhiệm chương trình
Tơi xác nhận rằng bản luận văn này đã đáp ứng được các yêu cầu của một luận văn
tốt nghiệp thuộc chương trình đào tạo Thạc sỹ Quản trị kinh doanh.

Chủ nhiệm chương trình
Chúng tơi, ký tên dưới đây xác nhận rằng chúng tơi đã đọc tồn bộ luận văn này và
cơng nhận bản luận văn hồn tồn đáp ứng các tiêu chuẩn của một luận văn Thạc
sỹ Quản trị kinh doanh.

Giáo viên hướng dẫn
Các thành viên hội đồng

iii

0

0


CAM KẾT
Tôi xin cam kết rằng nội dung của bản luận văn này chưa được nộp cho bất kỳ chương
trình cấp bằng cao học nào cũng như bất kỳ một chương trình đào tạo cấp bằng nào
khác.
Tơi cũng xin cam kết rằng bản luận văn này là nỗ lực cá nhân của tơi. Các kết quả,
phân tích, kết luận trong luận văn này (ngồi các phần được trích dẫn) đều là kết quả
làm việc của cá nhân tôi.

Chữ ký của học viên

iv

0

0


LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn chân thành tới Viện Quản trị kinh doanh FSB – Trường Đại
học FPT, các Quý thầy cô đã giúp tôi trang bị kiến thức, tạo điều kiện thuận lợi cho tôi
trong suốt quá trình học tập và thực hiện luận văn này.
Với lịng kính trọng và biết ơn, tơi xin được bày tỏ lời cảm ơn tới TS.
…………………………………. đã quan tâm, khuyến khích, và chỉ dẫn cho tơi trong
q trình thực hiện luận văn này.
Xin chân thành cảm ơn các thành viên trong tập thể lớp FeMBA 19 và các lãnh đạo,
đồng nghiệp tại Công ty TNHH Thương mại dịch vụ Nam Đặng Hồng đã hỗ trợ tơi
trong q trình thực hiện luận văn này.
Tôi xin gửi lời tri ân sâu sắc đến gia đình và những người bạn đã động viên, hỗ trợ
tơi rất nhiều trong suốt q trình học tập và hoàn thành luận văn.

v

0

0


DANH MỤC TỪ VIẾT TẮT


Từ viết tắt

Tên đầy đủ

DN

Doanh nghiệp

BMC

Bussines Model Canvas

P.O.E

Mơ hình truyền thơng hội tụ Paid – Owned – Earned

Công ty

Công ty TNHH Thương mại dịch vụ Nam Đặng Hoàng

NĐH

Nam Đặng Hoàng

NTTT

Nhà thuốc thân thiện

KHMT


Khách hàng mục tiêu

GSC

Google Search Console

vi

0

0


DANH MỤC BIỂU ĐỒ
Biểu đồ 2. 1: Khung phân tích. .............................................................................. 20
Biểu đồ 3. 1: Quy trình nghiên cứu.

22

Biểu đồ 3. 2: DN đã ứng dụng các kênh truyền thông trên nền tảng nào? ............... 25
Biểu đồ 3. 3: Tỷ trọng sử dụng ngân sách cho các kênh truyền thông của DN? ...... 25
Biểu đồ 3. 4: Tỷ trọng sử dụng ngân sách cho các kênh truyền thông của DN? ..... 26
Biểu đồ 3. 5: Các khó khăn DN gặp phải hiện nay trên nền tảng số digital? ........... 27
Biểu đồ 4. 1: Phân tích SWOT.

35

Biểu đồ 4. 2: Báo cáo các trang có vị trí thấp so với các kết quả tìm kiếm của Google.
.............................................................................................................................. 47

Biểu đồ 4. 3: Sơ đồ tri thức cho website DN. ......................................................... 52
Biểu đồ 5. 1: Báo cáo của Wearesocial.

54

Biểu đồ 5. 2: Website được ngườ i dùng Việt ghé thăm nhiều nhất. ........................ 54
Biểu đồ 5. 3: Sơ đồ biểu diễn gán các kiểu cho tài nguyên và liên kết trong website
của NĐH. .............................................................................................................. 56
Biểu đồ 5. 4:Báo cáo hiệu suất của Google Search Console cho website Nhà thuốc
thân thiện từ 1/12/2020 - 1/7/021. .......................................................................... 57
Biểu đồ 5. 5: Giải pháp tiêu chuẩn nội dung có hệ thống cho website DN NĐH. ... 58
Biểu đồ 5. 6: Cụm chủ đề website DN NĐH. ......................................................... 60
Biểu đồ 5. 7: Tổng quan về đối tượng người dùng Facebook. ................................ 61
Biểu đồ 5. 8: Tổng quan về đối tượng người dụng Instagram. ............................... 61
vii

0

0


Biểu đồ 5. 9: Sơ đồ tri thức của website doanh nghiệp Nam Đặng Hoàng. ............. 63
Biểu đồ 5. 10: Báo cáo các chỉ số website nhathuocthanthien.com.vn từ Ahref tháng
7/ 2021. ................................................................................................................. 64

viii

0

0



DANH MỤC HÌNH ẢNH
Hình 2. 1: Các lớp cấu trúc Semantic Web............................................................... 6
Hình 2. 2: Sử dụng URIs để đặt tên cho nguồn thông tin. Sử dụng URIs để đặt tên
cho nguồn thơng tin. ................................................................................................ 7
Hình 2. 3: XML khai báo tiền tố khơng gian tên. ..................................................... 7
Hình 2. 4: Đồ thị RDFs đơn giản. ............................................................................ 8
Hình 2. 5: Cấu trúc đồ thị chính thức của RDF. ....................................................... 9
Hình 2. 6: Bộ 3 RDF. ............................................................................................... 9
Hình 2. 7: Bản thể các phương tiện. ....................................................................... 10
Hình 2. 8: Đồ thị của một bản thể học RDFs đơn giản. .......................................... 10
Hình 2. 9: Các lớp Web ngữ nghĩa phụ thuộc quy quy tắc đơn giản. ...................... 12
Hình 2. 10: Mối quan hệ dữ liệu qua RDF. ............................................................ 15
Hình 4. 1: Cửa hàng vật lý của doanh nghiệp Nam Đặng Hoàng với tên Nhà thuốc
thân thiện.

31

Hình 4. 2: Mơ hình kinh doanh của doanh nghiệp NĐH. ....................................... 32
Hình 4. 3: NĐH đi bài trên báo Sức khỏe và Đời sống với tên Nhà thuốc thân thiện.
.............................................................................................................................. 38
Hình 4. 4: Nam Đặng Hồng trên báo Gia đình với tên Nhà thuốc thân thiện. ....... 39
Hình 4. 5: Nam Đặng Hồng trên báo VTC với tên Nhà thuốc thân thiện. ............. 39
Hình 4. 6: Nam Đặng Hoàng trên báo 24H với tên Nhà thuốc thân thiện. .............. 40
Hình 4. 7: Nam Đặng Hồng trên báo Dân trí với tên Nhà thuốc thân thiện. .......... 40
ix

0


0


Hình 4. 8: Hiệu suất tìm kiếm website DN qua báo cáo của Google Search Console.
.............................................................................................................................. 41
Hình 4. 9: Trang fanpage chính thức của Nam Đặng Hồng với tên Nhà thuốc thân
thiện. ..................................................................................................................... 42
Hình 4. 10: Nam Đặng Hồng trên Instagram với tên Nhà thuốc thân thiện. .......... 42
Hình 4. 11: Nam Đặng Hoàng trên Linkedin với tên Nhà thuốc thân thiện............. 43
Hình 4. 12: Trang chủ của website doanh nghiệp NĐH với tên Nhà thuốc thân thiện.
.............................................................................................................................. 43
Hình 4. 13: Nam Đặng Hoàng trên mạng xã hội Twitter với tên Nhà thuốc thân thiện.
.............................................................................................................................. 44
Hình 4. 14: Nam Đặng Hoàng trên Youtube với tên Nhà thuốc thân thiện. ............ 44
Hình 5. 1: Lớp chữ ký điện tử của NTTT.

56

x

0

0


MỤC LỤC
CHƯƠNG 1: PHẦN MỞ ĐẦU .......................................................................................... 1
1.1.

Tính cấp thiết của đề tài ............................................................................... 1


1.2.

Mục tiêu nghiên cứu ..................................................................................... 2

1.3.

Câu hỏi nghiên cứu ....................................................................................... 3

1.4.

Đối tượng và phạm vi nghiên cứu ................................................................ 3

1.4.1.

Đối tượng nghiên cứu ............................................................................. 3

1.4.2.

Phạm vi nghiên cứu ................................................................................ 4

1.5.

Ý nghĩa lý luận và thực tiễn đề tài ............................................................... 4

1.5.1.

Ý nghĩa lý luận ........................................................................................ 4

1.5.2.


Thực tiễn đề tài ....................................................................................... 4

1.6.

Kết cấu đề tài ................................................................................................ 4

CHƯƠNG 2: TỔNG QUAN TÀI LIỆU VÀ CƠ SỞ LÝ LUẬN ............................. 5
2.1.

Tổng quan về Semantic Web ........................................................................ 5

2.1.1.

Khái niệm về Semantic Web .................................................................... 5

2.1.2.

Thành phần của Semantic Web .............................................................. 5

2.2.

Ứng dụng Semantic trên cơng cụ tìm kiếm ............................................... 14

2.3.

Cơ sở lý luận ............................................................................................... 18

2.3.1.


Cách hoạt động của cơng cụ tìm kiếm Google ...................................... 18

2.3.2.

Các nền tảng marketing kỹ thuật số...................................................... 19
xi

0

0


2.4.

Khung phân tích ......................................................................................... 20

CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU .........................................................22
3.1.

Phương pháp nghiên cứu ........................................................................... 22

3.1.1.

Quy trình nghiên cứu ............................................................................ 22

3.1.2.

Phương pháp thu thập dữ liệu sơ cấp ................................................... 22

3.1.3.


Phương pháp thu thập dữ liệu thứ cấp ................................................. 23

3.1.4.

Phương pháp phân tích dữ liệu ............................................................ 23

3.1.5.

Phương pháp xử lý, tổng hợp và phân tích dữ liệu ............................... 24

3.2.

Phương pháp nghiên cứu được áp dụng trong đề tài ................................ 24

3.2.1.

Phương pháp thu thập dữ liệu sơ cấp ................................................... 24

3.2.2.

Phương pháp thu thập dữ liệu thứ cấp ................................................. 28

3.2.3.

Phương pháp định tính ......................................................................... 29

3.2.4.

Phương pháp định lượng ...................................................................... 29


3.2.5.

Phương pháp xử lý, tổng hợp và phân tích dữ liệu ............................... 29

CHƯƠNG 4: THỰC TRẠNG DOANH NGHIỆP NAM ĐẶNG HOÀNG .........31
4.1.

Doanh nghiệp Nam Đặng Hồng ............................................................... 31

4.1.1.

Khái qt về DN .................................................................................... 31

4.1.2.

Mơ hình kinh doanh BMC .................................................................... 32

4.1.3.

Phân tích SWOT doanh nghiệp ............................................................ 35

4.2.

Thực trạng DN NĐH trên mơi trường cơng cụ tìm kiếm ......................... 37
xii

0

0



4.2.1.

Sơ đồ cấu trúc website doanh nghiệp .................................................... 37

4.2.2.

Những đặc thù nội dung của ngành dược trên môi trường CCTK....... 37

4.2.3.

Sự hiện diện của DN trên các nền tảng marketing kỹ thuật số. ........... 38

4.2.4.

Liên kết website DN với các kênh truyền thông kỹ thuật số.................. 45

4.3.

Nhận định về thứ hạng của DN NĐH trên môi trường CCTK khi áp dụng

Web ngữ nghĩa. .................................................................................................... 46
4.4.

Đánh giá chung ........................................................................................... 47

4.4.1.

Thành tựu ............................................................................................. 47


4.4.2.

Hạn chế ................................................................................................. 49

4.4.3.

Nguyên nhân ......................................................................................... 50

CHƯƠNG 5: GIẢI PHÁP ỨNG DỤNG CÔNG NGHỆ SEMANTIC WEB CHO
DN NĐH TRÊN MÔI TRƯỜNG CCTK .......................................................................53
5.1.

Bối cảnh số của doanh nghiệp .................................................................... 53

5.2.

Giải pháp ứng dụng công nghệ Web ngữ nghĩa cho DN ........................... 55

5.2.1.

Sơ đồ cấu trúc website DN .................................................................... 55

5.2.2.

Tiêu chuẩn nội dung cho website DN NĐH.......................................... 58

5.2.3.

Sự hiện diện của DN trên các nền tảng kỹ thuật số .............................. 60


5.2.4.

Liên kết của DN với các kênh truyền thông kỹ thuật số ....................... 62

KẾT LUẬN .............................................................................................................................65
TÀI LIỆU THAM KHẢO ..................................................................................................67

xiii

0

0


CHƯƠNG 1: PHẦN MỞ ĐẦU
1.1.

Tính cấp thiết của đề tài

Sự phát triển của kinh tế số là xu hướng tất yếu của các nước trên thế giới và Việt
Nam cũng khơng nằm ngồi xu thế đó. Hiện nay, có khá nhiều quan điểm, khái
niệm về kinh tế số. Theo TS. Phạm Việt Dũng (2020), thuật ngữ “kinh tế số” đã
được đề cập từ khá lâu trước khái niệm Cách mạng công nghiệp (CMCN) 4.0. Tuy
nhiên, chỉ khi CMCN 4.0 xuất hiện thì kinh tế số mới được nhắc đến nhiều hơn và
trở thành xu thế phát triển, vì nó gắn với cơng nghệ hiện đại như: Trí tuệ nhân tạo,
dữ liệu lớn, tài sản số. Trong nền kinh tế số tại Việt Nam, các doanh nghiệp sẽ đổi
mới quy trình sản xuất, kinh doanh truyền thống sang mơ hình theo hệ sinh thái,
liên kết từ khâu sản xuất, thương mại đến sử dụng và điều này sẽ làm tăng năng
suất, cũng như hiệu quả lao động.

Nhận thấy tầm quan trọng của việc phát triển kinh tế số, Nam Đặng Hoàng đặt
mục tiêu phát triển thành doanh nghiệp công nghệ số của Việt Nam. Doanh nghiệp
tổ chức phương thức ứng dụng công nghệ Semantic Web vào xây dựng website
nhằm tăng thứ hạng trên mơi trường cơng cụ tìm kiếm, phát triển doanh nghiệp
trên mơi trường số hiện nay.
John Naisbitt đã nói:" Chúng ta đang chìm ngập trong thơng tin nhưng lại khát
khao tri thức ". World Wide Web (gọi tắt là Web) đã trở thành một kho tàng thông
tin khổng lồ của nhân loại và là một môi trường chuyển tải thông tin không thể
thiếu được trong thời đại công nghiệp 4.0. Sự phổ biến và bùng nổ thông tin trên
Web đặt ra những thách thức mới, làm thế nào để khai thác được thông tin trên
Web một cách hiệu quả, mà cụ thể là làm thế nào để máy tính có thể trợ giúp xử
lý tự động được chúng. Muốn vậy, trước hết máy tính phải hiểu được thơng tin
trên các tài liệu Web, trong khi thế hệ Web hiện tại thông tin được biểu diễn dưới
dạng chỉ con người mới đọc hiểu được.

1

0

0


Các chuyên gia dự đoán, bề nổi của Web (Surface Web) chứa đến hàng chục tỷ
trang tài liệu trong khi, ở phần sâu của Web thì chứa đến ngàn tỷ trang tài liệu. Có
khoảng hơn nửa số thơng tin này thuộc các cơ sở dữ liệu có chủ đề riêng biệt.
Các trang Web hiện nay có ít đường liên kết tới các trang Web khác nên việc tìm
kiếm là khó khăn. Ngồi ra, thơng tin tìm kiếm được khơng theo chủ đề mà chỉ là
vấn đề tìm thoả theo từ khố đơn thuần, kết quả tìm kiếm phải do con người chọn
lại theo chủ đề mong muốn. Những vấn đề này đã thúc đẩy sự ra đời của ý tưởng
Web ngữ nghĩa (Semantic Web), một thế hệ mới của Web, mà chính cha đẻ của

World Wide Web là Tim Berners-Lee đề xuất vào năm 1998.
Nắm bắt được xu thế và thị trường phát triết của mơi trường cơng cụ tìm kiếm,
trong thời gian qua hoạt động marketing trên môi trường số đã được doanh nghiệp
NĐH đặc biệt quan tâm và chú trọng. Tuy nhiên hiệu quả của hoạt động này đem
lại chưa tương xứng với tiềm năng hiện có của thị trường, các thông tin mà doanh
nghiệp cung cấp chưa đáp ứng được thị trường số với lượng người dùng trên mơi
trường cơng cụ tìm kiếm hiện tại. Vấn đề cấp thiết đặt ra hiện nay đối với doanh
nghiệp là đưa ra được giải pháp nhằm tăng thứ hạng của website doanh nghiệp trên
mơi trường cơng cụ tìm kiếm, tăng hiện hiện diện được nhiều người dùng biết đến
và tự chủ thông tin doanh nghiệp. Khai thác tiềm năng cho hiệu quả kinh doanh
bền vững, lâu dài của doanh nghiệp là việc hết sức quan trọng.
Tuy nhiên, doanh nghiệp NĐH có ngân sách cho quảng cáo lớn về nguồn lực cho
kỹ thuật quảng cáo, nguồn lực cho nội dung chiến dịch để hiệu suất trong kết quả
tìm kiếm 9 tháng đầu tạo lập website DN.
Vì vậy, đề tài “Ứng dụng công nghệ Semantic Web nhằm tăng thứ hạng doanh
nghiệp Nam Đặng Hồng trên mơi trường cơng cụ tìm kiếm” để DN chủ động
truyền thông kinh doanh, không phụ thuộc vào cơng nghệ quảng cáo. Đề tài vừa
có ý nghĩa ứng dụng thực tế, vừa có ý nghĩa về mặt khoa học và đề xuất được mơ
hình ứng dụng cơng nghệ mới vào hoạt động marketing cho doanh nghiệp.
1.2.

Mục tiêu nghiên cứu

2

0

0



Đề tài “Ứng dụng công nghệ Semantic Web nhằm tăng thứ hạng doanh nghiệp
Nam Đặng Hồng trên mơi trường cơng cụ tìm kiếm” là nghiên cứu về các lớp của
Web ngữ nghĩa và thực tế ứng dụng các lớp Semantic trong việc tăng thứ hạng
website doanh nghiệp trên công cụ tìm kiếm Google.
Đề tài nghiên cứu về các lớp của web ngữ nghĩa, ứng dụng của Semantic Web
trong việc xây dựng bộ máy tin và ứng dụng trong thư viện số của doanh nghiệp
Nam Đặng Hoàng. Ứng dụng này sẽ giúp doanh nghiệp chủ động quản trị dữ liệu
thông tin và chủ động tạo nội dung hấp dẫn người tiêu dùng có những hành động
mà doanh nghiệp mong đợi như: sự tương tác, đăng ký, dùng thử hay mua hàng.
Ứng dụng cơng nghệ Semantic Web giúp doanh nghiệp có thể chủ động kiểm sốt
nội dung, thơng tin và trải nghiệm của khách hàng. Các dạng website nói chung là
cốt lõi của Owned Platform – nơi doanh nghiệp tạo ra trải nghiệm phù hợp với
định vị, hình ảnh và thương hiệu doanh nghiệp mà không chịu sự phụ thuộc nào.
1.3.

Câu hỏi nghiên cứu

Với mục tiêu đề ra, tơi cần tìm hiểu các nền tảng kỹ thuật số, các kênh truyền thông
số và cấu trúc các lớp của Semantic Web, đánh giá về thực trạng doanh nghiệp và
giải pháp Web ngữ nghĩa cho Nam Đặng Hồng trên mơi trường cơng cụ tìm kiếm
Google ứng với hoạt động quản trị kinh doanh của doanh nghiệp Nam Đặng
Hoàng.
Các câu hỏi nghiên cứu phục vụ đề tài:
1) DN đã ứng dụng các kênh truyền thông trên nền tảng nào?
2) Tỷ trọng sử dụng ngân sách cho các kênh truyền thông của DN?
3) Đánh giá hiệu quả khi sử dụng các kênh marketing kỹ thuật số hiện tại của
DN? (Mức độ hiệu quả từ 1 đến 5: rất khơng hài lịng, khơng hài lịng, bình
thường, hài lòng, rất hài lòng)
4) Nhận xét về mức độ hiệu quả của kênh truyền thống (traditional) và kênh số
(Digital) của DN?

5) Các khó khăn DN gặp phải hiện nay trên nền tảng số digital?
6) Mong muốn cải thiện thứ hạng website doanh nghiệp là gì?
1.4.

Đối tượng và phạm vi nghiên cứu

1.4.1. Đối tượng nghiên cứu
3

0

0


Đối tượng nghiên cứu của đề tài là: Web ngữ nghĩa, doanh nghiệp (DN) Nam Đặng
Hồng, cơng cụ tìm kiếm Google, website nhathuocthanthien.com.vn.
1.4.2. Phạm vi nghiên cứu
Nội dung nghiên cứu: Ứng dụng công nghệ Semantic Web nhằm tăng thứ hạng
website doanh nghiệp Nam Đặng Hồng trên mơi trường cơng cụ tìm kiếm.
Giới hạn khơng gian: Nền tảng kỹ thuật số, các kênh truyền thơng số, cơng cụ tìm
kiếm Google và Website doanh nghiệp Nam Đặng Hoàng giai đoạn 2020 – 2021.
1.5.

Ý nghĩa lý luận và thực tiễn đề tài

1.5.1. Ý nghĩa lý luận
Đề phù hợp với nội dung, yêu cầu, mục đích của đề tài đề ra, lý luận được thực
hiện trong quá trình nghiên cứu gồm: lý thuyết của mơ hình truyền thơng hội tụ
(mơ hình Paid – Owned – Earned hay cịn gọi mơ hình POE), 7 nền tảng kỹ thuật
số và cách hoạt động của công cụ tìm kiếm Google.

1.5.2. Thực tiễn đề tài
Để tiến hành nghiên cứu, tác giả đã tiếp cận theo hướng đi từ lý luận đến thực tiễn:
Bước 1: Tiến hành nghiên cứu và thu thập các dữ liệu sơ cấp (điều tra bằng bảng
hỏi) và thứ cấp (dữ liệu báo cáo của Google Search Console.
Bước 2: Sau khi có kết quả thu thập, tác giả tiến hành tổng hợp và xử lý kết quả
điều tra bằng bảng hỏi và các chỉ số báo cáo từ GSC.
Bước 3: Tác giả phân tích các kết quả điều tra được khi thực hiện bản hỏi và dữ
liệu Google Search Console.
Bước 4: Dựa vào kết quả phân tích các dữ liệu thu thập được, tác giả đưa ra kết
luận và đánh giá được thực trạng của doanh nghiệp
1.6.

Kết cấu đề tài

Kết cấu của đề tài 5 chương:
Chương 1: Phần mở đầu
Chương 2: Tổng quan tài liệu và cơ sở lý luận
Chương 3: Phương pháp luận
Chương 4: Thực trạng doanh nghiệp Nam Đặng Hồng trên cơng cụ tìm kiếm
Chương 5: Giải pháp áp dụng cơng nghệ semantic web cho doanh nghiệp Nam
Đặng Hồng trên cơng cụ tìm kiếm
4

0

0


CHƯƠNG 2: TỔNG QUAN TÀI LIỆU VÀ CƠ SỞ LÝ LUẬN


2.1.

Tổng quan về Semantic Web

2.1.1. Khái niệm về Semantic Web
Web có ngữ nghĩa hay Semantic Web là thế hệ mở rộng của Web hiện tại. Mục
tiêu ban đầu của Semantic Web là hỗ trợ người dùng tìm kiếm thơng tin trên mạng
một cách nhanh chóng, chính xác và thơng minh hơn so với các cơng cụ tìm kiếm
truyền thống. Kể từ đó đến nay, các kỹ thuật liên quan đến Semantic Web khơng
ngừng được hồn thiện. Các ứng dụng Semantic Web được mở rộng như: phát
triển các chuẩn công nghệ chung để biểu diễn thông tin và cho phép máy tính có
thể hiểu được một số thơng tin trên Web, hỗ trợ tìm kiếm thơng minh hơn, hỗ trợ
việc khám phá, tách chiết xuất thơng tin, tích hợp dữ liệu và tự động hóa một số
cơng việc thay cho con người.
Xét về mặt bản chất, Semantic Web chỉ là một cơng cụ để con người cũng như
máy tính sử dụng để biểu diễn thơng tin. Hay nói chính xác hơn thì Semantic Web
chỉ là một dạng dữ liệu trên Web. Khác với các dạng thức dữ liệu được trình bày
trong HTML, dữ liệu trong Semantic Web được đánh dấu, phân lớp, mơ hình hóa
và được bổ sung thêm các thuộc tính, các mối liên hệ theo các lĩnh vực cụ thể, qua
đó giúp cho các phần mềm máy tính có thể hiểu được dữ liệu và tự động xử lý
được những dữ liệu đó. Chẳng hạn, với cụm từ “Nguyễn Ngọc Anh Phương”, trong
khơng gian Semantic Web, nó cũng có thể được suy luận tới cái nick có tên:
"kiep_oan_hon", với các thuộc tính cụ thể như: năm sinh, địa chỉ, số điện thoại,
email.
Vì vậy, vai trị của Semantic Web trong môi trường số hiện nay là vô cùng quan
trọng đối với doanh nghiệp muốn tăng thứ hạng trên môi trường số và nâng tầm
giá trị thương hiệu, đặc biệt với Nam Đặng Hoàng.
2.1.2. Thành phần của Semantic Web
Semantic Web là một tập hợp (stack) các ngôn ngữ và bao gồm các lớp cấu trúc
cấu thành. Tất cả các lớp của Web ngữ nghĩa được sử dụng để đảm bảo độ an tồn

và bảo vệ giá trị thơng tin trở nên tốt nhất.
World Wide Web (gọi tắt là Web) đã trở thành kho tàng có khối lượng thơng tin
khổng lồ của nhân loại. Và đây cũng là một môi trường truyền tải thông tin không
5

0

0


thể thiếu trong thời đại công nghệ thông tin ngày nay. Điều đó cũng là thách thức
để khai thác chính xác thơng tin trên web mà mình mong muốn. Cụ thể là làm thế
nào để máy tính có thể trợ giúp tổng hợp, xử lý được lượng thông tin khổng lồ đó.
Muốn vậy, web phải có khả năng mơ tả các thơng tin theo cách mà máy tính có thể
“hiểu được”. Hiện nay, hầu hết các trang web được lấp đầy thông tin và các tags
liên quan. Các tags này chủ yếu thể hiện về mặt định dạng như <H1>. Một số trang
có gắn tag để tạo ra ngữ nghĩa như <META>. Tuy nhiên tất cả các thẻ này thiếu
liên kết với nhau để cung cấp ngữ nghĩa cho trang web.
Cần phải mở rộng thế hệ Web hiện tại để máy tính có thể hiểu, tích hợp dữ liệu,
cũng như tái sử dụng dữ liệu thông qua các ứng dụng khác nhau. Chính những vấn
đề này đã thúc đẩy cho sự ra đời của web ngữ nghĩa (Semantic Web), một thế hệ
mới và tiên tiến của web. Cha đẻ của ý tưởng này là Tim Berners -Lee đề xuất vào
năm 1998.
2.1.2.1.

Các lớp cấu trúc của Semantic Web

Hình 2. 1: Các lớp cấu trúc Semantic Web. (Liyang Yu, 2014)

6


0

0


Theo Liyang Yu (2014) nghiên cứu về các lớp cấu trúc của web ngữ nghĩa: Khi
các định dạng dữ liệu trước chủ yếu có thể đọc được bằng máy, chúng có thể được
liên kết từ các trang web có thể đọc được của con người, hoặc được tích hợp vào
các trang web có thể đọc được dưới dạng chú thích ngữ nghĩa chẳng hạn như:
microformats, RDFa, or HTML5 microdata.
Các lớp cấu trúc quan trọng của Semantic Web
a. Lớp định danh tài nguyên Unicode & URI
Lớp Unicode & URI: Bảo đảm việc sử dụng tập kí tự quốc tế và cung cấp
phương tiện nhằm định danh các đối tượng trong Semantic Web. URI đơn giản
chỉ là một định danh Web giống như các chuỗi bắt đầu bằng giao thức “http”
hay “ftp” thường xun thấy trên mạng (ví dụ: ).

Hình 2. 2: Sử dụng URIs để đặt tên cho nguồn thông tin. Sử dụng URIs để đặt tên
cho nguồn thông tin. (Liyang Yu, 2014)

Bất kỳ ai cũng có thể tạo một URI, và có quyền sở hữu chúng. Vì vậy chúng đã
hình thành nên một công nghệ nền tảng lý tưởng để xây dựng một hệ thống
mạng tồn cầu thơng qua đó.
b. Lớp XML
Lớp XML cùng với các định nghĩa về vùng tên gọi (namespace) và lược đồ
(schema) bảo đảm rằng chúng ta có thể tích hợp các định nghĩa Semantic Web
với các chuẩn dựa trên XML khác.

Hình 2. 3: XML khai báo tiền tố không gian tên. (Liyang Yu, 2014)

7

0

0


Khi một URI đầy đủ thường được viết tắt bằng cách thay thế nó bằng tên đủ
điều kiện XML (Qname) của nó. Trong XML, Qname chứa tiền tố ánh xạ tới
URI không gian tên, theo sau là không gian tên và sau đó là một tên miền.
W3C đã xác định một số không gian tên tiêu chuẩn để sử dụng với công nghệ
Web, bao gồm xsd: cho định nghĩa lược đồ XML; xmlns: dành cho không gian
tên XML; và như thế. Semantic Web được xử lý theo cùng một cách, với các
định nghĩa khơng gian tên cho các lớp chính của Semantic Web (theo Dean
Allemang, Fabieng Gandon James nhận định năm 2020).
c. Lớp RDF [RDF] và RDFSchema [RDFS]
Dữ liệu RDF (Resource Description Framework) là nền tảng của web ngữ nghĩa
và có thể được coi là linh hồn của web ngữ nghĩa. Leslie F. Sikos năm 2015
(trong sách Mastering Structured Data on the Semantic Web from HTML5
Microdata to Linked Open Data) có nói rằng: RDF dựa trên một giản đồ dữ liệu
hướng đồ thị đơn giản theo ví dụ sau:

Hình 2. 4: Đồ thị RDFs đơn giản. (Leslie F. Sikos, 2015)

8

0

0



Đồ thị RDF đơn giản này có thể được mở rộng với các thuộc tính từ các từ vựng
bên ngồi khác, nhưng khái niệm vẫn giữ nguyên. Khi doanh nghiệp đã tạo tệp
RDF của mình, doanh nghiệp có một tệp siêu dữ liệu và các tài nguyên mà máy
có thể đọc được khi tải lên trang web.

Hình 2. 5: Cấu trúc đồ thị chính thức của RDF. (Leslie F. Sikos, 2015)

Lớp RDF [RDF] và RDFSchema [RDFS]: ta có thể tạo các câu lệnh (statement)
để mô tả các đối tượng với những từ vựng và định nghĩa của URI, và các đối
tượng này có thể được tham chiếu đến bởi những từ vựng và định nghĩa của
URI ở trên. Đây cũng là lớp mà chúng ta có thể gán các kiểu (type) cho các tài
nguyên và liên kết. Và cũng là lớp quan trọng nhất trong kiến trúc Semantic
Web.

Hình 2. 6: Bộ 3 RDF. (Leslie F. Sikos, 2015)

Mơ hình dữ liệu RDF dựa trên các câu lệnh để mô tả và đặc trưng cho các tài
nguyên, đặc biệt là tài nguyên web, dưới dạng các biểu thức vị từ - đối tượng
con (tài nguyên-thuộc tính-giá trị) được gọi là các câu lệnh RDF bộ ba hoặc
RDF.
Vị ngữ (thuộc tính) mơ tả mối quan hệ giữa chủ ngữ và tân ngữ. Ví dụ, câu ngôn
ngữ tự nhiên “Trang chủ của Leslie là ” có thể được
diễn đạt như trong hình 2.6. Tất cả các phần tử của bộ ba là tài nguyên được xác
định bởi một URI duy nhất.
9

0

0



d. Lớp Ontology
Lớp Ontology: hỗ trợ sự tiến hóa của từ vựng vì nó có thể định nghĩa mối liên
hệ giữa các khái niệm khác nhau. Một Ontology (bản thể luận trong logic) định
nghĩa một bộ từ vựng mang tính phổ biến & thơng thường, nó cho phép các
nhà nghiên cứu chia sẻ thông tin trong một hay nhiều lĩnh vực.
Có các bản thể học dành riêng cho các tài nguyên phương tiện, chẳng hạn như
tệp nhạc và video, như được tóm tắt như trong hình 2.7 bởi Leslie F. Sikos
(2015).

Hình 2. 7: Bản thể các phương tiện. (Leslie F. Sikos, 2015)

Hình 2. 8: Đồ thị của một bản thể học RDFs đơn giản. (Marko A. Rodriguez &
Mohammad N. Alm Muhammad A. Ali, Syamimi A. Lim, 2020)
10

0

0


Ví dụ đặc tả RDFS này mơ hình hóa sự tồn tại của một món ăn Thái Lan “cà ri
thái rau” dựa trên nước cốt dừa. Ví dụ này là kiến thức khẳng định và đưa ra các
mệnh đề về thực thể cụ thể của một lĩnh vực chủ đề. Lớp Ontologies trong RDF
và RDF schema trong mơ hình hóa biểu diễn sự tồn tại của một món ăn Thái
Lan “cà ri thái rau” dựa trên nước cốt dừa. Ví dụ này là kiến thức khẳng định
và đưa ra các mệnh đề về thực thể cụ thể của một lĩnh vực chủ đề. Lớp Ontology
có thể định nghĩa mối liên hệ giữa các khái niệm khác nhau trong một hay nhiều
lĩnh vực.

Các Ontology và các luật lập luận: Ở lớp này, dữ liệu mới có thể được suy ra từ
những dữ liệu đã có theo các luật logic. Theo Marko A. Rodriguez (2020 –
Emergent Web Intelligence: Advanced Semantic Technologies) có nói rằng:
Thực chất, dữ liệu bây giờ thơng minh đủ để được mô tả với các quan hệ cụ thể
và các dạng hình thức phức tạp. Điều này cho phép kết hợp hoặc tái kết hợp dữ
liệu nguyên thuỷ nhiều hơn và sự phân tích về dữ liệu mịn hơn.
e. Lớp Digital Signature
Rivest, R., Shamir, A., Adleman, L.: A method for obtaining digital signatures
and public-key cryptosystems. Communications of the ACM 21(2), 120–126
(1978) phát biểu rằng: “Lớp chữ ký điện tử (Digital Signature) hay còn gọi là
lớp mật mã cryptograpphy: được dùng để xác định chủ thể của tài liệu (ví dụ:
tác giả hay nhan đề của một loại tài liệu) nhằm chống vi phạm bản quyền vể sở
hữu thông tin hay sở hữu trí tuệ tác giả.
Bởi theo TS Dương Anh Đức – ThS Trần Minh Triết nghiên cứu về Mã hóa và
Ứng dụng, mật mã (Cryptography) là ngành khoa học là ngành nghiên cứu các
kỹ thuật toán học nhằm cung cấp các dịch vụ bảo vệ thông tin. Đây là ngành
khoa học quan trọng, có nhiều ứng dụng trong đời sống – xã hội. Với sự phát
triển ngày càng nhanh chóng của Internet và các ứng dụng giao dịch điện tử trên
mạng, nhu cầu bảo vệ thông tin trong các hệ thống và ứng dụng điện tử ngày
càng được quan tâm và có ý nghĩa quan trọng. Các kết quả của khoa học mật
mã ngày càng được triển khai trong nhiều lĩnh vực khác nhau của đời sống – xã

11

0

0


hội, trong đó phải kể đến rất nhiều những ứng dụng đa dạng trong lĩnh vực dân

sự, thương mại.
Trong kiến trúc của Semantic Web, chữ ký điện tử đóng một vai trị rất quan
trọng. Nó gắn liền với các tầng của kiến trúc Semantic Web kể từ tầng thứ ba
RDF, với vai trò là mở rộng cho các tầng này để đảm bảo rằng những thông tin
trong các tài liệu này là xác thực do một nhà cung cấp nào đó. Điều này giúp
ngăn chặn sự sụp đổ của Web ngữ nghĩa do chính đặc tính đơn giản và phổ cập
của nó mang đến.
f. Các lớp Logic, Proof, Trust
Các lớp Logic, Proof, Trust: Lớp thống nhất (logic) cho phép viết ra các luật
(rule) trong khi lớp thử nghiệm (proof) thi hành các luật và cùng với lớp chấp
nhận (trust) đánh giá nhằm quyết định nên hay không nên chấp nhận những vấn
đề đã thử nghiệm.

Hình 2. 9: Các lớp Web ngữ nghĩa phụ thuộc quy quy tắc đơn giản. (Pascal Hitzler,
Markus Krötzsch, Sebastian Rudol, 2010)

Cụ thể, lớp thống nhất (logic): việc biểu diễn các tài nguyên dưới dạng các bộ
từ vựng Ontology có mục đích là để máy có thể lập luận được. Mà cơ sở lập
luận chủ yếu dựa vào logic. Chính vì vậy mà các Ontology được ánh xạ sang
logic, cụ thể là logic mơ tả để có thể hỗ trợ lập luận. Vì logic mơ tả có biểu diễn
ngữ nghĩa hình thức (đặc trưng của lý thuyết mơ hình), và cung cấp các dịch vụ
lập luận, là cơ sở để hỗ trợ máy có thể lập luận và hiểu tài nguyên. Lớp thử
nghiệm (proof): lớp này đưa ra các luật để suy luận. Cụ thể từ các thơng tin đã
có có thể suy ra các thơng tin mới. Ví dụ: A là cha của B, A là em trai C thì khi
đó ta có thơng tin mới là C là bác của B. Để có được các suy luận này thì cơ sở
là FOL (First Order-Logic). Và tầng này hiện nay các nhà nghiên cứu đang xây
dựng các ngơn ngữ luật cho nó như: SWRL, RuleML. Lớp chấp nhận (trust):
nhằm đảm bảo tính tin cậy của các ứng dụng trên Web ngữ nghĩa. Ví dụ: có một
người bảo x là xanh, một người khác lại nói x không xanh, như thế Web ngữ
12


0

0


×