Tải bản đầy đủ (.docx) (77 trang)

Đánh giá thực trạng website khách sạn hữu nghị quảng trị qua công cụ tìm kiếm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.5 MB, 77 trang )

Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

Lời Cảm Ơn
Lời đầu tiên em xin chân thành cảm ơn quý thầy cô giáo Khoa Du Lịch – Đại
Học Huế đã tận tình giảng dạy và truyền đạt những kiến thức quý báu trong suốt 4
năm học Đại học vừa qua.
Đặc biệt em xin trân trọng cám ơn thầy giáo PGS.TS Võ Viết Minh Nhật đã
tận tình giúp đỡ, hướng dẫn em trong suốt thời gian nghiên cứu và hoàn thành khóa
luận này.
Xin trân trọng cám ơn Ban giám đốc, các anh chị nhân viên trong khách sạn
Hữu Nghị Quảng Trị đã tạo điều kiện thuận lợi cho em trong suốt thời gian thực tập
vừa qua, đã cung cấp những kinh nghiệm kiến thức quý báu và các tài liệu cần thiết
để em nghiên cứu, hoàn thành khóa luận này.
Xin trân trọng cám ơn gia đình, thầy cô và bạn bè đã động viên và giúp đỡ em
trong thời gian qua.
Mặc dù đã cố gắng, tuy nhiên do hạn chế về thời gian và kiến thức thực tế
nên đề tài không thể tránh khỏi những thiếu sót. Rất mong nhận được sự góp ý của
thầy cô và bạn bè để đề tài được hoàn thiện hơn.
Một lần nữa em xin chân thành cảm ơn!

Quảng Trị, ngày 08 tháng 05 năm 2017
Sinh viên thực hiện

Nguyễn Thị Thu Hoài

1
SVTH: Nguyễn Thị Thu Hoài

1


Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

LỜI CAM ĐOAN
Tôi cam đoan rằng đề tài này là do chính tôi thực hiện, các
số liệu thu thập và kết quả phân tích trong đề tài là trung thực, đề
tài không trùng với bất kỳ đề tài nghiên cứu khoa học nào.

Quảng Trị, ngày 08 tháng 05 năm 2017
Sinh viên thực hiện

Nguyễn Thị Thu Hoài

2
SVTH: Nguyễn Thị Thu Hoài

2
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

MỤC LỤC


3
SVTH: Nguyễn Thị Thu Hoài

3
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

DANH MỤC CÁC TỪ VIẾT TẮT VÀ KÍ HIỆU
ST
T
1
2
3
4

Từ viết tắt

Từ gốc

Từ diễn giải

SEO
SE
SERP
HTML


Search Engine Optimization

5

URL

Uniform Resource Locator

6
7

ALT
XML

8
9

IP
PR

Alternative
eXtensible Markup
Language
Internet Protocol
PageRank

Tối ưu hóa công cụ tìm kiếm
Công cụ tìm kiếm
Trang kết quả tìm kiếm
Ngôn ngữ đánh dấu siêu văn

bản
Tham chiếu tới tài nguyên trên
Internet
Mô tả hình ảnh trên trang web
Ngôn ngữ đánh dấu mở rộng

Search Engine

Search Engine Results Page
Hypertext Markup Language

4
SVTH: Nguyễn Thị Thu Hoài

Giao thức Internet
Thứ hạng trang

4
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

DANH MỤC HÌNH VẼ

5
SVTH: Nguyễn Thị Thu Hoài


5
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

DANH MỤC BẢNG BIỂU

6
SVTH: Nguyễn Thị Thu Hoài

6
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

PHẦN I: ĐẶT VẤN ĐỀ
1. Lí do chọn đề tài.
Thời đại bùng nổ công nghệ thông tin, các phương tiện thông tin đại chúng
ngày càng phát triển, trong đó phát triển mạnh mẽ nhất phải kể đến Internet. Với
những ưu thế vượt trội, Internet từ khi ra đời đến nay luôn đóng một vai trò quan
trọng trong đời sống xã hội, nó tác động đến mọi mặt, mọi lĩnh vực trong đời sống.
Nhờ có Internet mà xã hội phát triển nhanh hơn, mạnh hơn. Trong xã hội thông tin
như hiện nay, con người không thể làm việc nếu như thiếu Internet và cũng không
thể sống nếu không có nó. Tốc độ truy cập thông tin trên Internet cực kì nhanh, với

sự hỗ trợ của những công cụ tìm kiếm như Google, mọi người có thể tìm kiếm
thông tin trong vài giây. Chỉ cần gõ từ khóa về vấn đề cần tìm thì hàng loạt thông
tin liên quan đến vấn đề đó sẽ hiện ra cho bạn lựa chọn. Ngày nay, kinh tế thị trường
phát triển mạnh mẽ, hầu hết mọi người đều bận rộn với công việc của mình, họ
không có nhiều thời gian để đi ra ngoài mua sắm. Vì vậy mà họ đều chọn Internet
để mua sắm nhằm tiết kiệm thời gian cho bản thân. Điều này đã khiến cho các
doanh nghiệp đều đầu tư vào việc xây dựng một website riêng cho mình để đáp ứng
mọi nhu cầu cho khách hàng.
Theo số liệu mới được công bố bởi Tổ chức thống kê số liệu Internet quốc tế
(internetworldstats), tính đến hết tháng 6/2015, Việt Nam đã có 45,5 triệu người
dùng internet, đạt mức thâm nhập/dân số là 48%. Số lượng người dùng nói trên bao
gồm người truy cập internet ở tất cả các phương tiện hỗ trợ (PC, laptop, điện
thoại…) Với con số này, Việt Nam đang được xếp thứ 6 trong khu vực châu Á về số
lượng người dùng và đứng thứ 17/20 quốc gia có lượng người dùng internet nhiều
nhất thế giới. Chính vì điều này mà hiện nay các doanh nghiệp đều chú trọng vào
việc ứng dụng công nghệ thông tin vào hoạt động kinh doanh như xây dựng các
trang website để cung cấp thông tin, giới thiệu đến khách hàng gần xa một cách
nhanh chóng thông qua đường truyền internet, là chiến lược tối ưu cho hoạt động
marketing góp phần quảng bá rộng rãi chất lượng sản phẩm, dịch vụ nhằm thu hút
khách hàng, đối tác, xây dựng thương hiệu tạo uy tín trên thị trường, đồng thời nâng
7
SVTH: Nguyễn Thị Thu Hoài

7
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật


cao sức mạnh cạnh tranh cho các đơn vị kinh doanh.
Thực tế hiện nay, có hàng triệu website đang tồn tại trên internet, việc khách
hàng muốn mua sản phẩm hay tìm hiểu thông tin về công ty của bạn trên internet
đều sử dụng đến các công cụ tìm kiếm như google, yahoo, bing…khi họ gõ từ khóa
cần tìm thì google sẽ đưa ra hàng trăm hàng triệu kết quả để lựa chọn, thường thì họ
sẽ click vào 10 kết quả đầu tiên để xem. Vì vậy, việc cạnh tranh thứ hạng trên công
cụ tìm kiếm là phương pháp quảng bá website một cách nhanh nhất, đưa khách
hàng đến gần hơn với sản phẩm, dịch vụ của công ty mình. Bên cạnh đó, làm thế
nào để đưa website lên top 10 của google đang là một câu hỏi khó cho các doanh
nghiệp hiện nay. Do đó, việc tối ưu hóa công cụ tìm kiếm như là một phương pháp
hữu hiệu giúp website có vị trí cao tại trang kết quả truy vấn đầu tiên, giúp cho
người dùng dễ dàng tìm thấy kết quả nhất.
Khách sạn Hữu Nghị Quảng Trị là khách sạn 3 sao tốt nhất tại Quảng Trị. Tuy
nhiên, khách sạn vẫn còn gặp nhiều khó khăn trong việc quảng bá hình ảnh, sản
phẩm và dịch vụ đến với khách hàng, website huunghihotel.com.vn còn khá lạ lẫm
với người dùng, website còn rất nhiều mặt hạn chế do đó số lượng người truy cập
vào website và booking online còn rất thấp. Chính những điều này, tôi đã chọn đề
tài “Đánh giá thực trạng website khách sạn Hữu Nghị Quảng Trị qua công cụ
tìm kiếm” làm đề tài nghiên cứu để thu hút khách hàng đến với khách sạn, đưa ra
các giải pháp để nâng cao thứ hạng cho website.
2. Mục tiêu nghiên cứu.
Mục tiêu chung.
Đánh

giá

thực

trạng


website

khách

sạn Hữu Nghị

Quảng Trị

(huunghihotel.com.vn) qua công cụ tìm kiếm và đề xuất các giải pháp để nâng cao
thứ hạng trong tương lai.
Mục tiêu cụ thể .
-

Hệ thống hóa cơ sở lí luận về tối ưu hóa công cụ tìm kiếm.
Phân tích, đánh giá thực trạng việc áp dụng các kỹ thuật SEO của website

-

huunghihotel.com.vn.
Đề xuất một số giải pháp nâng cao thứ hạng của website và thu hút khách

8
SVTH: Nguyễn Thị Thu Hoài

8
Lớp: K47 TMĐT


Khóa luận tốt nghiệp


GVHD: PGS.TS Võ Viết Minh Nhật

hàng.
3. Đối tượng và phạm vi nghiên cứu .
Đối tượng nghiên cứu.
-

Website huunghihotel.com.vn của khách sạn Hữu Nghị Quảng Trị.

Phạm vi nghiên cứu.
-

Về không gian: Khách sạn Hữu Nghị Quảng Trị.
Về thời gian: Từ ngày 6/2/2017 – 6/5/2017.
Về nội dung: Đánh giá thực trạng website huunghihotel.com.vn thông qua
các công cụ phân tích và kiểm tra trực tuyến, từ đó đưa ra các giải pháp
khắc phục để nâng cao thứ hạng cho website khách sạn.

4. Phương pháp nghiên cứu .
-

-

Thu thập thông tin bằng phương pháp:
o Trực tiếp tiếp cận hệ thống.
o Tìm hiểu từ Internet, sách, giáo trình online, bài báo khoa học.
Xử lý thông tin bằng phương pháp:
o Phân tích thông tin, phân tích website.


5. Kết cấu đề tài.
Khoá luận gồm: Phần đặt vấn đề, phần nội dung và kết quả nghiên cứu, phần
kết luận và kiến nghị. Trong đó, phần nội dung chính tập trung trong ba chương là:
Chương 1: Cơ sở lí luận và thực tiễn về vấn đề nghiên cứu.
Chương 2: Thực trạng SEO của website khách sạn Hữu Nghị Quảng Trị.
Chương 3: Một số giải pháp nâng cao thứ hạng của website khách sạn Hữu
Nghị Quảng Trị.

9
SVTH: Nguyễn Thị Thu Hoài

9
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

PHẦN II: NỘI DUNG VÀ KẾT QUẢ NGHIÊN CỨU.
CHƯƠNG 1.

CƠ SỞ LÍ LUẬN VÀ THỰC TIỄN

1.1 Tổng quan về website.
1.1.1 Khái niệm.
Theo [5], trang thông tin điện tử (website) nói chung là hệ thống thông tin
dùng để thiết lập một hoặc nhiều trang thông tin được trình bày dưới dạng ký hiệu,
số, chữ viết, hình ảnh, âm thanh và các dạng thông tin khác phục vụ cho việc cung
cấp và sử dụng thông tin trên Internet.

Tập hợp các trang web phục vụ cho một tổ chức và được đặt trong một máy
chủ kết nối mạng được gọi là website. Trong website thường có một trang chủ và từ
đó có đường dẫn siêu liên kết đến các trang khác.
Website có thể được xây dựng bằng nhiều ngôn ngữ lập trình khác nhau như:
PHP, .NET, Java, Ruby on Rails,… Mỗi ngôn ngữ sẽ có các câu lệnh khác nhau.
Người dùng không cần quan tâm website đó viết bằng ngôn ngữ nào. Bởi vì trình
duyệt web sẽ làm nhiệm vụ đọc các câu lệnh đó và hiển thị nội dung website lên
trình duyệt web cho người dùng truy cập.
1.1.2 Phân loại website.
Có rất nhiều loại website nhưng có thể phân thành 2 loại cơ bản như sau:
Website cung cấp thông tin: như các website báo điện tử, website cung cấp
thông tin theo những chuyên đề cụ thể. Thông thường các website cung cấp thông
tin miễn phí và nguồn thu đến từ phí quảng cáo trên website khi có lượng người
xem thường xuyên đông. Tuy nhiên nếu các thông tin có giá trị cao, người xem có
thể sẽ phải trả phí để xem được cái thông tin này.
Website cung cấp sản phẩm hoặc dịch vụ: Các website này có thể chỉ giới
thiệu thông tin về các sản phẩm, dịch vụ hoặc có thể có những tính năng giúp người
xem có thể mua sản phẩm dịch vụ thẳng từ website (các website thương mại điện
tử).
Từ 2 loại website cơ bản như trên đã phát triển thành rất nhiều mô hình
10
SVTH: Nguyễn Thị Thu Hoài

10
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật


Website đa dạng và phong phú như :
+ Cổng thông tin (Portal)
+ Sàn giao dịch (Marketplace)
+ Cửa hàng, siêu thị trực tuyến (E-store)
+ Báo điện tử (E-newspaper)
+ Mạng xã hội (Social Networking Website)
+ Danh bạ (Web Directory)
+ Webiste việc làm
+ Website đấu giá
+ Webblog

1.2 Tổng quan về công cụ tìm kiếm (SE).
1.2.1 Khái niệm.
Theo [1], search Engine (SE) là các phần mềm chuyên thu thập dữ liệu về các
trang web. Tại thời điểm này, dữ liệu thu thập của các SE bao gồm URL trang web,
một số từ khóa hoặc nhóm từ khóa xác định nội dung của trang web, cấu trúc dữ
liệu tạo thành trang web và các liên kết được cung cấp trên trang web. Các dữ liệu
thu thập liên quan được lập chỉ mục và lưu trữ trên cơ sở dữ liệu. Tất cả các hoạt
động này được thực hiện bởi phần mềm công cụ tìm kiếm (crawler, spider, bot). Các
công cụ tìm kiếm sử dụng các chương trình đặc biệt, được đặt tên là spider hoặc
bot. Các chương trình này di chuyển bằng cách sử dụng cấu trúc siêu liên kết của
Web. Họ điều hướng thông qua các trang web định kỳ và nắm bắt những thay đổi đã
được thực hiện kể từ lần điều hướng mới nhất (Spiders / Crawlers). Dữ liệu thu
được từ các chương trình liên quan được lưu trữ trong một hệ thống cơ sở dữ liệu
rất rộng. Cơ sở dữ liệu này được gọi là chỉ mục của công cụ tìm kiếm. Mặt khác,
hoạt động được thực hiện được gọi là "index". Khi người dùng thực hiện truy vấn
để nhận được một số dữ liệu hoặc thông tin, querry liên quan được chuyển đến chỉ
mục của công cụ tìm kiếm và kết quả được hiển thị cho người dùng (querry). Yếu tố
cạnh tranh thiết yếu giữa các công cụ tìm kiếm xuất hiện trong "kết quả có liên quan

11
SVTH: Nguyễn Thị Thu Hoài

11
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

hiển thị, phân loại" quá trình. Sau khi xác định các trang có liên quan với querry
được thực hiện, chúng được hiển thị cho người dùng theo cấu trúc một danh sách đã
được sắp xếp. Tại thời điểm này, các thuật toán công cụ tìm kiếm đóng một vai trò
quan trọng và họ cố gắng đưa ra các kết quả phù hợp nhất cho người sử dụng
(øyiler, 2009) .Tìm kiếm, thu thập dữ liệu về mỗi URL và lưu trữ dữ liệu đã thu thập
được trong cơ sở dữ liệu. Khi người dùng kết nối với công cụ tìm kiếm cho một
phiên tìm kiếm, tài liệu tham khảo trong cơ sở dữ liệu có liên quan được đánh giá
và thu được kết quả được trả lại cho người dùng (Atay and others, 2010).
1.2.2 Lịch sử hình thành và vai trò.
Thế giới web mới ra đời trong hơn 20 năm. Ngày đó, máy tìm kiếm vẫn chưa
ra đời- các website được biết đến chỉ nhờ truyền miệng, hoặc nhờ một trang web
danh bạ chứa địa chỉ của tất cả các trang web khác (web hub). Khi thế giới internet
vẫn còn nhỏ, việc này không vấn đề gì. Nhưng khi thế giới này mở rộng mạnh mẽ
vào những năm tiếp theo, một giải pháp mới là điều bắt buộc.
Trong suốt 1993/1994, những máy tìm kiếm đầu tiên đã ra đời bao gồm
Excite, AltaVista và Yahoo! Số lượng các trang web và người dùng tăng lên mạnh
mẽ đến mức mà những trang web hub trở nên quá tải và không còn hiệu quả.
Năm 1996, Google ra đời. Đây là máy tìm kiếm đầu tiên nhận ra sức mạnh và
vai trò của liên kết và sử dụng chúng để đánh giá độ uy tín của trang web. Đây

chính là bước đột phá giúp tăng chất lượng bảng kết quả tìm kiếm.
1.2.3 Chức năng của máy tìm kiếm.
Dò quét: là quá trình máy tìm kiếm đi tìm những nội dung mới. Họ sử dụng
những phần mềm có thể tự động ghé thăm các website và lần theo liên kết trên các
trang web để tìm ra những nội dung khác
Xây dựng cơ sở dữ liệu: Các máy tìm kiếm copy nội dung của các trang web
mà chúng đã ghé thăm. Dữ liệu này được lưu trữ trên rất nhiều máy tính trong các
trung tâm dữ liệu (data center) ở khắp nơi trên thế giới. Điều này giúp cho việc tìm
kiếm trở nên nhanh chóng, dễ dàng hơn giúp bạn nhận được kết quả chỉ trong 1/2s
hoặc ít hơn.
12
SVTH: Nguyễn Thị Thu Hoài

12
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

Xếp hạng: Đây là công việc mà các SEO quan tâm nhất. Khi một người tìm
kiếm online, các cỗ máy này cần một thuật toán để đánh giá trang web nhằm xác
định trang web nào liên quan nhất và từ đó tính ra thứ hạng của trang web đó trên
bảng kết quả.
1.2.4 Cấu trúc máy tìm kiếm.
1.2.4.1 Bộ thu thập thông tin – Robot.
Robot là một chương trình tự động duyệt qua các cấu trúc siêu liên kết để thu
thập tài liệu & một cách để quy nó nhận về tất cả tài liệu có liên kết với tài liệu này.
Robot được biết đến dưới nhiều tên gọi khác nhau: spider, web wanderer hoặc web

worm,… Những tên gọi này đôi khi gây nhầm lẫn, như từ ‘spider’, ‘wanderer’ làm
người ta nghĩ rằng robot tự nó di chuyển và từ ‘worm’ làm người ta liên tưởng đến
virus. Về bản chất robot chỉ là một chương trình duyệt và thu thập thông tin từ các
site theo đúng giao thức web. Những trình duyệt thông thường không được xem là
robot do thiếu tính chủ động, chúng chỉ duyệt web khi có sự tác động của con
người.
1.2.4.2 Bộ lập chỉ mục – Index
Hệ thống lập chỉ mục hay còn gọi là hệ thống phân tích và xử lý dữ liệu, thực
hiện việc phân tích, trích chọn những thông tin cần thiết (thường là các từ đơn, từ
ghép, cụm từ quan trọng) từ những dữ liệu mà robots thu thập được và tổ chức
thành cơ sở dữ liệu riêng để có thể tìm kiếm trên đó một cách nhanh chóng, hiệu
quả. Hệ thống chỉ mục là danh sách các từ khoá, chỉ rõ các từ khoá nào xuất hiện ở
trang nào, địa chỉ nào.
1.2.4.3 Bộ tìm kiếm thông tin – Search Engine
Search engine là cụm từ dùng chỉ toàn bộ hệ thống bao gồm bộ thu thập thông
tin, bộ lập chỉ mục & bộ tìm kiếm thông tin. Các bộ này hoạt động liên tục từ lúc
khởi động hệ thống, chúng phụ thuộc lẫn nhau về mặt dữ liệu nhưng độc lập với
nhau về mặt hoạt động. Search engine tương tác với user thông qua giao diện web,
có nhiệm vụ tiếp nhận & trả về những tài liệu thoả yêu cầu của user.
Chúng ta thấy rằng, tìm kiếm từ là tìm kiếm các trang mà những từ trong câu
13
SVTH: Nguyễn Thị Thu Hoài

13
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật


truy vấn (query) xuất hiện nhiều nhất, ngoại trừ stopword (các từ quá thông dụng
như mạo từ a, an, the,…). Một từ càng xuất hiện nhiều trong một trang thì trang đó
càng được chọn để trả về cho người dùng. Và một trang chứa tất cả các từ trong câu
truy vấn thì tốt hơn là một trang không chứa một hoặc một số từ. Ngày nay, hầu hết
các search engine đều hỗ trợ chức năng tìm cơ bản và nâng cao, tìm từ đơn, từ ghép,
cụm từ, danh từ riêng, hay giới hạn phạm vi tìm kiếm như trên đề mục, tiêu đề,
đoạn văn bản giới thiệu về trang web,…..
Ngoài chiến lược tìm chính xác theo từ khoá, các search engine còn cố gắng ‘
hiểu ‘ ý nghĩa thực sự của câu hỏi thông qua những câu chữ do người dùng cung
cấp. Điều này được thể hiện qua chức năng sửa lỗi chính tả, tìm cả những hình thức
biến đổi khác nhau của một từ. Ví dụ : search engine sẽ tìm những từ như speaker,
speaking, spoke khi người dùng nhập vào từ speak.
1.2.5 Nguyên lý hoạt động
Nguyên lý hoạt động của Search Engine gồm các bước sau:
- Search engine điều khiển robots đi thu thập thông tin trên mạng thông qua
các siêu liên kết (hyperlink).
- Khi robots phát hiện ra một site mới, nó gởi tài liệu (web page) về cho server
chính để tạo cơ sở dữ liệu chỉ mục phục vụ cho nhu cầu tìm kiếm thông tin (các
thông tin luôn thay đổi do đó robot cần cập nhật và thay đổi liên tục).
- Khi search engine nhận câu truy vấn từ user, nó sẽ tiến hành phân tích, tìm
trong cơ sở dữ liệu chỉ mục và trả về những kết quả tài liệu thoả yêu cầu cho người
dùng.
Các máy tìm kiếm như Google và Bing thường xuyên cập nhật thuật toán của
chúng với tần suất nhiều lần mỗi tháng. Khi bạn thấy thứ hạng của mình bị thay đổi,
đó có thể là do sự thay đổi thuật toán hoặc một điều gì đó nằm ngoài tầm kiểm soát
của bạn. Về cơ bản, cơ chế hoạt động của tất cả các máy tìm kiếm là như nhau, tuy
nhiên một sự khác biệt nhỏ trong công thức tính độ liên quan cũng sẽ dẫn đến một
sự thay đổi tương đối lớn trong bảng kết quả.
Các bộ máy tìm kiếm liên tục cập nhật bảng chỉ mục (index) của mình và

14
SVTH: Nguyễn Thị Thu Hoài

14
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

chúng dùng spider để thu thập thông tin các trang web, những từ ngữ được sử dụng
trên các trang web này sẽ được lưu lại vào bảng chỉ mục và khi một người nào đó
tìm kiếm những từ này thông qua bộ máy tìm kiếm, chúng sẽ trả về 1 danh sách các
trang web có chứa từ ngữ đó.

Hình 1.1: Cơ cấu làm việc của bộ máy tìm kiếm

1.2.6 Giới thiệu về các Search Engine thông dụng
Hiện nay, Search Engine là một lĩnh vực khá độc quyền, với việc top 4 các
công cụ tìm kiếm hiện nay chiếm trên 97% thị phần người dùng trên toàn thế giới,
bao gồm: Google Search, Yahoo! Search, Bing Search, Baidu…
1.2.6.1 Google Search
Như chúng ta đã biết, Google là một công ty internet được thành lập vào năm
1998 có trụ sở chính tại Hoa Kỳ.
Google đã đưa ra rất nhiều các ứng dụng hữu ích đối với con người như:
Gmail, Picase, Drive, Google + … nhưng trong đó nổi bật nhất là ứng dụng Google
Search.
Google Search, hay còn được gọi là Google Web Search hay ngắn gọn
là Google là một công cụ phổ biến được sử dụng phổ biến nhất hiện nay trên thế

giới, với hơn 3 tỷ lượt tìm kiếm mỗi ngày. Được phát triển từ năm 1997 bởi Larry
Page và Sergey Brin, đến năm 1998, Google đã chính thức ra mắt công cụ tìm kiếm
của mình.
15
SVTH: Nguyễn Thị Thu Hoài

15
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

Tên miền Google.com được đăng kí lần đầu tiên vào ngày 15 tháng 9 năm
1997 tại MARKMONITOR INC.
Đến nay, sau nhiều năm liên tục được cập nhật và phát triển, với hàng tỷ dữ
liệu được lưu trữ, tốc độ tìm kiếm ưu việt hàng đầu và luôn đi tiên phong trong việc
tạo và cập nhật các thuật toán chống spam, giúp đem lại trải nghiệm tốt nhất cho
người dùng.

Hình 1.2: Thông tin về website google

Google search chiếm gần như tuyệt đối thị phần tìm kiếm trên Internet nhờ có
lượng máy chủ khổng lồ, công nghệ tốt. Theo dữ liệu của hãng phân tích Internet
StatCounter công bố ngày 4 tháng 8 năm 2009, Tổng thị phần tìm kiếm Yahoo! và
Microsoft sau khi kết hợp chiếm 20,36% thị trường ở Mỹ, Google 77,54%.
Tại Việt Nam, thị phần tìm kiếm cũng bị Google thống trị với con số gần như
tuyệt đối, tuy nhiên các công cụ tìm kiếm của người Việt với những lợi thế riêng
vẫn đang nỗ lực như Sóc bay, La bàn... và gần đây nhất là Cốc Cốc.

Như chúng ta thấy rằng, với từ khóa “khách sạn” được tìm kiếm bởi Google
thì đã có hơn 51 triệu kết quả chỉ trong 0.73s tìm kiếm. Và những trang web được
SEO tốt nhất sẽ được hiện lên trong trang tìm kiếm đầu tiên.
Bên cạnh đó, Google tập trung vào kết quả tìm kiếm gửi tới bạn và những kết
quả này là những trang web có liên quan nhiều nhất. Công cụ này cũng cho phép
bạn thu hẹp kết quả tìm kiếm theo ngày và địa điểm. Đó chính là một điểm nhấn mà
Google muốn đem lại cho người sử dụng: dễ dàng, nhanh chóng, thuận lợi...
Những công cụ liên quan: Máy tính, tìm kiếm sách, động đất, chuyển đổi đơn
16
SVTH: Nguyễn Thị Thu Hoài

16
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

vị, dữ liệu cộng đồng, thông tin cá nhân.
-

Chọn từ khoá: Nghĩa của từ tìm kiếm, từ điển, kiểm tra chính tả.
Tìm kiếm cục bộ: Tìm kiếm nơi ở, lịch chiếu phim.
Tìm kiếm y tế: Điều kiện sức khỏe, thuốc, kiểm soát chất độc, phòng

-

chống tự sát, tìm kiếm vắc xin cúm.
Kế hoạch chuyến đi: Theo dõi chuyến bay, chuyển đổi tiền tệ, bản đồ.

Sàng lọc truy vấn: Thêm (+) điều hành, tìm kiếm liên quan, điền vào chỗ

-

trống.
Những công cụ liên quan: Máy tính, tìm kiếm sách, động đất, chuyển đổi

-

đơn vị, dữ liệu cộng đồng, thông tin cá nhân.
Tìm kiếm theo số: Gói theo dõi, số bằng sáng chế.

Hình 1.3: Kết quả tìm kiếm trên google với từ khóa “khách sạn”

1.2.6.2 Bing Search
Bing là trình duyệt mới nhất của Microsoft và nhanh chóng trở thành đối thủ
của Google. Bing (trước đây là Live Search, Windows Live Search và MSN Search)
là bộ máy tìm kiếm web (được quảng cáo là một bộ máy "ra quyết định"), đại diện
cho công nghệ tìm kiếm hiện nay của Microsoft. Được Giám đốc Điều hành của
Microsoft Steve Ballmer tiết lộ vào ngày 28 tháng 5 năm 2009 tại hội nghị All
17
17
SVTH: Nguyễn Thị Thu Hoài
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật


Things D tại San Diego, Bing là một sự thay thế cho Live Search; bộ máy tìm kiếm
này được đưa lên trực tuyến hoàn toàn vào ngày 3 tháng 6 năm 2009.
Từ "bing" là một từ tượng thanh, một từ mô phỏng âm thanh. Thông qua
nghiên cứu Microsoft đã quyết định rằng cái tên Bing sẽ dễ nhớ, ngắn, dễ phát âm,
và nó sẽ dùng làm URL tốt trên khắp thế giới. Từ này làm mọi người nhớ tới âm
thanh tạo ra trong "khoảnh khắc khám phá và ra quyết định".
Để tìm kiếm, bạn chỉ cần điền thông tin muốn tìm kiếm vào khung search
ngay trang chủ để truy cập. Kết quả sẽ được trình bày theo thứ tự ngày, tháng giảm
dần cùng những đường link tìm kiếm.
Điểm mạnh thực sự của Bing là về các dịch vụ mà Microsoft độc quyền để
giúp việc tìm kiếm hiệu quả hơn. Bing Maps sẽ cung cấp những bản đồ gọn gàng và
hình ảnh về đường phố chi tiết. Bên cạnh đó, các tính năng tìm kiếm Bing Travel
cũng giúp bạn tìm được ngày tốt nhất để mua vé máy bay với giá thấp nhất.
Ngày 29 tháng bảy năm 2009, Microsoft và Yahoo! đã đi đến một thỏa thuận
mười năm với nội dung sẽ Yahoo! Search sẽ được thay thế bởi Bing Search. Yahoo!
sẽ nhận được để giữ 88% doanh thu từ tất cả các doanh quảng cáo tìm kiếm trên
trang web của mình trong năm năm đầu tiên của thỏa thuận, và có quyền để bán
quảng cáo trên một số trang web của Microsoft.

Hình 1.4: Thị phần công cụ tìm kiếm (-Google)

Vào đầu năm 2011, Bing đã bắt đầu vượt qua Yahoo Theo số liệu thống kê của
StatCounter, với 4,4%, Bing có thị phần lớn hơn 10% so với Yahoo! trong tháng Hai
vừa qua trên phạm vi toàn cầu.
18
SVTH: Nguyễn Thị Thu Hoài

18
Lớp: K47 TMĐT



Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

1.2.6.3 Yahoo! Search
Yahoo Search là công cụ tìm kiếm website trực thuộc sở hữu của tập đoàn
Yahoo!. Đây là công cụ tìm kiếm lớn thứ ba tại Mỹ tính đến tháng 2 năm 2015, với
lượng truy vấn tìm kiếm đạt 12,8%. Mặc dù được thành lập từ năm 1995, nhưng
phải đến 2004, Yahoo! mới chính thức trình làng sản phẩm Search Engine của mình.
Mặc dù được ra đời sau, nhưng do lợi thế về thị phần người sử dụng Yahoo!
Messenger và Yahoo! Mail khá lớn. Yahoo Search vẫn cạnh tranh khá tốt với các
đối thủ đi trước mình cả nửa thập niên.
Trước sự cạnh tranh quá khốc nghiệt với Google Search, năm 2009, Yahoo và
Microsoft đã quyết định đi đến một sự thỏa thuận hợp tác cùng phát triển Bing
Yahoo Search.

Hình 1.5: Thông tin về website Yahoo

1.2.6.4 Baidu
Baidu (baidu.com) là một công cụ tìm kiếm của Trung Quốc thành công nhất
cho đến nay, được thiết kế riêng cho người dùng sử dụng Tiếng Trung. Từ khi được
ra mắt vào năm 2000, đến nay Baidu đã trở thành công cụ tìm kiếm được sử dụng
nhiều thứ 2 thế giới, chỉ sau Google. Để có một thành công như vậy, ngoài việc kế
thừa những thành công của những đối thủ đi trước như Google hay Wikipedia,
Baidu đã phải có một sự hỗ trợ rất lớn từ chủ nghĩa dân tộc và những hỗ trợ độc
quyền của chính phủ của Trung Quốc. Hiện nay, Baidu Search đã trở thành công cụ
tìm kiếm không thể thiếu cho những ai sử dụng tiếng Trung và muốn kinh doanh tại
19
SVTH: Nguyễn Thị Thu Hoài


19
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

thị trường này.

Hình 1.6: Thông tin về website Baidu

1.2.6.5 Đánh giá chung.
Theo như thống kê của trang web Alexa(alexa.com) thì chúng ta thấy dẫn đầu
là trang Web Google với tổng số các trang web mà Google liên kết lên đến hơn 3
triệu trang và thời gian truy cập trung bình của mỗi khách là 8 phút 55 giây.
Tiếp đó chính là trang tìm kiếm Baidu của Trung Quốc, đứng thứ 4 xếp hạng
của Alexa và đứng thứ 2 về các công cụ tìm kiếm nổi tiếng. Nhờ vào chính sách can
thiệp của chính phủ Trung Quốc chặn truy cập vào các trang web như Facebook,
Google… mà lượng người Trung Quốc sử dụng công cụ tìm kiếm Baidu chiếm ở
mức cao. Trong năm 2012 doanh thu của Baidu đạt khoảng 1 tỷ USD.
Tiếp đến là Yahoo và Wikipedia đang chiếm cho mình thứ hạng 5 và 6 trên
Top 500 Website hàng đầu của thế giới. Đó cũng chính là 1 thứ hạng cao đối Yahoo
và khi các “ông trùm” của tìm kiếm và mạng xã hội đang phát triển đỉnh điểm.

20
SVTH: Nguyễn Thị Thu Hoài

20

Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

Hình 1.7: Top 500 website hàng đầu của thế giới

1.2.6.6 Một số công cụ tìm kiếm khác
- WOLFRAM ALPHA: Địa chỉ:
- YANDEX: Địa chỉ:
- DUCK DUCK GO: Địa chỉ:
- ASK: Địa chỉ:
- Cốc cốc:

1.3 Tổng quan về SEO (Search Engine Optimization).
1.3.1 Định nghĩa.
SEO là chữ viết tắt của Search Engine Optimization (tối ưu hóa công cụ tìm
kiếm).
Theo [2], tối ưu hóa công cụ tìm kiếm (SEO) là quá trình và kỷ luật của việc
cải thiện chất lượng và khả năng hiển thị của một trang web để tăng xếp hạng của
nó trong công cụ tìm kiếm, qua đó tăng lưu lượng khách truy cập.
Các công cụ tìm kiếm hiển thị một số dạng danh sách trong trang kết quả tìm
kiếm (SERP) bao gồm danh sách trả tiền, danh sách quảng cáo, dánh sách trả tiền
theo click và danh sách tìm kiếm miễn phí.

21
SVTH: Nguyễn Thị Thu Hoài


21
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

1.3.2 Mục đích.
Mục tiêu của SEO chủ yếu hướng tới việc nâng cao thứ hạng của danh sách
tìm kiềm miễn phí theo một số từ khóa nhằm tăng lượng và chất của khách viếng
thăm đến trang. SEO đôi khi là một dịch vụ độc lập hay là một phần của dự án tiếp
thị và có thể rất hiệu quả ở giai đoạn phát triển ban đầu và giai đoạn thiết kế
website.
-

Lên đỉnh Google: Top 1 - 10.
Phương pháp: Onpage, Offpage.
Khách hàng mục tiêu: Người dùng tìm kiếm từ khóa nào thì chắc chắn
người đó có nhu cầu muốn mua sản phẩm/dịch vụ đó hoặc là tìm hiểu về
thông tin đó vì vậy chắc chắn đó là khách hàng mục tiêu. Trong ngành có
các công cụ để tìm hiểu được người dùng hay tìm Keyword nào nhất trên

-

Google.
Chất, lượng: Làm SEO không phải cứ lên Top là coi như xong, nó còn
phải góp phần mang lại thương hiệu cho công ty, phải đảm bảo tính bền
vững cho kết quả đó, đồng thời phải đáp ứng những mục tiêu định lượng
được trước khi thực hiện làm SEO.


Hiện trên mạng Internet có 2 công cụ tìm kiếm hữu hiệu nhất và phổ biến
nhất:
Google và Bing.
Và ở Việt Nam thì Google và CocCoc là 2 công cụ tìm kiếm tiêu biểu và được
nhiều người lựa chọn.
SEO có thể coi như là một kỹ thuật, một bí quyết thực sự đối với mỗi người
quản trị, xây dựng website hay đơn thuần là người làm trong lĩnh vực truyền thông.
1.3.3 Nguyên lí hoạt động của SEO.
Theo [1], thứ nhất, việc phân tích từ khoá phải được thực hiện cho trang web,
thao tác tối ưu hóa sẽ được thực hiện. Phân tích từ khoá của một trang web phải
được thực hiện theo các quy tắc hoặc nhiệm vụ sau:
- Phải có một danh sách mạnh, bao gồm các từ khóa tiềm năng, phải được hình
thành thông qua phân tích từ khóa.
22
SVTH: Nguyễn Thị Thu Hoài

22
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

- Bằng cách thực hiện một số tìm kiếm, các trang web trong danh sách top 5
phải được tìm ra.
- Các liên kết phải được tính và từ khoá mục tiêu của họ phải được tìm thấy.
- Các từ ngữ, không được kiểm tra trong phân tích từ khóa, phải được tìm thấy
và liệt kê.

Một số trang web được sử dụng trong phân tích xác định từ khóa
Một số trang web tiêu biểu như:
- />- />- (trả phí – có thể dùng thử)
- (trả phí – có thể dùng thử)
- (trả phí – có thể dùng thử)
- />-
-
- />- />Bằng cách sử dụng dữ liệu thu được từ các trang web này, có thể biết sức
mạnh cạnh tranh và mật độ của từ khoá mà chúng ta cần hướng đến.
Trong từ khoá, sản phẩm hoặc dịch vụ phải được xác định trong cấu trúc sử
dụng từ ngắn và dài của chúng. Tại thời điểm này, các định nghĩa được thực hiện
bằng một số từ hơn là chỉ sử dụng một từ khóa ngắn và đơn. Theo các nghiên cứu
nghiên cứu thống kê, người dùng Internet thích sử dụng ít nhất 2 hoặc 3 từ để thực
hiện tìm kiếm trên công cụ tìm kiếm. Bởi vì sự cạnh tranh trong một từ là nhiều hơn
so với một trong những sở thích khác. Một số cách sử dụng từ khóa khác nhau cũng
có thể được sử dụng để tránh các lỗi đánh máy thông thường. Việc đặt các từ khoá
lên phần trên cùng, tên tiêu đề và tên hình ảnh là một nhiệm vụ quan trọng cho việc
tối ưu. Mật độ từ khoá 5-8% (5-8 từ khoá trong 100 từ) được đề xuất để sử dụng
23
SVTH: Nguyễn Thị Thu Hoài

23
Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

trong nội dung trang. Các từ khóa ưa thích nằm ở phía trên cho phép robot đánh giá

trang web là trang thích hợp nhất cho từ đã tìm. Sử dụng cùng một từ khoá hoặc
định nghĩa lặp lại trong nội dung trang, thẻ meta hoặc khu vực HTML có thể được
đánh giá là spam bởi robot.
Tóm lại, các từ khóa có liên quan có thể được sử dụng trong các lĩnh vực sau
để di chuyển trang web lên kết quả tìm kiếm hàng đầu của công cụ tìm kiếm:
- Trong thẻ tiêu đề trang
-Trong thẻ mô tả meta, trong thẻ mô tả từ khoá
-Trên thẻ tiêu đề
- Trong các thẻ mô tả
-Trong nội dung
-Trong văn bản liên kết
-Tại văn bản đơn giản
-Trên lĩnh vực tên miền (nếu có thể)
1.3.4 Lợi ích mang lại.
- Tiết kiệm chi phí.
- Có được khách hàng tự động, đều đặn mỗi ngày.
- Khách hàng tự tìm đến và bạn không mất phí cho việc marketing sai đối
tượng.
- Việc xuất hiện trên trang 1 Google với nhiều từ khóa khác nhau sẽ làm tăng
uy tín tên miền, từ đó tăng thương hiệu cho doanh nghiệp.
- SEO gần như miễn phí. Chi phí duy nhất bạn phải trả đó là thời gian.
- Gia tăng doanh thu và lợi nhuận. Đây là thứ thiết yếu nhất mà các doanh
nghiệp cần để duy trì và phát triển. Thông thường thì các doanh nghiệp sẽ tìm kiếm
những từ khóa mà người dùng hay tìm kiếm và SEO theo hướng từ khóa đó.
- Đảm bảo lượt khách ổn định và ngày càng mở rộng.

24
SVTH: Nguyễn Thị Thu Hoài

24

Lớp: K47 TMĐT


Khóa luận tốt nghiệp

GVHD: PGS.TS Võ Viết Minh Nhật

1.4 Các yếu tố ảnh hưởng đến thứ hạng website.
1.4.1 Yếu tố liên quan đến Page.
5 yếu tố quyết định thứ hạng liên quan đến Page đã được Moz thống kế cho
thấy rằng độ uy tín của page là một trong những tiêu chí hàng đầu để đánh giá một
page hay một website. Chi tiết như sau:

Hình 1.8: 5 yếu tố quyết định thứ hạng liên quan đến Page

Độ uy tín của Page (0.39)
Google đã chính thức thông báo Page Rank không còn là tiêu chí trong vấn đề
xếp hạng nữa (Matt Cutts thông báo tháng 2/2013). Tuy nhiên, với những website
top 1 trong bài phân tích lại có độ uy tín rất cao. Do đó với việc nắm giữ một thứ
hạng cao của trang thì việc SEO sẽ dễ dàng hơn
Số lượng domain trỏ đến Page đó mà sử dụng văn bản neo trùng với từ
khóa cần SEO (0.29)
Mỗi backlink trỏ tới Page cần SEO với những Anchortext là từ khóa như
những lá phiếu bầu cho Page đó về chính từ khóa nằm trong Anchortext. Số lượng
phiếu bầu từ những domain uy tín càng nhiều, việc lên top với từ khóa cần SEO
càng cao. Do đó việc số lượng domain trỏ đến Page cũng là một vấn đề cần được xử
lý để phát triển website
Tổng số lượng domain trỏ đến Page (0.29)
Ở Việt Nam hiện nay, các SEOer khi nói về backlink vẫn hay nói rằng cần đa
dạng domain. Với thống kê của Moz thì tiêu chí này vẫn luôn đúng cho đến thời

điểm hiện nay.
Chỉ số MozTrust của URL (0.25)
Chỉ số quan trọng được SEOmoz đưa ra dựa trên các thuật toán của Google
25
SVTH: Nguyễn Thị Thu Hoài

25
Lớp: K47 TMĐT


×