Tải bản đầy đủ (.pdf) (77 trang)

Seo webstie bán hàng mỹ phẩm nhật cho myphamnhatt247 com

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.36 MB, 77 trang )

SEO WEBSITE BÁN HÀNG MỸ PHÁM NHẬT CHO MYPHAMNHAT247.COM

Niên khóa: 2013-2017

VIỆN ĐẠI HỌC MỜ HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN

TRẦN THỊ MỸ LINH

SEO WEBSITE BÁN HÀNG MỸ PHÁM NHẬT
CHO MYPHAMNHAT247.COM

Chuyên ngành: Cơng nghệ thơng tin

ĐƠ ÁN TỐT NGHIỆP DẠI HỌC

Hà Nội -2017


VIỆN ĐẠI HỌC MỚ HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN

TRẦN THỊ MỸ LINH

SEO WEBSITE BÁN HÀNG MỸ PHÀM NHẶT
CHO MYPHAMNHAT247.COM

Chuyên ngành: Công nghệ thông tin
Giàng viên hướng dẫn: ThS. Trần Duy Hùng

ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC



Hà Nội-2017


LỜI NĨI ĐẦU
Hiện nay, trong xã hội đang có những bước phát triền đột phá về

lĩnh vực cơng nghệ thì việc tìm kiếm thơng tin nhanh chóng, thuận tiện
nhất trên Internet đang được sứ dụng rất phố biến. Đe tiết kiệm thời

gian hầu hết mọi người đều sử dụng các cơng cụ tìm kiếm online nhằm
đạt được mục tiêu tìm kiếm cúa mình. Theo thống kê thì Google là

cơng cụ tìm kiếm thơng dụng nhất hiện nay. Vậy làm the nào đế những

thông tin chúng ta cần cung cấp cho người tìm kiếm được xuất hiện
trong bộ máy tìm kiếm Google và xuất hiện ớ những TOP đầu cơng cụ
tìm kiếm này, điều này là một bài toán lớn đặt ra cho rất nhiều cá nhân
doanh nghiệp cần phái giải quyết.
Trong đề tài này, em sẽ áp dụng kiến thức, kỹ năng về SEO cúa mình

để SEO cho một website trong lĩnh vực mỹ phẩm nhật bàn cho những
bạn học sinh, sinh viên, những người đi làm bận rộn.
Trong quá trình triển khai khơng thề nào tránh khỏi được những thiếu

sót, vì vậy em kính mong các thầy cơ đóng góp ý kiến de em có the

hồn thành tốt nhất.
Em xin chân thành càm on Khoa Công nghệ Thông Tin - Viện Đại


Học Mớ Hà Nội, giáng viên hướng dẫn Ths.Trần Duy Hùng và các
thay cô trong nhà trường đã tạo điều kiện và nhiệt tình giúp đỡ em có

cơ hội thực hiện đề tài này.
Em xin chân thành cảm ơn!

Chúng em xin kính chúc các thầy cơ mạnh khỏe, ln ln là những
người lái đị ân cần dìu dắt các thế hệ tiếp theo cứa FITHOU trướng

thành.


MỤC LỤC
CHƯƠNG 1.........................................................................................................1

TỒNG QUAN.................................................................................................... 1
1.1.

Đặt vấn đề............................................................................................ 1

1.2.

Lược sử giải quyết vấn đề.................................................................. 3

1.3.

Mục tiêu cần đạt được........................................................................ 5

1.3.1.


về lý thuyết................................................................................. 5

1.3.2.

về ứng dụng................................................................................ 5

1.4.

Nghiên cứu và giãi quyết vấn đề - kế hoạch làm việc..................... 6

1.4.1.

Nghiên cứu và giãi quyết vấn đề............................................... 6

1.4.2.

Kế hoạch làm việc.......................................................................7

1.5.

Bố cục.................................................................................................. 7

CHƯƠNG II....................................................................................................... 9
Cơ SỞ LÝ THUYẾT........................................................................................ 9

2.1.

Nghiên cứu lý thuyết về SEO............................................................9

Tổng quan bộ máy tìm kiếm...........................................................9


2.1.1.

2.1.2.

Giới thiệu về các Search Engine thơng dụng.......................... 10

2.2.

Cấu tạo chung của các bộ máy tìm kiếm.........................................14

2.3.

Hệ thống - xếp hạng website theo Alexa - Alexa web ranking ... 16

2.4.

Tìm hiểu về SEO.............................................................................. 17

2.4.1.

SEO là gì?.................................................................................. 17

2.4.2.

Tại sao cần SEO?...................................................................... 17

2.4.3.

Từ khóa trong SEO là gì?....................................................... 18


2.5.

Một số thuật ngữ SEO cơ bán..........................................................19

2.6.

Các yếu tố quyết định đến thứ hạng của một website................... 23


2.6.1.

Yếu tố liên quan đến page........................................................ 23

2.6.2.

Yếu tố xếp hạng liên quan đến Domain.................................. 25

2.6.3.

Yếu tố liên quan đến độ phổ biến cúa domain........................ 25

2.6.4.

Yếu tố liên quan đến mạng xã hội........................................... 26

2.6.5.

Yếu tố liên quan đến việc sử dụng từ khóa trong URL........ 26


2.6.6.

Yếu tố Onpage........................................................................... 27

2.7.

Tổng hợp các thuật toán cơ bản của Google.................................. 27

2.7.1.

Thuật toán Google Panda ( Gấu trúc ).....................................27

2.7.2.

Thuật toán Google Penguin ( Chim cánh cụt)........................ 29

2.7.3.

Thuật toán Zebra ( Ngựa vằn )................................................. 32

2.7.4.

Thuật toán Hummingbird ( Chim ruồi ).................................. 34

2.7.5.

Thuật toán Pigeon (Chim bồ câu)............................................ 35

2.7.6.


Thuật toán Mobile-Friendly Ranking..................................... 37

2.7.7.

Thuật toán Payday loan.............................................................38

CHƯƠNG III.................................................................................................... 40
THIẾT KÉ ỨNG DỤNG................................................................................ 40

3.1.

Phân tích người dùng........................................................................ 40

3.2.

Đối thú cạnh tranh và hướng đi cúa website..................................40

3.3.

Xây dựng website............................................................................. 42

3.3.1.

Chọn tên miền........................................................................... 42

3.3.2.

Tạo hosting................................................................................ 42

3.3.3.


Mã nguồn phát triển.................................................................. 44

3.4.

Xây dựng bảng từ khóa....................................................................51

3.5.

Quy trinh thực hiện SEO ONPAGE................................................ 52

3.6.

Quy trình SEO OFFPAGE.............................................................. 55


KẾT LUẬN..................................................................................................... 61

TÀI LIỆU THAM KHẢO..............................................................................68


TÓM TÁT ĐỒ ÁN

Họ và tên

: Trần Thị Mỹ Linh

Chuyên ngành

: Cơng nghệ Thơng tin


Khóa: 13

Giàng viên hướng dẫn: Ths.Trần Duy Hùng

Tên đề tài
: SEO
MYPHAMNHAT247.COM

bán

hàng

mỹ

phẩm

Nhật

cho

Trong xã hội ngày nay, kinh tế người dân ngày càng được cải thiện, do

đó nhu cầu chăm sóc bán thân càng được nâng cao. Mối quan tâm tới
ngoại hình ngày càng lớn do đó mỹ phẩm dần dần trở thành sàn phẩm

tiêu dùng quen thuộc. Biết được cách làm đẹp của người Nhật là sử

dụng các phương pháp tự nhiên, và tạo ra được các dòng sán phấm mỹ
phẩm chất lượng và được sử dụng một cách rộng rãi. Do vậy mà việc


thiết kế ra một website gần gũi, thân thiện với người tiêu dùng nhằm
đáp ứng các thông tin, dịch vụ, giá thành sán phẩm một cách nhanh
nhất giúp cho người tiêu dùng có the mua hàng một cách dễ dàng mà

không mất quá nhiều công sức và thời gian, ...
Chương 1: Tổng quan
Chương 2: Cơ sở lý thuyết
Chương 3: Thiết kế ứng dụng


DANH MỤC BẢNG BIẾU

Bảng 1 K.ế hoạch thực hiện............................................................................... 7
Báng 2 Bảng từ khỏa....................................................................................... 52

Báng 3 Thứ hạng từ khóa sau khi SEO.......................................................... 63


DANH MỤC HÌNH ÁNH

Hình 1 Tổng quan q trình nghiên cứu và giải quyết vấn đề....................... 6
Hình 2 Tống quan cách thức làm việc cùa bộ máy tính tìm kiếm................. 9

Hình 3 Biểu đồ thị phần SE theo trang Netmarketshare............................... 10
Hình 4 Cấu tạo Search Engine........................................................................ 14

Hình 5 Search Engine Optimization...............................................................17
Hình 6 Thuật ngữ trong SEO........................................................................ 20
Hình 7 Yếu tố liên quan đến page................................................................. 24

Hình 8 Yếu tố xếp hạng liên quan đến Domain............................................ 25

Hình 9 Yếu tố liên quan đến độ phổbiến của domain................................. 26
Hình 10 Yếu tổ liên quan đến mạng xã hội....................................................26

Hình 11 Ycu tố liên quan đến việc sử dụngtừ khóa trong URL.................. 27
Hình 12 Yếu tố Onpage................................................................................... 27
Hình 13 Thuật tốn Google Panda................................................................. 28

Hình 14 Thuật tốn Google Penguin.............................................................. 30
Hình 15 Thuật tốn Zebra............................................................................... 33

Hình 16 Thuật tốn Hummingbird................................................................. 34
Hình 17 Thuật tốn Pigeon............................................................................. 35

Hình 18 Thuật tốn Mobile-Friendly Ranking............................................. 37
Hình 19 Thuật tốn Paydayloan..................................................................... 39

Hình 20 Giao diện của website...................................................................... 48
Hình 21 Kết quá sau quá trình SEO Onpage trang web đạt các tiêu chí

chuẩn SEO........................................................................................................ 54
Hình 22 Chi số Alex rank ban đầu của website........................................... 61
Hình 23 Chí số Alex Rank cúa website tăng lên là 4,33M......................... 61


CHNG I
TĨNG QUAN
1.1.


Đặt vấn đề

Trong kỷ ngun số hiện nay, website thực sự là ngôi nhà cùa Doanh

nghiệp trên Internet, tên miền là bảng hiệu của một Cơng ty cịn
website chính là văn phịng cùa Cơng ty đó, là nơi khách hàng tìm kiếm

các thơng tin về doanh nghiệp trước khi kí họp đồng, là nơi khách hàng
và các đối tác liên hệ doanh nghiệp, là bộ mặt của doanh nghiệp...
Khơng những chi là một văn phịng giao dịch, website cịn mang nhiều

chức năng có khơng ít lợi thế khác như:

- Hướng hoạt động cùa doanh nghiệp từ địa phương ra toàn quốc và
ra toàn cầu.

- Website là cứa hàng trưng bày, giới thiệu sản phẩm, hàng hóa dịch
vụ cùa Doanh nghiệp, hoạt động lên tục 24x7, không giới hạn thời gian

và không gian.
- Website là kênh thông tin giới thiệu sán phấm, dịch vụ hoàn hào nhất

và hữu dụng nhất với hình ánh, các giới thiệu, các media...
- Website cịn là một kho hàng khống lồ, khơng giới hạn về sức chứa.
- Hơn cá, website là một kênh bán hàng với chi phí thấp nhất và ít tốn
hao thời gian nhất cho cả người bán và người mua.

Thông qua website, doanh nghiệp có the thường xuyên và liên tục tiếp
thị hình ánh, thương hiệu, dịch vụ, sản phẩm của mình ra ngồi phạm


vi, khu vực cúa mình ra tồn quốc và quốc tế.
Chính vì những lợi ích ấy, việc khơng có website đã là một thiệt thịi so

với các đối thủ cạnh tranh.
Theo Tống cục Thống kê, tống số người sử dụng Internet tại Việt Nam
tính đến tháng 7/2011 là 31,1 triệu người, tăng 24% ( chiếm hơn 30%


2

dân số Việt Nam) và 4 triệu người dùng Internet băng thơng rộng, tăng

19% tính theo năm.
Trong giai đoạn 2000 - 2010, ti lệ tăng trường người sử dụng Internet

tại Việt Nam đạt mức 12%, tốc độ tăng trưởng nhanh nhất trong khu
vực. Như vậy sau gần 14 năm kể từ ngày Việt Nam gia nhập cộng đồng

Internet toàn cầu (1/12/1997), lượng người sữ dụng Internet trong nước
đã tăng nhanh một cách đáng kế.
Nhìn chung, Internet là một món ăn khơng thể thiếu với cuộc sống của
mọi người, với thói quen sứ dụng các bộ máy tìm kiếm (Google, Bing,

Yahoo...) để tìm kiếm thơng tin về doanh nghiệp, tài liệu học tập, mua
sắm trực tuyến, nạp thẻ điện thoại, thanh tốn hóa đơn...

Theo thống kê, có đến hơn 86% lượng truy cập cũa một website đều

đến từ các công cụ tìm kiếm (Search Engine - SE) = lớn như Google,


Yahoo, MSN... Mỗi ngày có hàng triệu người dùng lướt wcb sử dụng
Search Engine đê tìm những sản phâm, dịch vụ và thông tin họ đang
cần. Nhưng liệu với hàng ti website hiện đang tồn tại, làm sao khách

hàng có the tìm thấy website cúa bạn trước mà khơng phải là website
cùa các đối thủ cạnh tranh?

Hầu hết người sử dụng các bộ máy tìm kiếm đều khơng kiên nhẫn, họ
chi tập trung vào các kết quả tìm kiếm ớ “Trang nhất” trong hàng trăm,

hàng triệu kết quá trà về khi truy vấn tìm kiếm.

Như vậy, câu hói được đặt ra là: “làm sao giúp website cùa bạn có thế

hiến thị được ở trang đầu tiên khi người dùng truy vấn ?”
SEO - Search Enginee Optimization: Tối ưu hóa cơng cụ tìm kiếm là

các phương pháp hữu hiệu giúp website có vị trí cao tại trang kết quả
truy vấn đầu tiên của một cơng cụ tìm kiếm, giúp cho người dùng dễ

dàng tim đến website cúa bạn nhanh nhất.


3

Chính vì đa phần người dùng đến 1 website đều thơng qua cơng cụ tìm

kiếm nên nếu bở qua SEO đồng nghĩa với việc bạn mất tiền mồi ngày

cho website cúa đối thú cạnh tranh. Trên thực tế, thông thường không

người dùng nào đù kiên nhẫn xem quá 3 trang kết quả sau khi thực hiện
tìm kiếm trên SE.
Neu website của bạn không nằm trong top 30 - top 10, khách hàng hầu
như SC không hề biết website cùa bạn tồn tại.

SEO là hoạt động không thể thiếu đối với bất kỳ trang web nào, nó là

con đường để làm cho một trang web được nhiều người biết đến. Các
phương pháp quáng cáo truyền thống ngày càng bão hoà, chi phí cao
nhưng hiệu quả lại giảm sút. Nhất là trong giai đoạn kinh tế khó khăn

như hiện nay thì trong mọi dạng kinh doanh, việc quáng cáo càng phái

được chú trọng hàng đầu.
SEO có rất nhiều ưu điếm so với các phương pháp quảng bá truyền

thống như: người dùng không phái độc thoại mà có thế giao tiếp trao
đối thơng tin trực tiếp với doanh nghiệp; doanh nghiệp có the linh hoạt
hơn trong phân loại các nhóm đối tượng người dùng và đặc biệt là

người quán lý website - Webmaster - có thế qn lý được thơng tin
khách hàng...
Do rất nhiều ưu điểm mà các phương tiện truền thông cũ như: phát

thanh, truyền hình, báo giấy, tờ rơi... khơng có được, Internet sẽ luôn là

lựa chọn hàng đầu cho việc quảng cáo.
1.2.

Lược sử giải quyết vấn đề


Các Webmaster và các nhà cung cấp dịch vụ SEO đã bắt đầu tối ưu hóa

các trang web cho cơng cụ tim kiếm vào giữa nhũng năm 1990.
Ban đầu, các webmaster bắt đầu gửi đường liên kết - link - hay địa chì

url cúa trang web đến các công cụ tim kiếm, các công cụ này sẽ gửi
một “con nhện” - spider - website đó; website sẽ được thu thập dữ


4

liệu, sau đó được “ghi mục lục” - index - lên máy chủ tìm kiếm, tại đấy

các thơng tin VC website sẽ được lưu trữ lại, các spider sẽ làm việc

index lên máy chủ các thơng tin như từ khóa của website, các link liên
kết trong website đó, theo lịch trình mà các cơng cụ tìm kiếm quy ước.
Người sở hữu website bắt đầu đế nhận ra những giá trị cùa việc có các

trang web của họ và có thể nhìn thấy được xếp hạng cao trong kết quả
cơng cụ tìm kiếm.

Người ta chia SEO ra làm hai dạng đó là : SEO mũ trắng - SEO dạng
công khai truyền thống (White Hat SEO) và SEO mũ đen - dạng gian
lận dùng các biện pháp không được thừa nhận là chính quy hợp pháp

để thực hiện SEO (Black Hat SEO).
Theo Danny Sullivan, cụm từ “Tối ưu hóa cơng cụ tìm kiếm” bắt đầu


được sứ dụng rất nhiều trên mạng kể từ năm 1997.
Đầu phiên bản cùa thuật tốn tìm kiếm dựa vào quản trị trang website

cung cấp thông tin như các thẻ meta từ khoá, hoặc tập tin chi mục như
ALIWEB. Thẻ mcta cung cấp một hướng dẫn đến nội dung của mồi

trang.
Tống quan sứ dụng dừ liệu meta vào các trang chỉ mục được tìm thấy
sẽ được ít hơn đáng tin cậy, tuy nhiên, vì những sự lựa chọn của
webmasterma các thẻ meta có sự chính xác trong khá năng đưa thơng

tin website lên máy chủ tìm kiếm. Những dữ liệu khơng chính xác,

khơng đầy đú, và khơng nhất quán trong thẻ meta có thế gây ra sự xếp
hạng khơng đúng vị trí cho các tim kiếm khơng liên quan. Việc cung
cấp nội dung được tối ưu hóa và một số thuộc tính trong mã nguồn

HTML đối với một trang web cần phải chính xác để có được kết quả
tốt trên cơng cụ tìm kiếm.
Bằng cách dựa q nhiều vào các yếu tố như mật độ từ khóa đó được

độc quyền trong vịng kiểm sốt của một Webmaster, cơng cụ tìm kiếm


5

sớm bị lạm dụng vào thao tác xếp hạng. Đe cung cấp kết quả tốt hon

cho người dùng của họ, cơng cụ tìm kiếm đã phải thích ứng để đàm bão
kết quá của các trang đã cho thấy các kết q tìm kiếm có liên quan


nhất, thay vi các trang khơng liên quan nhồi với từ khố nhiều bởi
Black Hat SEO - nhóm Webmaster khơng bao giờ tn theo các qui

định của các bộ máy tìm kiếm, họ ln lạm dụng q mức các thú
thuật. Các cơng cụ tìm kiếm đã phán ứng lại bằng cách phát triển phức

tạp hơn thuật tốn xếp hạng, có tính đến các yếu tố bố sung mà gây

nhiều khó 5han cho quán trị web đế thao tác.
1.3.

Mục tiêu cần đạt được

ỉ. 3.1. về lý th uyết

Sau khi hoàn thành đồ án, em sẽ tiếp thu và nắm vừng được các kiến
thức sau:

- Tìm hiếu bộ máy tìm kiếm.
- Hiều thế nào là SEO, các biện pháp để tiến hành SEO một trang web.
1.3.2. về ứng dụng
Úng dụng các kiến thức lý thuyết về SEO đã tim hiếu, áp dụng vào

thực tiễn, em thí diem ứng dụng cho một website cụ the:

myphamnhat247.com và đã:
- Đưa website vào top 10 của bộ máy tìm kiếm Google với từ khóa

“mỹ phấm nhật”

- Đã kiềm tra phương pháp duy trì top 10 khi SEO đã thành cơng.


6

1.4.

Nghiên cún và giải quyết vấn đề - kế hoạch làm việc

ĩ.4. ỉ. Nghiên cứu và giải quyết vấn để
Việc đầu tiên trước khi SEO một website đã được định hướng đúng đắn

bằng những ý tưởng độc đáo và mã nguồn mở thì chúng ta phái biết

được SEO và các phương pháp lựa chọn những thành phần hồ trợ cho
website đó là những gì?
Một website được SEO tốt khi và chỉ khi webmaster có được hiếu biết

đúng đắn, tránh để khơng chuyền sang tình trạng Black Hat SEO.
Nhìn chung, q trình nghiên cứu được phân ra thành 04 giai đoạn, các
giai đoạn này được thực hiện liên tục đến khi SEO thành cơng.

Hình 1 Tơng quan q trình nghiên cứu và giải quyết vấn đề

-

Bước 1: Xây dựng ý tường, lựa chọn mã nguồn, xây dựng website có

nội dung riêng biệt, hỗ trợ người dùng tối đa.


-

Bước 2: Bắt đầu xây dựng website cả về mã nguồn lần nội dung, tối

ưu hóa website.
-

Bước 3:Thống kê lượng tìm kiếm và lưu lượng người truy cập.

-

Bước 4: Theo dõi các báo cáo cụ thể.


7

1.4.2. Ke hoạch làm việc
Tuần

Công việc

1 -4

Nghiên cứu về SEO (Search Engines Optimization),cách thức
hoạt động, những khó khăn sẽ gặp phải khi thực hiện công
việc SEO.
Nghiên cứu đối thủ cạnh tranh.

Phân tích website .
Viết báo cáo.


4-5

Nghiên cứu bàng từ khóa, thống kê phân tích và lựa chọn từ
khóa phù hợp.

Tối ưu hóa làm nội dung website chuẩn SEO (SEO onpage).
Viết báo cáo.

6-12

Xây dựng chiến lược liên kết đền website của mình (SEO
offpage).
Xác định hướng đi đúng đắn cho website.

Viết báo cáo.

12- 14

Theo dõi,quản trị, điều chinh kịp thời đế khẳc phục nhanh
chóng.
Viết báo cáo.

15

Hồn thành
Bảng 1 Ke hoạch thực hiện

1.5.


Bố cục

Chương 1: Tổng quan.
Tại chương này, em sẽ đề cập đến các khái niệm cơ bản về SEO, các
hiểu biết ban đầu về SEO.

Cũng trong chương này, em giới thiệu đề tài đồ án là: “SEO Website
bán hàng mỹ phẩm nhật cho myphamnhat247.com”.

Chương 2: Cơ sở lý thuyết.


8

về cơ sở lý thuyết, em tìm hiểu cách thức làm việc chung của các bộ

máy tìm kiếm, các cách thức thu thập thông tin, cách thức đe một bộ
máy tìm kiếm có thề thấy được website. Trong chương này, em cũng

giới thiệu về hai phương thức đánh giá thứ hạng của website là Alcxa

và GoogleRank, hai phương thức này đã và đang là thước đo quan

trọng trong việc phát triền web. Cũng trong chương này, em giới thiệu

SEO, giúp cho người đọc có cái nhìn rỗ ràng hơn về SEO.
Chng 3: ủng dụng.
Sau khi đã tìm hiểu và nắm rõ các phương thức tìm kiếm, các tiêu chí

đánh giá xếp hạng tại Chương 2, em áp dụng những hiếu biết trên cơ sờ


lý thuyết đó đe bắt đầu SEO website: myphamnhat247.com.
Tối ưu hóa website: myphamnhat247.com cho cơng cụ tìm kiếm
GOOGLE. Vì vậy, ở chương này, em sẽ nghiên cứu các phương pháp

cơ bản nhất, chính qui nhất đe có thổ tối ưu hóa một website, nhàm đưa
website lên các thứ hạng cao khi người dùng truy vấn. Sau khi đã áp

dụng các phương pháp cơ bản và chính qui, em sẽ thống kê các số liệu
và so sánh lúc chưa áp dụng SEO và sau khi áp dụng SEO.

Một sốphương pháp, kĩ năng mềm mà em đã áp dụng để SEO thành

công website.
Chuong 4: Ket luận - hướng phát triển.

Nội dung của chương 4 sẽ là tổng họp kết quả các công việc đã làm ở
các chương trước. Các kết quá đã đạt được sau khi hoàn thành đồ án.

Hướng phát triển, đề xuất các phương pháp đễ giữ các vị trí cao khi
SEO thành cơng, cũng như cách thức quáng bá website đế có thế thu

lợi nhuận, tự nuôi sống website.


9

CHUÔNG II

Cơ SỞ LÝ THUYẾT

2.1.

Nghiên cứu lý thuyết về SEO

2.1.1.


Tong quan hộ mảy tìm kiếm

Bộ mảy tìm kiếm hoạt dộng như thế nào?

Search Engine (SE) hay còn được gọi là cơng cụ tìm kiếm, bộ máy tìm
kiếm giúp người xem tìm thấy những thơng tin mơt cách liên quan

nhất. Người dùng có thế tìm kiếm thơng tin theo từ khóa, hình ánh, địa
điểm... trên SE. Khi nhận được lệnh yêu cầu tim kiếm , SE sẽ phân tích

u cầu đó, đánh giá, xếp hạng và trả về kết quả liên quan nhất.

Quy trình hoạt động cùa SE:
Khảo sát

Trả vè kết
quà.

Lưu trữ

Phân tích

Hình 2 Tổng quan cách thức làm việc của bộ máy tính tỉm kiếm


Trong đó:

Khảo sát - CravvkLà một giai đoạn rất quan trọng đe SE tham quan,

thu thập thơng tin trên website của bạn. SE có những con bọ( spider
hay crawler) được lập trình đe có thể tự động theo các liên kết (link) để
mò đến các website khác nhau, thu thập và đánh giá các thông tin trên

website đỏ.


10

Lưu trữ - Index: Là giai đoạn được SE lưu lại thông tin sau khi đã
crawl. Với khối lượng lưu trừ vơ hạn, các SE có the chứa hàng tỉ các
kêt quả liên quan. Một trang web có thê được lưu trữ nhanh hoặc chậm

tùy vào tốc độ khảo sát, độ tin tưởng cùa website và nhiều yếu tổ khác.
Phân tích -Analysis: Giai đoạn này SE sẽ làm trên các dừ liệu nó thu
thập được. Sau đó tính độ liên quan của dữ liệu so với yêu cầu người

dùng. Các SE khác nhau có các thuật tốn phân tích khác nhau từ đây
tạo ra sự khác biết giữa các SE. Giai đoạn phân tích này sẽ tạo tiền đề

cho giai đoạn phía sau - trà về kết quà.
Kết quả_Result: Các kết quá liên quan sẽ được hiển thị trong giai

đoạn này. Các kết quá liên quan hường được sắp xếp phía trên, cao hơn


những kết quá ít liên quan. Mặc dìi khơng phái lúc nào các kết q
cũng thỏa mãn được yêu cầu cúa người tim kiếm. Nhưng cho đến hiện
nay, người dùng khá hài lịng về những gì SE trả về.

Tuy bức tranh hoạt động của SE bên ngoài nhìn khá đơn giản nhưng
bên trong là tập hợp của rất nhiều thuật tốn phức tạp. SE thóa mãn

nhiều nhu cầu tìm kiếm cho người sứ dụng sẽ được sử dụng rộng rãi và
phát triến mạnh mẽ trong tương lai. Ai là vua trọng thị trường tìm kiếm

trực tuyến đầy tài năng này?
2.1.2. Giới thiệu về các Search Engine thông dụng
Hiện nay trên thế giới có rất nhiều SE đang hoạt động.

Google - Global: 68.6 %

Hình 3 Biểu đồ thị phần SE theo trang Netmarketshare


11

❖ Google Search

Google Search, hay còn được gọi là Google Web Search hay ngắn
gọn là Google, là một công cụ tìm kiếm thơng tin Online thuộc sớ hữu
bởi tập đồn Google, là một trong những Search Engine được sử dụng

phố biến nhất hiện nay trên thế giới, với hơn 3 tý lượt tìm kiếm mồi

ngày. Được phát triển từ năm 1997 bới Larry Page và Sergey Brin,


đến năm 1998, Google đã chính thức ra mắt cơng cụ tìm kiếm của
mình.
Đen nay, sau nhiều năm liên tục được cập nhật và phát triền, với hàng

tỷ dừ liệu được lưu trừ, tốc độ tìm kiếm ưu việt hàng đầu và ln đi

tiên phong trong việc tạo và cập nhật các thuật toán chống spam, giúp
đcm lại trải nghiệm tốt nhất cho người dùng.
❖ Yahoo! Search

YAHOO?
Yahoo Search là cơng cụ tìm kiếm website trực thuộc sở hữu cúa tập

đồn Yahoo! Đây là cơng cụ tìm kiếm lớn thứ ba tại Mỹ tính đến tháng


12

2 năm 2015, với lượng truy vấn tìm kiếm đạt 12,8%. Mặc dù được

thành lập từ năm 1995, nhưng phải đến 2004, Yahoo! mới chính thức
trình làng sản phẩm Search Engine cùa mình. Mặc dù được ra đời sau,
nhưng do lợi thế về thị phần người sử dụng Yahoo! Messenger và

Yahoo! Mail khá lớn. Yahoo Search vẫn cạnh tranh khá tốt với các đối

thủ đi trước mình cả nửa thập niên.
Trước sự cạnh tranh quá khốc nghiệt với Google Search, năm 2009,


Yahoo và Microsoft đã quyết định đi đến một sự thỏa thuận họp tác
cùng phát triển Bing Yahoo Search.
❖ Baidu

BaiúKSÍl
Baidu là một cơng cụ tìm kiếm cùa Trung Quốc thành công nhất cho

đến nay, được thiết kế riêng cho người dùng sừ dụng Tiếng Trung.Từ
khi được ra mắt vào năm 2000, đến nay Baidu đã trờ thành công cụ tìm
kiếm được sứ dụng nhiều thứ 2 thế giới, chí sau Google. Đe có một

thành cơng như vậy, ngồi việc kế thừa những thành công của những

đối thú đi trước như Google hay Wikipedia, Baidu đã phái có một sự
hỗ trợ rất lớn từ chủ nghĩa dân tộc và những hồ trợ độc quyền cúa

chính phú của Trung Quốc. Hiện nay, Baidu Search đã trớ thành cơng
cụ tìm kiếm khơng the thiếu cho những ai sử dụng tiếng Trung và

muốn kinh doanh tại thị trường này.


13



Bing Search

t>ing
Bing Search, tiền thân là MSN Search (trước đó còn gọi với tên

là Live Search, Windows Live Search) là một cơng cụ tìm kiếm cùa
tập đồn Microsoft.Cong cụ tìm kiếm Bing lần đầu tiên được ra mắt

vào 28 tháng 5 2009, và trờ thành cơng cụ tìm kiếm lớn thứ hai tại thị
trường Bắc Mỹ.

Ngày 29 tháng bảy năm 2009, Microsoft và Yahoo! đã đi đến một thỏa

thuận mười năm với nội dung sẽ Yahoo! Search sẽ được thay thế bới
Bing Search. Yahoo! sẽ nhận được để giữ 88% doanh thu từ tất cá các
doanh quàng cáo tìm kiếm trên trang web của mình trong năm năm đầu

tiên cúa thỏa thuận, và có quyền đe bán quảng cáo trên một số trang

web của Microsoft.


Yandex

Yandex là trình tim kiếm phố biến nhất tại Nga và xếp hạng thứ 4 trong
số những trình tìm kiếm phổ biến nhất. Được thành lập vào năm 1997,
trinh tìm kiếm đến từ Nga này trung bình phục vụ hom 150 triệu lượt
tìm kiếm mồi ngày.
Từ E-mail cho đến dịch vụ bán đồ, Yandex cung cấp hầu hết các dịch
vụ mà Google có và cũng cung cấp dưới dạng đa ngơn ngữ đế người
dùng có thể tìm kiếm thơng tin phù hợp nhất với ngơn ngữ của mình.


14


Nhờ nguồn dữ liệu thông tin và dịch vụ khổng lồ cùa nó, Yandex hồn
tồn xứng đáng là cơng cụ tốt nhất có thổ thay the Googlc.
❖ Ask

Trước đây được biết tới với cái tên Ask Jeeves. Ask được phát triền
dựa theo định dạng câu hói/câu trá lời, phố biến với các kết quả có
ngơn từ tự nhiên, thơng tục.

Hầu hết các câu hói được đã được chọn lọc kỹ lưỡng và được trà lời
bởi những người dùng khác. Bên cạnh đó, Ask cũng cung cấp chức
năng tìm kiếm thơng thường
❖ AOL

AOL đã luôn luôn tập trung vào cổng thông tin, không phái thật sự là
công cụ tim kiếm. Trong thực tế, kết quá tìm kiếm và quảng cáo cùa họ
được cung cấp bời Google.

Ở Việt Nam hiện nay , đa số mọi người đều sử dụng Google đế tìm
kiếm thơng tin. Vậy nên đề tài của em sẽ tìm hiểu trên Google.

2.2.

Cấu tạo chung cùa các bộ máy tìm kiếm

Bộ máy tìm kiếm thường cấu tạo bởi 3 bộ phận đó là: bộ thu thập thơng

tin, bộ lập chỉ mục và bộ tìm kiếm thơng tin, được hoạt động theo mơ
hình sau:

Search

Eng.ne

■■■

Index

Hình 4 Cấu tạo Search Engine


15

Trong đó:
Robot - Bộ thu thập thơng tin:

Robot là một chương trình tự động duyệt qua các cấu trác siêu liên kết
để thu thập tài liệu, nó tìm và nhận về tất cả tài liệu có liên kết với tài

liệu đó.
Robot được biết đen dưới nhiều tên gọi khác nhau : spider, web

wanderer hoặc web worm,... Những tên gọi này đôi khi gây nhầm lẫn,
như từ‘spider’, ‘wanderer’ làm người ta nghĩ ràng robot tự nó di
chuyến và từ‘worm’ làm người ta liên tưởng đến virus, về bán chất

robot chì là một chương trinh duyệt và thu thập thông tin từ các site

theo đúng giao thức web. Nhùng trình duyệt thơng thường khơng được
xem là robot do thiếu tính chú động, chúng chi duyệt web khi có sự tác

động của con người.

Index - Bộ lập chỉ mục
Hệ thống lập chi mục hay cịn gợi là hệ thống phân tích và xử lý dữ
liệu, thực hiện việc phân tích, trích chọn những thông tin cần thiết

(thường là các từ đơn , từ ghép , cụm từquan trọng) từ những dừ liệu
mà robot thu thập được và tổ chức thành cơ sở dữ liệu riêng để có thể

tìm kiếm trên đó một cách nhanh chóng, hiệu quà. Hệ thống chi mục là

danh sách các từ khoá, chi rõ các từ khoá nào xuất hiện ớ trang nào, địa
chi nào.

Search Engine - Bộ tìm kiếm thơng tin
Search Engine là cụm từ dùng chi tồn bộ hệ thống bao gồm bộ thu
thập thông tin, bộ lập chí mục & bộ tìm kiếm thơng tin. Các bộ này

hoạt động liên tục từ lúc khởi động hệ thống, chúng phụ thuộc lẫn nhau
về mặt dừ liệu nhtmg độc lập với nhau về mặt hoạt động.

Search Engine tương tác với user thơng qua giao diện web, có nhiệm

vụ tiếp nhận & trả về những tài liệu thoả yêu cầu của user. Nói nơm na,


16

tìm kiếm từ là tìm kiếm các trang mà những từ trong câu truy vấn
(query) xuất hiện nhiều nhất, ngoại trừ stopword (các từ quá thông

dụng như mạo từ a, an, the,...). Một từ càng xuất hiện nhiều trong một

trang thì trang đó càng được chọn đế trả về cho người dùng.Và một
trang chứa tất cá các từ trong câu truy vấn thì tốt hơn là một trang

khơng chứa một hoặc một số từ. Ngày nay, hầu hết các search engine
đều hỗ trợ chức năng tìm cơ bàn và nâng cao, tim từ đơn, từ ghép, cụm
từ, danh từ riêng, hay giới hạn phạm vi tìm kiếm như trên đề mục, tiêu

đề, đoạn văn bàn giới thiệu về trang web,.....
Ngoài chiến lược tìm chính xác theo từ khố, các search engine còn cố

gắng ‘hiểu ‘ ý nghĩa thực sự của câu hởi thông qua những câu chữ do
người dùng cung cấp. Điều này được thề hiện qua chức năng sứa lồi

chính tá, tìm cá những hình thức biến đổi khác nhau của một từ. Ví dụ:
Search Engine sẽ tìm những từ như mỹ phấm nhật bản nội địa, mỹ

phâm nhật băn xách tay, mỹ phàm nhật băn tôt khi người dùng nhập

vào từ mỹ phấm nhật bàn.
2.3.

Hệ thống - xếp hạng website theo Alexa - Alexa web

ranking
Alexa Rank là thước đo mức độ phổ biến cùa các website. Chì số thứ

hạng của mồi website được Alexa kết họp đánh giá từ 2 yếu tố là: số
trang wcb người dùng xem (Page Views) và số người truy cập website

(Reach).

• Alexa Rank mang lại lọi ích gì?

Chỉ số thứ hạng Alexa cúa một website cao được hiểu là website đó có
đơng người truy cập, phần nào đem lại cho website an tượng sống động

và uy tín. Trong thị trường quáng cáo trực tuyến, Alexa Rank có thể
được sử dụng để đánh giá giá trị quảng cáo. Chỉ so Alexa Rank là

thước đo ghi nhận thành quá lao động cùa các webmaster với cộng


×