Tải bản đầy đủ (.pdf) (55 trang)

Đề tài nghiên cứu và tìm hiểu về SEO

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.26 MB, 55 trang )

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

CHƯƠNG I:

Chương 1: Tổng quan

Trang:1


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:2

Chương 1: TỔNG QUAN
1.1.

ĐẶT VẤN ĐỀ

Website – ngôi nhà của Doanh nghiệp trên Internet, nếu nói tên miền là bảng hiệu của
một Công ty thì website chính là văn phòng của Công ty đó, là nơi khách hàng tìm kiếm các
thông tin về doanh nghiệp trước khi kí hợp đồng, là nơi khách hàng và các đối tác liên hệ doanh
nghiệp, là bộ mặt của doanh nghiệp… Ngoài ra website còn tạo ra không ít lợi thế khác như:
-

Hướng hoạt động của doanh nghiệp từ nội địa hoặc cục bộ ra toàn cầu.

-

Website là nơi trưng bày, giới thiệu sản phẩm, hàng hóa dịch vụ của Doanh nghiệp. Hoạt
động lên tục 24x7, không giới hạn thời gian và không gian.


-

Website là kênh thông tin giới thiệu sản phẩm, dịch vụ hoàn hảo nhất và hữu dụng nhất
với hình ảnh, các giới thiệu, các media…

-

Website còn là một kho hàng khổng lồ, không giới hạn về sức chứa.

-

Hơn cả, website là một kênh bán hàng tốn ít chi phí nhất.
Thông qua website, doanh nghiệp có thể tiếp thị hình ảnh, thương hiệu, dịch vụ, sản

phẩm của mình ra ngoài phạm vi, khu vực của quốc gia. Chính vì những lợi ích ấy, việc không
có website đã là một thiệt thòi so với các đối thủ cạnh tranh.
Theo Tổng cục Thống kê, tổng số người sử dụng Internet tại Việt Nam tính đến 2013 là
hơn39 triệu người, ( chiếm hơn 43.9% dân số Việt Nam) và hơn 8,5 triệu người dùng Internet
băng thông rộng (08/2014).
Trong giai đoạn 2000 - 2010, tỉ lệ tăng trưởng người sử dụng Internet tại Việt Nam đạt
mức 12%, tốc độ tăng trưởng nhanh nhất trong khu vực. Như vậy sau gần 14 năm kể từ ngày
Việt Nam gia nhập cộng đồng Internet toàn cầu (1/12/1997), lượng người sử dụng Internet trong
nước đã tăng nhanh một cách đáng kể.
Nhìn chung, Internet là một món ăn không thể thiếu với cuộc sống của mọi người, với
thói quen sử dụng các bộ máy tìm kiếm (Google, Bing, Yahoo…) để tìm kiếm thông tin về
doanh nghiệp, tài liệu học tập, mua sắm trực tuyến, nạp thẻ điện thoại, thanh toán hóa đơn…
Theo thống kê, có đến hơn 86% lượng truy cập của một website đều đến từ các Search
Engine lớn như Google, Yahoo, MSN… Mỗi ngày có hàng triệu người dùng lướt web sử dụng
Search Engine để tìm những sản phẩm, dịch vụ và thông tin họ đang cần.Nhưng liệu với hàng tỉ
website hiện đang tồn tại, làm sao khách hàng có thể tìm thấy website của bạn trước mà không

phải của các đối thủ cạnh tranh? Hầu hết người sử dụng các bộ máy tìm kiếm đều không kiên
nhẫn, họ chỉ tập trung vào các kết quả tìm kiếm ở “Trang nhất” trong hàng trăm, hàng triệu kết
quả trả về khi truy vấn tìm kiếm.

Chương 1: Tổng quan


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:3

Như vậy, câu hỏi được đặt ra là: “làm sao giúp website có thể hiển thị được ở trang đầu
tiên khi người dùng truy vấn ?”
SEO – Search Enginee Optimization: tối ưu hóa công cụ tìm kiếm được đề xuất như là
một phương pháp hữu hiệu giúp website có vị trí cao tại trang kết quả truy vấn đầu tiên, giúp cho
người dùng dễ dàng tìm thấy kết quả nhất.
Chính vì đa phần người dùng đến 1 website đều thông qua công cụ tìm kiếm nên nếu bỏ
qua SEO đồng nghĩa với việc bạn mất tiền mỗi ngày cho website của đối thủ cạnh tranh.Không
người dùng nào đủ kiên nhẫn xem quá 3 trang kết quả sau khi thực hiện tìm kiếm trên SE.
Nếu website của bạn không nằm trong top 30 – top 10, khách hàng sẽ không hề biết
website của bạn tồn tại.
SEO là hoạt động không thể thiếu đối với bất kỳ trang web nào, nó là con đường để trở
thành một trang web được nhiều người biết đến.Các phương pháp quảng cáo truyền thống càng
bị bão hoà đối, chi phí cao nhưng hiệu quả lại giảm sút.Nhất là trong giai đoạn khủng hoảng hiện
nay, khi mà hiệu quả của việc quảng cáo phải được đặt lên hàng đầu.
SEO có rất nhiều ưu điểm so với các phương pháp quảng bá truyền thống như: người
dùng không phải độc thoại, có thể tiếp cận trao đổi thông tin trực tiếp; linh hoạt hơn trong phân
loại người dùng và đặc biệt là Webmaster có thể quản lý được thông tin khách hàng...Với rất
nhiều ưu điểm mà truyền hình, báo giấy... không có được, Internet sẽ luôn là lựa chọn hàng đầu.
1.2.


LỊCH SỬ GIẢI QUYẾT VẤN ĐỀ

Webmaster và các nhà cung cấp dịch vụ SEO đã bắt đầu tối ưu hóa các trang web cho
công cụ tìm kiếm vào giữa những năm 1990. Ban đầu, các webmaster bắt đầu gửi link liên kết
hay url của trang web đến các công cụ tìm kiếm, các công cụ này sẽ gửi một spider đến trang
website đó, website sẽ được thu thập dữ liệu, sau đó được index lên máy chủ tìm kiếm, nơi đây
các thông tin về website sẽ được lưu trữ lại, các từ khóa của website, các link liên kết trong
website đó, các spider này sẽ làm việc index lên máy chủ theo lịch trình mà các công cụ tìm
kiếm quy ước. Người sở hữu trang web bắt đầu để nhận ra những giá trị của việc có các trang
web của họ và có thể nhìn thấy được xếp hạng cao trong kết quả công cụ tìm kiếm. SEO chia ra
làm hai dạng đó là : SEO truyền thống (White Hat SEO) và SEO gian lận (Black Hat SEO).
Theo nhà phân tích Danny Sullivan, cụm từ “Tối ưu hóa công cụ tìm kiếm” sử dụng rất
nhiều trên mạng vào năm 1997.
Đầu phiên bản của thuật toán tìm kiếm dựa vào quản trị trang web cung cấp thông tin như
các thẻ meta từ khoá, hoặc tập tin chỉ mục như ALIWEB. Thẻ meta cung cấp một hướng dẫn đến
nội dung của mỗi trang.

Chương 1: Tổng quan


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:4

Sử dụng dữ liệu meta vào các trang chỉ mục được tìm thấy sẽ được ít hơn đáng tin cậy,
tuy nhiên, vì những sự lựa chọn của webmastermà các thẻ meta có sự chính xác trong khả năng
đưa thông tin website lên máy chủ tìm kiếm. Những dữ liệu không chính xác, không đầy đủ, và
không nhất quán trong thẻ meta có thể gây ra sự xếp hạng không đúng vị trí cho các tìm kiếm
không liên quan. Việc cung cấp nội dung được tối ưu hóa và một số thuộc tính trong mã nguồn

HTML đối với một trang web cần phải chính xác để có được kết quả tốt trên công cụ tìm kiếm.
Bằng cách dựa quá nhiều vào các yếu tố như mật độ từ khóa đó được độc quyền trong
vòng kiểm soát của một webmaster, công cụ tìm kiếm sớm bị lạm dụng vào thao tác xếp hạng.
Để cung cấp kết quả tốt hơn cho người dùng của họ, công cụ tìm kiếm đã phải thích ứng để đảm
bảo kết quả của các trang đã cho thấy các kết quả tìm kiếm có liên quan nhất, thay vì các trang
không liên quan nhồi với từ khoá nhiều bởi Black Hat SEO – nhóm Webmaster không bao giờ
tuân theo các qui định của các bộ máy tìm kiếm, họ luôn lạm dụng quá mức các thủ thuật. Các
công cụ tìm kiếm đã phản ứng lại bằng cách phát triển phức tạp hơn thuật toán xếp hạng, có tính
đến các yếu tố bổ sung mà gây nhiều khó khăn cho quản trị web để thao tác.
SEO tại Việt Nam bắt đầu những nền móng phát triển đầu tiên khoảng vào thời điểm giữa
năm 2006. Sau 5 năm, đến nay SEO đã là một khái niệm mà hầu như bất kì một nhà quản trị
website nào cũng biết đến và tìm hiểu nó dù ít hay nhiều. Thậm chí, SEO còn được đưa vào hoạt
động của công ty như một hướng đi chiến lược với những kế hoạch dài hơi. Điển hình, bạn có
thể dễ dàng nhận ra FPT có bộ phận SEO riêng, Zing có bộ phận SEO riêng, VCCORP cũng có
bộ phận traffic riêng, Báo điện tử 24h…
Như đã trình bày ở trên, hầu hết người làm SEO chỉ chú ý đến việc là sao để một website
Thương mại được lên trang nhất của bộ máy tìm kiếm. Vấn đề đặt ra: có thể áp dụng SEO cho
một website phi lợi nhuận, mang tính giáo dục và Cộng đồng không ? Liệu SEO cho một trang
web phi thương mại có khả năng thành công không…
Luận văn đề tài “Tối ưu website dn24h.com cho các công cụ tìm kiếm” là một minh
chứng cụ thể nhất cho việc áp dụng phương pháp SEO vào một website phi lợi nhuận, cộng đồng
cùng trao đổi học tập.
1.3.

MỤC TIÊU CẦN ĐẠT ĐƯỢC

1.3.1.

Về lý thuyết


Sau khi hoàn thành luận văn, sinh viên có các kĩ năng sau:
-

Tìm hiểu bộ máy tìm kiếm.

-

Hiểu thế nào là SEO, các biện pháp để tiến hành SEO một trang web.
1.3.2.

Về ứng dụng

Chương 1: Tổng quan


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:5

Sau khi áp dụng lý thuyết đạt được vào thực tiễn, sinh viên có được cách để:
-

Đưa website vào top 3 của bộ máy tìm kiếm với từ khóa “diễn đàn đăk nông”

-

Phương pháp duy trì top 10 khi seo đã thành công.

1.4 Phương pháp nghiên cứu và giải quyết vấn đề
Việc đầu tiên trước khi SEO một website đã được định hướng đúng đắn bằng

những ý tưởng độc đáo và mã nguồn tốt thì chúng ta phải biết được SEO là gì?Và các
phương pháp lựa chọn những thành phần hỗ trợ cho website đó.Một website được SEO tốt
khi và chỉ khi webmaster có được hiểu biết đúng đắn, tránh rơi vào tình trạng Black Hat
SEO.
Nhìn chung, quá trình nghiên cứu được phân thành 04 giai đoạn, các giai đoạn này được
thực hiện liên tục cho đến khi SEO thành công.

Chương 1: Tổng quan


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

CHƯƠNG 2:

Chương 2: Khảo sát hiện trạng

Trang:6


Tối ư
ưu hóa trangg web dn24h.com cho công
c
cụ tìm
m kiếm GOO
OGLE

Trang:7

Chương 2:
2 KHẢO SÁT HIỆN TRẠNG

2.1. Phư
ương pháp
p nghiên cứ
ứu và giải qu
uyết vấn đềề
Việc đầuu tiên trướcc khi SEO một
m websitee đã được định
đ
hướngg đúng đắn bằng nhữngg ý
tưởng độc đáo và
v mã nguồồn tốt thì chhúng ta phảii biết được SEO là gì??Và các phư
ương pháp lựa
h trợ cho website đó.Một
đ
web
bsite được SEO tốt khi
k và chỉ khi
k
chọnn những thàành phần hỗ
webm
master có đư
ược hiểu biếết đúng đắnn, tránh rơi vào
v tình trạnng Black Hat SEO.
Nhìn chu
ung, quá trìình nghiên cứu
c được phhân thành 04
0 giai đoạn
n, các giai đoạn
đ
này đư

ược
thực hiện liên tụục cho đến khi
k SEO thàành công.

H
Hình
1: Tổổng quan quá
q trình nghiên cứu và
v giải quy
yết vấn đề
-

Bước 1: Xây dựng ý tưởng, lựaa chọn mã nguồn,
n
xây dựng websiite có nội duung riêng biệt,
gười dùng tốối đa.
hỗ trợ ng

-

Bước 2: Bắt đầu phhát triển website, song song với việc phát triểển cả về nộội dung lẫn mã
đ áp dụng các biện phháp để tối ưu
ư hóa website.
nguồn, táác giả bắt đầu

-

Bước 3: Thống kê, theo
t
dõi cácc từ khóa, lư

ượng ngườii truy cập.

-

n SEO thàành công hooặc
Bước 4: Theo dõi cáác báo cáo cụ thể, duy trì công việệc hiện tại nếu
c
thành công
c
sữa chữaa khi SEO chưa

Chươ
ơng 2: Khảoo sát hiện trrạng


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE
2.1.2.

Trang:8

Kế hoạch làm việc

Tuần

Công việc

1-3

Nghiên cứu về Search Engines, cách thức hoạt động, cách thức thu thập
thông tin.


4-6

Nghiên cứu về SEO, các cách giải quyết vấn đề về SEO.

8 - 15

Tối ưu hóa website.
Quảng bá website dựa trên các mạng xã hội.
Phân tích theo dõi bằng các công cụ miễn phí của các Search Engines cung
cấp. Xác định hướng đi đúng đắn cho Website.

16

Theo dõi, điều chỉnh từ khóa, các nội dung không phù hợp

17

Viết báo cáo.

18

Hoàn thành.

2.2. BỐ CỤC
-

Chương 1: Tổng quan.
Tại chương này, tác giả sẽ đề cập đến các khái niệm cơ bản về SEO, các hiểu biết ban


đầu về SEO.
Cũng trong chương này, tác giả giới thiệu đề tài luận văn là: “Tìm hiểu và ứng dụng SEO
– Search Engine Optimization vào website DN24h.com” – Một website cộng đồng học tập, trao
đổi kinh nghiệm. Đây là một hướng đi mới khi làm SEO.
Qua chương 1, tác giả giới thiệu toàn cảnh về đề tài.Cách thức nghiên cứu, tiếp cận đề tài
và các mục tiêu đạt được khi hoàn thành tốt luận văn.
-

Chương 2: Cơ sở lý thuyết.
Về cơ sở lý thuyết, tác giả tìm hiểu cách thức làm việc chung của các bộ máy tìm kiếm,

các cách thức thu thập thông tin, cách thức để một bộ máy tìm kiếm có thể thấy được trang web.
Trong chương này, tác giả cũng giới thiệu về hai phương thức đánh giá thứ hạng của
website là Alexa và GoogleRank, hai phương thức này đã và đang là thước đo quan trọng trong
việc phát triển trang web.
Cũng trong chương này, tác giả giới thiệu SEO, giúp cho người đọc có cái nhìn rõ ràng
hơn về SEO.
-

Chương 3: Ứng dụng.
Sau khi đã tìm hiểu và nắm rõ các phương thức tìm kiếm, các tiêu chí đánh giá xếp hạng

tại Chương 2, tác giả áp dụng những hiểu biết trên cơ sở lý thuyết đó để bắt đầu SEO trang web
DN24h.com.
Chương 2: Khảo sát hiện trạng


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:9


Vì vậy, ở chương này, chúng ta sẽ nghiên cứu các phương pháp cơ bản nhất, chính qui
nhất để có thể tối ưu hóa một website, nhằm đưa website lên các thứ hạng cao khi người dùng
truy vấn.
Sau khi đã áp dụng các phương pháp cơ bản và chính qui, tác giả sẽ thống kê các số liệu
và so sánh lúc chưa áp dụng SEO và sau khi áp dụng SEO.
Một số phương pháp, kĩ năng mềm mà tác giả đã áp dụng để SEO thành công trang web.
-

Chương 4: Kết luận – hướng phát triển.
Nội dung của chương 4 sẽ là tổng hợp kết quả các công việc đã làm ở các chương trước.

Các kết quả đã đạt được sau khi hoàn thành luận văn.
Những nhược điểm của SEO.
Hướng phát triển, đề xuất các phương pháp đễ giữ các vị trí cao khi SEO thành công,
cũng như cách thức quảng bá website để có thể thu lợi nhuận, tự nuôi sống website.

Chương 2: Khảo sát hiện trạng


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

CHƯƠNG 3:

Chương 3: Cơ sở lý thuyết

Trang:10


Tối ư

ưu hóa trangg web dn24h.com cho công
c
cụ tìm
m kiếm GOO
OGLE

Trang:11

CHƯƠN
NG 3: CƠ SỞ
S LÝ THUYẾT
TỔNG QUA
AN BỘ MÁ
ÁY TÌM KIIẾM
3.1.T
3.1.11. Bộ máy tìm kiếm hoạt
h
động như
n thế nàoo ?
E
hay còn gọi là công cụ tìm
m kiếm, bộộ máy tìm kiếm
k
giúp người
n
xem tìm
t
Search Engine
thấy những thônng tin một cách liên quan
q

nhất. Người
N
dùngg có thể tìm
m kiếm thôông tin theoo từ
… trên search
h engine. Khhi nhận đượ
ợc câu lệnh yêu cầu tìm
m kiếm, search
khoáá, hình ảnh, địa điểm…
enginne sẽ phân tích yêu cầầu đó, đánhh giá, xếp hạng và trảả về kết quuả liên quann nhất. Seaarch
enginne hoạt độn
ng theo quy trình như saau :
Ban đầu, SE sẽ gửi các Spider (hay còn gọọi là con bọọ, Crawler) để
đ tiến hànhh khảo sát một
m
webssite khi nó được
đ
uploadd lên. Các Spider
S
này được
đ
lập trìnnh để có thểể tự động lầần theo liên kết
để đii đến các website khácc nhau, sau khi
k dừng lạại ở một webbsite nào đóó, Spider nàày sẽ thu thhập,
đánhh giá các thôông tin trênn website đó
đ trước khii tự động lầần theo các liên kết đếến các webssite
khác…
Sau khi nhận
n
được các

c thông tiin từ Spiderr, SE có nhiiệm vụ lưu trữ
t lại trướcc khi phân tích
t
đ trả về cácc kết quả khhi người dù
ùng truy vấnn đúng vào nội
chúnng bằng các thuật toán riêng biệt để
dungg. Ta có thể tham khảo cách thức làm việc chuung của SE tại hình dưới đây:

Hình 1: Tổng
T
quan cách thức là, việc củaa bộ máy tìm kiếm.
Trong đóó:
Khảo sáát – Crawl: là một giaii đoạn rất quan
q
trọng để
đ search en
ngine tham quan, thu thhập
thôngg tin trên website
w
của bạn. Searcch engine có những coon bọ (spider hay craw
wler) được lập
trìnhh để có thể tự động theeo các liên kết (link) để
đ mò đến các website khác nhauu, thu thập và
đánhh giá các thôông tin trên website đó..
Lưu trữ
ữ - Index: làà giai đoạn search enggine lưu lại thông
t
tin saau khi đã crrawl. Với khối
k
lượng lưu trữ vôô hạn, các ssearch engin

ne có thể chhứa hàng tỉ kết quả liên quan.Mộtt trang web có
ơng 3: Cơ sở lý thuyết
Chươ


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:12

thể được index nhanh hoặc chậm tuỳ thuộc vào tốc độ crawl, độ trust của website và nhiều yếu tố
khác.
Phân tích – Analysis: giai đoạn này search engine sẽ làm việc trên các dữ liệu mà nó thu
thập được. Sau đó tính toán độ liên quan của dữ liệu so với yêu cầu của người dùng. Các search
engine khác nhau có những thuật toán phân tích khác nhau từ đây tạo ra sự khác biệt giữa các
search engine. Giai đoạn phân tích sẽ tạo tiền đề cho giai đoạn phía sau – Trả về kết quả.
Kết quả - Results: Các kết quả liên quan sẽ được hiển thị trong giai đoạn này. Những kết
quả liên quan thường được sắp ở phía trên, cao hơn những kết quả ít liên quan.Mặc dù không
phải lúc nào các kết quả cũng thoả mãn được yêu cầu của người tìm kiếm.Nhưng cho đến hiện
nay, người dùng khá hài lòng với những gì mà search engine trả về.
Tuy bức tranh hoạt động của search engine bên ngoài nhìn chung khá đơn giản nhưng
bên trong là tập hợp rất nhiều thuật toán phức tạp. Search engine nào thoả mãn nhiều nhất nhu
cầu tìm kiếm người sử dụng sẽ được sử dụng rộng rãi và phát triển mạnh mẽ trong tương lai. Ai
là vua trong thị trường tìm kiếm trực tuyến đầy tiềm năng này?
3.1.2.

Giới thiệu về các search engine thông dụng

Hiện nay trên thế giới có rất nhiều search engine đang hoạt động. Trong đó, phải kể đến
ba chàng khổng lồ đang chi phối 98% thị phần tìm kiếmtheo thông kê của SEO MOD tháng
01/2014.


Hình 2: Biểu đồ thị phần search engine từ seomoz.org
Google là search engine được nhiều người sử dụng nhất với 80% số người sử dụng. Tiếp
theo là Yahoo 9.5% và Bing 8.5%, còn lại số phần trăm ít ỏi dành cho các search engine khác.
Hiện nay, ở Việt Nam đa số mọi người cũng sử dụng Google để tìm kiếm thông tin.Nên
việc SEO trên Google là ưu tiên hàng đầu đối với các website.
3.2.CẤU TẠO CHUNG CÁC BỘ MÁY TÌM KIẾM
Bộ máy tìm kiếm thường cấu tạo bởi 3 bộ phận đó là: Bộ thu thập thông tin, Bộ lập chỉ
mục và bộ tìm kiếm thông tin, được hoạt động theo mô hình sau:
Chương 3: Cơ sở lý thuyết


Tối ư
ưu hóa trangg web dn24h.com cho công
c
cụ tìm
m kiếm GOO
OGLE

Trang:13

Hình 3: Cấu tạoo Search En
ngine
Robot – bộ thu th
hập thông tin: Robot được biết đến dưới nhiều
n
tên gọi
g khác nhhau:
spideer, bot, craw
wler, hoặc web

w worm…
…Về bản chhất robot ch
hỉ là một ch
hương trìnhh duyệt và thu
thập thông tin từ
ừ các websiite trên mạn
ng, nó tự động duyệt quua các cấu trúc
t
siêu liên kết và trảả về
các danh
d
mục kếết quả của công
c
cụ tìm kiếm. Những trình duyyệt thông th
hường khônng được xem
m là
robott do thiếu tíính chủ độnng, chúng chhỉ duyệt webb khi có sự tác động củủa con ngườ
ời.
Index – bộ lập chỉ mục: Các trang
t
web sau
s khi thu thập
t
về sẽ được
đ
phân tích, trích chhọn
nhữnng thông tinn cần thiết (tthường là các
c từ đơn, từ
t ghép, cụm
m từ quan trọng)

t
để lư
ưu trữ trongg cơ
sở dữ
ữ liệu nhằm
m phục vụ chho nhu cầu tìm
t kiếm saau này.
Search Engine – Bộ
B tìm kiếếm thông tin: Tưởng tượng ta muốn
m
tìm vài quyển sáách
trongg một thư viện
v
rất lớn.. Với sức lự
ực cá nhân ta không thhể xem qua hết tất cả sách,
s
vì vậyy ta
cần một
m danh mục
m sách. Tư
ương tự, tồnn tại hàng trriệu trang web
w trên thế giới và mỗỗi phút trôi qua
q
số lư
ượng được đẩy
đ lên càngg nhiều hơn, cho dù ta có
c trong tayy một công cụ lướt webb tuyệt vời đến
đ
đâu ccũng không
g thể duyệt hết. Tuy nhiên,

n
với sự
ự trợ giúp của
c SE, ta có thể thậm
m chí xác định
đượcc vị trí của những
n
từ cầnn tìm trong các trang web
w khắp nơ
ơi trên thế giới.
g
3.2.11. Robot
ược chia làm
m 2 loại đó là: Robot thhu thập thônng tin, và roobot chỉ mục.
Robot đư
3.2.1.1. Robot th
hu thập thôông tin có nhiệm
n
vụ
Phân tícch – thống kê - Statisttical Analyssis: Robot đầu tiên đư
ược dùng để đếm số lượ
ợng
t liệu trunng bình của một server,, tỉ lệ các dạạng file kháác nhau, kícch thước truung
web server, số tài
bình của một traang web,độ kết dính…
Duy trì siêu liên kết
k – Mainttenance: M
Một trong nhhững khó khăn
k
của việệc duy trì một

m
siêu liên kết là nó
n liên kết với những trang
t
bị hỏnng (dead linnks) khi nhữ
ững trang này
n bị thay đổi
c cơ chế nàào cảnh báo
o các bộ duyy trì về sự thhay
hoặc thậm chí bị xóa. Thật không mayy vẫn chưa có
ơng 3: Cơ sở lý thuyết
Chươ


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:14

đổi này. Trên thực tế khi các tác giả nhận ra tài liệu của mình chứa những liên kết hỏng, họ sẽ
thông báo cho nhau, hoặc thỉnh thoảng độc giả thông báo cho họ bằng email. Một số robot có thể
trợ giúp tác giả phát hiện các liên kết hỏng cũng như duy trì các cấu trúc siêu liên kết cùng nội
dung của một trang web. Chức năng này lặp lại liên tục mỗi khi một tài liệu được cập nhật, nhờ
đó mọi vấn đề xảy ra sẽ được giải quyết nhanh chóng.
Ánh xạ địa chỉ web – Mirroring: Mirroring: là một kỹ thuật phổ biến trong việc duy trì
các kho dữ liệu. Một ánh xạ (mirror) sẽ sao chép toàn bộ cấu trúc cây thư mục và thường xuyên
cập nhật những file bị thay đổi. Điều này cho phép nhiều người cùng truy xuất một nguồn dữ
liệu, giảm số liên kết bị thất bại, nhanh hơn và ít chi phí hơn so với truy cập trực tiếp vào site
thực sự chứa các dữ liệu này.
Phát hiện tài nguyên: Có lẽ ứng dụng thú vị nhất của robot là dùng nó để phát hiện tài
nguyên. Con người không thể kiểm soát nổi một khối lượng thông tin khổng lồ trong môi trường

mạng. Robot sẽ giúp thu thập tài liệu, tạo và duy trì cơ sở dữ liệu, phát hiện và xoá bỏ các liên
kết hỏng nếu có, kết hợp với công cụ tìm kiếm cung cấp thông tin cần thiết cho con người.
Kết hợp các công dụng trên - Combined uses: Một robot có thể đảm nhận nhiều chức
năng như: vừa thống kê số lượng tài liệu thu được vừa tạo cơ sở dữ liệu…. Tuy nhiên những ứng
dụng như thế còn khá ít ỏi.
3.2.1.2.Robot chỉ mục – Robot Indexing
Trong quá trình thu thập thông tin phục vụ cho việc lập chỉ mục, ta cần giải quyết vấn đề
sau:
Trong môi trường mạng, robot lấy thông tin từ các site. Vậy robot sẽ bắt đầu từ site nào
?Điều này hoàn toàn phụ thuộc vào robot.Mỗi robot khác nhau có những chiến lược khác
nhau.Thường thì robot sẽ viếng thăm các site phổ biến hoặc những site có nhiều liên kết dẫn đến
nó.
Ai sẽ cung cấp địa chỉ của các site này cho robot ?Có 2 nguồn; Một là Robot nhận các
URL ban đầu từ user.Hai là Robot phân tích các trang web để lấy các URL mới, đến lượt các
URL này trở thành địa chỉ đầu vào cho robot.Quá trình này được lặp lại liên tục.
Chọn dữ liệu nào trong tài liệu để lập chỉ mục? Quyết định chọn dữ liệu nào trong tài liệu
cũng hoàn toàn phụ thuộc vào robot, thường thì những từ được liệt kê như sau được xem là quan
trọng :
-

Ở góc cao của tài liệu.

-

Trong các đề mục.

-

Được in đậm.


- Trong URL.
Chương 3: Cơ sở lý thuyết


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE
-

Trong tiêu đề (quan trọng).

-

Trong phần miêu tả trang web (Description) .

-

Trong các thẻ dành cho hình ảnh (ALT).

-

Trong các thẻ chứa từ khóa.

-

Trong các text liên kết.

Trang:15

Một số robot lập chỉ mục trên tiêu đề, hoặc một số đoạn văn bản đầu tiên hoặc toàn bộ
tài liệu (full text). Một số khác lại lập chỉ mục trên các thẻ META(META tags) hoặc các thẻ ẩn,
nhờ vậy tác giả của trang web được quyền ấn định từ khoá cho tài liệu của mình. Tuy nhiên chức

năng này bị lạm dụng quá nhiều do đó các thẻ META không còn giữ được giá trị ban đầu của
chúng nữa (Black Hat SEO).
3.2.2. Index – bộ lập chỉ mục
3.2.2.1.Mô hình xử lý tổng quát của một hệ thống lập chỉ mục

Chương 3: Cơ sở lý thuyết


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:16

Lập chỉ mục là quá trình phân tích và xác định các từ, cụm từ thích hợp cốt lõi có khả
năng đại diện cho nội dung của tài liệu.Như vậy, vấn đề đặt ra là phải rút trích ra những thông tin
chính, có khả năng đại diện cho nội dung của tài liệu.
Thông tin này phải “vừa đủ”, nghĩa là không thiếu để trả ra kết quả đầy đủ so với nhu cầu
tìm kiếm, nhưng cũng phải không dư để giảm chi phí lưu trữ và chi phí tìm kiếm và để loại bỏ
kết quả dư thừa không phù hợp.
Việc rút trích này chính là việc lập chỉ mục trên tài liệu. Trước đây, quá trình này thường
được các chuyên viên đã qua đào tạo thực hiện một cách “thủ công “ nên có độ chính xác cao.
Nhưng trong môi trường hiện đại ngày nay, với lượng thông tin khổng lồ thì việc lập chỉ mục
bằng tay không còn phù hợp, phương pháp lập chỉ mục tự động mang lại hiệu quả cao hơn.
Một thủ tục lập chỉ mục tự động cơ bản:
-

Step of tokenization: Tách văn bản ra thành các chuỗi nhờ vào khoảng trắng, mỗi chuỗi
xem như là một từ.

-


Step of removal of stop words: bỏ những từ thường xuyên xuất hiện trong hầu hết các tài
liệu nhưng lại không quan trọng trong các tài liệu như tính từ, đại từ.

-

Step of stemming: loại bỏ các hậu tố (Suffixes) để đưa về các từ gốc.
Các từ thu được sẽ được lập chỉ mục. Tuy nhiên hai bước đầu cũng cần cho quá trình lập

chỉ mục cho các tài liệu tiếng Việt, bước thứ ba không cần vì tiếng Việt thuộc dòng ngôn ngữ
đơn thể.
3.2.2.2.Phương pháp lập chỉ mục
Phương pháp lập chỉ mục gồm hai phần chính yếu sau:
Đầu tiên là xác định các mục từ, khái niệm mà có khả năng đại diện cho văn bản sẽ được
lưu trữ (bao gồm cả việc tách từ, loại bỏ stop-word, xử lý hậu tố…)
Thứ hai là xác định trọng số cho từng mục từ, trọng số này là giá trị phản ánh tầm quan
trọng của mục từ đó trong văn bản.
3.2.2.2.1. Xác định mục từ quan trọng cần lập chỉ mục
Mục từ hay còn gọi là mục từ chỉ mục, là đơn vị cơ sở cho quá trình lập chỉ mục. Mục từ
có thể là từ đơn, từ phức hay một tổ hợp từ có nghĩa trong một ngữ cảnh cụ thể. Ta xác định mục
từ của 1 văn bản dựa vào chính nội dung của văn bản đó, hoặc dựa vào tiêu đề hoặc tóm tắt nội
dung của văn bản đó.
Hầu hết việc lập chỉ mục tự động bắt đầu với việc khảo sát tần số xuất hiện của từng loại
từ riêng rẽ trong văn bản. Nếu tất cả các từ xuất hiên trong tập tài liêu với những tần số băng
nhau, thì không thể phân biệt các mục từ theo tiêu chuẩn định lượng. Tuy nhiên, trong văn bản

Chương 3: Cơ sở lý thuyết


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE


Trang:17

ngôn ngữ tự nhiên, tần số xuất hiện của từ có tính thất thường, do đó những mục từ có thể được
phân biệt bởi tần số xuất hiên của chúng.
3.2.2.2.2. Xác định trọng số cho mục từ
Trọng số của mục từ là sự tần xuất xuất hiện của mục từ trong toàn bộ tài liệu.Phương
pháp thường được sử dụng để đánh giá trọng số của từ là dựa vào thống kê, với ý tưởng là những
từ thường xuyên xuất hiện trong tất cả các tài liệu thì “ít có ý nghĩa hơn” là những từ tập trung
trong một số tài liệu.
Ví dụ: tại trang web DN24h.com thì những mục từ có trọng số cao: từ thiện, đăk nông,
tuổi trẻ…
3.2.3. Search Engine – bộ tìm kiếm thông tin
Vì sao ta cần một công cụ tìm kiếm thông tin? Tưởng tượng ta muốn tìm vài quyển sách
trong một thư viện rất lớn. Với sức lực cá nhân ta không thể xem qua hết tất cả sách, vì vậy ta
cần một danh mục sách. Tương tự, tồn tại hàng triệu trang web trên thế giới và mỗi phút trôi qua
số lượng được đẩy lên càng nhiều hơn, cho dù ta có trong tay một công cụ lướt web tuyệt vời đến
đâu cũng không thể duyệt hết. Tuy nhiên, với sự trợ giúp của SE, ta có thể thậm chí xác định
được vị trí của những từ cần tìm trong các trang web khắp nơi trên thế giới.
3.2.3.1.Các phương thức tìm kiếm:
3.2.3.1.1. Tìm kiếm theo từ khóa
Đây là phương pháp được áp dụng với hầu hết các search engine. Trừ khi tác giả của
trang web xác định từ khóa cho tài liệu của mình, ngược lại điều này phụ thuộc vào search
engine. Như vậy các search engine sẽ tự mình chọn và đánh chỉ mục. Một số site lập chỉ mục cho
tất cả các từ có trong một trang web, một số khác chỉ chọn một số đoạn văn bản.
Các hệ thống đánh chỉ mục trên toàn văn bản (full-text indexing systems) đếm số lần xuất
hiện của mỗi từ trong tài liệu ngoại trừ các từ stopword.Có những công cụ tìm kiếm còn phân
biệt cả chữ hoa lẫn chữ thường.
Những khó khăn khi tìm theo từ khóa: Search engine thường gặp rắc rối với những từ
đồng âm khác nghĩa hoặc những từ có các biến thể khác nhau do có tiền tố và hậu tố. Bên cạnh
đó search engine cũng không thể trả về các tài liệu chứa những từ đồng nghĩa với các từ trong

câu truy vấn.
3.2.3.1.2. Tìm kiếm theo ngữ nghĩa
Không giống các hệ thống tìm theo từ khoá, hệ thống tìm theo ngữ nghĩa sẽ ‘đoán’ ý
muốn của người dùng thông qua câu chữ. Tìm theo ngữ nghĩa hoạt động dựa trên hình thức gom
nhóm tài liệu, phức tạp hơn thì dựa vào ngôn ngữ học, các thuyết về trí tuệ nhân tạo; tiếp cận dựa
Chương 3: Cơ sở lý thuyết


Tối ư
ưu hóa trangg web dn24h.com cho công
c
cụ tìm
m kiếm GOO
OGLE

Trang:18

p
phááp tính toánn bằng cách
h đếm số lầnn xuất hiện của các từ quan trọngg. Khi nhiềuu từ
vào phương
hoặc những cụm
m từ có nghĩĩa đặt gần nhau
n
trong tài
t liệu thì cho
c rằng chú
úng đang ám
m chỉ một chủ
c

đề nàào đó.

Hình
h 4: Hệ thốống tự độngg đoán hàn
nh vi tìm kiếm
3.2.33.1.3. Các chiến lược tìm kiếm
Mọi ngư
ười đều nhậnn xét rằng web
w là nơi mà
m ta luôn có được thônng tin về bấất kỳ chủ đề gì.
Nhưnng kết quả cuối
c
cùng thhường là lãnng phí thời gian
g cho nhhững URL vô
v ích.
Do đó đãã đến lúc ta nghĩ đến cáác chiến lượ
ợc tìm kiếm
m.
-

Ta khởi đầu với mộột đống thôn
ng tin trên một
m chủ đề khá
k rộng ?

-

đ hình dunng được cụ thể
t những gì
g cần tìm ?

Hoặc ta đã

-

Hay ta muốn
m
tìm địaa chỉ của ai đó ?
Nếu phạạm vi quan tâm
t của ta quá
q rộng, taa nên xem xét
x các thư mục
m web (w
web directorry).

Nếu sau đó ta th
hu hẹp phạm
m vi cần tìm
m, hãy xem
m xét việc lự
ựa chọn mộột công cụ tìm
t kiếm th
hích
hợp.
Ví dụ: chỉ
c với từ khóa
k
“diễn đàn
đ tuổi trẻẻ” ta có thểể có “diễn đàn
đ tuổi trẻẻ tây nguyêên”,
“diễnn đàn tuổi trrẻ việt nam””, “diễn đànn tuổi trẻ bến tre”, “diễnn đàn tuổi trrẻ quy nhơnn”...

3.3.H
HỆ THỐNG
G RANK
3.3.11. Google PageRank
P
3.3.11.1.Google PageRank
P
là gì?
Google PageRank
P
là chỉ số đán
ng tin cậy chhỉ giá trị củ
ủa một trang
g web.Googgle đánh giáá và
xếp hhạng các traang web bằằng cả hai phương
p
phááp tự động và
v thủ côngg dựa trên hơn
h 100 chỉỉ số
chínhh với những
g thuật toán xuất sắc.
Một vài chỉ số quann trọng quyếết định Gooogle PageRaank của một trang webb: độ hữu dụ
ụng
của tthông tin trêên trang webb, độ phổ biiến của tranng web, chấtt lượng kỹ thuật...
t
G
Google PageRank được chia làm 10 bậc và được biểu hiện bằng vạch màu xanh trên nền
n
trắngg:


. Giá trị của mỗi trang web
w theo Gooogle PageR
Rank tăng dần
d từ 1 đếnn 10.

ơng 3: Cơ sở lý thuyết
Chươ


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:19

Thuật ngữ PageRank™ là một thương hiệu được bảo hộ của Google, do Larry Page và
Sergey Brin phát triển tại trường đại học Stanford của Mỹ trong một dự án nghiên cứu về công
cụ tìm kiếm năm 1995.
3.3.1.2.Google PageRank đem lại lợi ích gì ?
Google PageRank hiện nay được coi là chỉ số đáng tin cậy đánh giá mức độ quan trọng
mỗi trang web. Một trang web có chỉ số Google PageRank cao sẽ đem lại ấn tượng đáng tin cậy
cho khách truy cập, điều này đặc biệt có ý nghĩa với các website kinh doanh thương mại điện tử.
Google PageRank ảnh hưởng trực tiếp tới vị trí hiển thị của mỗi trang web khi cạnh tranh
thứ hạng hiển thị trong danh sách kết quả tìm kiếm của Google.Một trang web có PageRank cao
dễ xuất hiện trên đầu danh sách kết quả tìm kiếm của Google hơn.
3.3.1.3.Tăng Google PageRank như thế nào?
Về cơ bản, theo các chuyên gia của Google: "Không được sử dụng các phương pháp giả
tạo, hãy tạo ra các trang web cho mọi người chứ không phải cho các công cụ tìm kiếm".
Tăng thứ hạng trong danh sách kết quả tìm kiếm của Google là phương pháp tăng
PageRank rất hiệu quả vì vừa tăng độ phổ biến các trang web của bạn, vừa tăng lượng khách truy
cập.
Cấu trúc website, cấp bậc cần rõ ràng, nội dung thông tin cần phong phú, hữu ích.

Website không được chứa các liên kết lỗi, các lỗi HTML, lỗi câu lệnh.
Đăng ký website vào các danh bạ uy tín cũng như các website chất lượng khác để tăng độ
phổ biến.
3.3.2. Alexa Rank
3.3.2.1.Alexa Rank là gì ?
Alexa Rank là thước đo mức độ phổ biến của các website. Chỉ số thứ hạng của mỗi
website được Alexa kết hợp đánh giá từ 2 yếu tố là: số trang web người dùng xem (Page Views)
và số người truy cập website (Reach).
3.3.2.2.Alexa Rank mang lại lợi ích gì?
Chỉ số thứ hạng Alexa của một website cao được hiểu là website đó có đông người truy
cập, phần nào đem lại cho website ấn tượng sống động và uy tín.
Trong thị trường quảng cáo trực tuyến, Alexa Rank có thể được sử dụng để đánh giá giá
trị quảng cáo.
Chỉ số Alexa Rank là thước đo ghi nhận thành quả lao động của các webmaster với cộng
đồng và là một công cụ rất hữu ích giúp các webmaster quản trị website hiệu quả.
3.3.2.3.Tăng Alexa Rank như thế nào?
Chương 3: Cơ sở lý thuyết


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:20

Tiến hành các chiến dịch quảng bá website định kỳ nhằm thường xuyên thu hút khách
truy cập website, tăng cao chỉ số Reach.

Hình 5: Minh họa về chỉ số Traffic của Alexa

Trong website, nên có các phần thông tin có giá trị cao, cập nhật để thu hút khách hàng
thường xuyên quay lại website, tăng Page views, Traffic.

Bố trí nội dung, cấu trúc website sao cho thu nhận được thật nhiều cú nhấp chuột của
khách truy cập để tăng Page views nhưng vẫn mang lại cảm giác thoải mái, tiện lợi.
3.4.TÌM HIỂU VỀ SEO
Theo thống kê của tổ chức Verisign, trong Q1 năm 2010 đã có thêm 1 triệu địa chỉ
Internet, nâng tổng số địa chỉ Internet trên thế giới lên trên 193 triệu và số lượng này sẽ không
ngừng tăng lên đồng nghĩa với việc có bằng đó địa chỉ website đã hoặc sẽ hoạt động trên mạng.
Việc thiết kế xong một website cũng giống như việc chọn và mua được vật liệu để xây
nhà từ những cữa hàng vật liệu uy tín mà thôi. Thiết kế một website đẹp là do đội ngũ thiết kế và
xây dựng; còn việc website đó có làm ra tiền hay không thì phần lớn lại phụ thuộc vào cách mà
webmaster quảng cáo và khai thác website đó như thế nào ? Như vậy, câu hỏi được đặt ra là: làm
thế nào để quảng cáo website tới người dùng ?
Có rất nhiều cách để bạn đưa website của mình đến với người dùng như là quảng cáo trên
ti vi, báo chí, quảng cáo tờ rơi, làm hội thảo… Mỗi cá nhân và doanh nghiệp chọn một cách
quảng bá khác nhau. Nhưng một cách vô cùng hiệu quả mà bất kỳ website nào cũng phải làm đó
là tối ưu hóa công cụ tìm kiếm hay còn gọi là SEO. Như vậy:
3.4.1. SEO là gì?
SEO là chữ viết tắt của Search Engine Optimization (tối ưu hóa công cụ tìm kiếm).
SEO là một tập hợp các phương pháp nhằm nâng cao thứ hạng của một website trong các
trang kết quả của các công cụ tìm kiếm và có thể được coi là một tiểu lĩnh vực của tiếp thị qua
công cụ tìm kiếm.

Chương 3: Cơ sở lý thuyết


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:21

Thuật ngữ SEO cũng có thể được dùng để chỉ những người làm công việc tối ưu hóa
công cụ tìm kiếm, là những nhà tư vấn đưa ra những dự án tối ưu hóa cho các website của khách

hàng.
Làm SEO là quá trình tối ưu hóa mã nguồn website, giúp website thân thiện với các công
cụ tìm kiếm để tăng lượng truy cập qua từ khóa tìm kiếm từ đó tăng số lượng người truy cập tới.
Một website được làm SEO tốt, đồng nghĩa với việc website đó luôn xuất hiện ở thứ hạng cao
khi người truy cập sử dụng công cụ tìm kiếm để tìm nội dung mà họ cần. SEO cũng có thể bao
gồm nhiều loại mục tiêu khác nhau khi tìm kiếm như: tìm ảnh, tìm từ khóa, tìm theo quốc gia và
một số loại SEO khác.
Các công cụ tìm kiếm hiển thị một số dạng danh sách trong trang kết quả tìm kiếm
(SERP) bao gồm danh sách trả tiền, danh sách quảng cáo, dánh sách trả tiền theo click và danh
sách tìm kiếm miễn phí.
Mục tiêu của SEO chủ yếu hướng tới việc nâng cao thứ hạng của danh sách tìm kiềm
miễn phí theo một số từ khóa nhằm tăng lượng và chất của khách viếng thăm đến trang.
SEO đôi khi là một dịch vụ độc lập hay là một phần của dự án tiếp thị và có thể rất hiệu
quả ở giai đoạn phát triển ban đầu và giai đoạn thiết kế website. Hiện nay, nhận thức của người
quản trị website tại Việt Nam nói riêng và thế giới nói chung nhận biết việc tối ưu hóa website
để các máy tìm kiếm trỏ tới rất ít. Người sử dụng không ý thức được tầm quan trọng của việc tối
ưu hóa website, hoặc làm các phương thức để các máy tìm kiếm trỏ đến. Hiện trên mạng Internet
có 3 công cụ tìm kiếm hữu hiệu nhất và phổ biến nhất:
-

Google

-

Yahoo

-

Bing
Hiện nay, nhận thức của người quản trị website tại Việt Nam nói riêng và thế giới nói


chung nhận biết việc tối ưu hóa website để các máy tìm kiếm trỏ tới rất ít. Người sử dụng không
ý thức được tầm quan trọng của việc tối ưu hóa website, hoặc làm các phương thức để các máy
tìm kiếm trỏ đến.SEO có thể coi như là một kỹ thuật, một bí quyết thực sự đối với mỗi người
quản trị, xây dựng website hay đơn thuần là người làm trong lĩnh vực truyền thông.
3.4.2. Tại sao cần SEO?
Đại đa số lưu lượng truy cập đến với các website hiện nay đều từ các bộ máy tìm kiếm
lớn như : Google, Yahoo, Bing… Nếu website không được tìm thấy bởi các công cụ tìm kiếm
hoặc nội dung không nằm trong cơ sơ dữ liệu của các bộ máy tìm kiếm thì đó chính là một thảm
họa nếu công ty bạn đang kinh doanh online hoặc có giao dịch trực tuyến hoặc có đi chăng nữa
nhưng kết quả tìm kiếm luôn nằm ở trang 3, 4, 5… trở đi thì cũng coi như là 1 thất bại.
Chương 3: Cơ sở lý thuyết


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:22

Một ví dụ nhỏ: website kinh doanh nội thất và…cứ mỗi “khách hàng tiềm năng” lên
Google, Bing gõ từ khóa tìm kiếm: “đồ nội thất giá rẻ” thì kết quả truy vấn đầu tiên đập vào mắt
họ là website của bạn. Sau đó, khả năng “khách hàng tiềm năng” trở thành ”khách hàng thân
thiết” sẽ cao hơn các đối thủ khác, và dĩ nhiên doanh số tăng theo.
Làm SEO hiện tại với thị trường phát triển mạnh và liên tục như hiện nay là điều mà các
trang web nên làm và phải làm, hãy bắt đầu ngay vì không bao giờ SEO là quá muộn.
Một câu hỏi khác được đặt ra: “Tại sao các công cụ tìm kiếm không thể tìm thấy website
của tôi nếu không có sự trợ giúp của SEO?”
Nếu nói là “không thể tìm thấy” thì không hoàn toàn đúng.
Thực ra, sau 1 thời gian dài, website cũng được các cổng tìm kiếm đưa vào index, nhưng
chỉ là “cho có” chứ không thật sự như những gì mà chúng ta muốn, vì khi các đối thủ cạnh tranh
có sử dụng các biện pháp SEO thì website bạn chẳng bao giờ được lọt vào các trang đầu trên bộ

máy tìm kiếm.
Khi có SEO tham gia vào công việc này, nó sẽ
giúp website bạn tăng thứ hạng trên các công cụ tìm
kiếm và hiển thị nội dung ở những nơi mà người dùng dễ
thấy và tìm kiếm nhất (kết quả hiển thị ngay trang 1).
Thời đại toàn cầu hóa đã biến bất kỳ môi trường
làm việc nào cũng mang tính cạnh tranh, và thế giới ảo
cũng không ngoại lệ.Những website nào đã và đang quan
tâm đến SEO thì đã có 1 lợi thế hơn so với đối thủ của
mình trong việc giành lấy người dùng.

Chương 3: Cơ sở lý thuyết


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

CHƯƠNG 4:

Chương 4: Ứng dụng

Trang:23


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:24

CHƯƠNG 4 - ỨNG DỤNG
Ở chương trước, chúng tôi đã trình bày nguyên lý hoạt động, các nguyên lý thu thập
thông tin cũng như Index một trang web lên bộ máy tìm kiếm. Tại chương này, chúng tôi sẽ áp

dụng những nguyên tắc về lý thuyết đó vào trang web Dn24h.com để giúp cho trang web có vị trí
cao khi người dùng truy vấn. Nội dung chương 4 không nêu rõ từng bước xây dựng website mà
chỉ chú trọng về các cách thức cách thức khảo sát người chùng, cách thức chọn tên miền cũng
như các cách để tối ưu hóa nó sao cho việc Index lên các bộ máy tìm kiếm là dễ dàng nhất.
4.1 KHẢO SÁT THÔNG TIN NGƯỜI DÙNG
4.1.1. Thành phần người sử dụng
Đây là bước đầu tiên khi xây dựng một website, tìm hiểu các thành viên cần những gì để
có thể xây dựng một site có thể hỗ trợ tối đa cho họ. Diễn đàn dn24h được tạo nên với mục đích
hướng cho cộng đồng học sinh – sinh viên một sân chơi - một trang web học tập, gắn kết các
thành viên trong địa bàn tỉnh thành 1 khối thống nhất, hướng tuổi trẻ đến cộng đồng qua những
hoạt động từ thiện, các buổi offline, dã ngoại, các kỹ năng trong cuộc sống.
4.1.2 Đối thủ cạnh tranh và hướng đi của Dn24h.com
Đối thủ cạnh tranh của diễn đàn dn24h gồm có những diễn đàn sau:
-

Diễn đàn trong tỉnh chưa có diễn đàn nào thực sự lớn mạnh, các nhóm, hội chủ yếu hoạt
động qua Mạng xã hội facebook… Các website cạnh tranh đa số là những bộ ban nghành,
báo Đăk Nông online…
Do các đối thủ trực tiếp cạnh tranh được hình thành từ rất lâu (8-10 năm), nguồn tin tức,

dữ liệu phong phú. Nên việc lựa chọn một hướng đi đúng đắn và riêng biệt cho DN24H.COM là
một điều quyết định đối với sự phát triển của trang web, do đó hướng phát triển của trang web
phải mang tính riêng biệt, nhắm vào nhu cầu thực tế của người sử dụng:
-

Hướng các thành viên tới các hoạt động từ thiện.

-

Xây dựng một trang web với các thao tác dễ nhất, hỗ trợ tối đa cho các bạn có kiến thức

tin học chưa cao.

-

Chia sẻ tài liệu, kiến thức thực tiễn trong cuộc sống.

-

Xây dựng một cộng đồng uy tín, thường xuyên tổ chức nhiều hoạt động để các thành viên
không cảm thấy nhàm chán khi tham gia diễn đàn.

-

Áp dụng Tin học vào thói quen của đa số các bạn trẻ trong địa bàn tỉnh, tìm kiếm những
thông tin phong phú, phù hợp với giới trẻ.

4.2

XÂY DỰNG WEBSITE

4.2.1 Chọn tên miền
Là một trong những nhân tố ảnh hưởng đến quá trình phát triển website của bạn trên các
công cụ tìm kiếm việc chọn tên miền cho website theo các tiêu chí sau:
Chương 4: Ứng dụng


Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE

Trang:25


Tiêu chí ngắn gọn và dễ nhớ: Với tên miền dễ nhớ, bạn sẽ có nhiều cơ hội để người sử
dụng trở lại với website hơn những tên miền khó nhớ. Điều này nói lên rằng, không phải tên
miền ngắn là dễ nhớ đối với người sử dụng, mà nó cần phải làm cho người sử dụng có khả năng
nhớ lại website của bạn khi họ cần tìm đến những nội dung mà bạn có khả năng cung cấp.

Hình 1: Minh họa việc chọn Domain
Tiêu chí liên quan đến vấn đề: Việc có được từ khóa chính trong tên miền rất có ý
nghĩa, vì tên miền có ảnh hưởng lớn đến kết quả tìm kiếm trên các công cụ tìm kiếm hiện nay.
Ngoài ra, nó cũng tạo cho người sử dụng dễ nhớ đến tên miền của bạn hơn khi họ muốn tìm
thông tin liên quan đến dịch vụ của bạn.
4.2.2 Chọn Hosting
Hosting là một phần quan trọng để quyết định sự thành công của website.Một website chỉ
phát triển tốt khi được chạy trên một hosting tốt. Việc lựa chọn Hosting sao cho phù hợp được
đánh giá theo các tiêu chí sau:
Tốc độ truy cập: tốc độ nhanh sẽ làm cho người dùng giảm bớt khó chịu khi phải chờ
đợi. Giúp cho họ có cái nhìn tốt về website.
“Tại hội thảo PubCon, Matt Cutts cho biết, Google đang thảo luận nội bộ để đưa
thêm một yếu tố nữa vào hệ thống tìm kiếm của mình giúp xác định thứ hạng các website
trên Google.Yếu tố mới này liên quan đến tốc độ của website và tốc độ tải trang. Matt
Cutts giải thích thêm rằng, đồng sáng lập Google mong muốn rằng tốc độ tìm kiếm trong
tương lai sẽ thực sự nhanh kể cả với các trang báo điện tử. Điều này có nghĩa rằng, các
trang có tốc độ truy cập nhanh chắc chắn sẽ có thứ hạng cao hơn các trang có tốc độ
truy cập chậm. Matt cũng nói thêm rằng, tốc độ tải trang hiện đang là một trong những
yếu tố quyết định tính điểm chất lượng quảng cáo trong hệ thống AdWords, do đó, đây sẽ
là cơ sở để đưa yếu tố này vào hệ thống tìm kiếm của Google trong năm 2010.”
Chương 4: Ứng dụng


×