Tải bản đầy đủ (.pdf) (187 trang)

Tài Liệu Seo Tiếng Việt By VietMoz

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.92 MB, 187 trang )

Tru
ng tâm Đào tạo SEO VietMoz –
VietMoz.edu.vn
2
Ebook SEO VietMoz 2013
About VietMoz
T
rung tâm đào to SEO VietMoz thuc Công Ty TNHH Truyn Thông VietMoz chính thc thành
lp vào ngày 31/05/2013, tuy nhiên nhng hot đng đào to và t vn ca chúng tôi thc s đã bt đu
t nm 2010.
Khi ngun t nhng bui offline cng đng và nhng lp hc SEO vi s lng hn ch do Mr.Lê
Nam (ngi sáng lp trung tâm SEO VietMoz đng thi là CEO ca VietMoz) trc tip đng lp và
ging dy. Sau rt nhiu khóa
hc tri dài trong nhiu nm qua, trung tâm đào to SEO VietMoz đã đào
to đc hàng trm SEOer và hin vn đang có rt nhiu hc viên tip tc theo hc.
Trong đào to, VietMoz c gng ti đa đ tho mãn yêu cu ca hc viên. Không ch cung cp kin
thc trong khoá hc, ging viên ca chúng tôi s chia s các kinh nghim làm vic, các thông tin b ích
v ngành Internet Marketing  Vit Nam. Chúng tôi quan tâm ti sc hc ca tng
hc viên trong lp,
vi nhng bn hc yu hoc quá bn công vic, VietMoz luôn dành thi gian giúp đ thêm đ các bn
theo kp chng trình. c bit vi nhng hc viên xut sc, s đc mi  li làm vic vi VietMoz
hoc đc VietMoz tin c ti các công ty cung cp dch v SEO và công ty làm các lnh vc khác.
VietMoz đã, đang và s luôn tìm mi các
h đ hc viên cm thy thoi mái và thun tin nht khi
đn lp hc, nhm đn mc đích cui cùng là giúp cho vic tip thu kin thc đc hiu qu hn. Phòng
hc ti trung tâm đào to SEO VietMoz đt tiêu chun quc t vi ni tht đc thit k đc bit s
mang li cm giác d chu và tri nghim đc bit
cho các hc viên.




Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
3
Ebook SEO VietMoz 2013

Trung tâm ào to SEO VietMoz liên tip t chc các bui offline min phí cho cng đng, là ni
tho lun, t vn thc mc cho mi thành viên
 có thêm thông tin v chúng tôi, xin mi các bn đng ngi ngn ti thm quan phòng hc ca
chúng tôi ti:

Trung tâm ào to SEO VietMoz
a ch: Hoa Cng Building – S 18/11 Thái Hà, ng a, Hà Ni
in thoi: (04) 6292 3344
Email:

Bn đ :

Tru
ng tâm Đào tạo SEO VietMoz –
VietMoz.edu.vn
4
Ebook SEO VietMoz 2013
CHỊU TRÁCH NHIỆM NỘI DUNG
Mr. Lee Nam
CEO VietMoz
BIÊN DỊCH
Mr. Tun
SEOer - VietMoz
NHÓM BIÊN SOẠN
Mr. Thành

Designer - VietMoz
Mr. Tùng
Coder - VietMoz



Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
5
Ebook SEO VietMoz 2013
Mục lục

Chng 1: C bn v công c tìm kim 8
Bài 1: Tng quan v các máy tìm kim
9
Bài 2: Tìm kim vi công c tìm kim 12
Bài 3: Tìm kim nâng cao 14
Bài 4: Dò quét WEBSI TE 16
Bài 5: Indexing 18
Bài 6: Th hng (Ranking) 21
Bài 7: Kim tra (10 phút) 24
Chng 2:Thc hành s dng toán t tìm kim 25
Bài 1: Cn bn v toán t tìm kim
25
Bài 2: Tìm kim title trang web 26
Bài 3: Tìm kim trong đa ch trang web (URL) 26
Bài 4 : Gii hn tìm kim đn mt tên min cp 1 nào đó. 26
Bài 5: Ly v bn cache gn đây nht ca trang web 27
Bài 6: Tìm file pdf trên Internet 27
Bài 7 : Tìm bài vit theo tên tác gi 27
Bài 8: S dng toán t ph đnh 27

Bài 9: Kt hp toán t ph đnh và toán t nâng cao 27
Bài 10: Tìm kim vn bn neo 28
Chng 3: Ti u Onpage 29
Bài 1: Gii thiu
30
Bài 2: K thut ti u Onpage và chèn t khóa 30
Bài 3: Ti u hình nh 34
Bài 4: Nhng li thng gp khi ti u Onpage 36
Bài 5: Câu hi kim tra kin thc 39
Chng 4: Các yu t k thut trong SEO 40
Bài 1: Vì sao phi nghiên cu các yu t k thut trong SEO
41
Bài 2: Dò quét và lu d liu 41
Bài 3: Mã trng thái HTTP là gì? Chúng đc dùng khi nào? 49
Bài 4: ng dn URL – Cu trúc và cách ti u 53
Bài 5: Trùng lp ni dung và cách khc phc 55
Bài 6: Tc đ site – Tm quan trng và cách ti u 61
Bài 7: Sitemap và RSS Feeds – Tm quan trng và ti sao? 63
Bài 8: Nhng li thng gp . 69
Tru
ng tâm Đào tạo SEO VietMoz –
VietMoz.edu.vn
6
Ebook SEO VietMoz 2013
Bài 9: Nhng tool cn bit 72
Bài 10: Câu hi kim tra 74
Chng 5: Interactive robots.txt 75
Bài 1: Kin thc c bn 76
Bài 2: Chn c th mc 76
Bài 3: Cho phép mt đng dn c th nào đó 76

Bài 4: Chn mt loi b c th 77
Bài 5: Add multiple block 77
Bài 6: Khai báo User-agent c th 78
Bài 7: C bn v ký t đi din 78
Bài 8: Chn tham s 79
Bài 9: Chn đnh dng ca file 80
Bài 10: Ch ra v trí sitemap XML 80
Chng 6 : Nghiên cu t khóa 81
Bài 1: Th nào là nghiên cu t khóa
82
Bài 2: Giá tr ca vic nghiên cu t khóa 85
Bài 3: Các loi t khóa 87
Bài 4: Gii thiu công c nghiên cu t khóa ca Google 89
Bài 5: Bt tay xây dng danh sách t khóa đu tiên ca bn 94
Bài 6: Nhóm t khóa theo tng ch đ 96
Bài 7: M rng danh sách t khóa: 98
Bài 9: Tài liu tham kho và công c h tr 104
Bài 10: Câu hi kim tra 106
Chng 7: Information Architecture 107
Bài 1: Gii thiu v Information Architecture
108
Bài 2: Các loi điu hng tiêu biu 109
Bài 3: Nhng hn ch ca máy tìm kim 111
Bài 4: S dng sitemap đ tìm ra nhng li trong cu trúc website 114
Bài 5: Liên kt ni b 117
Bài 6: iu khin các máy tìm kim 123
Bài 7: Gii thiu v Faceted Navigation – iu hng nhiu chiu 128
Bài 8: Cu trúc các website quc t 133
Bài 9: Công c 133


Chng 8: Nghiên cu đi th cnh tranh 138
Bài 1: Gii thiu v nghiên cu đi th cnh tranh
139
Trun
g tâm Đào tạo SEO VietMoz –
VietMoz.edu.vn
7
Ebook SEO VietMoz 2013
Bài 2: Phân tích mc đ cnh tranh ca mt t khóa c th 140
Bài 3: Phân tích công ty và website đi th 144
Bài 4: Phân tích h thng link 150
Bài 5: Competitive Link Growth 154
Bài 6: Các công c và tài liu tham kho hu ích 156
Bài 7: Câu hi kim tra kin thc 157
Chng 9: Phân tích link 158
Bài 1: Gii thiu v phân tích link
159
Bài 2:  uy tín và giá tr ca trang liên kt 160
Bài 3: Mc đ liên quan v ni dung gia trang đt liên kt và trang nhn đc liên kt 165
Bài 4: Vn bn neo 168
Bài 5: S lng và cht l
ng link
172
Bài 6: c đim ca link xu 175
Bài 7: Công c phân tích link 178
Bài 8: Hi đáp 183
Chng 10: Thc hành cài đt Google Analytics 184
Bài 1: Tùy chnh tham s UA
185
Bài 2: To pageview o 185

Bài 3: Theo dõi bin ngu nhiên 186
Li kt 187
Tru
ng tâm Đào tạo SEO VietMoz –
VietMoz.edu.vn
8
Ebook SEO VietMoz 2013
CHƯƠNG
1
Cơ bản về công cụ tìm kiếm
Bài 1 : Tng quan v các máy tìm kim
Bài 2 : Tìm kim vi công c tìm kim
Bài 3 : Tìm kim nâng cao
Bài 4 : Dò quét WEBSITE
Bài 5 : Indexing
Bài 6 : Th hng (Ranking)
Bài 7 : Kim tra (10 phút)



Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
9
Ebook SEO VietMoz 2013
Bài 1: Tổng quan về các máy tìm kiếm
Trong bài này, chúng ta s tìm hiu v
 World Wide Web là gì?
 Lch s và vai trò ca công c tìm kim
 S lc v dò quét, to ch mc và xây dng th hng
 Nhng tin b gn đây ca các công c tìm kim
World Wide Web là gì?

V c bn, th gii web là tp hp các trang web và các file (thuc rt nhiu đnh dng khác nhau)
đc liên kt vi nhau bi h thng phc tp ca các liên kt hay links. H
Các file trên th gii web này có th thuc nhng đnh dng sau:
 Hình nh
 Videos
 File pdf
 Video Flash
 File Javascript
Vi nhiu đnh dng file khác nhau, ni dung trang web tr nên hp dn hn, thay vì thun túy là
vn bn. Vic này gây khó khn cho máy tìm kim, đc bit vào thi đim nó mi ra đi. Mt phn vì
k thut dò quét cha thc s phát trin.
Cho đn ngày nay, máy tìm kim vn gp khó khn vi mt vài đnh dng file.
Là mt ngi làm SEO, bn cn bit nhng đnh dng file nào mà máy tìm kim gp khó khn đ
không đa nhng ni dung quan trng vào các file này.
Lch s và vai trò ca các máy tìm kim
Th gii web mi ra đi trong hn 20 nm.
Ngày đó, máy tìm kim vn cha ra đi – các website đc bit đn ch nh truyn ming, hoc
nh mt trang web danh b cha đa ch ca tt c các trang web khác (web hub). Khi th gii Internet
vn còn nh, vic này ko vn đ gì. Nhng khi th gii này m rng mnh m vào nhng nm tip theo,
mt gii pháp mi là điu bt buc.
Trong sut 1993/1994, nhng máy tìm kim đu tiên đã ra đi bao gm Excite, AltaVista và
Yahoo!. S lng các trang web và ngi dùng tng lên mnh m đn mc mà nhng trang web hub
tr nên quá ti và không còn hiu qu.
Nm 1996, Google ra đi. ây là máy tìm kim đu tiên nhn ra sc mnh và vai trò ca liên kt
và s dng chúng đ đánh giá đ uy tín ca trang web. ây chính là bc đt phá giúp tng cht lng
bng kt qu tìm kim.



Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn

10
Ebook SEO VietMoz 2013
3 công vic chính ca máy tìm kim: Dò quét, Xây dng c s d liu và Xp hng
V c bn:
Dò quét: Là quá trình máy tìm kim đi tìm nhng ni dung mi. H s dng nhng phn mm có
th t đng ghé thm các website và ln theo liên kt trên các trang web đ tìm ra nhng ni dung khác.
Xây dng c s d liu: Các máy tìm kim copy ni dung ca các trang web mà chúng đã ghé thm.
D liu này đc lu tr trên rt nhiu máy tính trong các trung tâm d liu (data center)  khp ni
trên th gii. iu này giúp cho vic tìm kim tr nên nhanh chóng, d dàng hn giúp bn nhn đc
kt qu ch trong 1/2s hoc ít hn.
Xp hng: ây là công vic mà các SEO quan tâm nht. Khi mt ngi tìm kim online, các c
máy này cn mt thut toán đ đánh giá trang web nhm xác đnh trang web nào liên quan nht, và t
đó tính ra th hng ca trang web đó trên bng kt qu
Nhng tin b gn đây ca công c tìm kim
Bên cnh đó, kt qu tìm kim không phân bit theo khu vc. Bt k ai trong mt đt nc tìm
kim mt sn phm hay dch v đu nhn đc mt bng kt qu nh nhau.
Tuy nhiên, trong nhng nm gn đây, đã có mt s thay đi:
Mng xã hi: Các trang mng xã hi nh Facebook và Twitter giúp máy tìm kim bit chính xác
trang web nào đang đc quan tâm. Máy tìm kim đã nhanh chóng cp nht tín hiu này vào thut toán,
giúp bng kt qu tr nên chính xác hn, cp nht hn.
Cá nhân hóa kt qu tìm kim: Tng t, máy tìm kim thu thp lch s lt web ca ngi dùng.
Lch s đó bao gm: nhng cm t nào đc h tìm kim nhiu, nhng trang web nào h hay ghé thm
và  li lâu. T đó, máy tìm kim có th bit mc đ yêu thích ca ngi dùng đi v
i các trang web.
Kt qu là vi cùng mt cm t, bng kt qu tìm kim ca ngi này s có khác bit vi bng kt qu
ca ngi khác.
Ví d trang web vnexpress.net và 24h.com.vn. Tôi thích trang web này, bn thích trang web khác.
Chúng ta ai cng có quan đim ca riêng mình.
Máy tìm kim đã tin hóa rt nhiu trong nhng nm gn đây và t đó thay đi cách thc tìm kim
ca mi ngi, đc bit là Google. C máy này đã tr nên thông minh hn rt nhiu nh c ch t hc

cng nh kh nng thu thp d liu vt tri giúp nó có th cung cp kt qu phù hp nht vi mong
mun ngi dùng. S vt tri này ca Google th hin qua 2 tính nng di đây:
Google Suggets: Ra đi t 8/2008. Khi bn bt đu gõ, Google s đ xut t khóa cho bn, giúp
bn không mt nhiu thi gian mà vn bit đc t khóa nào phù hp nht cho mình.
Google Instant: Ra đi 9/2010, Google Instant thay đi đáng k cách tìm kim bng cách ngay lp
tc cung cp kt qu da trên nhng ký t mà ngi dùng gõ vào. Bn s thu đc kt qu ngay khi gõ
mà không cn nhn Enter.
Là mt chuyên gia SEO, bn không ch cn bit nhng điu này, bn còn phi nhn thc nh hng
ca nó đn công vic. C
th, bn cn phi bit cách tìm kim s thay đi nh th nào, cm t tìm kim
s thay đi nh th khi nhng tính nng này ra đi.
Bài tp



Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
11
Ebook SEO VietMoz 2013
S dng tính nng Google Instant ngay hôm nay và mô t hot đng ca nó.
Ví d
1. Tìm kim vi cm t “bún ch”.
2. M tab khác tìm vi cm t “bún ch hà ni”
So sánh 2 bng kt qu và đa ra kt lun




Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
12
Ebook SEO VietMoz 2013

Bài 2: Tìm kiếm với công cụ tìm kiếm
Trong bài này chúng ta s hc v:
 Gii thiu v bng kt qu tìm kim
 Kt qu tìm kim hn hp và vai trò ca nó vi ngi làm SEO
Bng kt qu tìm kim
Hình thc truyn thng ca bng kt qu thng bao gm 10 liên kt hay 10 trang web. Ngoài ra
không còn thông tin nào khác.
Gi đây, khi tìm kim bn s nhn đc bng kt qu bao gm:
 Tin tc.
 Hình nh.
 Bn đ và đa ch chi tit các doanh nghip, t chc trong vùng.
 im đánh giá ca ngi dùng.
 Thông tin sn phm.
 Video.
Ví d, nu b
n tìm kim vi cm t “Vietmoz logo”, đn 99% trong bng kt qu s có hình nh
logo ca Vietmoz. Bng kt qu ca bn s có hình thù nh sau:

ây là lý do mà bng kt qu này có tên là bng kt qu hn hp.
2. Kt qu hn hp (blended results) có ý ngha gì vi các SEOer



Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
13
Ebook SEO VietMoz 2013

Nu bn m mt nhà hàng  Hà ni, bn nên lp tài khon Google Place và s có th xut hin
trong bng kt qu tìm kim nh nhà hàng Venus  trên.
Nu đc tn dng tt, kt qu hn hp mang đn nhiu c hi hn na cho bn, giúp bn xut

hin trc mt khách hàng.
Bài tp:
Tìm kim trên Google
Tìm kim vi nhng cm t s mang li kt qu hn hp (blended results) bao gm c hình nh,
vn bn và video.





Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
14
Ebook SEO VietMoz 2013
Bài 3: Tìm kiếm nâng cao
Trong bài này, bn s đc hc v:
 Gii thiu các toán t tìm kim
 u đim ca vic s dng toán t tìm kim
 Cách s dng các toán t tìm kim
1. Toán t tìm kim là gì?
Toán t tìm kim là nhng t khóa bn s dng trong khi tìm kim, giúp thu hp phm vi tìm kim
đn chính xác nhng gì bn cn.
2. Nhng ví d v toán t tìm kim:
Di đây là nhng toán t tìm kim hay đc dùng trong gii SEO:
a. Tìm ra nhng trang đã đc index ca mt website cho trc
Câu lnh tìm kim: site:vietmoz.com
Toán t “site” yêu cu máy tìm kim ch ly ra nhng trang thuc tên min đã cho, trong trng
hp này là vietmoz.com
b. Tìm nhng trang web mà tên min cha cm t cho trc
Câu lnh tìm kim: Inurl:forum qun áo
Toán t “inurl” yêu cu máy tìm kim ch tr v nhng trang mà đa ch URL ca nó có cha t


hoc cm t đã cho, trong trng hp này là t forum.
Kt qu tr v là tt c nhng din đàn có cha t qun áo trong ni dung. Nhng din đàn này s
rt hu ích khi bn xây dng liên kt đ SEO cho mt website cng nói v ch đ qun áo.
Bên cnh vic s dng riêng l tng toán t, bn cng có th kt hp chúng vi nhau:
Nhiu toán t có th kt hp vi nhau, ví d vi 2 toán t “site” và “inurl”  trên. Nh bn s thy
 đây vi:
site:vnexpress.net inurl:the thao
Câu lnh này s tr v tt c nhng trang trong website vnexpress.net mà trong đng dn URL có
cha t “the thao”
Ngoài ra, còn rt nhiu toán t khác đang ch bn khám phá. Nu hng thú, hãy truy cp vào đng
link:
3. Toán t ca các máy tìm kim khác
Trên đây là nhng toán t đc dùng chung cho các máy tìm kim. Ngoài ra, mi máy tìm kim
cng có nhng toán t riêng.
Các toán t dành cho Bing (máy tìm kim ca Microsoft)



Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
15
Ebook SEO VietMoz 2013
Có 2 toán t bn có th s dng vi Bing mà rt hu ích vi công vic SEO:
1. Toán t linkfromdomain:
Toán t này s ly ra tt c nhng website đi tác, nhng ngi nhn đc link tr t domain ca
bn:
linkfromdomain:vietmoz.com
Kt qu tr v cho bn là tt c nhng trang web đc website vietmoz.com đt link tr ti.
Bit điu này s rt hu ích trong quá trình xây dng link: Ví du: Nu bn
đang mun ly link t

mt website, bn có th xem h đã đt link ti nhng đâu và vì sao h li làm vy.
4. Nhng tác dng mà toán t tìm kim mang li:
Vi mt ngi làm SEO, toán t tìm kim rút ngn thi gian làm vic ca bn. Nó giúp bn tìm ra
nhng website, blog, forum mà bn có th đt link, giúp bn tìm kim theo nhng đnh dng file c th
nh pdf, word, power point…
Bài tp:
Kim tra xem trên website ca bn, hoc website mà bn hay ghé thm có bao nhiêu trang đc
index




Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
16
Ebook SEO VietMoz 2013
Bài 4: Dò quét WEBSITE
Trong bài này, chúng ta s đc hc v dò quét website, mt trong 3 công vic hàng ngày ca máy tìm
kim.


1. Cách b tìm kim dò quét website
Máy tìm kim thc hin dò quét website nhm mc đích tìm ra ni dung mi.
Máy tìm kim làm đc vic này nh s dng nhng phn mm hin đi có th thu thp thông tin
trên Internet. Nhng chng trình này thng đc gi là b tìm kim (Spider). Vi quy mô ngày càng
m rng ca mng Internet, công vic này ngày càng tiêu tn nhiu tài nguyên. Do đó, máy tìm kim
s dng các thut toán đ quyt đnh xem trang web nào s đc dò quét, bao lâu s dò quét, và đ sâu
dò quét. iu này cho phép h tn dng tài nguyên ca mình mt cách hiu qu nht có th. Bài hc
quan trng mà các SEOer cn phi nh là các máy tìm kim se không t đng dò quét trang web ca
bn tr phi chúng có lý do đ làm điu đó.
Mt khi b tìm kim ghé thm trang web ca bn, đu tiên chúng s tìm đn file robots.txt, đây

cng chính là bng ni quy ca trang web và s ch ra nhng trang nào (nu có) mà chúng không đc
dò quét. Bn có th
 tìm hiu nhiu hn v bng ni quy đc bit này  nhng bài hc sau.
Gi s rng con b không b chn theo cách này, nó s bt đu dò quét tt c các trang web trên
website ca bn. Dc đng đi, nó s lu li tt c các đa ch tên min vào trong mt danh sách đ s
dng cho nhng ln dò quét sau.
Gia dò quét và index (lu d liu) có s khác bit l
n. Dò quét là tìm ra các đa ch trang web,
trong khi index là thu thp thông tin hay ni dung trong các trang web đó.
2. Nhng vn đ mà b tìm kim thng gp phi
B tìm kim là các chng trình máy tính thông minh, tuy nhiên, chúng vn ch là máy móc và do
đó có nhng hn ch nht đnh
Nhng công ngh Web có th gây khó khn cho b tìm kim:
Website ngày nay s dng nhiu công ngh khác nhau đ nâng cao cht lng đng thi mang li
tri nghim tt hn cho ngi dùng. Tuy nhiên mt s công ngh li gây khó khn cho b tìm kim. C
th là:



Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
17
Ebook SEO VietMoz 2013
 Javascript
 AJAX
 Flash
Nhng là mt ngi làm SEO, bn cn bit rng s dng các công ngh này trong trang web có th
làm khó cho b tìm kim khi chúng dò quét ni dung ca bn.
Nhng loi ni dung có th gây khó cho hot đng ca b tìm kim:
Có nhng loi ni dung mà b tìm kim không thích, vì chúng không th đc đc d dàng nh
con ngi, c th là video và hình nh. Trong khi chúng có th phát hin và nhn ra s tn ti ca video

hoc hình nh trên mt trang web, chúng vn cha đ kh nng đ hiu đy đ ni dung này. Mt ln
na, b tìm kim đang ngày càng tr nên thông minh hn nhng còn xa chúng mi đt ti trình đ có
th hiu đy đ các loi ni dung nh con ngi.
Ví d: Máy tìm kim s không th đc đc ch trên mt bc nh. iu tng t cng xy ra vi
video.
Vì vy cn đm bo trang web ca bn không ch cha hình nh hoc video. Bên cnh hình nh,
video cn có nhng đon ni dung mô t. Và nhng ni dung quan trng nht đnh phi đc đ trong
nhng đnh dng mà máy tìm kim có th d dàng hiu đc. C th là vn bn
3. Các loi b tìm kim
Mi máy tìm kim có con b riêng vi cái tên riêng. Ví d ca Google là googlebot. Ca Bing là
bingbot. Baidu là Baiduspider.
4. Tài liu tham kho
 Vlog C ch tìm kim ca Google Spider ( />cua-cong-cu-tim-kiem/ ).
 Tìm hiu c ch tìm kim ca Google Spider ( />co-che-tim-kiem-cua-Google-Spider-46/).




Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
18
Ebook SEO VietMoz 2013
Bài 5: Indexing
Trong bài này chúng ta s hc v:
 Web index là gì?
 Thu thp thông tin
 Caching là gì và làm th nào đ kim tra bn cache ca mt trang web?
Mt khi máy tìm kim đã dò quét trang web, chúng cn lu tt c nhng ni dung này vào c s d
liu ca mình. Tt c nhng thông tin này đc t chc li và đt trong tình trng sn sàng cung cp
cho ngi dùng khi h tìm kim.
1. C s d liu web (Web index) là gì?

V c bn, web index là c s d liu lu tr các trang web. Các máy tìm kim s dng hàng ngìn
máy ch đt khp ni trên th gii đ lu tr nhiu t trang web trong CSDL ca mình. Vic này đm
bo ngi tìm kim nhn đc kt qu gn nh ngay lp tc sau khi h nhn nút Enter.
2. Ly thông tin
Khi mt ngi dùng tìm kim vi mt t khóa, thc t h không tìm kim trên th gii web. H
đang tìm kim trên c s d liu ca các máy tìm kim. Các máy tìm kim s vào c s d liu ca
mình và ly ra các trang web cùng ch đ. C th đó là nhng trang web có cha t tìm kim hoc cha
nhng t liên quan. T đây rút ra đc, đ tng đ liên quan ca trang web đn t khóa bn mun
hng ti, bn cn bit chèn t khóa mt cách hp lý  nhng v trí quan trng. Bên cnh đó, cng
không đc quên nhng t liên quan.
Làm th nào máy tìm kim bit đc ni dung trang web có liên quan đn t khóa đang đc tìm
kim
a. S dng t khóa:
Máy tìm kim tìm xem trong ni dung ca trang web có cha t khóa đang đc tìm kim hay
không?
Nu ngi lên Google tìm kim v
i t bóng đá:
Ni dung A: Bóng đá là môn th thao tp th, gm 2 đi thi đu đi kháng vi nhau. Mi đi có 11
vn đng viên. Trong đó có 1 th môn, có quyn chi bóng bng tay và đc bo v trong vòng cm
đa. Trn đu đc điu khin bi 3 trng tài trong đó có 1 trng tài chính, 2 tr lý trng tài…
Ni dung B: Vi k thut điêu luyn và kh nng đc trn đu cc tt, Messi đã góp công ln trong
k tích 3 chc vô đch La Liga liên tip ca Barca. Cng nh điu này mà anh đã 4 nm lin đc bu
chn là cu th hay nht th gii.
Tóm li: vì ni dung A cha t bóng đá trong khi ni dung B không có mc dù cng nói v ch đ
bóng đá, máy tìm kim d dàng xác đnh ni dung A liên quan hn, và t đó tr v cho ngi tìm kim
Rõ ràng là s không còn d dàng nu c 2 ni dung này cùng cha t “bóng đá”.



Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn

19
Ebook SEO VietMoz 2013
b. Tn sut xut hin * tn s nghch ca t trong vn bn
(Term Frequency*Inverse Document Frequency)
Tn s xut hin là s ln xut hin ca t khóa trong vn bn.
Tn s nghch là t l gia mc đ ph bin ca mt t trên trang web đó vi mc đ ph trung
bình trên mi trang web. V cn bn, nhng t đc s
 dng ph bin hn s có trng s thp hn.
Ví d khi bn tìm kim vi cm t “bóng đá Messi”
Ni dung A: Bóng đá là môn th thao vua, vi hàng t ngi hâm m trên toàn th gii. Các gii
bóng đá hàng đu th gii có th k đn nh Ngoi Hng Anh, Bundesliga c hay La Liga Tây Ban
Nha.
Ni dung B: Trên th trng chuyn nhng, hin Messi là cu th đc đnh giá cao nht và đc
rt nhiu câu lc b ln sn đón. Dù vy, đi bóng ch qun ca Messi, CLB Barca cha bao gi và
kh nng s không bao gi bán ngôi sao ln này ca h.
Vi phng pháp TF*IDF: vì t “Messi” ít ph bin hn “bóng đá” nên IDF ca “Messi” cao hn.
Vi cùng mt t l TF, thì rõ ràng ni dung B liên quan đn cm t truy vn hn ni dung A. Và do đó,
máy tìm kim s tr v ni dung B cho ngi dùng.
Máy tìm kim s dng IDF. Ví d, khi ngi dùng gi mt truy vn đn máy tìm kim, h thng
cn bit t nào là t ngi dùng quan tâm nht. Chng hn: truy vn ca ngi dùng là "làm th nào đ
sa máy i". Sau khi tách t, chúng ta s có 5 t đn nh sau: làm, th nào, đ, sa, máy i. Trong các
t này, "máy i" s có IDF cao nht. H thng s ly ra tt c các ni dung có cha t máy i và sau đó
s thc hin vic đánh giá và so sánh da trên các t còn li trong câu truy vn.
Kt qu s xác đnh t l gia mc đ ph bin ca mt t trên trang web đó vi mc đ ph trung
bình trên mi trang web. V cn bn, nhng t đc s dng ph bin hn s có trng s thp hn.
Nhng t có giá tr TF-IDF cao là nhng t xut hin nhiu trong vn bn này, và xut hin ít trong
các vn bn khác. Vi máy tìm kim đây là nhng t có giá tr cao hn. Vic này giúp lc ra nhng t
ph bin và gi li nhng t có giá tr cao (t khoá ca vn bn đó).
c. Nhng t liên quan (Co-occurrence)
Ví d, cm t tìm kim: “tôn ng không”

Ni dung A: Tôn Ng Không còn gi là T Thiên i Thánh hay T Thiên, là nhân vt chính trong
tiu thuyt Tây du ký, nhân vt gi tng có th đc xem là ni ting nht trong vn hc Trung Hoa.
Ni dung B: Theo truyn thuyt, Tôn Ng Không sinh ra t mt hòn đá và đã hc đc 72 phép
bin hóa (gp hai ln s phép ca Tr Bát Gii).
Vì cm t “tôn ng không” thng đc s dng vi “tây du ký” nên ni dung A liên quan đn
cm t cn tìm kim hn n
i dung B. Do vy, nó có th hng cao hn.
3. Caching
 s dng hiu qu ngun tài nguyên ca mình, các máy tìm kim s tin hàng copy ni dung
trang web ca bn v máy ch ca h đ dùng cho vic đánh giá th hng. Nhng bn copy ni dung
trang web này đc gi là bn cache. Vì ni dung trang web thng đc cp nht nên máy tìm kim



Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
20
Ebook SEO VietMoz 2013
thng phi quay tr li đ copy ni dung. Tn sut có th là t vài ting/1 ln đn vài ngày/1 ln hoc
thm chí lâu hn. iu này có ngha ni dung ca bn cache có th khác bit vi ni dung hin ti ca
trang web.
iu này s lý gii thc t vì sao: th hng ca website không thay đi mc dù bn đã tin hành ti
u nó. Thc t, máy tìm kim vn đánh giá website da trên bn cache c, ch đn khi nó download ni
dung mi – hay to bn cache mi thì th hng website ca bn mi thay đi. Ví d, khi bn b sung
thêm ni dung đ nhm đn nhng t khóa khác, bn không th ngay lp tc thy s ci thin v th
hng cho đn khi máy tìm kim ghé thm website ca bn ln ti, thy đc ni dung mi và lu nhng
ni dung này vào bn cache mi ca trang web.
4. Cách kim tra bn cache ca trang web
Nu bn dùng Google Chrome, bn có th dùng lnh sau:
cache:vnexpress.net
Khi tìm kim, bn s thy bn cache đã đc Google lu ca trang web này.

Bn cng có th kim tra phiên bn ch cha text hay ch, phiên bn Google nhìn thy. Vic này
s giúp bn bit thc t Google có th thy nhng gì trên trang web ca bn.
Bài tp:
Kim tra bn cache trên Google, và so sánh vi bn hin ti. tìm ra nhng đim khác bit nu có.




Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
21
Ebook SEO VietMoz 2013
Bài 6: Thứ hạng (Ranking)
Trong bài hc này, chúng ta s đc hc v:
 iu gì xy ra khi bn thc hin tìm kim?
 Cá nhân hóa kt qu tìm kim nh hng gì đn th hng website?
 Cá nhân hóa nh hng gì đn nhng ngi làm SEO?
Phn cui cùng trong quá trình chính là phn chúng ta thng thy nht – Kt qu tìm kim. ây
cng là phn mà chúng ta quan tâm nhiu nht.
1. iu gì xy ra khi bn thc hin tìm kim?
ây là s đ mô t nhng s kin s din ra khi bn thc hin tìm kim trên Google:

V c bn, sau khi nhn đc truy vn tìm kim, máy ch s xác đnh ni dung chính ca truy vn
này. Và sau đó lc ra danh sách tt c nhng trang web có chung ch đ. Sau đó máy tìm kim đánh
giá da trên nhng trang web đó, và xp trang web phù hp nht vi cm t tìm kim  v trí đ
u tiên,
cng nh các v trí tip theo.
Qua thi gian, máy tìm kim dn tr nên thông minh hn. Chúng bt đu hc hi t hành vi ca
ngi dùng đ nâng cao cht lng tìm kim. Ví d, chúng có th đo lng khong thi gian k t khi
mt ngi di khi bng kt qu tìm kim đ ghé thm mt website đn khi h nhn nút Back đ quay
tr li chính bng kt qu đó. Khong thi gian này s ngn khi website có ni dung hoc hình thc




Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
22
Ebook SEO VietMoz 2013
không tt và không đáp ng đc mong mun ca ngi dùng. Nu vic này xy ra lp đi lp li,
website đó s b mt th hng.
2. Kt qu tìm kim đc cá nhân hóa
Nh các bn đã bit, các máy tìm kim thng thu thp d liu v hành vi ngi dùng đ xem
ngi dùng có hài lòng vi bng kt qu tìm kim không. iu này không ch giúp tng cht lng
bng kt qu mà còn sinh ra mt thc t rng: Dù tìm kim vi cùng mt t khóa, mi cá nhân s nhn
đc mt bng kt qu khác nhau. iu này là do mi ngi có mt lch s
 tìm kim cng nh hành vi
tìm kim khác nhau.
Google là ngi đi tiên phong trong vic cá nhân hóa kt qu tìm kim, đn mc mà nhiu ngi
đã phi e ngi vì s nhit tình trong vic thu thp d liu ngi dùng ca Google. H gii thiu v cá
nhân hóa kt qu tìm kim vào nm 2005 ( />personal.html) và chính thc áp dng nó trên toàn cu k t nm 2009
(
C th, Kt qu tìm kim khi bn tìm kim n danh s khác bit ít nhiu vi kt qu khi bn đã đng
nhp vào tài khon Google Account.
Nu bn đã đng nhp vào tài khon Google, Google s s dng lch s tìm kim ca tài khon đó
đ cá nhân hóa kt qu tìm kim. H s xem nhng website nào bn thng ghé thm và ri xp hng
nhng website đó  v trí cao hn. Bn có th xem lch s tìm kim ng vi tài khon Google ca bn
ti đây (
Nu bn không đng nhp vào tài khon Google, Google vn s cá nhân hóa kt qu tìm kim ca
bn da vào cookie (đnh ngha v cookie />terms-cookie). Lu ý là Google ch s dng d liu cookie ca 180 ngày gn nht.
Là mt ngi làm SEO, có vài điu bn cn lu ý v vic cá nhân hóa kt qu tìm kim:
 Phn mm kim tra th hng gi tr nên ít hu ích hn
 Vic mang đn tri nghim tt cho ngi dùng tr nên quan trng hn

 Khi kim tra th hng bng tay, bn nên s dng mt trình duyt sch cha có lch s tìm kim.
Nu không kt qu bn nhn đc s không chính xác.
Tích hp mng xã hi Google+ trong kt qu tìm kim
Vào tháng 1 nm 2012, Google tin mt bc dài trong vic cá nhân hóa kt qu tìm kim. Ln này
là vic tích hp mng xã hi Google+ (mng xã hi ca riêng h và đã vn lên tr thành mng xã h
i
ln th 2 th gii ch sau Facebook). Chúng ta có th d dàng nhìn thy nh hng ca mng xã hi
này lên bng kt qu tìm kim: Nhng trang web đc bn bè trong vòng kt ni G+ ca chúng ta “cng
1” s có th hng cao hn khi ta tìm kim.
Là mt ngi làm SEO, bn cn chú ý nhng đim nh sau:
 Thng xuyên theo dõi và đánh giá nh hng ca Google+ lên bng kt qu tìm kim, đc
bit trong lnh vc ca bn
 m bo các website ca bn hoc nhng website bn đang ti u cho khách hàng có cài đt
bn quyn tác gi



Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
23
Ebook SEO VietMoz 2013
 Tích hp các chc nng ca Google+ lên website ca bn đ khuyn khích ngi dùng s dng
Bài tp
 Bn m 2 trình duyt, mt trình duyt có đng nhp tài khon Google, mt trình duyt thì
không. Sau đó tìm kim trên Google vi cùng 1 t khóa và ch ra s khác nhau gia 2 bng kt
qu. Lý gii ti sao li có s khác bit đó?




Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn

24
Ebook SEO VietMoz 2013
Bài 7: Kiểm tra (10 phút)
1. Lit kê 5 loi file mà máy tìm kim không th dò quét và index chính xác:
Hình nh, video, flash, ajax, javascript
2. Lit kê 3 công vic ch yu ca máy tìm kim:
Dò quét, lu d liu và xp hng website
3. Miêu t 2 cách mà vic cá nhân hóa kt qu tìm kim nh hng đn công vic
ca các SEOs:
Tích hp mng xã hi Google+ vào bng kt qu tìm kim
Máy tìm kim da vào lch s tìm kim và hành vi ngi dùng (lu tr trong tài khon Google hoc
cookies) đ ti u hóa bng kt qu tìm kim
Do đó: Vic kim tra th hng t khóa tr nên ít chính xác hn và tri nghim ngi dùng tr nên
quan trng hn
4. Toán t tìm kim nào đc s dng đ xác đnh xp x s lng trang đc
index trong Google
Toán t site. Cu trúc câu lnh site:domain.com
Tài liu tham kho:









Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
25
Ebook SEO VietMoz 2013










CHƯƠNG
2

Thực hành sử dụng toán tử tìm kiếm

Bài 1 : Cn bn v toán t tìm kim
Bài 2 : Tìm kim title trang web
Bài 3 : Tìm kim trong đa ch trang web (URL)
Bài 4 : Gii hn tìm kim đn mt tên min cp 1 nào đó.
Bài 5 : Ly v bn cache gn đây nht ca trang web
Bài 6 : Tìm file pdf trên Internet
Bài 7 : Tìm bài vit theo tên tác gi
Bài 8 : S dng toán t ph đnh
Bài 9 : Kt hp toán t ph đnh và toán t nâng cao27
Bài 10 :Tìm kim vn bn neo


×