Tru
ng tâm Đào tạo SEO VietMoz –
VietMoz.edu.vn
2
Ebook SEO VietMoz 2013
About VietMoz
T
rung tâm đào to SEO VietMoz thuc Công Ty TNHH Truyn Thông VietMoz chính thc thành
lp vào ngày 31/05/2013, tuy nhiên nhng hot đng đào to và t vn ca chúng tôi thc s đã bt đu
t nm 2010.
Khi ngun t nhng bui offline cng đng và nhng lp hc SEO vi s lng hn ch do Mr.Lê
Nam (ngi sáng lp trung tâm SEO VietMoz đng thi là CEO ca VietMoz) trc tip đng lp và
ging dy. Sau rt nhiu khóa
hc tri dài trong nhiu nm qua, trung tâm đào to SEO VietMoz đã đào
to đc hàng trm SEOer và hin vn đang có rt nhiu hc viên tip tc theo hc.
Trong đào to, VietMoz c gng ti đa đ tho mãn yêu cu ca hc viên. Không ch cung cp kin
thc trong khoá hc, ging viên ca chúng tôi s chia s các kinh nghim làm vic, các thông tin b ích
v ngành Internet Marketing Vit Nam. Chúng tôi quan tâm ti sc hc ca tng
hc viên trong lp,
vi nhng bn hc yu hoc quá bn công vic, VietMoz luôn dành thi gian giúp đ thêm đ các bn
theo kp chng trình. c bit vi nhng hc viên xut sc, s đc mi li làm vic vi VietMoz
hoc đc VietMoz tin c ti các công ty cung cp dch v SEO và công ty làm các lnh vc khác.
VietMoz đã, đang và s luôn tìm mi các
h đ hc viên cm thy thoi mái và thun tin nht khi
đn lp hc, nhm đn mc đích cui cùng là giúp cho vic tip thu kin thc đc hiu qu hn. Phòng
hc ti trung tâm đào to SEO VietMoz đt tiêu chun quc t vi ni tht đc thit k đc bit s
mang li cm giác d chu và tri nghim đc bit
cho các hc viên.
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
3
Ebook SEO VietMoz 2013
Trung tâm ào to SEO VietMoz liên tip t chc các bui offline min phí cho cng đng, là ni
tho lun, t vn thc mc cho mi thành viên
có thêm thông tin v chúng tôi, xin mi các bn đng ngi ngn ti thm quan phòng hc ca
chúng tôi ti:
Trung tâm ào to SEO VietMoz
a ch: Hoa Cng Building – S 18/11 Thái Hà, ng a, Hà Ni
in thoi: (04) 6292 3344
Email:
Bn đ :
Tru
ng tâm Đào tạo SEO VietMoz –
VietMoz.edu.vn
4
Ebook SEO VietMoz 2013
CHỊU TRÁCH NHIỆM NỘI DUNG
Mr. Lee Nam
CEO VietMoz
BIÊN DỊCH
Mr. Tun
SEOer - VietMoz
NHÓM BIÊN SOẠN
Mr. Thành
Designer - VietMoz
Mr. Tùng
Coder - VietMoz
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
5
Ebook SEO VietMoz 2013
Mục lục
Chng 1: C bn v công c tìm kim 8
Bài 1: Tng quan v các máy tìm kim
9
Bài 2: Tìm kim vi công c tìm kim 12
Bài 3: Tìm kim nâng cao 14
Bài 4: Dò quét WEBSI TE 16
Bài 5: Indexing 18
Bài 6: Th hng (Ranking) 21
Bài 7: Kim tra (10 phút) 24
Chng 2:Thc hành s dng toán t tìm kim 25
Bài 1: Cn bn v toán t tìm kim
25
Bài 2: Tìm kim title trang web 26
Bài 3: Tìm kim trong đa ch trang web (URL) 26
Bài 4 : Gii hn tìm kim đn mt tên min cp 1 nào đó. 26
Bài 5: Ly v bn cache gn đây nht ca trang web 27
Bài 6: Tìm file pdf trên Internet 27
Bài 7 : Tìm bài vit theo tên tác gi 27
Bài 8: S dng toán t ph đnh 27
Bài 9: Kt hp toán t ph đnh và toán t nâng cao 27
Bài 10: Tìm kim vn bn neo 28
Chng 3: Ti u Onpage 29
Bài 1: Gii thiu
30
Bài 2: K thut ti u Onpage và chèn t khóa 30
Bài 3: Ti u hình nh 34
Bài 4: Nhng li thng gp khi ti u Onpage 36
Bài 5: Câu hi kim tra kin thc 39
Chng 4: Các yu t k thut trong SEO 40
Bài 1: Vì sao phi nghiên cu các yu t k thut trong SEO
41
Bài 2: Dò quét và lu d liu 41
Bài 3: Mã trng thái HTTP là gì? Chúng đc dùng khi nào? 49
Bài 4: ng dn URL – Cu trúc và cách ti u 53
Bài 5: Trùng lp ni dung và cách khc phc 55
Bài 6: Tc đ site – Tm quan trng và cách ti u 61
Bài 7: Sitemap và RSS Feeds – Tm quan trng và ti sao? 63
Bài 8: Nhng li thng gp . 69
Tru
ng tâm Đào tạo SEO VietMoz –
VietMoz.edu.vn
6
Ebook SEO VietMoz 2013
Bài 9: Nhng tool cn bit 72
Bài 10: Câu hi kim tra 74
Chng 5: Interactive robots.txt 75
Bài 1: Kin thc c bn 76
Bài 2: Chn c th mc 76
Bài 3: Cho phép mt đng dn c th nào đó 76
Bài 4: Chn mt loi b c th 77
Bài 5: Add multiple block 77
Bài 6: Khai báo User-agent c th 78
Bài 7: C bn v ký t đi din 78
Bài 8: Chn tham s 79
Bài 9: Chn đnh dng ca file 80
Bài 10: Ch ra v trí sitemap XML 80
Chng 6 : Nghiên cu t khóa 81
Bài 1: Th nào là nghiên cu t khóa
82
Bài 2: Giá tr ca vic nghiên cu t khóa 85
Bài 3: Các loi t khóa 87
Bài 4: Gii thiu công c nghiên cu t khóa ca Google 89
Bài 5: Bt tay xây dng danh sách t khóa đu tiên ca bn 94
Bài 6: Nhóm t khóa theo tng ch đ 96
Bài 7: M rng danh sách t khóa: 98
Bài 9: Tài liu tham kho và công c h tr 104
Bài 10: Câu hi kim tra 106
Chng 7: Information Architecture 107
Bài 1: Gii thiu v Information Architecture
108
Bài 2: Các loi điu hng tiêu biu 109
Bài 3: Nhng hn ch ca máy tìm kim 111
Bài 4: S dng sitemap đ tìm ra nhng li trong cu trúc website 114
Bài 5: Liên kt ni b 117
Bài 6: iu khin các máy tìm kim 123
Bài 7: Gii thiu v Faceted Navigation – iu hng nhiu chiu 128
Bài 8: Cu trúc các website quc t 133
Bài 9: Công c 133
Chng 8: Nghiên cu đi th cnh tranh 138
Bài 1: Gii thiu v nghiên cu đi th cnh tranh
139
Trun
g tâm Đào tạo SEO VietMoz –
VietMoz.edu.vn
7
Ebook SEO VietMoz 2013
Bài 2: Phân tích mc đ cnh tranh ca mt t khóa c th 140
Bài 3: Phân tích công ty và website đi th 144
Bài 4: Phân tích h thng link 150
Bài 5: Competitive Link Growth 154
Bài 6: Các công c và tài liu tham kho hu ích 156
Bài 7: Câu hi kim tra kin thc 157
Chng 9: Phân tích link 158
Bài 1: Gii thiu v phân tích link
159
Bài 2: uy tín và giá tr ca trang liên kt 160
Bài 3: Mc đ liên quan v ni dung gia trang đt liên kt và trang nhn đc liên kt 165
Bài 4: Vn bn neo 168
Bài 5: S lng và cht l
ng link
172
Bài 6: c đim ca link xu 175
Bài 7: Công c phân tích link 178
Bài 8: Hi đáp 183
Chng 10: Thc hành cài đt Google Analytics 184
Bài 1: Tùy chnh tham s UA
185
Bài 2: To pageview o 185
Bài 3: Theo dõi bin ngu nhiên 186
Li kt 187
Tru
ng tâm Đào tạo SEO VietMoz –
VietMoz.edu.vn
8
Ebook SEO VietMoz 2013
CHƯƠNG
1
Cơ bản về công cụ tìm kiếm
Bài 1 : Tng quan v các máy tìm kim
Bài 2 : Tìm kim vi công c tìm kim
Bài 3 : Tìm kim nâng cao
Bài 4 : Dò quét WEBSITE
Bài 5 : Indexing
Bài 6 : Th hng (Ranking)
Bài 7 : Kim tra (10 phút)
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
9
Ebook SEO VietMoz 2013
Bài 1: Tổng quan về các máy tìm kiếm
Trong bài này, chúng ta s tìm hiu v
World Wide Web là gì?
Lch s và vai trò ca công c tìm kim
S lc v dò quét, to ch mc và xây dng th hng
Nhng tin b gn đây ca các công c tìm kim
World Wide Web là gì?
V c bn, th gii web là tp hp các trang web và các file (thuc rt nhiu đnh dng khác nhau)
đc liên kt vi nhau bi h thng phc tp ca các liên kt hay links. H
Các file trên th gii web này có th thuc nhng đnh dng sau:
Hình nh
Videos
File pdf
Video Flash
File Javascript
Vi nhiu đnh dng file khác nhau, ni dung trang web tr nên hp dn hn, thay vì thun túy là
vn bn. Vic này gây khó khn cho máy tìm kim, đc bit vào thi đim nó mi ra đi. Mt phn vì
k thut dò quét cha thc s phát trin.
Cho đn ngày nay, máy tìm kim vn gp khó khn vi mt vài đnh dng file.
Là mt ngi làm SEO, bn cn bit nhng đnh dng file nào mà máy tìm kim gp khó khn đ
không đa nhng ni dung quan trng vào các file này.
Lch s và vai trò ca các máy tìm kim
Th gii web mi ra đi trong hn 20 nm.
Ngày đó, máy tìm kim vn cha ra đi – các website đc bit đn ch nh truyn ming, hoc
nh mt trang web danh b cha đa ch ca tt c các trang web khác (web hub). Khi th gii Internet
vn còn nh, vic này ko vn đ gì. Nhng khi th gii này m rng mnh m vào nhng nm tip theo,
mt gii pháp mi là điu bt buc.
Trong sut 1993/1994, nhng máy tìm kim đu tiên đã ra đi bao gm Excite, AltaVista và
Yahoo!. S lng các trang web và ngi dùng tng lên mnh m đn mc mà nhng trang web hub
tr nên quá ti và không còn hiu qu.
Nm 1996, Google ra đi. ây là máy tìm kim đu tiên nhn ra sc mnh và vai trò ca liên kt
và s dng chúng đ đánh giá đ uy tín ca trang web. ây chính là bc đt phá giúp tng cht lng
bng kt qu tìm kim.
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
10
Ebook SEO VietMoz 2013
3 công vic chính ca máy tìm kim: Dò quét, Xây dng c s d liu và Xp hng
V c bn:
Dò quét: Là quá trình máy tìm kim đi tìm nhng ni dung mi. H s dng nhng phn mm có
th t đng ghé thm các website và ln theo liên kt trên các trang web đ tìm ra nhng ni dung khác.
Xây dng c s d liu: Các máy tìm kim copy ni dung ca các trang web mà chúng đã ghé thm.
D liu này đc lu tr trên rt nhiu máy tính trong các trung tâm d liu (data center) khp ni
trên th gii. iu này giúp cho vic tìm kim tr nên nhanh chóng, d dàng hn giúp bn nhn đc
kt qu ch trong 1/2s hoc ít hn.
Xp hng: ây là công vic mà các SEO quan tâm nht. Khi mt ngi tìm kim online, các c
máy này cn mt thut toán đ đánh giá trang web nhm xác đnh trang web nào liên quan nht, và t
đó tính ra th hng ca trang web đó trên bng kt qu
Nhng tin b gn đây ca công c tìm kim
Bên cnh đó, kt qu tìm kim không phân bit theo khu vc. Bt k ai trong mt đt nc tìm
kim mt sn phm hay dch v đu nhn đc mt bng kt qu nh nhau.
Tuy nhiên, trong nhng nm gn đây, đã có mt s thay đi:
Mng xã hi: Các trang mng xã hi nh Facebook và Twitter giúp máy tìm kim bit chính xác
trang web nào đang đc quan tâm. Máy tìm kim đã nhanh chóng cp nht tín hiu này vào thut toán,
giúp bng kt qu tr nên chính xác hn, cp nht hn.
Cá nhân hóa kt qu tìm kim: Tng t, máy tìm kim thu thp lch s lt web ca ngi dùng.
Lch s đó bao gm: nhng cm t nào đc h tìm kim nhiu, nhng trang web nào h hay ghé thm
và li lâu. T đó, máy tìm kim có th bit mc đ yêu thích ca ngi dùng đi v
i các trang web.
Kt qu là vi cùng mt cm t, bng kt qu tìm kim ca ngi này s có khác bit vi bng kt qu
ca ngi khác.
Ví d trang web vnexpress.net và 24h.com.vn. Tôi thích trang web này, bn thích trang web khác.
Chúng ta ai cng có quan đim ca riêng mình.
Máy tìm kim đã tin hóa rt nhiu trong nhng nm gn đây và t đó thay đi cách thc tìm kim
ca mi ngi, đc bit là Google. C máy này đã tr nên thông minh hn rt nhiu nh c ch t hc
cng nh kh nng thu thp d liu vt tri giúp nó có th cung cp kt qu phù hp nht vi mong
mun ngi dùng. S vt tri này ca Google th hin qua 2 tính nng di đây:
Google Suggets: Ra đi t 8/2008. Khi bn bt đu gõ, Google s đ xut t khóa cho bn, giúp
bn không mt nhiu thi gian mà vn bit đc t khóa nào phù hp nht cho mình.
Google Instant: Ra đi 9/2010, Google Instant thay đi đáng k cách tìm kim bng cách ngay lp
tc cung cp kt qu da trên nhng ký t mà ngi dùng gõ vào. Bn s thu đc kt qu ngay khi gõ
mà không cn nhn Enter.
Là mt chuyên gia SEO, bn không ch cn bit nhng điu này, bn còn phi nhn thc nh hng
ca nó đn công vic. C
th, bn cn phi bit cách tìm kim s thay đi nh th nào, cm t tìm kim
s thay đi nh th khi nhng tính nng này ra đi.
Bài tp
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
11
Ebook SEO VietMoz 2013
S dng tính nng Google Instant ngay hôm nay và mô t hot đng ca nó.
Ví d
1. Tìm kim vi cm t “bún ch”.
2. M tab khác tìm vi cm t “bún ch hà ni”
So sánh 2 bng kt qu và đa ra kt lun
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
12
Ebook SEO VietMoz 2013
Bài 2: Tìm kiếm với công cụ tìm kiếm
Trong bài này chúng ta s hc v:
Gii thiu v bng kt qu tìm kim
Kt qu tìm kim hn hp và vai trò ca nó vi ngi làm SEO
Bng kt qu tìm kim
Hình thc truyn thng ca bng kt qu thng bao gm 10 liên kt hay 10 trang web. Ngoài ra
không còn thông tin nào khác.
Gi đây, khi tìm kim bn s nhn đc bng kt qu bao gm:
Tin tc.
Hình nh.
Bn đ và đa ch chi tit các doanh nghip, t chc trong vùng.
im đánh giá ca ngi dùng.
Thông tin sn phm.
Video.
Ví d, nu b
n tìm kim vi cm t “Vietmoz logo”, đn 99% trong bng kt qu s có hình nh
logo ca Vietmoz. Bng kt qu ca bn s có hình thù nh sau:
ây là lý do mà bng kt qu này có tên là bng kt qu hn hp.
2. Kt qu hn hp (blended results) có ý ngha gì vi các SEOer
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
13
Ebook SEO VietMoz 2013
Nu bn m mt nhà hàng Hà ni, bn nên lp tài khon Google Place và s có th xut hin
trong bng kt qu tìm kim nh nhà hàng Venus trên.
Nu đc tn dng tt, kt qu hn hp mang đn nhiu c hi hn na cho bn, giúp bn xut
hin trc mt khách hàng.
Bài tp:
Tìm kim trên Google
Tìm kim vi nhng cm t s mang li kt qu hn hp (blended results) bao gm c hình nh,
vn bn và video.
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
14
Ebook SEO VietMoz 2013
Bài 3: Tìm kiếm nâng cao
Trong bài này, bn s đc hc v:
Gii thiu các toán t tìm kim
u đim ca vic s dng toán t tìm kim
Cách s dng các toán t tìm kim
1. Toán t tìm kim là gì?
Toán t tìm kim là nhng t khóa bn s dng trong khi tìm kim, giúp thu hp phm vi tìm kim
đn chính xác nhng gì bn cn.
2. Nhng ví d v toán t tìm kim:
Di đây là nhng toán t tìm kim hay đc dùng trong gii SEO:
a. Tìm ra nhng trang đã đc index ca mt website cho trc
Câu lnh tìm kim: site:vietmoz.com
Toán t “site” yêu cu máy tìm kim ch ly ra nhng trang thuc tên min đã cho, trong trng
hp này là vietmoz.com
b. Tìm nhng trang web mà tên min cha cm t cho trc
Câu lnh tìm kim: Inurl:forum qun áo
Toán t “inurl” yêu cu máy tìm kim ch tr v nhng trang mà đa ch URL ca nó có cha t
hoc cm t đã cho, trong trng hp này là t forum.
Kt qu tr v là tt c nhng din đàn có cha t qun áo trong ni dung. Nhng din đàn này s
rt hu ích khi bn xây dng liên kt đ SEO cho mt website cng nói v ch đ qun áo.
Bên cnh vic s dng riêng l tng toán t, bn cng có th kt hp chúng vi nhau:
Nhiu toán t có th kt hp vi nhau, ví d vi 2 toán t “site” và “inurl” trên. Nh bn s thy
đây vi:
site:vnexpress.net inurl:the thao
Câu lnh này s tr v tt c nhng trang trong website vnexpress.net mà trong đng dn URL có
cha t “the thao”
Ngoài ra, còn rt nhiu toán t khác đang ch bn khám phá. Nu hng thú, hãy truy cp vào đng
link:
3. Toán t ca các máy tìm kim khác
Trên đây là nhng toán t đc dùng chung cho các máy tìm kim. Ngoài ra, mi máy tìm kim
cng có nhng toán t riêng.
Các toán t dành cho Bing (máy tìm kim ca Microsoft)
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
15
Ebook SEO VietMoz 2013
Có 2 toán t bn có th s dng vi Bing mà rt hu ích vi công vic SEO:
1. Toán t linkfromdomain:
Toán t này s ly ra tt c nhng website đi tác, nhng ngi nhn đc link tr t domain ca
bn:
linkfromdomain:vietmoz.com
Kt qu tr v cho bn là tt c nhng trang web đc website vietmoz.com đt link tr ti.
Bit điu này s rt hu ích trong quá trình xây dng link: Ví du: Nu bn
đang mun ly link t
mt website, bn có th xem h đã đt link ti nhng đâu và vì sao h li làm vy.
4. Nhng tác dng mà toán t tìm kim mang li:
Vi mt ngi làm SEO, toán t tìm kim rút ngn thi gian làm vic ca bn. Nó giúp bn tìm ra
nhng website, blog, forum mà bn có th đt link, giúp bn tìm kim theo nhng đnh dng file c th
nh pdf, word, power point…
Bài tp:
Kim tra xem trên website ca bn, hoc website mà bn hay ghé thm có bao nhiêu trang đc
index
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
16
Ebook SEO VietMoz 2013
Bài 4: Dò quét WEBSITE
Trong bài này, chúng ta s đc hc v dò quét website, mt trong 3 công vic hàng ngày ca máy tìm
kim.
1. Cách b tìm kim dò quét website
Máy tìm kim thc hin dò quét website nhm mc đích tìm ra ni dung mi.
Máy tìm kim làm đc vic này nh s dng nhng phn mm hin đi có th thu thp thông tin
trên Internet. Nhng chng trình này thng đc gi là b tìm kim (Spider). Vi quy mô ngày càng
m rng ca mng Internet, công vic này ngày càng tiêu tn nhiu tài nguyên. Do đó, máy tìm kim
s dng các thut toán đ quyt đnh xem trang web nào s đc dò quét, bao lâu s dò quét, và đ sâu
dò quét. iu này cho phép h tn dng tài nguyên ca mình mt cách hiu qu nht có th. Bài hc
quan trng mà các SEOer cn phi nh là các máy tìm kim se không t đng dò quét trang web ca
bn tr phi chúng có lý do đ làm điu đó.
Mt khi b tìm kim ghé thm trang web ca bn, đu tiên chúng s tìm đn file robots.txt, đây
cng chính là bng ni quy ca trang web và s ch ra nhng trang nào (nu có) mà chúng không đc
dò quét. Bn có th
tìm hiu nhiu hn v bng ni quy đc bit này nhng bài hc sau.
Gi s rng con b không b chn theo cách này, nó s bt đu dò quét tt c các trang web trên
website ca bn. Dc đng đi, nó s lu li tt c các đa ch tên min vào trong mt danh sách đ s
dng cho nhng ln dò quét sau.
Gia dò quét và index (lu d liu) có s khác bit l
n. Dò quét là tìm ra các đa ch trang web,
trong khi index là thu thp thông tin hay ni dung trong các trang web đó.
2. Nhng vn đ mà b tìm kim thng gp phi
B tìm kim là các chng trình máy tính thông minh, tuy nhiên, chúng vn ch là máy móc và do
đó có nhng hn ch nht đnh
Nhng công ngh Web có th gây khó khn cho b tìm kim:
Website ngày nay s dng nhiu công ngh khác nhau đ nâng cao cht lng đng thi mang li
tri nghim tt hn cho ngi dùng. Tuy nhiên mt s công ngh li gây khó khn cho b tìm kim. C
th là:
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
17
Ebook SEO VietMoz 2013
Javascript
AJAX
Flash
Nhng là mt ngi làm SEO, bn cn bit rng s dng các công ngh này trong trang web có th
làm khó cho b tìm kim khi chúng dò quét ni dung ca bn.
Nhng loi ni dung có th gây khó cho hot đng ca b tìm kim:
Có nhng loi ni dung mà b tìm kim không thích, vì chúng không th đc đc d dàng nh
con ngi, c th là video và hình nh. Trong khi chúng có th phát hin và nhn ra s tn ti ca video
hoc hình nh trên mt trang web, chúng vn cha đ kh nng đ hiu đy đ ni dung này. Mt ln
na, b tìm kim đang ngày càng tr nên thông minh hn nhng còn xa chúng mi đt ti trình đ có
th hiu đy đ các loi ni dung nh con ngi.
Ví d: Máy tìm kim s không th đc đc ch trên mt bc nh. iu tng t cng xy ra vi
video.
Vì vy cn đm bo trang web ca bn không ch cha hình nh hoc video. Bên cnh hình nh,
video cn có nhng đon ni dung mô t. Và nhng ni dung quan trng nht đnh phi đc đ trong
nhng đnh dng mà máy tìm kim có th d dàng hiu đc. C th là vn bn
3. Các loi b tìm kim
Mi máy tìm kim có con b riêng vi cái tên riêng. Ví d ca Google là googlebot. Ca Bing là
bingbot. Baidu là Baiduspider.
4. Tài liu tham kho
Vlog C ch tìm kim ca Google Spider ( />cua-cong-cu-tim-kiem/ ).
Tìm hiu c ch tìm kim ca Google Spider ( />co-che-tim-kiem-cua-Google-Spider-46/).
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
18
Ebook SEO VietMoz 2013
Bài 5: Indexing
Trong bài này chúng ta s hc v:
Web index là gì?
Thu thp thông tin
Caching là gì và làm th nào đ kim tra bn cache ca mt trang web?
Mt khi máy tìm kim đã dò quét trang web, chúng cn lu tt c nhng ni dung này vào c s d
liu ca mình. Tt c nhng thông tin này đc t chc li và đt trong tình trng sn sàng cung cp
cho ngi dùng khi h tìm kim.
1. C s d liu web (Web index) là gì?
V c bn, web index là c s d liu lu tr các trang web. Các máy tìm kim s dng hàng ngìn
máy ch đt khp ni trên th gii đ lu tr nhiu t trang web trong CSDL ca mình. Vic này đm
bo ngi tìm kim nhn đc kt qu gn nh ngay lp tc sau khi h nhn nút Enter.
2. Ly thông tin
Khi mt ngi dùng tìm kim vi mt t khóa, thc t h không tìm kim trên th gii web. H
đang tìm kim trên c s d liu ca các máy tìm kim. Các máy tìm kim s vào c s d liu ca
mình và ly ra các trang web cùng ch đ. C th đó là nhng trang web có cha t tìm kim hoc cha
nhng t liên quan. T đây rút ra đc, đ tng đ liên quan ca trang web đn t khóa bn mun
hng ti, bn cn bit chèn t khóa mt cách hp lý nhng v trí quan trng. Bên cnh đó, cng
không đc quên nhng t liên quan.
Làm th nào máy tìm kim bit đc ni dung trang web có liên quan đn t khóa đang đc tìm
kim
a. S dng t khóa:
Máy tìm kim tìm xem trong ni dung ca trang web có cha t khóa đang đc tìm kim hay
không?
Nu ngi lên Google tìm kim v
i t bóng đá:
Ni dung A: Bóng đá là môn th thao tp th, gm 2 đi thi đu đi kháng vi nhau. Mi đi có 11
vn đng viên. Trong đó có 1 th môn, có quyn chi bóng bng tay và đc bo v trong vòng cm
đa. Trn đu đc điu khin bi 3 trng tài trong đó có 1 trng tài chính, 2 tr lý trng tài…
Ni dung B: Vi k thut điêu luyn và kh nng đc trn đu cc tt, Messi đã góp công ln trong
k tích 3 chc vô đch La Liga liên tip ca Barca. Cng nh điu này mà anh đã 4 nm lin đc bu
chn là cu th hay nht th gii.
Tóm li: vì ni dung A cha t bóng đá trong khi ni dung B không có mc dù cng nói v ch đ
bóng đá, máy tìm kim d dàng xác đnh ni dung A liên quan hn, và t đó tr v cho ngi tìm kim
Rõ ràng là s không còn d dàng nu c 2 ni dung này cùng cha t “bóng đá”.
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
19
Ebook SEO VietMoz 2013
b. Tn sut xut hin * tn s nghch ca t trong vn bn
(Term Frequency*Inverse Document Frequency)
Tn s xut hin là s ln xut hin ca t khóa trong vn bn.
Tn s nghch là t l gia mc đ ph bin ca mt t trên trang web đó vi mc đ ph trung
bình trên mi trang web. V cn bn, nhng t đc s
dng ph bin hn s có trng s thp hn.
Ví d khi bn tìm kim vi cm t “bóng đá Messi”
Ni dung A: Bóng đá là môn th thao vua, vi hàng t ngi hâm m trên toàn th gii. Các gii
bóng đá hàng đu th gii có th k đn nh Ngoi Hng Anh, Bundesliga c hay La Liga Tây Ban
Nha.
Ni dung B: Trên th trng chuyn nhng, hin Messi là cu th đc đnh giá cao nht và đc
rt nhiu câu lc b ln sn đón. Dù vy, đi bóng ch qun ca Messi, CLB Barca cha bao gi và
kh nng s không bao gi bán ngôi sao ln này ca h.
Vi phng pháp TF*IDF: vì t “Messi” ít ph bin hn “bóng đá” nên IDF ca “Messi” cao hn.
Vi cùng mt t l TF, thì rõ ràng ni dung B liên quan đn cm t truy vn hn ni dung A. Và do đó,
máy tìm kim s tr v ni dung B cho ngi dùng.
Máy tìm kim s dng IDF. Ví d, khi ngi dùng gi mt truy vn đn máy tìm kim, h thng
cn bit t nào là t ngi dùng quan tâm nht. Chng hn: truy vn ca ngi dùng là "làm th nào đ
sa máy i". Sau khi tách t, chúng ta s có 5 t đn nh sau: làm, th nào, đ, sa, máy i. Trong các
t này, "máy i" s có IDF cao nht. H thng s ly ra tt c các ni dung có cha t máy i và sau đó
s thc hin vic đánh giá và so sánh da trên các t còn li trong câu truy vn.
Kt qu s xác đnh t l gia mc đ ph bin ca mt t trên trang web đó vi mc đ ph trung
bình trên mi trang web. V cn bn, nhng t đc s dng ph bin hn s có trng s thp hn.
Nhng t có giá tr TF-IDF cao là nhng t xut hin nhiu trong vn bn này, và xut hin ít trong
các vn bn khác. Vi máy tìm kim đây là nhng t có giá tr cao hn. Vic này giúp lc ra nhng t
ph bin và gi li nhng t có giá tr cao (t khoá ca vn bn đó).
c. Nhng t liên quan (Co-occurrence)
Ví d, cm t tìm kim: “tôn ng không”
Ni dung A: Tôn Ng Không còn gi là T Thiên i Thánh hay T Thiên, là nhân vt chính trong
tiu thuyt Tây du ký, nhân vt gi tng có th đc xem là ni ting nht trong vn hc Trung Hoa.
Ni dung B: Theo truyn thuyt, Tôn Ng Không sinh ra t mt hòn đá và đã hc đc 72 phép
bin hóa (gp hai ln s phép ca Tr Bát Gii).
Vì cm t “tôn ng không” thng đc s dng vi “tây du ký” nên ni dung A liên quan đn
cm t cn tìm kim hn n
i dung B. Do vy, nó có th hng cao hn.
3. Caching
s dng hiu qu ngun tài nguyên ca mình, các máy tìm kim s tin hàng copy ni dung
trang web ca bn v máy ch ca h đ dùng cho vic đánh giá th hng. Nhng bn copy ni dung
trang web này đc gi là bn cache. Vì ni dung trang web thng đc cp nht nên máy tìm kim
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
20
Ebook SEO VietMoz 2013
thng phi quay tr li đ copy ni dung. Tn sut có th là t vài ting/1 ln đn vài ngày/1 ln hoc
thm chí lâu hn. iu này có ngha ni dung ca bn cache có th khác bit vi ni dung hin ti ca
trang web.
iu này s lý gii thc t vì sao: th hng ca website không thay đi mc dù bn đã tin hành ti
u nó. Thc t, máy tìm kim vn đánh giá website da trên bn cache c, ch đn khi nó download ni
dung mi – hay to bn cache mi thì th hng website ca bn mi thay đi. Ví d, khi bn b sung
thêm ni dung đ nhm đn nhng t khóa khác, bn không th ngay lp tc thy s ci thin v th
hng cho đn khi máy tìm kim ghé thm website ca bn ln ti, thy đc ni dung mi và lu nhng
ni dung này vào bn cache mi ca trang web.
4. Cách kim tra bn cache ca trang web
Nu bn dùng Google Chrome, bn có th dùng lnh sau:
cache:vnexpress.net
Khi tìm kim, bn s thy bn cache đã đc Google lu ca trang web này.
Bn cng có th kim tra phiên bn ch cha text hay ch, phiên bn Google nhìn thy. Vic này
s giúp bn bit thc t Google có th thy nhng gì trên trang web ca bn.
Bài tp:
Kim tra bn cache trên Google, và so sánh vi bn hin ti. tìm ra nhng đim khác bit nu có.
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
21
Ebook SEO VietMoz 2013
Bài 6: Thứ hạng (Ranking)
Trong bài hc này, chúng ta s đc hc v:
iu gì xy ra khi bn thc hin tìm kim?
Cá nhân hóa kt qu tìm kim nh hng gì đn th hng website?
Cá nhân hóa nh hng gì đn nhng ngi làm SEO?
Phn cui cùng trong quá trình chính là phn chúng ta thng thy nht – Kt qu tìm kim. ây
cng là phn mà chúng ta quan tâm nhiu nht.
1. iu gì xy ra khi bn thc hin tìm kim?
ây là s đ mô t nhng s kin s din ra khi bn thc hin tìm kim trên Google:
V c bn, sau khi nhn đc truy vn tìm kim, máy ch s xác đnh ni dung chính ca truy vn
này. Và sau đó lc ra danh sách tt c nhng trang web có chung ch đ. Sau đó máy tìm kim đánh
giá da trên nhng trang web đó, và xp trang web phù hp nht vi cm t tìm kim v trí đ
u tiên,
cng nh các v trí tip theo.
Qua thi gian, máy tìm kim dn tr nên thông minh hn. Chúng bt đu hc hi t hành vi ca
ngi dùng đ nâng cao cht lng tìm kim. Ví d, chúng có th đo lng khong thi gian k t khi
mt ngi di khi bng kt qu tìm kim đ ghé thm mt website đn khi h nhn nút Back đ quay
tr li chính bng kt qu đó. Khong thi gian này s ngn khi website có ni dung hoc hình thc
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
22
Ebook SEO VietMoz 2013
không tt và không đáp ng đc mong mun ca ngi dùng. Nu vic này xy ra lp đi lp li,
website đó s b mt th hng.
2. Kt qu tìm kim đc cá nhân hóa
Nh các bn đã bit, các máy tìm kim thng thu thp d liu v hành vi ngi dùng đ xem
ngi dùng có hài lòng vi bng kt qu tìm kim không. iu này không ch giúp tng cht lng
bng kt qu mà còn sinh ra mt thc t rng: Dù tìm kim vi cùng mt t khóa, mi cá nhân s nhn
đc mt bng kt qu khác nhau. iu này là do mi ngi có mt lch s
tìm kim cng nh hành vi
tìm kim khác nhau.
Google là ngi đi tiên phong trong vic cá nhân hóa kt qu tìm kim, đn mc mà nhiu ngi
đã phi e ngi vì s nhit tình trong vic thu thp d liu ngi dùng ca Google. H gii thiu v cá
nhân hóa kt qu tìm kim vào nm 2005 ( />personal.html) và chính thc áp dng nó trên toàn cu k t nm 2009
(
C th, Kt qu tìm kim khi bn tìm kim n danh s khác bit ít nhiu vi kt qu khi bn đã đng
nhp vào tài khon Google Account.
Nu bn đã đng nhp vào tài khon Google, Google s s dng lch s tìm kim ca tài khon đó
đ cá nhân hóa kt qu tìm kim. H s xem nhng website nào bn thng ghé thm và ri xp hng
nhng website đó v trí cao hn. Bn có th xem lch s tìm kim ng vi tài khon Google ca bn
ti đây (
Nu bn không đng nhp vào tài khon Google, Google vn s cá nhân hóa kt qu tìm kim ca
bn da vào cookie (đnh ngha v cookie />terms-cookie). Lu ý là Google ch s dng d liu cookie ca 180 ngày gn nht.
Là mt ngi làm SEO, có vài điu bn cn lu ý v vic cá nhân hóa kt qu tìm kim:
Phn mm kim tra th hng gi tr nên ít hu ích hn
Vic mang đn tri nghim tt cho ngi dùng tr nên quan trng hn
Khi kim tra th hng bng tay, bn nên s dng mt trình duyt sch cha có lch s tìm kim.
Nu không kt qu bn nhn đc s không chính xác.
Tích hp mng xã hi Google+ trong kt qu tìm kim
Vào tháng 1 nm 2012, Google tin mt bc dài trong vic cá nhân hóa kt qu tìm kim. Ln này
là vic tích hp mng xã hi Google+ (mng xã hi ca riêng h và đã vn lên tr thành mng xã h
i
ln th 2 th gii ch sau Facebook). Chúng ta có th d dàng nhìn thy nh hng ca mng xã hi
này lên bng kt qu tìm kim: Nhng trang web đc bn bè trong vòng kt ni G+ ca chúng ta “cng
1” s có th hng cao hn khi ta tìm kim.
Là mt ngi làm SEO, bn cn chú ý nhng đim nh sau:
Thng xuyên theo dõi và đánh giá nh hng ca Google+ lên bng kt qu tìm kim, đc
bit trong lnh vc ca bn
m bo các website ca bn hoc nhng website bn đang ti u cho khách hàng có cài đt
bn quyn tác gi
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
23
Ebook SEO VietMoz 2013
Tích hp các chc nng ca Google+ lên website ca bn đ khuyn khích ngi dùng s dng
Bài tp
Bn m 2 trình duyt, mt trình duyt có đng nhp tài khon Google, mt trình duyt thì
không. Sau đó tìm kim trên Google vi cùng 1 t khóa và ch ra s khác nhau gia 2 bng kt
qu. Lý gii ti sao li có s khác bit đó?
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
24
Ebook SEO VietMoz 2013
Bài 7: Kiểm tra (10 phút)
1. Lit kê 5 loi file mà máy tìm kim không th dò quét và index chính xác:
Hình nh, video, flash, ajax, javascript
2. Lit kê 3 công vic ch yu ca máy tìm kim:
Dò quét, lu d liu và xp hng website
3. Miêu t 2 cách mà vic cá nhân hóa kt qu tìm kim nh hng đn công vic
ca các SEOs:
Tích hp mng xã hi Google+ vào bng kt qu tìm kim
Máy tìm kim da vào lch s tìm kim và hành vi ngi dùng (lu tr trong tài khon Google hoc
cookies) đ ti u hóa bng kt qu tìm kim
Do đó: Vic kim tra th hng t khóa tr nên ít chính xác hn và tri nghim ngi dùng tr nên
quan trng hn
4. Toán t tìm kim nào đc s dng đ xác đnh xp x s lng trang đc
index trong Google
Toán t site. Cu trúc câu lnh site:domain.com
Tài liu tham kho:
Trung tâm Đào tạo SEO VietMoz – VietMoz.edu.vn
25
Ebook SEO VietMoz 2013
CHƯƠNG
2
Thực hành sử dụng toán tử tìm kiếm
Bài 1 : Cn bn v toán t tìm kim
Bài 2 : Tìm kim title trang web
Bài 3 : Tìm kim trong đa ch trang web (URL)
Bài 4 : Gii hn tìm kim đn mt tên min cp 1 nào đó.
Bài 5 : Ly v bn cache gn đây nht ca trang web
Bài 6 : Tìm file pdf trên Internet
Bài 7 : Tìm bài vit theo tên tác gi
Bài 8 : S dng toán t ph đnh
Bài 9 : Kt hp toán t ph đnh và toán t nâng cao27
Bài 10 :Tìm kim vn bn neo