Tải bản đầy đủ (.doc) (60 trang)

tìm hiểu và xây dựng chương trình tối ưu hóa kết quả tìm kiếm_

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (482.34 KB, 60 trang )

LỜI CẢM ƠN
Lời đầu tiên em xin cảm ơn Khoa Công Nghệ Thông Tin, trường Đại học
Công Nghệ Thông Tin và Truyền Thông đã tạo điều kiện tốt cho chúng em thực
hiện đồ án tốt nghiệp.
Em xin chân thành cảm ơn cô giáo Ths. NGÔ THỊ LAN PHƯƠNG giảng
viên khoa công nghệ thông tin trường Đại Học Công Nghệ Thông Tin và Truyền
Thông đã tận tụy hướng dẫn giúp đỡ em trong suốt quá trình nghiên cứu và hoàn
thành đồ án tốt nghiệp.
Cuối cùng em xin chân thành cảm ơn các thầy cô trong khoa, cũng như
các thầy cô trong trường đã giảng dạy, giúp đỡ em trong 5 năm học qua. Chính
các thầy cô đã xây dựng cho chúng em những kiến thức nền tảng và những kiến
thức chuyên môn để em có thể hoàn thành luận văn này cũng như những công
việc của mình sau này.

Thái Nguyên, tháng 06 năm 2012
Sinh viên
Phùng Duy Linh
1
LỜI CAM ĐOAN
Em xin cam đoan toàn bộ nội dung của báo cáo này là do em tự tìm hiểu
nghiên cứu dưới sự định hướng của cô giáo hướng dẫn. Nội dung báo cáo này
không sao chép và vi phạm bản quyền từ bất kỳ công trình nghiên cứu nào.
Nếu những lời cam đoan trên không đúng, em xin chịu hoàn toàn trách
nhiệm trước pháp luật.
Thái Nguyên, tháng 6 năm 2012
Sinh viên
Phùng Duy Linh
2
MỤC LỤC
LỜI CẢM ƠN 1
LỜI CAM ĐOAN 2


MỤC LỤC 3
LỜI MỞ ĐẦU 3
CHƯƠNG 1 5
TÌM HIỂU CÔNG CỤ TÌM KIẾM SEARCH ENGINE 5
CHƯƠNG III 49
LỜI MỞ ĐẦU
Như chúng ta đã biết trung bình trên 86% lượng truy cập của một
website đều đến từ các search engine lớn như Google, Yahoo, MSN. Mỗi ngày
có hàng triệu người dùng lướt web sử dụng Search Engine để tìm những sản
phẩm, dịch vụ và thông tin họ đang cần. Nhưng liệu với hàng tỉ website hiện
đang tồn tại, làm sao khách hàng có thể tìm thấy website của bạn trước mà không
phải của các đối thủ cạnh tranh? Search Engine Optimization (SEO) chính là giải
pháp cho vấn đề trên. Mục đích của SEO là nhằm cải thiện lượng truy cập về cả
chất lẫn lượng cho Website, trực tiếp đến từ trang kết quả của các máy tìm kiếm
như Google, Yahoo, bing với một số từ khóa nhất định. Được sự phân công của
bộ môn cùng với sự hướng dẫn của cô Ngô Thị Lan Phương em đã làm báo cáo
3
đồ án về đề tài “Tìm hiểu và xây dựng chương trình tối ưu hóa kết quả tìm
kiếm”. Qua đây em xin gửi lời cảm ơn sâu sắc tới các thầy cô trong bộ môn
HTTT đặc biệt là cô Ngô Thị Lan Phương đã quan tâm, giúp đỡ chỉ bảo tận tình
trong suốt thời gian thực tập để em hoàn thành bài báo cáo này.
Do thời gian và kinh nghiệm còn hạn chế nên bài báo cáo sẽ không tránh
khỏi những sai sót. Em rất mong nhận được sự góp ý từ các thầy cô và các bạn để
bài báo cáo được hoàn chỉnh hơn. Em xin chân thành cảm ơn !
Thái Nguyên, tháng 06 năm 2012
Sinh viên
Phùng Duy Linh
4
CHƯƠNG 1
TÌM HIỂU CÔNG CỤ TÌM KIẾM SEARCH ENGINE

1. Khái niệm Search Engine
Search Engine hay còn được gọi với nghĩa rộng hơn là công cụ tìm
kiếm (search tool), nguyên thủy là một phần mềm nhằm tìm ra các trang trên
mạng Internet có nội dung theo yêu cầu người dùng dựa vào các thông tin mà
chúng có. Trữ lượng thông tin của công cụ tìm kiếm thực chất là một loại cơ sở
dữ liệu (database) cực lớn. Việc tìm các tài liệu sẽ dựa trên các từ khóa
(keyword) được người dùng gõ vào và trả về một danh mục của các trang Web
có chứa từ khóa mà nó tìm được.
2. Phân loại Search Engine
Ngày nay, thì các máy truy tìm đã phát triển rất xa so với dạng nguyên
thuỷ. Có hai cách chính phân loại máy tìm kiếm:
2.1. Theo phương thức hoạt động
a. Kiểu máy nhện (spider):
Cơ sở dữ liệu của các máy tìm kiếm được cập nhật hoá bởi các phần mềm
đặc biệt thường gọi là "robot", "spider" hay "Webcrawler". Các phần mềm này sẽ
tự động dò tìm và phân tích từ những trang có sẵn trong cơ sở dữ liệu để kiếm ra
các liên kết (link) từ các trang và trở lại bổ sung dữ liệu cho chính nó sau khi
phân tích. Phần mềm này cũng sẽ báo cáo về các liên kết đã bị đào thải. Từ khoá
được bỏ vào là để cho máy tìm kiếm lục kiếm trong bảng chỉ số của nó. Kết quả
tốt nhất sau khi phân hạng sẽ được xếp ở thứ tự đầu tiên. Trang thông dụng nhất
dùng nguyên tắc này là .
b. Kiểu máy tìm kiếm ảo (meta-search engine):
Ngày nay, người ta có thể lợi dụng các máy tìm kiếm sẵn có để thiết kế
thành một loại máy tìm kiếm mới gọi là máy truy tìm ảo. Nguyên tắc của loại
máy tìm kiếm này khá đơn giản.
Nó không có cơ sở dữ liệu. Khi hoạt động thì nó sẽ gửi từ khoá đến các
máy tìm kiếm khác một cách đồng loạt và nhận về tất cả các kết quả tìm được.
Nhiệm vụ tiếp theo chỉ là phân tích và phân hạng lại các tài liệu tìm được cho
5
thân chủ. Ưu điểm của loại máy tìm kiếm này là lợi dụng cơ sở dữ liệu của các

máy tìm kiếm khác để tìm ra nhiều kết quả hơn và nhanh hơn. Nhưng vì loại này
chỉ tồn tại nếu có các máy tìm kiếm nguyên thuỷ nên gọi là meta- (tiền tố meta
có nghĩa là "siêu hình" hay "ảo"). Điển hình loại này là MetaCrawler.
c. Kiểu thư mục đối tượng (subject directory):
Còn gọi là máy tìm kiếm theo phân lớp (hierarchical search engine) - máy
tìm kiếm này phân lớp sẵn các đối tượng vào các thư mục và người dùng sẽ lựa
theo kiểu rẽ nhánh từ từ cho đến khi tìm ra các trang Web mà mình muốn. Kiểu
này dễ cho người truy cập nhưng có điểm yếu là nó không thể bao gồm hết mọi
chủ đề mà họ muốn kiếm tra. Hơn nữa, sự phân loại đôi khi không được đầy đủ
và chính xác. Điển hình của loại này là .
d. Kiểu cơ sở dữ liệu đặc biệt hay còn gọi là bất khả kiến Web
(invisible Web):
Đặc điểm của loại này là dữ liệu kiếm ra không thực sự có từ địa chỉ trang
Web cụ thể qua các máy tìm kiếm; dữ liệu này tồn tại trong các cơ sở dữ liệu của
một máy tính hay mạng ở đâu đó trên Internet mà các trang Web được phép sử
dụng. Đặc biệt, các trang Web nghiên cứu của các đại học hay học viện như
, và thuộc kiểu
này. Sau này nhiều máy tìm kiếm hỗ trợ người dùng qua nhiều cách thức khác
nhau nên người ta ít thấy ranh giới phân chia giữa các máy tìm kiếm mà thay vào
đó là các hệ thống máy tìm kiếm bao gồm nhiều chức năng khác nhau. Chẳng
hạn như không còn đơn thuần là một máy tìm kiếm theo
kiểu thư mục đối tượng mà bên cạnh đó nó cũng cung cấp luôn cả kiểu máy nhện
cho người dùng.
2.2. Theo chức năng
Theo cách phân loại này thì tùy theo đối tượng tìm kiếm mà có:
* Kiếm địa chỉ trang Web
* Kiếm địa chỉ thư điện tử
* Kiếm thông tin riêng về một người
* Kiếm thông tin về một tổ chức
6

* Kiếm việc làm
* Kiếm bản đồ
3. Phép toán và hỗ trợ của máy tìm kiếm
Để mở rộng các chức năng tìm kiếm, cũng như tạo thêm nhiều tiện dụng
cho người dùng, các máy truy tìm cũng đã hỗ trợ thêm nhiều phép toán lên từ
khóa. Mỗi máy có thể sẽ hỗ trợ những phép toán khác nhau.
Một số phép toán được hỗ trợ bởi hầu hết các máy tìm kiếm:
a. Dùng phép "+"
Để tìm các trang có mặt tất cả các chữ của từ khóa mà không theo thứ tự
nào hết thì viết nối các chữ này với nhau bằng dấu +. Thí dụ: Tìm trang nói về
cách thức viết Linux scripts có thể dùng bộ từ khóa "+ Linux +script +tutor".
b. Dùng phép "-"
Trong số các trang Web tìm được do quy định của từ khóa thì máy tìm
kiếm sẽ loại bỏ các trang mà nội dung của chúng có chứa chữ (hay cụm từ) trong
ngoặc kép đứng ngay sau dấu trừ. Thí dụ: Khi tìm tin tức về các loại xe dùng kỹ
thuật lai mới chưa có bán trên thị trường nhưng không muốn các trang bán xe
hay các trang nói về hai kiểu xe Prius (của Toyota) và kiểu xe Insight (của
Honda) lọt vào danh cách truy tìm thì có thể thử từ khóa "+car +hibrid -sale
-Prius -Insight".
c. Dùng dấu ngoặc kép " "
Khi muốn chỉ thị máy tìm kiếm nguyên văn của cụm từ, có thể dùng dấu
ngoặc kép. Thí dụ: Để tìm lại nguyên tác và nội dung bài thơ có câu nước non
nặng một lời thề thì có thể thử dùng từ khoá với ngoặc kép "Nước non nặng một
lời thề".
d. Dùng các phép toán của đại số Bool
Hiện tại, nhiều máy tìm kiếm hỗ trợ thêm các phép toán như là OR, AND
và NOT. Khi dùng thì tên của các phép toán này bắt buộc phải viết chữ in hoa.
Phép toán Bool đòi hỏi điền vào đúng vị trí qui định một từ (hay một cụm từ
trong ngoặc kép) giữ vai trò của toán tử. Ngoài ra, đa số máy tìm kiếm chỉ hoạt
động tốt trong một số lượng giới hạn các phép toán Bool cho một bộ từ khoá. Lời

7
khuyên chung là không nên dùng quá 6 phép toán Bool cho cùng một bộ từ khoá
và không phải máy tìm kiếm nào cũng hỗ trợ đầy đủ các phép toán AND, OR hay
NOT.
 OR
Có cú pháp là (Toán tử 1) OR (Toán tử 2). Lệnh này cho phép tìm
những trang Web nào có chứa một trong các toán tử của phép toán OR của bộ từ
khoá. Thí dụ để tìm các bài viết về Nguyễn Trãi trong cả tiếng Việt và tiếng nước
ngoài thì có thể dùng bộ từ khoá:"Nguyễn Trãi" OR "Nguyen Trai". Các máy
truy tìm có thể dùng OR là: AltaVista, AOL Search, Excite, Google, Inktomi
(HotBot, MSN), Ask Jeeves, Lycos, Northern Light, HotBot và Gigablast.
 AND
Có cú pháp (Toán tử 1) AND (Toán tử 2). Phép toán AND nhằm yêu
cầu máy truy tìm kiếm các trang có sự hiện diện của tất cả các toán tử. Thí dụ
nanotechology AND health sẽ giúp truy tìm các trang có mặt đồng thời hai chữ
health và chữ nanotechnology.
Một số trang truy tìm sẽ dùng AND như là mặc định (trong đó có Google).
Ta cũng có thể thay thế bằng cách dùng dấu + trong một số trường hợp nào máy
truy tìm không có chức năng của đại số Bool.
Các trang hỗ trợ phép toán AND là: AltaVista, AOL Search, Google,
Excite, Inktomi (HotBot, MSN), Northern Light, Yahoo và Gigablast.
 NOT
Phép này hoàn toàn tương tự như cách dùng dấu Nghĩa là, sự truy tìm
sẽ loại bỏ những trang mà nội dung có chứa toán tử đứng ngay sau phép toán
NOT. Tuy nhiên trong nhiều máy truy tìm có hỗ trợ thì phép này cũng chỉ được
dùng có một lần cho một bộ từ khoá. Thí dụ để tìm tài liệu hướng dẫn về ngôn
ngữ lập trình C/C++ có thể thử dùng trên Altavista "C/C++ tutor" NOT book
Các trang có thể dùng NOT là AOL Search, Excite, Inktomi (HotBot,
MSN), Northern Light và Gigablast.
8

 NEAR
Dùng để truy tìm những trang Web mà nội dung của chúng có các thành
tố của từ khoá nằm gần nhau. Phép toán này rất có lợi để tìm ra những trang có
một cụm từ, một khái niệm, một định nghĩa hay một lời phát biểu mà ta không
nhớ hết được. Ví dụ: Tìm lại nguyên văn câu thơ và tác giả bằng bộ từ khoá:
"Ong non" NEAR "Dê cỏn"
Dùng dấu ngoặc đơn () để chẻ nhánh. Dùng ngoặc đơn cho phép tìm nhiều
kết hợp phức tạp. Thí dụ để truy tìm tài liệu về cách tạo ra CD ROM có khả năng
tự khởi động có thể thử từ khoá bootable AND (CD OR CDROM OR CD-ROM)
AND (howto OR instruction)
Hỗ trợ cho kiểu phân nhánh bằng ngoặc đơn là AltaVista, AOL Search,
Excite, Inktomi (MSN), Northern Light.
4. Từ khoá mặc định
Những máy tìm kiếm còn hỗ trợ thêm các từ khoá mặc định. Khi dùng các
từ khoá mặc định như một thành phần của bộ từ khoá thì các trang Web được trả
về sẽ thoả mãn các đặc tính chuyên biệt hoá theo ý nghĩa mà các từ khoá mặc
định này. Các hỗ trợ này cho phép kiểm soát được các loại trang nào muốn truy
tìm.
a. Các từ khoá mặc định kết thúc bằng dấu hai chấm ":" và chữ (hay cụm
từ trong ngoặc kép) của bộ từ khoá nào đứng ngay sau dấu này sẽ bị chi phối bởi
điều kiện của từ khoá mặc định, còn các thành phần khác trong từ khoá sẽ không
thay đổi ý nghĩa.
Các từ khoá mặc định giới hạn máy tìm kiếm trả về các trang nằm trong
một tên miền, hay một miền con. Tuỳ theo máy tìm kiếm mà các từ khoá mặc
định được sử dụng.
Altavista hỗ trợ chức năng này bằng từ khoá host: Thí dụ,
host:mars.jpl.nasa.gov mars saturn chỉ tìm trong mars.jpl.nasa.gov tất cả các
trang có chứa chữ "mars" và chữ "saturn".
Excite, Google (Netscape, Yahoo) hỗ trợ chức năng này bằng từ khoá
site: khi kết hợp với các lệnh khác có thể tìm theo cách chuyên biệt. Thí dụ,

9
"carbon nanotech" -host:www.technologyreview.com cho phép tìm tất cả các
trang nào có chứa cụm từ "carbon nanotech" ngoại trừ các trang xuất sứ từ
www.technologyreview.com.
Inktomi (HotBot, iWon, LookSmart) hỗ trợ chức năng này bằng từ khoá
domain:. Thí dụ, để tìm các trang có đuôi là ".edu" (thường là trang Web của các
đại học) về đề tài "heart transplan", có thể dùng bộ từ khoá "heart transplan"
+host:edu để tìm các trang có đuôi gốc là .edu mang đề tài này.
AllTheWeb hỗ trợ các từ khoá domain, url, site: cho chức năng này. Thí
dụ để tìm các trang về "deutch" từ các trang trong nước Đức có thể dùng deutch
domain:.de.
b. Các từ khoá mặc định dùng để tìm trang có tựa đề chứa một từ (hay
cụm từ) đặc biệt
AltaVista, AllTheWeb, Inktomi (MSN và HotBot) dùng từ khoá title:. Thí
dụ, title: "Mars Landing" sẽ giúp truy tìm các trang có đề tựa về Hỏa Tinh.
Google và Teoma hỗ trợ các từ khoá intitle: và allintitle: ("allintitle:" sẽ
ảnh hưởng đến tất cả các chữ đứng sau dấu :).
c. Các từ khoá dùng để tìm các địa chỉ Web có chứa từ (hay cụm từ) của
bộ từ khoá: Google hỗ trợ từ khoá inurl: và allinurl: Muốn tìm địa chỉ các trang
Web có một chữ đặc biệt thì dùng inurl. Thí dụ, inurl:nasa sẽ giúp tìm tất cả các
địa chỉ Web nào có chứa chữ "nasa".
Nếu cần truy tìm một điạ chỉ có nhiều hơn một chữ thì dùng allinurl. Thí
dụ allinurl:vietnam thetholucbat sẽ giúp tìm tất cả các trang nào mà nội dung địa
chỉ của nó chứa chữ "vietnam" hay là chữ "thetholucbat".
Inktomi, AOL, GoTo, HotBot cung cấp từ khoá originurl: cho việc này.
Yahoo thì dùng từ khoá u:Exite dùng url:
d. Các từ khoá mặc định giúp tìm các trang có cài đặt các liên kết tới địa
chỉ trang được ghi trong từ khoá:
Google, Yahoo sẽ cung cấp từ khoá link:. Tuy nhiên, Yahoo yêu cầu địa
chỉ trong từ khoá phải có đủ tiếp đầu ngữ http:// thì mới hoạt động hữu hiệu. Thí

dụ, bộ từ khoá link:vi.wikipedia.org sẽ giúp truy ra tất cả các trang Web nào có
10
liên kết tới trang Bách khoa toàn thư tiếng Việt này. MSN hỗ trợ chức năng này
bằng từ khoá linkdomain.
e. Để truy tìm các loại tệp có định dạng (format) đặc biệt thì có thể dùng
từ khoá filetype (đuôi của tập tin)
Google: sẽ hỗ trợ truy tìm các kiểu tệp: PDF, Word (.doc), Excel (.xls),
PowerPoint (.ppt) và Rich Text Format (.rtf) cũng như PostScript (.ps), Text
(.txt), HTML (.htm hay .html), WordPerfect (.wpd) và các đuôi khác Thí dụ:
laser filetype:pdf sẽ giúp tìm các trang là các tập tin dạng .pdf (.pdf là loại tập tin
được dùng trong cá hồ sơ văn bản của phần mềm Adobe Arcobat).
Yahoo cho phép tìm HTML (htm hay html), PDF, Excel (.xls),
PowerPoint (.ppt), Word (.doc), RSS/XML (.xml) và tập tin văn bản dạng (.txt).
MSN chỉ hỗ trợ chuyên tìm các loại tệp: HTML, PDF, PowerPoint (.pps
hay .ppt), các dạng của Word, hay Excel.
5. Chế độ cao cấp của máy tìm kiếm
Ngoài chế độ tìm kiếm thông thường hầu hết các máy tìm kiếm đều hỗ
trợ chức năng nâng cao mà dòng liên kết của nó thường viết bởi cụm từ
"Advanced search", hay đơn giản là "Advanced". Trong chế độ này thì sự tìm
kiếm được hướng dẫn chi tiết hơn. Đặc điểm chung của các chế độ nâng cao là:
Giao diện được thêm vào nhiều khung chữ hay ô trống (text box) có dòng
hướng dẫn để tiện người dùng điền vào. Không nhất thiết phải điền hết tất cả các
khung chữ nhưng các khung này được điền một cách đúng đắn và chi tiết thì
càng giúp cho máy tìm kiếm làm việc hiệu quả hơn.
Đa số các máy tìm kiếm cho phép lọc lựa (filter) lại các thông tin như là:
* Lựa chọn ngôn ngữ. Cho đến nay có một số máy tìm kiếm sau cho
phép tìm riêng các trang Việt ngữ như:
Google , Yahoo Nik Baamboo MooM
* Lựa chọn ngày tháng của trang Web.
* Lựa chọn các kiểu tệp (file type).

* Lọc bỏ các nội dung dành riêng cho người lớn
11
6. Các chức năng của máy tìm kiếm
Các máy tìm kiếm có thể cung cấp thêm một số phương tiện để giảm thiểu
khó khăn của việc tìm kiếm. Sau đây là vài chức năng đặc biệt:
6.1. Tìm thêm dữ liệu theo liên hệ (related search)
Sau khi tìm kiếm, máy tìm kiếm có thể giúp đào sâu sự truy tìm bằng cách
cung cấp các bộ từ khoá chi tiết hơn dưới dạng các dòng liên kết (link). Các liên
kết này thu nhỏ thị trường tìm kiếm (nếu số trang tìm theo từ khoá quá lớn). Ta
thấy nếu cách chọn từ khoá đủ tập trung và khéo thì sẽ không phải mượn đến
chức năng này. Thí dụ, như tìm các trang viết về sao Hoả mà dùng từ khoá mars
thì số lượng trang tìm ra sẽ vô cùng lớn. Do đó, có thể bấm thêm vào các chữ liên
hệ để máy tìm kiếm thu nhỏ thị trường tìm kiếm lại. Những trang có chức năng
để tìm dữ liệu theo liên hệ là: AltaVista (Related Searches), Ask.com AllTheWeb
(Narrow your search), Excite (Refine Your Results), HotBot, Lycos, MSN,
Yahoo (also try).
6.2. Nhóm gọn (cluster)
Trong lúc tìm kiếm nếu máy tìm kiếm cho rằng các trang tìm ra có thể ở
chung một trang nguồn thì nó chỉ chọn ra một trang đại diện, còn các trang khác
sẽ được xếp gọn vào và người dùng có thể khai triển rộng ra thành nhiều trang
nếu muốn. Như vậy, sự tìm kiếm sẽ dễ hơn và ít bị nhiễu loạn thông tin của cùng
một trang. Những trang có chức năng này là: AltaVista (Additional relevant
pages from this site), AllTheWeb (more hits from), Excite, Google (More results
from), HotBot, MSN, Northern Light.
6.3. Trang tương tự
Trong một số trường hợp thì chức năng tìm các trang tương tự như các
trang mà máy tìm kiếm cho rằng có thể hữu dụng. Để dùng chức năng này chỉ
việc bấm vào liên kết tương ứng. Riêng trong Google thì còn có link gợi ý thêm
hay sửa chính tả cho việc truy tìm bằng chữ "Did you mean ". Các trang có
chức năng tìm trang Web tương tự là: AltaVista (similar pages, related pages),

AOL Search (Show me more like this), Google (did you mean, similar pages).
12
6.4. Trang có từ nối dài (stemming)
Đây là khả năng của một số máy tìm kiếm cho phép tìm những trang có
những chữ mở rộng của chữ trong từ khoá. Thí dụ, thay vì chỉ tìm "tutor" thì tìm
luôn các trang có "tutors, tutorial, e-tutor, ". AOL Search có chức năng này mặc
định, Direct Hit, HotBot (Enable Word Stemming).
6.5. Chức năng tồn trữ (cached) của Google
Có nhiều trường hợp trang Web đã bị xoá không thể hiển thị được nữa
nhưng thông tin của nó trong cơ sở dữ liệu của máy tìm kiếm vẫn còn mà người
dùng có thể cần đến. Trong thời gian các tin tức này chưa bị xoá khỏi cơ sở dữ
liệu thì vẫn có thể đọc được nó nhờ vào chức năng đặc biệt này của Google.
6.6.Chuyển dịch (translation)
Một số trang cho khả năng dịch lại trang tìm thấy sang thứ tiếng mà người
dùng đang có. Thường thì chỉ có dịch được ra các thứ tiếng thông dụng như Anh,
Pháp, Đức, hay Tây Ban Nha và sự chuyển dịch này cũng không chính xác hoàn
toàn. Dù vậy, người dùng có thể nắm được một phần thông tin có thể dịch ra. Các
trang có chức năng chuyển dịch là: AltaVista (Translate), Google(Translate this
page).
7. Cơ chế hoạt động của Search Engine
7.1. Các bộ phận hệ thống máy tìm kiếm search engine
a. Bộ thu thập thông tin – Robot:
Robot là một chương trình tự động duyệt qua các cấu trúc siêu liên kết để
thu thập tài liệu và một cách đệ quy nó nhận về tất cả tài liệu có liên kết với tài
liệu này. Robot được biết đến dưới nhiều tên gọi khác nhau : spider, web
wanderer hoặc web worm,… Những tên gọi này đôi khi gây nhầm lẫn, như từ
‘spider’, ‘wanderer’ làm người ta nghĩ rằng robot tự nó di chuyển và từ ‘worm’
làm người ta liên tưởng đến virus. Về bản chất robot chỉ là một chương trình
duyệt và thu thập thông tin từ các site theo đúng giao thức web. Những trình
duyệt thông thường không được xem là robot do thiếu tính chủ động, chúng chỉ

duyệt web khi có sự tác động của con người.
13
b. Bộ lập chỉ mục – Index
Hệ thống lập chỉ mục hay còn gọi là hệ thống phân tích và xử lý dữ liệu,
thực hiện việc phân tích, trích chọn những thông tin cần thiết (thường là các từ
đơn , từ ghép , cụm từ quan trọng) từ những dữ liệu mà robot thu thập được và tổ
chức thành cơ sở dữ liệu riêng để có thể tìm kiếm trên đó một cách nhanh chóng,
hiệu quả. Hệ thống chỉ mục là danh sách các từ khoá, chỉ rõ các từ khoá nào xuất
hiện ở trang nào, địa chỉ nào.
c. Bộ tìm kiếm thông tin – Search Engine
Search engine là cụm từ dùng chỉ toàn bộ hệ thống bao gồm bộ thu thập
thông tin, bộ lập chỉ mục và bộ tìm kiếm thông tin. Các bộ này hoạt động liên tục
từ lúc khởi động hệ thống, chúng phụ thuộc lẫn nhau về mặt dữ liệu nhưng độc
lập với nhau về mặt hoạt động.
Search engine tương tác với user thông qua giao diện web, có nhiệm vụ
tiếp nhận và trả về những tài liệu thoả yêu cầu của user.
Như vậy, tìm kiếm từ là tìm kiếm các trang mà những từ trong câu truy
vấn (query) xuất hiện nhiều nhất, ngoại trừ stopword (các từ quá thông dụng như
mạo từ a, an, the,…). Một từ càng xuất hiện nhiều trong một trang thì trang đó
càng được chọn để trả về cho người dùng. Và một trang chứa tất cả các từ trong
câu truy vấn thì tốt hơn là một trang không chứa một hoặc một số từ. Ngày nay,
hầu hết các search engine đều hỗ trợ chức năng tìm cơ bản và nâng cao, tìm từ
đơn, từ ghép, cụm từ, danh từ riêng, hay giới hạn phạm vi tìm kiếm như trên đề
mục, tiêu đề, đoạn văn bản giới thiệu về trang web,…
Ngoài chiến lược tìm chính xác theo từ khoá, các search engine còn cố
gắng ‘ hiểu ‘ ý nghĩa thực sự của câu hỏi thông qua những câu chữ do người
dùng cung cấp. Điều này được thể hiện qua chức năng sửa lỗi chính tả, tìm cả
những hình thức biến đổi khác nhau của một từ. Ví dụ : search engine sẽ tìm
những từ như speaker, speaking, spoke khi người dùng nhập vào từ speak.
7.2. Nguyên lý hoạt động của Search Engine

Search engine điều khiển robot đi thu thập thông tin trên mạng thông qua
các siêu liên kết ( hyperlink ). Khi robot phát hiện ra một site mới, nó gửi tài liệu
14
(web page) về cho server chính để tạo cơ sở dữ liệu chỉ mục phục vụ cho nhu cầu
tìm kiếm thông tin. Bởi vì thông tin trên mạng luôn thay đổi nên robots phải liên
tục cập nhật các site cũ. Mật độ cập nhật phụ thuộc vào từng hệ thống search
engine. Khi search engine nhận câu truy vấn từ user, nó sẽ tiến hành phân tích,
tìm trong cơ sở dữ liệu chỉ mục và trả về những thông tin yêu cầu.
8. Cách Search Engine xếp hạng một website
Khi tìm kiếm bất cứ thứ gì với các cỗ máy tìm kiếm, thì gần như ngay lập
tức, các cỗ máy tìm kiếm sẽ tìm trong cơ sở dữ liệu hàng triệu trang của nó lấy
một hay nhiều kết quả phù hợp nhất . Những kết quả phù hợp hơn sẽ được liệt kê
trên cùng. Những trang không liên quan làm nó bỏ qua. Nhưng, đối với những cỗ
máy tìm kiếm lớn, kết quả rất tốt. Đối với các search engine thì không phải như
vậy. Ta chỉ có thể tìm được những thông tin liên quan đến từ khóa mình nhập
vào. Nó ít khi đưa ra một gợi ý tốt hơn (ngoại trừ từ đưa vào bị sai chính tả).
Việc tìm kiếm hàng trăm ngàn tài liệu rất khó khăn cho nên chúng có những quy
tắc nhất định, được biết đến như những giải thuật đặc biệt. Mỗi giải thuật có
những điểm cơ bản sau đây:
a. Vị trí và tần số:
Một trong số những quy tắc chính trong giải thuật xếp hạng bao gồm sự
định vị (vị trí) và tần số xuất hiện của những từ khóa trên một trang Web. Những
trang với những thuật ngữ tìm kiếm xuất hiện trong tiêu đề HTML thường là
những nội dung liên quan nhất của đề tài. Những cỗ máy tìm kiếm cũng kiểm tra
xem những từ khóa cần tìm kiếm xuất hiện gần đỉnh của một trang web, như
trong hàng title hay trong câu đầu tiên văn bản. Chúng giả thiết rằng bất kỳ trang
nào liên quan đối với đề tài sẽ đề cập những từ đó ngay từ đầu tiên. Tần số là
nhân tố chính khác trong những cỗ máy tìm kiếm xác định mối quan hệ như thế
nào. Các cỗ máy tìm kiếm sẽ phân tích tần số xuất hiện của một từ khóa trong
tòan bộ trang web. Một từ xuất hiện lặp lại nhiều lần thường trên một trang được

coi là liên quan hơn so với các trang khác.
b. Những nhân tố bên ngoài (Off the page factors):
15
Các search engine hiện nay đã có nhiều kinh nghiệm đối với một số
webmaster có kiến thức tốt có thể áp dụng những công thức làm đảo lộn kết quả
để trang web của họ được xếp hạng cao hơn. Bởi vậy, hầu hết các Search engine
giờ đều lấy nhân tố "Off Page" làm tiêu chuẩn để đánh giá xếp hạng một trang
web. Những nhân tố bên ngoài (Off Page) là những nhân tố không dễ bị tác động
bởi các webmaster. Đứng đầu trong số này là sự phân tích những mối liên kết.
Bằng việc phân tích những trang liên kết tới nhau như thế nào, một cỗ máy tìm
kiếm có thể xác định một trang là có vị thế gì và liệu trang kia có "quan trọng" và
xứng đáng được xếp hạng cao hay không. Ngoài ra, các webmaster kinh nghiệm
còn sử dụng các mối liên kết giả tạo nhằm đẩy cao thứ hạng website của mình.
Một nhân tố bên ngoài khác có tác động lớn là việc đếm số lần truy cập vào trang
web. Tức là, các search engine theo dõi xem trang nào được tìm kiếm nhiều hơn
với một từ khóa nào đó. Một trang hôm qua đang xếp hạng thấp, nhưng có nhiều
người tìm kiếm truy cập vào thì sẽ được nâng cao trong hiện tại. Còn những
trang ở top trên, nhưng hiếm khi được ai đó truy cập sẽ bị mất dần ngôi vị. Đấy
chính là lý do vì sao hầu hết các trang báo lớn, với số người truy cập cao luôn có
vị trí cao trong các cỗ máy tìm kiếm.
16
CHƯƠNG 2
LÝ THUYẾT SEO TRONG TỐI ƯU HÓA TÌM KIẾM
1. Tổng quan về SEO
1.1. SEO là gì
SEO là chữ viết tắt của Search Engine Optimization (tối ưu hóa công cụ
tìm kiếm). SEO là một tập hợp các phương pháp nhằm nâng cao thứ hạng của
một website trong các trang kết quả của các công cụ tìm kiếm và có thể được coi
là một tiểu lĩnh vực của tiếp thị qua công cụ tìm kiếm. Thuật ngữ SEO cũng có
thể được dùng để chỉ những người làm công việc tối ưu hóa công cụ tìm kiếm, là

những nhà tư vấn đưa ra những dự án tối ưu hóa cho các website của khách hàng.
Các công cụ tìm kiếm hiển thị một số dạng danh sách trong trang kết quả tìm
kiếm (SERP) bao gồm danh sách trả tiền, danh sách quảng cáo, dánh sách trả tiền
theo click và danh sách tìm kiếm miễn phí. Mục tiêu của SEO chủ yếu hướng tới
việc nâng cao thứ hạng của danh sách tìm kiềm miễn phí theo một số từ khóa
nhằm tăng lượng và chất của khách viếng thăm đến trang. SEO đôi khi là một
dịch vụ độc lập hay là một phần của dự án tiếp thị và có thể rất hiệu quả ở giai
đoạn phát triển ban đầu và giai đoạn thiết kế website. Hiện nay, nhận thức của
người quản trị website tại Việt Nam nói riêng và thế giới nói chung nhận biết
việc tối ưu hóa website để các máy tìm kiếm trỏ tới rất ít. Người sử dụng không ý
thức được tầm quan trọng của việc tối ưu hóa website, hoặc làm các phương thức
để các máy tìm kiếm trỏ đến. Hiện trên mạng Internet có 3 công cụ tìm kiếm hữu
hiệu nhất và phổ biến nhất:
Google.com, Yahoo.com , Live.com (MSN.com) SEO có thể coi như là
một kỹ thuật, một bí quyết thực sự đối với mỗi người quản trị, xây dựng website
hay đơn thuần là người làm trong lĩnh vực truyền thông.
1.2. Mục đích của Search Engine Optimization (SEO)
Mục đích của SEO là nhằm cải thiện lượng truy cập về cả chất lẫn lượng
cho Website, trực tiếp đến từ trang kết quả của các máy tìm kiếm(Google,
Yahoo, bing) với một số từ khóa nhất định. Mục tiêu mà các Seoer luôn nhắm
đến là 10 thứ hạng đầu trong google, bing, Yahoo…
17
1.3. Tối ưu hoá website (Google SEO)
a. Càng "tự nhiên" càng thu hút nhiều click
Google Adwords dù sao cũng là quảng cáo, trong khi đó kết quả tự nhiên
là những kết quả không phải quảng cáo. Do vậy không có gì ngạc nhiên khi tỷ lệ
khách hàng lựa chọn những kết quả "tự nhiên" cao hơn rất nhiều lần so với chọn
Quảng cáo Google Adwords. Dưới đây là một số thống kê giúp ta có thể định
hình vai trò của SEO:
- 86% người tìm kiếm chọn các kết quả tự nhiên hơn là kết quả quảng cáo.

- 70% đối tượng tìm kiếm ngay lập tức nhìn vào kết quả tự nhiên (nghiên
cứu về hoạt động của mắt khi tìm kiếm). Theo một khảo sát khác: có 78% người
được hỏi thấy thông tin từ quảng cáo Adwords hữu ích chỉ chiếm 40%.
b. Mức độ tin tưởng
Kết quả tự nhiên luôn mang lại sự tin tưởng cao hơn quảng cáo, đây là yếu
tố vô cùng quan trọng khi các nhà quảng cáo muốn hướng tới đối tượng khách
hàng và tính hiệu quả. Cụ thể qua các thông tin khảo sát có khoảng 14% khách
hàng tin tưởng vào Quảng cáo Adwords, nhưng có tới 29% cảm thấy khó chịu
với hình thức quảng cáo tài trợ này. Đây là những con số buộc các nhà quảng cáo
phải nghĩ tới các phương án đưa ra các thông điệp quảng cáo hấp dẫn hơn tới
khách hàng.
c. Giá trị của khách hàng
Mười kết quả đầu tiên của Google đem lại cho khách hàng mà không phải
trả phí cho mỗi lần họ ghé thăm website. Bên cạnh đó, các khách hàng này "có
giá trị" hơn so với những khách hàng đến từ Pay per click, cụ thể có khoảng 17%
khách hàng thao tác nhiều hơn (chuyển trang, đọc bài ) so với quảng cáo tài trợ
và tỷ lệ Conversion từ SEO thường ở mức cao hơn so với Adwords.
Khách hàng dễ dàng phân biệt đâu là quảng cáo. Quảng cáo và không
quảng cáo tạo những ấn tượng khác nhau cho người dùng trước khi click vào
đường link dẫn tới website. Không khó để có thể phân biệt được quảng cáo
Google Adwords và có tới 54% người sử dụng dễ dàng nhận biết yếu tố này. Đây
cũng là thông số rất quan trọng giúp các nhà hoạch định quảng cáo có phương án
18
tối ưu trong việc chiếm các vị trí quảng cáo và sáng tạo thông điệp cho riêng
mình.
d. Giá click sẽ bị đẩy lên cao
Với chính sách đấu giá từ khóa của Google Adwords, một từ khóa hot sẽ
nhanh chóng bị đẩy lên một mức giá cao hơn khả năng của khách hàng và nếu
muốn duy trì khả năng tiếp cận khách hàng thì không có cách nào khác là phải
tăng giá. Ngược lại, SEO là mức phí duy trì hợp lý và ít biến đổi, đây là yếu tố

quan trọng giúp khả năng quản lý ngân sách của Marketer được dễ dàng hơn.
e. Kết quả bền vững
SEO đó là tối ưu hóa website, không chỉ là nội dung, cấu trúc, kỹ thuật
liên kết mà còn cả việc thu hút truy cập. Một khi bạn đã đạt thành công ở một thứ
hạng cao, khả năng thay đổi thứ hạng đó sẽ chậm.hơn nhiều so với tốc độ biến
mất của Adwords. Đó chính là cơ sở đầu tư lâu dài nếu thật sự SEO mang lại
những nguồn lợi to lớn đối với từ khóa đã chọn.
f. Yếu tố phù hợp
Có đến 72,3% người dùng Google đánh giá cao kết quả tìm kiếm tự nhiên
so với 27,3% chọn Quảng cáo Adwords, với Yahoo tỷ lệ này là 60,8% - 39,2%
cũng đủ cho thấy vai trò quan trọng của SEO tác động như thế nào.
2. Quy trình thực hiện SEO
SEO cũng giống như làm PR, cần có phương án, kế hoạch khoa học, cụ
thể. Làm SEO không đúng cách sẽ không mang lại hiệu quả, mà còn phản tác
dụng. Thông thường triển khai SEO cho khách hàng theo quy trình sau:
Bước 1: Khảo sát thông tin khách hàng
* Lấy thông tin về doanh nghiệp khách hàng
* Xác định lĩnh vực hoạt động, mức độ cạnh tranh
* Lên danh sách các đối thủ cạnh tranh, xác định hình thức quảng bá. Kết
thúc bước này, chúng ta sẽ có cái nhìn tổng quan về doanh nghiệp, ngành hoạt
động, tính cạnh tranh trong ngành, từ đó đưa ra phương án quảng bá phù hợp
(không nhất thiết phải là quảng bá qua Internet).
19
Bước 2: Khảo sát website (áp dụng cho doanh nghiệp đã có website)
* Domain đang sử dụng là gì? Website sử dụng công nghệ nào? Máy chủ
đặt ở đâu? Tốc độ nhanh hay chậm?
* Kiểm tra tính tối ưu của website: tốc độ truy cập, cache dữ liệu, băng
thông
* Kiểm tra khả năng SEO ở hiện tại: check lại các thẻ meta, title,
description, content, footer, xem đã đặt đúng chưa, có hiệu quả hay không?

* Kiểm tra tốc độ load trang, số lượng ảnh, file flash và các dữ liệu nặng
khác
* Xác định Rank hiện tại: rank Google, Alexa.
* Xác định vị trí website khi search trên Google với các từ khóa là
domain, từ khóa là tên công ty, từ khóa theo lĩnh vực hoạt động.
* Kiểm tra sitemaps hiện tại của trang, có sitemap hay không, sitemap có
hiệu quả không?
* Số lượng page đã được Google, Yahoo, Bing index trên trang.
* Số lượng Backlink (link trên trang khác) tìm thấy trên Google.
Kết thúc bước này, có thể biết được khả năng hiện tại của website, từ đó
có phương án sửa chữa, tối ưu, nâng cấp website phù hợp cho việc SEO.
Bước 3: Tối ưu hóa website
* Nâng cấp máy chủ, nếu máy chủ không đáp ứng nhu cầu
* Sửa lại website, thêm thẻ keyword, description, copyright
* Tạo sitemaps, submit sitemaps lên các search engine
* Tạo cache site trên máy chủ: filecache, memcache, apc-cache, x-cache
* Cài đặt Gzip tăng tốc website
* Tạo các trang refer, các trang refer được đặt trên những server quốc tế,
tốc độ cao.
* Tạo chuyên mục Tin tức
* Cập nhật nội dung thường xuyên cho trang.
* Submit các bản tin mới lên các site: Linkhay, Digg, Sigg
Việc cập nhật nội dung được tiến hành thường xuyên, hàng ngày.
20
Bước 4-A: Quảng bá website
*Tạo account quảng bá trên các mạng: Facebook, MySpace, Yahoo,
LinkIn, Twitte, BlogViet.
*Tạo trang blog riêng trên Yahoo, BlogViet, Opera, Blogger
*Cập nhật nội dung, xây dựng mạng lưới kết bạn trên Facebook,
MySpace, Yahoo, Twitte,tạo fanclub trên Facebook.

*Tạo Account trên các forum (tối thiểu 100 forum), tạo chữ ký chứa
backlink vào dòng quảng cáo, chăm sóc các chuyên mục trên những forum này,
tối thiểu một ngày sẽ có 30- 50 bài viết trên các forum.
*Submit link website lên các web directories của Việt Nam và nước ngoài,
tối thiểu 1000 web directories.
*Cập nhật nội dung trên các blog khởi tạo, submit nội dung này lên các
trang chia sẻ: Sig,Digg, Linkhay, Tagvn.com
*Tạo account trên các trang rao vặt: Rongbay.com, Enbac.vn,
Timnhanh.com, Chodientu.com, Vatgia.com
*Tạo gian hàng trên Enbac, Chodientu, Vatgia Submit từ 10-20 tin rao vặt
mới/ngày trên các site rao vat.
Bước 4-B: Gửi Email Marketing
Xác định list email tiềm năng cho site: 20.000 - 100.000 email. Viết nội
dung mail, tiến hành lên lịch gửi mail.
Kiểm tra mail reply, trả lời email, lên danh sách khách hàng tiềm năng từ
việc gửi mail.
Bước 5: Xây dựng hệ thống quản lý khách hàng (tùy chọn)
Hệ thống quản lý khách hàng trực tuyến sẽ thống kê thông tin khách hàng,
quản lý thông tin liên hệ, lên kế hoạch làm việc, chuẩn hóa quy trình sales và
marketing của doanh nghiệp.
2.1. Nghiên cứu xác định từ khóa
Xác định từ khoá cần SEO: Có những từ khoá ta tưởng nhiều người tra
cứu nhưng thực tế lại rất ít và ngược lại. Việc chi tiền vào những từ khoá đắt tiền
là hợp lý nhưng chi phí nhiều vào những từ khoá không hiệu quả sẽ tốn phí của
21
doanh nghiệp. Hiện nay nhiều khách hàng đã bắt đầu biết đến SEO và Ranking
nhưng vẫn làm một cách thiếu hiểu biết. Việc áp dụng các tiêu chuẩn chuyên
nghiệp cũng như gặp được những đối tác tư vấn am hiểu thì sẽ giúp ích nhiều cho
việc quảng bá của mình trên Internet.
2.2. Tối ưu hóa trong trang

Search Engine liên tục hoàn thiện thuật toán để có thể cung cấp cho người
dùng những kết quả tốt nhất ( những website chất lượng). Một website có chất
lượng là site mang đến cho khách viếng thăm những thông tin bổ ích vì thế sau
khi đã chọn keyword, công việc tiếp theo là xây dựng nội dung trang web liên
quan đến keyword đó. On-page SEO có nghĩa là tối ưu hóa các mã trên trang
web, vì thế cần chú ý những điều sau đây:
a. Title Tag :
Thẻ tiêu đề Title tag là trong những một nhân tố quan trọng trong việc đạt
được thứ hạng cao. Title tag thì rất cần thiết trong mã HTML, nó tạo ra những từ
mà xuất hiện trên thanh tiêu đề của trinh duyệt. Thường thì title tag là yếu tố đầu
tiên trong thẻ , tiếp theo là Meta Description và Meta Keywords tags. Một số qui
luật chung nên tuân theo khi tối ưu hóa title tag:
- Sử dụng 5-7 từ và tối đa 65 ký tự cho title tag.
- Nếu có thể, không nên sử dụng những từ được gọi là stop word như "a,
and, or "
- Tránh spam: không nên lập lại cùng một keyword quá hai lần.
b. Meta Description tag :
Meta Description tag mô tả nội dung website. Search Engine sẽ dùng nội
dung này để mô tả ngắn gọn nội dung trang web khi thể hiện kết quả tìm kiếm
cho người dùng. Thẻ Meta description nên bao gồm nhiều từ khóa được tổ chức
trong một câu có ý nghĩa. Đặt cụm từ keyword ở đầu description để đạt được thứ
hạng cao nhất có thể. Cố gắng giữ description trong khoảng 255 ký tự.
22
c. Meta Keyword tag :
Meta Keyword tag cho phép cung cấp thêm thông tin cho Search Engine
về nội dung website. Nên kèm theo 25 từ hay cụm từ ngăn cách bởi dầu phẩy
trong meta keyword tag.
d. Body text :
Nội dung trong thẻ body, sẽ hiện lên trong trình duyệt. Đây là phần mà
visitor sẽ thấy khi tham quan website của bạn. Có nhiều vấn đề cần xem xét khi

đặt keyword trong nội dung của website. Hầu hết các search engine sẽ chỉ mục
(index) tất cả chữ (text) trong mỗi trang web, vì thế việc việc đặt keyword xuyên
suốt nội dung trang web thì rất quan trọng. Tuy nhiên, mỗi search engine (SE) sử
dụng các thuật toán khác nhau để xếp hạng webpage.
Dưới đây là một số quy định chung :
- Đảm bảo trang chủ chính của có đủ keyword. Nó sẽ có cơ hội được
index nhiều hơn những trang khác, và nó sẽ chỉ là trang được index bởi một số
search engine. Một vài search engine xếp hạng webpage cao nếu nó có ít nhất
100 từ, vì thế nội dung của nên có tối thiều 100 words. Khi submit website vào
directories thì các Directories đòi hỏi website phải có nội dung tốt (quality
content), trang web phải có nội dung thật sự chứ không phải chỉ là trang list các
keyword.
- Các thẻ H1, H2 H6 (heading) thì cũng rất hữu ích trong việc SEO, Nên
đặt keyword chính trong những thẻ này. Ta nên đặt keyword chính trong một thẻ
H1, và mỗi keyword phụ trong hai thẻ H2.
- In đậm và in nghiêng các keyword chính ít nhất một lần.
2.3. Tối ưu hóa ngoài trang
a. Link Exchange (Trao đổi liên kết )
Khi trao đổi liên kết nên tìm những website có nội dung tốt, cùng chủ đề
hoặc tương tự website .Để trao đổi liên kết, ta nên thực hiện như sau : tìm kiếm
những site có cùng chủ đề. Sau đó, email cho các webmaster , hỏi xem họ có vui
lòng trao đổi liên kết với website của mình không. Nếu họ đồng ý thì họ sẽ đặt
23
liên kết đến website của mình, ngược lại mình cũng sẽ đặt liên kết đến website
của họ. Thực hiện đúng chiến lược xây dựng liên kết sẽ mang lại các lợi ích sau:
- Gia tăng traffic cho website.
- Tăng hạng trên các search engine.
- Cung cấp thêm tài nguyên cho trang web
- Tiết kiệm được tiền quảng cáo. Một số cách khác để người khác trỏ liên
kết đến site.

-Cho phép người khác phát hành nội dung nhưng phải có chích dẫn lấy từ
website nào.
- Tạo một directory trên site và cho phép người khác submit site họ vào
directory, đặt quảng cáo trên đầu trang chủ directory.
- Phát hành miễn phí ebook cho visitor. Ebook phải có nội dung liên quan
đến website của mình. Cho phép họ phát hành miễn phí cho visitor của họ nhưng
phải đặt liên kết đến website của mình.
b. Directory Submission (Submit website vào các directory)
Một vài search engine sẽ đánh giá cao website được list trên các directory
có uy tín, điều đó giải thích tại sao việc submit site vào directory là rất cần thiết.
Trước khi submit website vào các directories cần phải tối ưu hóa website, submit
vào đúng category nếu không sẽ bị từ chối. Dưới đây là một vài directory uy tín
nên submit:
- Yahoo (phí $299/năm)
- DMOZ miễn phí
- Jayde B2B miễn phí
- GoGuides miễn phí
- Zeal miễn phí.
2.4. Nghiên cứu và xác định từ khóa
2.4.1. Quá trình chon keyword cho một Website
Chọn keyword cho một website để bắt đầu chiến dịch SEO luôn là bước
đầu tiên và rất quan trọng ảnh hưởng đến toàn bộ quá trình làm SEO của một
website. Quá trình lựa chọn keyword cho 1 website:
24
Bước 1: Xác định rõ mục tiêu của website . Qua đó tìm những từ khóa
tiềm năng .
Bước 2: Sử dụng www.google.com. Bắt đầu search các keyword của
website và đánh giá mức độ ranking của website so với các website cùng
ngành .Đánh giá : ranking tốt ( đều nằm ở vị trí thứ 2 đến thứ 5 trên
google.com ). Lướt qua tất cả các title của các website đối thủ , tìm hiểu sự khác

nhau giữa title của các website đó với website mình đang làm. Qua bước này
mình đã nhận ra được một vài vấn đề cơ bản
Bước 3: Sử dụng Keyword research tools: có thể dùng Google Insight For
Search.,Google AdWords được một list các keyword từ đó dựa vào lượng tìm
kiếm tiềm năng chọn lựa keyword phù hợp.
2.4.2. Nghiên cứu từ khóa
a. Nghiên cứu từ khóa mục tiêu trước khi SEO
Việc nghiên cứu những từ khóa chính cho một website trước khi thực
hiện SEO là công việc rất quan trọng và cần thiết. Nếu không quan tâm đến vấn
đề này, có thể phải trả giá cho những sai lầm không đáng có trong quá trình thực
hiện dịch vụ SEO của mình.
Để nghiên cứu một vấn đề nào đó, chắc chắn phải bỏ thời gian để thực
hiện nó. Dịch vụ SEO cũng vậy, trước khi bắt đầu công việc của mình, phải bỏ ra
một khoảng thời gian để nghiên cứu từ khóa mục tiêu trước khi thực hiện công
việc SEO .
Mỗi một cụm từ phải được nghiên cứu kỹ lưỡng, chính xác để đảm bảo
tìm ra những cụm từ thích hợp và loại bỏ những cụm từ không thích hợp với
website cần thực hiện.
Quá trình nghiên cứu từ khóa cho dịch vụ SEO không thể tiến triển một
cách tuyến tính. Cần phải nghiên cứu nhiều từ khóa và tại một thời điểm nào đó
sẽ tập trung cho một từ khóa. Trong quá trình nghiên cứu phải lật đi, lật lại để tìm
ra được những từ khóa phù hợp nhất.
Chúng ta có thể bắt đầu nghiên cứu từ khóa bất kỳ đâu nhưng nên bắt đầu
từ một danh sách các từ khóa phù hợp với ngành nghề kinh doanh nhất. Vì vậy
25

×