Tải bản đầy đủ (.pdf) (54 trang)

Nghiên cứu và ứng dụng seo (search engine optimization)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2 MB, 54 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN
KHOA THƯ VIỆN-THÔNG TIN HỌC


ĐỀ TÀI NGHIÊN CỨU KHOA HỌC

NGHIÊN CỨU VÀ ỨNG DỤNG SEO
(SEARCH ENGINE OPTIMIZATION)

GVHD: ThS. Nguyễn Danh Minh Trí
Nhóm SVTH:
1. Trần Huệ Vân – 1356100181
2. Trần Thị Kim Tiến – 1356100159
3. Trương Thị Thái Thảo – 1356100141
4. Nguyễn Thiên Phương – 13561001
5. Võ Thị Hoàng Yến - 1356100191

TP.HCM - 2016


MỤC LỤC
PHẦN MỞ ĐẦU .................................................................. 1
1. Lý do chọn đề tài: ...................................................................................... 1
2. Lịch sử nghiên cứu vấn đề: ....................................................................... 2
3. Mục đích và nhiệm vụ của đề tài............................................................... 3
4. Cơ sở lý luận và phương pháp nghiên cứu ................................................ 4
5. Phạm vi nghiên cứu của đề tài................................................................... 4
6. Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài...................................... 4
7. Kết cấu của đề tài ...................................................................................... 5


PHẦN NỘI DUNG .............................................................. 6
CHƯƠNG 1 BỘ MÁY TÌM KIẾM (SEARCH ENGINE) ..... 6
1.1. Khái quát về bộ máy tìm kiếm: .............................................................. 6
1.1.1. Định nghĩa: ..................................................................................... 6
1.1.2. Một số bộ máy tìm kiếm thông dụng. ............................................. 7

1.2. Cấu tạo chung của bộ máy tìm kiếm ...................................................... 9
1.2.1. Bộ thu thập thơng tin – Spider: ....................................................... 9
1.2.2. Bộ lập chỉ mục – Index: .................................................................. 9
1.2.3. Bộ truy vấn thông tin - Query ....................................................... 10

1.3. Hoạt động của bộ máy tìm kiếm: .......................................................... 11
1.4. Hệ Thống xếp hạng (rank) .................................................................... 13
1.4.1. Alexa rank. ................................................................................... 13
1.4.2. Google PageRanking. ................................................................... 14


KẾT LUẬN CHƯƠNG 1 ........................................................... 15
CHƯƠNG 2 TỐI ƯU HOÁ WEBSITE TRÊN CƠNG CỤ
TÌM KIẾM (Search Engine Optimization – SEO) ......................... 16
2.1. Sơ lược về Search Engine Optimization (SEO): .................................. 16
2.1.1. Định nghĩa: ................................................................................... 16
2.1.2. Các thuật ngữ trong SEO: ............................................................. 17

2.2. Các kỹ thuật SEO: ................................................................................ 18
2.2.1. Tối ưu hóa nội dung bài viết: ........................................................ 19
2.2.2. Tối ưu hóa URL: ........................................................................... 21
2.2.3. Tối ưu hóa hình ảnh: ..................................................................... 22
2.2.4. Tối ưu hóa label: ........................................................................... 23
2.2.5. Tối ưu hóa Sitemap:...................................................................... 25

2.2.6. Tối ưu hoá từ khoá: ....................................................................... 27
2.2.7. Tối ưu hoá Meta tags: ................................................................... 30
2.2.8. Tối ưu hoá robots.txt:.................................................................... 35
2.2.9. Xây dựng các backlink: ................................................................ 36

KẾT LUẬN CHƯƠNG 2 ........................................................... 38
CHƯƠNG 3 KẾT QUẢ NGHIÊN CỨU ................................ 39
3.1. Giới thiệu Website: ............................................................................... 40
3.2. Kết quả tối ưu website trên công cụ tìm kiếm: ..................................... 44

KẾT LUẬN CHUNG ................................................................. 47
TÀI LIỆU THAM KHẢO ......................................................... 50


-1-

PHẦN MỞ ĐẦU
1. Lý do chọn đề tài:
Ngày nay, theo thống kê trên thế giới mỗi năm có gần 3 tỷ người (số liệu
thống kê năm 2014) sử dụng các dịch vụ internet, trong đó một phần rất lớn
người dùng sử dụng các cơng cụ tìm kiếm (Search Engine) như Google, Yahoo,
Bing… như một kênh gián tiếp để tiếp cận thơng tin cần thiết mà khơng cần mất
thời gian tìm kiếm thủ công. Việc ra đời của các bộ máy tìm kiếm là bước ngoặc
lịch sử quan trọng trong cuộc cách mạng công nghệ thế kỷ hai mươi, rút ngắn
khoảng cách tiếp cận giữa con người và khối lượng thông tin khổng lồ trên mạng
internet. Bộ máy tìm kiếm ngày nay gắn liền mới mọi hoạt động sống của con
người, mọi thơng tin cần thiết mỗi ngày đều có thể tìm ra bằng các cơng cụ tìm
kiếm, với điều kiện thơng tin đó hiện hữu trên mạng internet. Có thể nói, các bộ
máy tìm kiếm là một trong những thành tựu quan trọng, đóng vai trị to lớn trong
sự phát triển của mạng internet. Do đó, nhóm nghiên cứu muốn dành phần đầu

trong nội dung đề tài để đề cập một cách sơ lược về bộ máy tìm kiếm như là
phần để làm rõ thêm về SEO cũng như các kỹ thuật SEO.
Song song đó là việc tối ưu hóa website để thân thiện hơn với cơng cụ tìm
kiếm hay ta còn gọi là SEO một website. SEO hiện nay khơng cịn là một khái
niệm mới đối với thế giới, nhưng nó chỉ mới quen thuộc với cộng đồng mạng
Việt Nam khoảng một thập kỷ trở lại đây. SEO thường được áp dụng trong lĩnh
vực quảng cáo, marketing, thương mại điện tử và là một phần quan trọng trong
chiến lược kinh doanh của bất kỳ cơng ty hay tập đồn nào. Vì thế, SEO thường
bị bó buộc với các lĩnh vực về kinh tế hay thương mại mà không được nhìn nhận


-2-

có hiệu quả trong những lĩnh khác. Lý do chọn đề tài này là và nghiên cứu về
SEO, các kỹ thuật SEO và áp dụng SEO để SEO một website tin tức dành riêng
phục vụ cho việc học tập và giải trí cho Sinh viên trường đại học Khoa học Xã
hội và Nhân văn. Đồng thời đưa website lên top 10 kết quả tìm kiếm với một số
từ khóa cụ thể.

2. Lịch sử nghiên cứu vấn đề:
Theo thống kê, hơn 85% lượng truy cập một Website đến từ các
công cụ tìm kiếm (Search Engine) lớn như Google, Yahoo, Bing, MSN,… Mỗi
ngày, hàng triệu người lướt Web sử dụng Search Engine để tìm những sản
phẩm, thơng tin, dịch vụ họ cần. Vậy làm cách nào để trong hàng tỷ Website
đang tồn tại người dùng tìm thấy Website mình muốn khi họ hầu như không đủ
kiên nhẫn để di chuyển đến các trang phía sau? Làm sao đưa Website của
mình lên những trang đầu khi người dùng truy vấn? Câu trả lời chính là SEO
(Search Engine Optimization) - phương pháp giúp Website có vị trí cao trong
trang kết quả tìm kiếm.
Cụm từ SEO - Tối ưu hóa cơng cụ tìm kiếm bắt đầu xuất hiện vào năm

1997. Từ đó, trên thế giới, SEO đã phát triển một nghề cụ thể và được ứng dụng
phổ biến vào lĩnh vực kinh doanh và bán hàng trực tuyến trên mạng internet. Tất
cả các công ty và các tập đoàn lớn trên thế giới đều sử dụng SEO cũng như có
một đội ngũ SEO chuyên biệt được coi như một bộ phận quan trọng trong việc
marketing trực tuyến.
Nghề SEO xuất hiện ở Việt Nam từ 1999 đến 2003 nhưng chỉ thực sự trở
nên phổ biến vào năm 2010. Do sự phát triển của công nghệ, SEO ở Việt Nam đi


-3-

chậm hơn so với thế giới khoảng 3-5 năm. Theo thống kê của hiệp hội SEO Việt
Nam, tính tới năm 2012 có khoảng 20.000 người làm SEO, 5.000 doanh nghiệp
sử dụng SEO và khoảng 3.000 doanh nghiệp làm dịch vụ SEO. Ở những nước
phát triển trên thế giới, SEO trong kinh doanh chỉ chiếm một phần, phần khác là
những lĩnh vực như khoa học, giáo dục, giải trí, .v.v... Mặt khác, SEO ở Việt
Nam hầu hết chỉ được ứng dụng trong lĩnh vực kinh doanh, nhưng lại chưa thực
sự phổ biến trong việc tìm kiếm những thơng tin khác, điều nay vơ tình tạo nên
một định kiến về SEO rằng: SEO chỉ là một hình thức quảng cáo trên các cơng
cụ tìm kiếm.
Do đó, việc nghiên cứu và phát triển SEO trong những lĩnh vực tìm kiếm
thơng tin cần được quan tâm, chú trọng hơn ở Việt Nam.

3. Mục đích và nhiệm vụ của đề tài
Mục đích nghiên cứu của đề tài là thông qua việc nghiên cứu bộ máy tìm
kiếm, SEO và các phương pháp để tiến hành SEO một Website. Từ đó, đưa
Website lên các trang đầu với những từ khoá cụ thể.
Nhiệm vụ: Để đạt được mục đích trên, đề tài nghiên cứu “Nghiên cứu và
ứng dụng SEO (Search Engine Optimization)” thực hiện các nhiệm vụ sau:
- Tìm hiểu cấu tạo của bộ máy tìm kiếm.

- Đi sâu và tìm hiểu kĩ hơn về cách lập chỉ mục trong cơ sở dữ liệu, các
chiến lược tìm kiếm, hệ thống xếp hạng, đánh giá thông tin người dùng.
- Xây dựng một Website và SEO Website lên công cụ tìm kiếm Google.


-4-

4. Cơ sở lý luận và phương pháp nghiên cứu
Để đạt được mục đích và nhiệm vụ trên một cách khoa học, nhóm đề tài sử
dụng tổng hợp các phương pháp nghiên cứu cụ thể sau:
- Phương pháp lý thuyết: phương pháp phân tích và tổng hợp lý thuyết.
- Phương pháp thực tiễn: phương pháp thực nghiệm khoa học.

5. Phạm vi nghiên cứu của đề tài
SEO và các mảng đề tài liên quan đến nó đều đã được nghiên cứu ở nhiều
nơi trên thế giới, trong đó có Việt Nam. Vậy nên đề tài sẽ lấy nghiên cứu và ứng
dụng SEO (Search Engine Optimization) với không gian nghiên cứu là Việt Nam.
Đặc biệt là dùng website do chính nhóm xây dựng để tối ưu lên cơng cụ tìm
kiếm làm minh chứng cũng như kết quả của việc áp dụng các kỹ thuật SEO được
nêu trong bài viết của nhóm.

6. Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài
Đề tài khoa học này được ứng dụng cho web, với đối tượng sử dụng là sinh
viên của trường Khoa học Xã hội và Nhân Văn TP.HCM nói chung và sinh viên
khoa Thư viện - Thơng tin học nói riêng, giúp sinh viên hiểu như thế nào là SEO
một website trên cơng cụ tìm kiếm, nâng cao khả năng tìm tin của bản thân.
Bên cạnh đó, khi sinh viên khoa Thư viện – Thông tin đọc đề tài nghiên cứu
khoa học này sẽ tìm ra hướng đi cho việc áp dụng SEO vào công việc thực tế sau



-5-

khi ra trường, giúp họ có khả năng, nền tảng để tự SEO được website thư viện
điện tử của thư viện mình lên top của các cơng cụ tìm kiếm phổ biến hiện nay
như Google, Yahoo hay Bing. Và hơn hết là giúp người dùng tin dễ dàng tiếp
cận gần hơn với nguồn tài nguyên thông tin của thư viện.
Mặt khác, đề tài này còn nhằm phá vỡ những định kiến về SEO. Bởi lẽ,
SEO không chỉ dừng lại ở chỗ là một hình thức quảng cáo trực tuyến chỉ dùng
trong kinh doanh mà đó cịn là một phương pháp giúp tìm tin một cách hiệu quả,
chính xác nhất nhưng khơng làm mất nhiều thời gian.
Ngồi ra, sinh viên khoa sau khi ra trường nếu làm việc trong bộ phận thơng
tin của các cơng ty, doanh nghiệp cũng có thể tự SEO được website của doanh
nghiệp mình mà khơng cần đến các dịch vụ SEO bên ngoài, nâng cao năng lực
nghề nghiệp và cơ hội thăng tiến trong tương lai. nghĩa khoa học: Tính thẩm
mỹ là một trong những đặc trưng văn hóa rất quan trọng đối với dân tộc Nhật
Bản. Do đó, đề tài của bài nghiên cứu sẽ giúp tìm hiểu được phần nào về tính
cách dân tộc cũng như văn hóa Trà đạo của đất nước này. Đồng thời mang tính
cập nhật, bổ sung thêm về mặt kiến thức, giới thiệu và tìm hiểu về khái niệm
cảm thức thẩm mỹ, cách nhìn nhận về cảm thức thẩm mỹ wabi và sabi trong văn
hóa Nhật Bản.

7. Kết cấu của đề tài
Với mục đích và nhiệm vụ trên, ngồi phần mở đầu; phần kết luận và phần
danh mục tài liệu tham khảo thì đề tài được kết cấu thành ba chương, tám tiết và
mười tám tiểu tiết.


-6-

PHẦN NỘI DUNG

CHƯƠNG 1
BỘ MÁY TÌM KIẾM (SEARCH ENGINE)

1.1. Khái quát về bộ máy tìm kiếm:
1.1.1. Định nghĩa:
Ra đời đầu tiên vào năm 1993, đến nay, Search Engine đã trở thành một
phần không thể thiếu của cuộc sống, và không ngừng được cải thiện về số lượng
và chất lượng các kết quả tìm kiếm. Sự phát triển của Search Engine được gắn
liền với sự phát triển của công nghệ thông tin toàn cầu, và đặc biệt gắn liền với
sự thay đổi của ngành dịch vụ SEO.
Bộ máy tìm kiếm - Search Engine (tên đầy đủ là Web Search Engine) là
công cụ được xây dựng trên nền tảng web cho phép người sử dụng tìm kiếm
thơng tin trên mạng World Wide Web. Khi người dùng sử dụng cơng cụ tìm
kiếm, họ sẽ cần phải nhập một từ khóa tìm kiếm (keyword) của chủ đề cần tìm
hiểu thơng tin để có thể nhận về một bảng kết quả tìm kiếm các website, hình
ảnh. video, địa chỉ bản đồ (đối với tên địa danh) hoặc các loại files tài liệu,… có
liên quan đến chủ đề tìm kiếm đó.
Các kết quả trả về này sẽ được sắp xếp theo một thứ tự nhất định bằng các
thuật tốn tìm kiếm của Search Engine, và tùy vào mỗi Search Engine mà chúng
ta tại có một thuật tốn tìm kiếm khác nhau. Do khơng hề được can thiệp bởi con
người, nên các kết quả trả về này cịn được gọi là kết quả tìm kiếm tự nhiên
(Organic Search Traffic).


-7-

Bộ máy tìm kiếm được tạo thành bởi ba bộ phận là: bộ phận thu thập dữ liệu
– Spider , bộ phận lập chỉ mục – Index, bộ phận đảm nhận truy vấn và xếp hạng
website – Query.
1.1.2. Một số bộ máy tìm kiếm thơng dụng.

Hiện nay, Search Engine là một mảng thị phần cạnh tranh rất gay gắt trên
toàn cầu, với ngôi đầu bảng tạm thời rơi vào tay Google Search, với thị phần
người dùng trung bình trên tồn cầu rơi vào khoảng trên 70%. Cụ thể:

Hình 1.1: Thị phần tìm kiếm trên tồn cầu của Search Engine năm 2014
Ảnh: dautuseo.com
Tuy nhiên, tại Nga và một số các quốc gia Đông Á, Google lại để mất vị thế
dẫn đầu của mình vào tay các đối thủ khác. Cụ thể, Yandex là cơng cụ tìm kiếm


-8-

được sử dụng nhiều nhất tại Nga với 61,9% thị phần tìm kiếm. Tại Trung Quốc,
Baidu là cơng cụ tìm kiếm phổ biến nhất, Naver tại Hàn Quốc, Yahoo! Japan tại
Nhật Bản và Yahoo! Taiwan tại Đài Loan [2].
Việt Nam là một trường hợp khá đặc biệt khác. Tại Việt Nam, Cốc Cốc là
cơng cụ tìm kiếm có lượng người truy cập hàng tháng và hàng ngày nhiều nhất.
Tuy nhiên, các kết quả tìm kiếm trả về trên cơng cụ tìm kiếm này phần lớn được
thực hiện bởi Google Search. Vì vậy, trên lý thuyết, Google Search sẽ là cơng cụ
tìm kiếm được sử dụng nhiều nhất tại Việt Nam hiện nay.
 Sự khác nhau giữa các cơng cụ tìm kiếm
Mặc dù nguyên tắc hoạt động cơ bản của tất cả các cơng cụ tìm kiếm là như
nhau, sự khác biệt nhỏ giữa chúng dẫn đến những thay đổi lớn trong các kết quả
liên quan. Đối với các công cụ tìm kiếm khác nhau, các yếu tố khác nhau rất
quan trọng. Có những lúc, khi các chuyên gia SEO nói đùa rằng các thuật toán
của Bing được cố ý làm chỉ với mục đích đối nghịch với những người của
Google.
Có rất nhiều ví dụ về sự khác biệt giữa các cơng cụ tìm kiếm. Ví dụ, đối với
Yahoo! và Bing, các yếu tố từ khóa trên trang quan trọng hàng đầu, trong khi đó
đối với Google thì các liên kết và nội dung lại rất quan trọng [3]. Ngoài ra có một

sự khác biệt rất lớn giữa các cơng cụ tìm kiếm đó là về khả năng lập chỉ mục (các
từ khoá), đối với Yahoo! hoặc Bing bạn sẽ cần rất nhiều thời gian để một website
được lập chỉ mục trong kết quả tìm kiếm, tuy nhiên đối với Google bạn chỉ cần
vài tiếng. Điều này chứng tỏ khả năng lập chỉ mục của Google nhanh hơn rất
nhiều lần so với Yahoo! và các công cụ khác.


-9-

1.2. Cấu tạo chung của bộ máy tìm kiếm
Bộ máy tìm kiếm thường được cấu tạo bởi 3 bộ phận: bộ thu thập thông tin,
bộ lập chỉ mục và bộ truy vấn thông tin.
1.2.1. Bộ thu thập thông tin – Spider:
Mỗi bộ máy tìm kiếm có một spider với tên gọi riêng, của Google là
Googlebot, của Bing là Bingbot, của Baidu là Baiduspider…
Một cách đơn giản bạn có thể hiểu rằng đây là một quá trình mà spider sẽ đi
từ trang này sang trang khác để khám phá nội dung và các liên kết trong website
của bạn. Chính vì thế, spider có thể coi là một chương trình thu thập dữ liệu và
phát hiện ra các website mới, thay đổi các website hiện có và truy tìm các liên
kết khơng tồn tại, các dữ liệu này được sử dụng để cập nhật cho các chỉ mục của
nó.
Tuy Spider được lập trình là một bộ phận thơng minh nhưng nội dung và
cấu trúc phức tạp của website (không phân biệt được nội dung quảng cáo, nội
dung phụ so với nội dung chính), các đoạn nhúng Javascript, AJAX, Flash hay
các tập tin đa phương tiện như image, video,… cũng sẽ gây ra khó khăn trong
việc tìm kiếm và rút trích thơng tin của Spider. Muốn khắc phục được điều này
cũng như giúp cho việc SEO website hiệu quả, chúng ta có thể viết theo đúng
chuẩn Html5, sử dụng các phương pháp tăng ngữ nghĩa cho nội dung web, đối
với nội dung đa phương tiện bằng các kỹ thuật: mơ tả, chú thích, đính kèm,…
1.2.2. Bộ lập chỉ mục – Index:

Hệ thống lập chỉ mục hay cịn gọi là hệ thống phân tích và xử lý dữ liệu,
thực hiện việc phân tích, trích chọn những thông tin cần thiết (thường là các từ
đơn, từ ghép, cụm từ quan trọng), loại bỏ những stopword (các từ quá thông


- 10 -

dụng như mạo từ a, an, the,…) từ những dữ liệu mà spider thu thập được và tổ
chức thành cơ sở dữ liệu riêng để có thể tìm kiếm trên đó một cách nhanh chóng,
hiệu quả. Hệ thống chỉ mục là danh sách các từ khoá, chỉ rõ các từ khoá nào xuất
hiện ở trang nào, địa chỉ nào.
Giống như chỉ mục ở phía sau của một cuốn sách, Google lập chỉ mục cũng
bao gồm thông tin về các từ và vị trí của chúng. Khi bạn tìm kiếm, ở mức cơ bản
nhất, các thuật toán của chúng tơi sẽ tra cứu những cụm từ tìm kiếm của bạn
trong chỉ mục để tìm các trang phù hợp.[4]
1.2.3. Bộ truy vấn thơng tin - Query
Là những gì người dùng nhìn thấy hay cịn gọi là giao diện khi sử dụng bộ
máy tìm kiếm. Nó bao gồm ơ để gõ từ khóa và ra lệnh tìm kiếm. Bộ máy tìm
kiếm sẽ đưa ra những website phù hợp, liên quan đến từ khóa của bạn. Tuy vậy,
thực chất thì bộ phận chịu trách nhiệm truy vấn query khơng trực tiếp tìm kiếm
các website, nó chỉ lấy ra các dữ liệu đã được bộ phận lập chỉ mục index lưu trữ,
đánh giá và sắp xếp.
Các bộ phận này hoạt động liên tục từ lúc khởi động hệ thống, chúng phụ
thuộc lẫn nhau về mặt dữ liệu nhưng độc lập với nhau về mặt hoạt động. Bộ máy
tìm kiếm tương tác với người dùng thơng qua giao diện web, có nhiệm vụ tiếp
nhận và trả về những tài liệu thoả yêu cầu của người dùng.


- 11 -


1.3. Hoạt động của bộ máy tìm kiếm:

Hình 1.2: Sơ đồ hoạt động của Search Engine
Ảnh: www.seotongthe.vn
Có 3 loại cơng cụ tìm kiếm cơ bản: chương trình máy tính tự động – robot
(được biết đến dưới tên gọi khác nhau crawler, spider) – bộ thu thập thông tin;
các thư mục do con người quản lý và cập nhật; kết hợp cả tìm kiếm tự động và
các thư mục do con người quản lý.
 Các cơng cụ tìm kiếm dựa trên chương trình tự động
Các cơng cụ tìm kiếm dựa trên chương trình tự động, tức là các cơng việc
được tự động hố theo một quy trình đã được lập trình sẵn mà khơng có sự can
thiệp của con người. Đầu tiên bộ máy tìm kiếm, tiêu biểu là Google sẽ tạo danh
sách tất cả các chủ đề, ví dụ như du lịch, ẩm thực, vật lý…, sau đó các bộ thu
thập thông tin đưa các spider đã được lập trình tự động dị qt các website, đi


- 12 -

theo các liên kết nội bộ, xem xét nội dung. Tiếp theo bộ lập chỉ mục sẽ đánh chỉ
mục cho từng website và lưu vào trong danh sách có sẵn theo chủ đề. Giờ đây
bản lưu của tất cả website bọ tìm kiếm qt được đã có sẵn trong cơ sở dữ liệu
của Google. Khi người dùng tìm kiếm, bộ truy vấn thơng tin sẽ tìm kiếm trong
cơ sở dữ liệu, chứ khơng phải tìm kiếm trong tồn bộ thế giới Internet nên chỉ
mất một khoảng thời gian cực ngắn. Ngồi ra các spider tìm kiếm cũng được lập
trình dị qt theo chu kỳ, thường là 1-2 tháng để cập nhật lại sự thay đổi trên các
website. Tất cả các cơng đoạn đều hồn tồn khơng có sự can thiệp của con
người cho nên có thể nói các cơng cụ tìm kiếm dựa trên chương trình tự động.
 Các thư mục do con người quản lý
Các thư mục do người quản lý, ví dụ Open Directory (Dự án Thư mục mở Dmoz1 - sẽ phụ thuộc vào sự quản lý của con người. Bạn đăng ký một website
vào thư mục với vài dịng mơ tả ngắn gọn hay biên tập viên có thể viết phần mơ

tả các website. Điều này có nghĩa, việc tìm kiếm chỉ phù hợp với những nội dung
mô tả đã được đăng ký.
Việc thay đổi những website của bạn khơng có ảnh hưởng đến danh mục
của bạn. Những cách thức để cải thiện danh mục với cơng cụ tìm kiếm sẽ chẳng
liên quan đến cách thức cải thiện vị trí cho một thư mục. Ngoại lệ duy nhất là

1

Dmoz: là thư mục quan trọng nhất trên Internet, các website được đăng ký miễn phí tại đây
sẽ được chỉnh sửa kỹ càng và đưa vào một danh mục đặc thù tại đây. Chỉ có những website có
chất lượng và đăng ký nghiêm túc mới được đưa vào danh bạ của Dmoz. Dmoz là con đường
duy nhất để có mặt trong danh bạ của Google. Dmoz là danh bạ trực tuyến – danh bạ Internet,
nó bắt buộc phải đăng ký vào thư mục thích hợp và sẽ được xem xét bởi biên tập viên tình
nguyện. Cịn những Search Engine khác đều sử dụng phương thức đăng ký website tự
động.[5]


- 13 -

một website tốt với nội dung tốt sẽ có khuynh hướng được đánh giá cao hơn là
một website có nội dung sơ sài.
 Kết hợp 2 dạng trên
Hiện nay, việc kết hợp 2 dạng tìm kiếm dựa trên chương trình tự động và
các thư mục do con người quản lý đã trở nên cực kỳ phổ biến. Sau này nhiều
cơng cụ tìm kiếm hỗ trợ người dùng qua nhiều cách thức khác nhau, nên người ta
khó thấy ranh giới phân chia của các cơng cụ tìm kiếm, thay vào đó là các hệ
thống cơng cụ tìm kiếm gồm nhiều kiểu chức năng khác nhau.Ví dụ, MSN
Search, Yahoo! và Yahoo! Directory, Google và Google Directory…
1.4. Hệ Thống xếp hạng (rank)
Rank website là chỉ việc xếp hạng thứ tự của một website. Có các loại rank

sau:
1.4.1. Alexa rank.
Alexa Rank là thước đo mức độ phổ biến của các website. Alexa đánh giá
chỉ số thứ hạng của website thông qua sự kết hợp của hai yếu tố là số websitesite
người dùng xem (Page View)2 và số người truy cập website (Reach)3.
Các số liệu thống kê của Alexa dựa trên những dữ liệu thu thập được từ
người dùng cài đặt.

2

Page View: là số lượt người dùng truy cập vào website đó, hoặc reload website đó qua một
địa chỉ URL của website.
3
Reach: là số lượng người dùng đã truy cập vào website, dựa theo Cookies trình duyệt và địa
chỉ IP của người dùng


- 14 -

Alexa Toolbar: Cứ 3 tháng 1 lần, Alexa tiến hành tổng kết số liệu và xếp
hạng các website. Alexa Toolbar là một tiện ích giúp người dùng lướt web, (hiện
có khoảng hơn 10 triệu người dùng Internet trên thế giới sử dụng công cụ này).
Chỉ số Alexa rank là thước đo ghi nhận thành quả lao động của các webmaster
với cộng đồng và là một công cụ rất hữu ích giúp các webmaster quản trị website
hiệu quả.
1.4.2. Google PageRanking.
Hiện nay Google PageRank được xem là chỉ số đáng tin cậy nhất đánh giá
giá trị của mỗi websitesite. Chỉ số Google PageRank cao sẽ đem lại ấn tượng
đáng tin cậy cho khách truy cập vào một websitesite, điều này đặc biệt có ý nghĩa
với các website kinh doanh thương mại điện tử. Google PageRank hiện là chỉ số

đáng tin cậy nhất chỉ giá trị của một websitesite, không chỉ bởi những thuật toán
xuất sắc dựa trên hơn 100 chỉ số mà cịn vì Google đánh giá và xếp hạng các
website bằng cả hai phương pháp tự động và thủ công. Một vài chỉ số quan trọng
quyết định Google PageRank của một website: độ hữu dụng của thông tin trên
website, độ phổ biến của website, chất lượng kỹ thuật…Google PageRank được
chia làm 10 bậc và được biểu hiện bằng vạch màu xanh trên nền trắng: Google
PageRank image. Giá trị của mỗi website theo Google PageRank tăng dần từ 1
đến 10.
Thuật ngữ PageRank™ là một thương hiệu được bảo hộ của Google, do
Larry Page và Sergey Brin phát triển tại trường đại học Stanford của Mỹ trong
một dự án nghiên cứu về cơng cụ tìm kiếm năm 1995.
Google PageRank ảnh hưởng trực tiếp tới vị trí hiển thị của mỗi website,
khi cạnh tranh thứ hạng hiển thị trong danh sách kết quả tìm kiếm của Google.
Nếu muốn website tăng thứ hạng trong danh sách kết quả tìm kiếm của Google,


- 15 -

nên nâng cao Google PageRank cho các website trong website. Google
PageRank là một công cụ hỗ trợ các webmaster quản trị website. Đồng thời, một
website có Google PageRank cao phần nào chứng minh năng lực quản trị tốt của
webmaster website đó.

KẾT LUẬN CHƯƠNG 1
Song song với sự phát triển của công nghệ thông tin, Search Engine cũng
ngày càng phát triển, không ngừng đổi mới và trở thành ứng dụng được nhiều
người sử dụng nhất, trở thành một phần khơng thể thiếu của cuộc sống. Ở mỗi
quốc gia có mỗi một Search Engine phổ biến khác nhau; và tuỳ theo mỗi Search
Engine lại trả về cho người sử dụng những kết quả khác nhau. Riêng ở Việt Nam
thì Google Search vẫn là cơng cụ tìm kiếm được sử dụng nhiều nhất. Dựa vào

cấu tạo và hoạt động của Search Engine mà người dùng có thể tìm kiếm thơng tin
một cách dễ dàng và nhanh chóng. Bên cạnh đó, nhờ vào hệ thống xếp hạng, các
webmaster có thể đưa website của mình lên thứ hạng cao và được nhiều người
biết đến hơn. Trong đó, đặc biệt phải kể đến Google Pagerank – chỉ số ảnh
hưởng đến vị trí của các website và cũng chứng minh được năng lực của
webmaster đó.


- 16 -

CHƯƠNG 2
TỐI ƯU HỐ WEBSITE TRÊN CƠNG CỤ TÌM KIẾM
(Search Engine Optimization – SEO)

2.1. Sơ lược về Search Engine Optimization (SEO):
2.1.1. Định nghĩa:
Khi đề cập đến SEO, có rất nhiều định nghĩa về nó. Chẳng hạn như: định
nghĩa về SEO của iNET “SEO (Search Engine Optimization) là tập hợp những
phương pháp tối ưu hóa để website trở lên thân thiện với máy chủ tìm kiếm
(Search Engine) từ đó nâng cao thứ hạng website khi người dùng tìm kiếm với
các từ khóa liên quan”. Hay định nghĩa về SEO của WIKI “Tối ưu hóa cơng cụ
tìm kiếm (SEO - Search Engine Optimization) là một quá trình tối ưu nội dung
văn bản và cấu trúc website để các công cụ tìm kiếm chọn lựa website phù hợp
nhất phục vụ người tìm kiếm trên Internet. Có thể hiểu đơn giản SEO là một tập
hợp các phương pháp nhằm đưa website lên vị trí TOP 10 (trang đầu) trong các
trang kết quả của các Search Engine”
Sau thời gian tìm hiểu cũng như tham khảo và dựa trên những định nghĩa có
sẵn về SEO thì nhóm nghiên cứu đề tài đưa ra định nghĩa sau: SEO (Search
Engine Optimization – Tối ưu hóa cơng cụ tìm kiếm): là quá trình bao gồm các
phương pháp tối ưu hóa website với mục đích nâng cao thứ hạng của website đó

trên các trang kết quả của các cơng cụ tìm kiếm khi người dùng tìm kiếm với các
từ khóa liên quan.


- 17 -

2.1.2. Các thuật ngữ trong SEO:
Dưới đây trình bày các thuật ngữ phổ biến trong SEO:
 SERP: Search Engine Results Page – trang kết quả tìm kiếm. [1, 236]
 Anchor text: là phần nhìn thấy của liên kết tới một website hoặc một file
trên mạng. [1, 236]
 Sitemap: sơ đồ website – liệt kê các nội dung trên website theo cấu trúc.
Có hai định dạng: XML cho Google và HTML cho người dùng. [1, 236]
 Crawler (tên gọi khác: Robot, Spider):là một phần mềm có khả năng tự
động tìm và đọc nội dung các tài nguyên trên mạng. [1, 236]
 Google Penalty: là một hình phạt của Google cho các website mắc lỗi
nghiêm trọng, thường là do thực hiện các kỹ thuật SEO mũ đen. [1, 236]
 Blackhat SEO (SEO mũ đen):là tập hợp những phương pháp SEO giúp
tăng thứ hạng của website bằng việc tập trung vào cơ chế của bộ máy tìm kiếm
mà khơng mang lại giá trị gì cho người dùng cuối.[6]
 Keyword: từ khóa - là từ hoặc cụm từ được dùng để tìm kiếm. [1, 236]
 Từ khóa chính: là từ khóa quan trọng nhất, là chủ đề chính của trang.
Mỗi trang chỉ nên SEO với một và chỉ một từ khóa chính. [1, 236]
 Từ khóa phụ: là những từ khóa dài và chứa từ khóa chính. Mỗi website
chỉ có một từ khóa chính, nhưng có thể có nhiều từ khóa phụ. [1, 236]
 HTML: Hyper Text Markup Language – là ngôn ngữ dùng để định dạng
nội dung website. Google phân tích cú pháp HTML của một website để trích lọc


- 18 -


thơng tin nội dung chính của website đó và sau đó dùng nó để xếp hạng website.
[1, 236]
 SEO Onpage: công việc tối ưu các yếu tố bên trong một website. SEO
Onsite: tối ưu các yếu tố trên tồn bộ website. [1, 236]
 SEO Offpage: bao gồm cơng việc xây dựng liên kết và tăng lượng
khách truy cập vào website, từ đó làm tăng độ uy tín và thứ hạng website. [1,
236]
 Inbound link: liên kết trỏ về (VÀO) website của bạn, từ những website
khác. [1, 236]
 Outbound link: liên kết đi ra khỏi website của bạn, đến những website
khác. [1, 236]
 Backlinks – Link Back – Link Popularity: Liên kết ngược, độ phổ biến
của liên kết. Các thông số này đánh giá mức độ phổ biến của liên kết đến website
của bạn, bạn có càng nhiều liên kết từ những trang khác đến website của bạn, các
công cụ càng đánh giá cao website của bạn. [1, 237]
 Traffic: Là các thơng số được lượng hóa của lượng người truy cập vào

website bạn, số lượng page views, số Kilobyte tải về. [7]

2.2. Các kỹ thuật SEO:
Để tối ưu được một Website trên cơng cụ tìm kiếm thành cơng, chúng ta cần
phải áp dụng một hoặc nhiều kỹ thuật SEO khác nhau. Sau đây, nhóm nghiên
cứu đề tài xin giới thiệu một số kỹ thuật SEO thông dụng và đã được nhóm áp
dụng trên Website do nhóm xây dựng:


- 19 -

2.2.1. Tối ưu hóa nội dung bài viết:

Bài viết là yếu tố chính để đánh giá chất lượng của website. Một bài viết tốt
là bài viết đáp ứng được nhu cầu thơng tin của người dùng, lợi ích nó đem lại
chính là độ tin cậy của người dùng và đó yếu tố chính quyết định thành cơng
trong chiến lược SEO của các cơng ty/tập đồn. Website có được độ tin cậy cao
sẽ thu hút được nhiều lượt truy cập và có traffic tập trung hơn là những website
có độ tin cậy thấp. Bên cạnh đó, một bài viết tốt cũng là một bài viết thân thiện
với bộ máy tìm kiếm.
Bài viết tốt phải chuẩn SEO từ hình thức cho đến nội dung
Về phần hình thức, thứ nhất lời văn không nên quá cầu kỳ và hoa mỹ, câu
chữ càng chân thành, mộc mạc càng dễ đi sâu vào lịng người. Thứ hai, nên ngắn
gọn cả trong cách trình bày, càng ngắn gọn, xúc tích càng tốt, tránh viết lan man,
dài dịng. Nhưng cũng đừng vì q tập trung vào các tiêu chuẩn mà làm bài viết
trở nên khô khan, buồn chán, cần phải thêm yếu tố thuyết phục, thân thiện và
đem lại hứng thú cho người đọc để họ có thể quay lại website của chúng ta. Thứ
ba, phải có lời mở đầu điều hướng, có nghĩa là nội dung bài viết phải có phần mơ
tả để dẫn dắt người dùng. Do đó chúng ta nên bắt đầu với những lợi ích thuyết
phục nhất cũng như mục đích mà bài viết đang hướng đến. Tránh kêu gọi hành
động như like, share hay giật tít ngay đầu bài viết, điều này sẽ khiến cho người
dùng không vui khi chưa nhận được giá trị gì mà họ quan tâm và họ sẽ rời khỏi
bài viết của chúng ta. Một bài viết có chất lượng đối với Google là khi bài viết đó
được nhiều người dùng đọc và quay lại website của chúng ta.
Về phần nội dung, trước khi bắt tay vào viết thì bạn cần phải nắm rõ mình
sẽ viết cái gì, sử dụng các cơng cụ phân tích từ khóa để xem xem từ khóa nào tốt


- 20 -

nhất để đưa vào bài viết, sau đó mới nghĩ đến viết như thế nào. Nội dung bài viết
cần có cấu trúc rõ ràng, vừa có sự nhất quán, vừa phải tuân thủ các tiêu chuẩn về
nội dung. Chúng ta nên tập trung vào nhu cầu của những khách hàng thường

xuyên ghé thăm website và những triển vọng của nó trong tương lai. Ngồi ra
cịn là nhất qn trong cách chọn font chữ, màu chữ. Ngoài ra, google còn đánh
giá chất lượng của một webpage bằng thời gian từ khi người dùng truy cập vào
bài viết đến khi họ nhấn back và thốt ra ngồi, nếu như khoảng thời gian này dài
chứng tỏ rằng bài viết đáp ứng được nhu cầu tin của người dùng. Bên cạnh đó,
cũng nên sử dụng công cụ Google Trends để nắm bắt những chủ đề, xu hướng
đang hot trong cộng đồng mạng. Những bài viết có chủ đề được nhiều người
quan tâm, bình luận sẽ tạo nên những Traffic tuyệt vời cho website của bạn, từ
đó nâng cao thứ hạng trên bảng kết quả tìm kiếm.
Đối với từ khóa:
• Trong tiêu đề bài viết phải chứa từ khóa mà mọi người thường sử dụng để
tìm kiếm và tỉ lệ từ khóa này phải phù hợp với các từ khóa phần nội dung.
• Tuyệt đối tránh việc lạm dụng từ khóa quá nhiều, tức là từ khóa xuất hiện
với tần suất quá dày đặc trong bài viết.
• Nên tạo các Archor Text với đường link dẫn tới các bài viết liên quan đến
nội dung đề cập trong bài viết. Các Archor text được khuyến khích là các từ khóa.
Trùng lặp nội dung là lỗi mà các website thường hay gặp phải, nó xảy ra khi
hai website khác nhau có nội dung giống nhau. Tuy cơ chế tìm kiếm của Google
khơng quy định hình phạt với các trang có nội dung trùng lặp nhưng đối với
những website trùng lặp nội dung có chủ đích, tức là số lượng bài trùng lắp quá
nhiều với những trang khác. Hậu quả là bộ máy tìm kiếm phải phân vân và lựa


- 21 -

chọn xem trang nào phù hợp nhất trong số hàng tá website có nội dung giống
nhau. Cho nên tốt nhất là nên hạn chế việc sao chép bài viết ở những trang khác
mà không hề sửa chữa, điều đó hồn tồn khơng tốt cho website của bạn trên
bảng xếp hạng tìm kiếm.


2.2.2. Tối ưu hóa URL:
Địa chỉ URL là một trong những thành phần của website mà Google dùng
để đánh giá thứ hạng website. Khi tối ưu URL thì tỉ lệ người dùng nhớ và gõ lại
URL đó nếu họ muốn quay lại website sẽ nhiều hơn. Với mỗi URL nên đưa một
từ khóa chính vào, các từ nên phân cách bởi dấu gạch ngang, khi thay đổi một
địa chỉ đã có nhớ sử dụng redirect 301 từ trang cũ sang trang mới để thơng báo
cho máy tìm kiếm hay trình duyệt, máy chủ rằng website hiện tại đã được chuyển
rời tới địa chỉ mới. Vì trước đó Google đã đánh chỉ mục (index) toàn bộ các
trang trên website của bạn, URL của một hay nhiều trang đó thay đổi sẽ dẫn tới
việc các kết quả tìm kiếm link đến trang đó sẽ mất tác dụng. Và chỉ nên sử dụng
một URL duy nhất cho một tên miền và việc sử dụng URL tĩnh là điều cần ưu
tiên vì khi sử dụng URL động sẽ làm cho bộ máy tìm kiếm gặp khó khăn khi đọc
và hiểu URL đang mơ tả cái gì. Địa chỉ URL khơng nên quá dài, vượt quá 55 ký
tự và có quá nhiều từ khóa. Địa chỉ URL được gọi là tối ưu khi URL ngắn và có
tính mơ tả rõ ràng.
URL đã được tối ưu: />

- 22 -

Hình 2.1: Liên kết cố định trong Blogspot
Ảnh: blogspot.com
Không nên để các ký tự như "?", "#", "=", "@", "%","%", "$" trong URL
của mình vì khi có những ký hiệu này thì URL đó chính là những URL động,
URL động này sẽ gây khó khăn cho cơng cụ tìm kiếm (Search Engine - SE) đồng
thời giảm index. Tùy thuộc vào chiến lược SEO mà chúng ta tính tốn khi đưa từ
khóa vào và cách phân bổ sao cho thích hợp. Từ khóa chính nên nằm ngay đầu
URL.
Ví dụ URL động:
/>
2.2.3. Tối ưu hóa hình ảnh:

Hình ảnh là một phần không thể thiếu trong một bài viết, bài viết có hình
ảnh minh họa sẽ thu hút người đọc hơn là những bài viết chỉ có câu chữ khơ
cứng. Khi chèn hình ảnh vào bài viết, chúng ta phải ln sử dụng thẻ mơ tả hình
ảnh ALT cho bất kỳ hình ảnh nào trong website. Tên hình ảnh, thẻ title của hình


×