TRƯỜNG ĐẠI HỌC LẠC HỒNG
KHOA CÔNG NGHỆ THÔNG TIN
----------
BÁO CÁO
NGHIÊN CỨU KHOA HỌC
ĐỀ TÀI:
NGHIÊN CỨU VÀ XÂY DỰNG QUY
TRÌNH TỐI ƯU HÓA CÔNG CỤ TÌM
KIẾM CHO WEBSITE THƯƠNG MẠI
ĐIỆN TỬ
TRƯƠNG HỮU NHƠN
BIÊN HÒA, THÁNG 11/2017
TRƯỜNG ĐẠI HỌC LẠC HỒNG
KHOA CÔNG NGHỆ THÔNG TIN
----------
BÁO CÁO
NGHIÊN CỨU KHOA HỌC
ĐỀ TÀI:
NGHIÊN CỨU VÀ XÂY DỰNG QUY
TRÌNH TỐI ƯU HÓA CÔNG CỤ TÌM
KIẾM CHO WEBSITE THƯƠNG MẠI
ĐIỆN TỬ
SVTH: TRƯƠNG HỮU NHƠN
GVHD: Th.S TẠ NGUYỄN
BIÊN HÒA, THÁNG 11/2017
NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
.............................................................................................................................................
Giáo viên hướng dẫn
(ký họ và tên)
LỜI CÁM ƠN
Sau gần 6 tháng nỗ lực tìm hiểu và thực hiện đề tài “Nghiên cứu và xây dựng
quy trình tối ưu hóa công cụ tìm kiếm cho website thương mại điện tử” đã được hoàn
thành, ngoài sự cố gắng hết mình của bản thân, em còn nhận được nhiều sự động viên,
khích lệ từ gia đình, thầy cô và bạn bè.
Trước hết em xin chân thành cảm ơn cha mẹ, anh chị, là những người luôn gần
gũi, động viên và tạo mọi điều kiện tốt để em hoàn thành luận văn này.
Em xin chân thành cám ơn các thầy cô của trường Đại học Lạc Hồng đã truyền
đạt nhiều kinh nghiệm và kiến thức quý báu cho em trong suốt quá trình học tập ở
trường. Đặc biệt em xin tỏ lòng biết ơn sâu sắc tới thầy Tạ Nguyễn và các thầy cô
trong khoa Công nghệ thông tin đã tận tình giúp đỡ chúng em trong suốt quá trình thực
hiện luận văn tốt nghiệp.
Em cũng xin gởi lời cám ơn đến thạc sĩ, giáo viên phản biện cô Văn Đình Vỹ
Phương đã góp ý giúp em hoàn thiện đề tài.
Xin cảm ơn tất cả các bạn bè đã giúp đỡ động viên em trong quá trình học tập
và hoàn thành luận văn tốt nghiệp này.
Mặc dù đã cố gắng hết sức để hoàn thành luận văn này, nhưng chắc chắn sẽ
không tránh khỏi những thiếu sót. Em rất mong nhận được sự thông cảm và đóng góp,
chỉ bảo tận tình của quý thầy cô và bạn bè. Em xin chân thành cảm ơn.
Biên Hòa, tháng 11 năm 2017
Sinh viên thực hiện
Trương Hữu Nhơn
LỜI NÓI ĐẦU
Internet ngày càng phổ biến rộng rãi, người dùng Internet ngày càng nhiều. Họ
tìm kiếm thông tin, mua bán trao đổi qua mạng nhiều hơn, điều này giúp cho
Marketing Online phát triển. Và rõ ràng khi Internet là kênh tương tác hai chiều thì
Marketing truyền thống sẽ dần yếu thế. Vì vậy, một doanh nghiệp muốn phát triển
vượt bậc theo thời gian phải sử dụng Marketing Online để đưa sản phẩm, hàng hóa và
dịch vụ đến người tiêu dùng một cách nhanh chóng và hiệu quả. Bởi vì Internet chính
là:
•
Nơi khách hàng tra cứu thông tin, sản phẩm, dịch vụ doanh nghiệp.
•
Nơi thể hiện nhu cầu của khách hàng.
•
Cách để doanh nghiệp nắm bắt thông tin về khách hàng.
•
Phương tiện giúp doanh nghiệp dễ dàng quảng cáo đến đối tượng mục
tiêu.
•
Cơ hội giao dịch trực tuyến tiện lợi, linh động nhất giữa khách hàng và
doanh nghiệp.
•
Công nghệ hiện đại nhất theo thời gian, có mặt ở mọi nơi trên thế giới.
•
Hình thức quảng cáo hiệu quả nhờ tính lan truyền nhanh, ít tốn kém chi
phí.
Ngày nay, Google đã quá quen thuộc với người dùng Internet tại Việt Nam, hơn
90% người dùng đều sử dụng Google để tìm kiếm thông tin trước khi đưa ra quyết
định mua hàng. Để có cơ hội tiếp cận được nhóm đối tượng khách hàng đang có nhu
cầu tìm kiếm thông tin về sản phẩm và dịch vụ, doanh nghiệp phải tìm cách đưa
website của mình đạt thứ hạng cao trong kết quả tìm kiếm tự nhiên của Google thì mới
có cơ hội bán được hàng. Do vậy, thứ hạng trên Google đóng vai trò vô cùng quan
trọng của một website đối với doanh nghiệp. Trang web có thứ hạng càng cao trong
kết quả tìm kiếm của Google, cơ hội bán hàng càng nhiều. Đó là lí do các doanh
nghiệp cần phải đầu tư cho việc tối ưu website (SEO – Search Engine Optimization).
Trong luận văn này tôi sẽ nghiên cứu và xây dựng quy trình tối ưu hóa công cụ
tìm kiếm cho những website thương mại điện tử để giúp tăng thứ hạng website và có
nhiều từ khóa đạt thứ hạng cao trên trang một của bộ máy tìm kiếm Google trong thời
gian 3 – 5 tháng.
MỤC LỤC
Trang
PHẦN MỞ ĐẦU.......................................................................................... 1
1. Lý do chọn đề tài .....................................................................................................1
2. Tình hình nghiên cứu trong và ngoài nước ..............................................................1
3. Mục tiêu nghiên cứu ................................................................................................2
4. Đối tượng và phạm vi nghiên cứu ...........................................................................2
4.1. Đối tượng nghiên cứu........................................................................................2
4.2. Phạm vi nghiên cứu ...........................................................................................3
5. Phương pháp nghiên cứu .........................................................................................3
6. Những vấn đề chưa thực hiện được .........................................................................3
7. Kết cấu của đề tài .....................................................................................................3
CHƯƠNG 1: TỔNG QUAN VỀ SEO ...................................................... 5
1.1. Tổng quan về SEO .............................................................................................5
1.1.1. Giới thiệu .....................................................................................................5
1.1.2. Lịch sử ra đời, phát triển của SEO ..............................................................6
1.1.3. Cơ chế hoạt động của Google ...................................................................10
1.1.4. Một số thuật ngữ phổ biến trong SEO ......................................................19
1.1.5. Xu hướng SEO 2017 .................................................................................27
1.2. Vai trò và tầm quan trọng của SEO trong hoạt động kinh doanh ....................31
CHƯƠNG 2: XÂY DỰNG QUY TRÌNH SEO CHO WEBSITE
THƯƠNG MẠI ĐIỆN TỬ ...................................................................................32
2.1. Quy trình SEO truyền thống ...............................................................................32
2.1.1. Nghiên cứu từ khóa ......................................................................................32
2.1.2. Phân tích đối thủ...........................................................................................38
2.1.3. Tối ưu On-page ............................................................................................44
2.1.4. Xây dựng nội dung .......................................................................................46
2.1.5. Xây dựng backlink (liên kết) ........................................................................47
2.2. Quy trình ESEO (Ecommerce SEO) ...................................................................49
2.2.1. Xác định yếu tố cốt lõi của SEO ..................................................................50
2.2.2. Phân tích website..........................................................................................51
2.2.3. Nghiên cứu từ khóa ......................................................................................54
2.2.4. Phân tích đối thủ...........................................................................................58
2.2.5. Chiến lược nội dung .....................................................................................61
2.2.6. Tối ưu On-page ............................................................................................73
2.2.7. Link building (Xây dựng liên kết) ................................................................76
2.3. So sánh hai quy trình ..........................................................................................77
CHƯƠNG 3: THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ ................... 78
3.1. Theo dõi, giám sát website .................................................................................78
3.2. Thử nghiệm và áp dụng vào website noithatsonkim.vn .....................................79
3.3. Đánh giá kết quả .................................................................................................84
KẾT LUẬN ................................................................................................ 90
TÀI LIỆU THAM KHẢO
DANH MỤC HÌNH ẢNH
STT
Hình ảnh
Mô tả
1
Hình 1.1
Archie – Search Engine đầu tiên trên thế giới
2
Hình 1.2
Google Beta Version
3
Hình 1.3
Black Hat – White Hat – Gray Hat
4
Hình 1.4
Quy trình hoạt động của Google
5
Hình 1.5
Các thuật ngữ trong SEO
6
Hình 1.6
Outbound link cải thiện SEO như thế nào
7
Hình 1.7
Google Rankbrain
8
Hình 1.8
Tối ưu trải nghiệm khách hàng trên di động
9
Hình 2.1
Quy trình SEO truyền thống
10
Hình 2.2
Giao diện đầu tiên của Google Keyword Planner
11
Hình 2.3
Thay đổi ngôn ngữ Google Keyword Planner
12
Hình 2.4
Lấy ý tưởng từ khóa
13
Hình 2.5
Khoanh vùng từ khóa, đối tượng mục tiêu
14
Hình 2.6
Danh sách các từ khóa liên quan đến lĩnh vực tìm kiếm
15
Hình 2.7
Lượt tìm kiếm, độ cạnh tranh từ khóa
16
Hình 2.8
Lấy ý tưởng từ khóa dài
17
Hình 2.9
Kết quả gợi ý từ khóa từ Keywordtool.io
18
Hình 2.10
Lấy ý tưởng từ khóa từ site của đối thủ
19
Hình 2.11
Danh sách từ khóa gợi ý từ site của đối thủ
20
Hình 2.12
Kiểm tra chỉ số index của Google trên site đối thủ
21
Hình 2.13
Kiểm tra số liên kết đến site của đối thủ
22
Hình 2.14
Kiểm tra domain có đặt backlink đến site
23
Hình 2.15
Kiểm tra các liên kết đến site đối thủ
24
Hình 2.16
Kiểm tra tiêu đề liên kết – Anchor text
25
Hình 2.17
Chỉ số DA, PA của đối thủ
26
Hình 2.18
Tuổi của site đối thủ phongcachmoc.com
27
Hình 2.19
Kiểm tra index của Google trên site với từ khóa bàn ghế café
28
Hình 2.20
Tối ưu On-page
29
Hình 2.21
Xây dựng backlink từ anchor text
30
Hình 2.22
Quy trình ESEO
31
Hình 2.23
Điều hướng website sử dụng cấu trúc silo
32
Hình 2.24
Cấu trúc URL website theo cấp thư mục
33
Hình 2.25
Cấu trúc Internal Link.
34
Hình 2.26
Các chỉ số của Ahref.
35
Hình 2.27
Từ khóa gợi ý trên Google Search.
36
Hình 2.28
Kiểm tra từ khóa của đối thủ
37
Hình 2.29
Danh sách từ khóa đối thủ đang SEO.
38
Hình 2.30
Phân loại từ khóa
39
Hình 2.31
Comment của khách hàng trên Fanpage đối thủ.
40
Hình 2.32
Tạo Fanpage có chứa từ khóa quảng bá sản phẩm, dịch vụ trên
Facebook.
41
Hình 2.33
Kiểm tra chỉ số DA, PA các trang đứng đầu Google.
42
Hình 2.34
Số lượng domain có backlink trỏ về site.
43
Hình 2.35
Chỉ số TF và CF của đối thủ.
44
Hình 2.36
Mật độ anchor text của phongcachmoc.com (vị trí 1 Google)
45
Hình 2.37
Mật độ anchor text của thegioibanghe.vn (vị trí 2 Google)
46
Hình 2.38
Hiển thị kết quả tìm kiếm trên Google.
47
Hình 2.39
Kiểm tra mật độ từ khóa của site.
48
Hình 2.40
SEO hình ảnh.
49
Hình 2.41
Mô tả ảnh bằng Alternative Text.
50
Hình 2.42
Mô tả title cho ảnh.
51
Hình 2.43
Các yếu tố On-page cơ bản.
52
Hình 3.1
Cài mã Google Analytics, Web Mastertool vào website.
53
Hình 3.2
Giao diện theo dõi website Web Mastertool
54
Hình 3.3
Cấu trúc danh mục của website noithatsonkim.vn
55
Hình 3.4
Từ khóa gợi ý trên Google Search
56
Hình 3.5
Lấy danh sách từ khóa gợi ý từ đối thủ
57
Hình 3.6
Tối ưu Onpage cho sản phẩm “Mẫu ghế bistro GC24”
58
Hình 3.7
H1, H2, mô tả ngắn chứa từ khóa “mẫu ghế bistro” giao diện
code
59
Hình 3.8
Giao diện H1, H2, mô tả ngắn trên site
60
Hình 3.9
Đặt tên, chú thích hình ảnh
61
Hình 3.10
Bố sung nội dung bài viết cho sản phẩm
62
Hình 3.11
Thẻ meta keyword, button chia sẻ mạng xã hội
63
Hình 3.12
Chia sẻ sản phẩm lên mạng xã hội Facebook
64
Hình 3.13
Thứ hạng từ khóa thử nghiệm
65
Hình 3.14
Từ khóa có độ cạnh tranh trung bình
66
Hình 3.15
Thứ hạng từ khóa có độ cạnh tranh trung bình
67
Hình 3.16
Từ khóa có lượng tìm kiếm cao
68
Hình 3.17
Thứ hạng từ khóa có độ cạnh tranh cao
69
Hình 3.18
Số lượng, thứ hạng từ khóa trên Google
70
Hình 3.19
Thông số website ngày 16/10/2017
71
Hình 3.20
Thông số website ngày 12/11/2017
72
Hình 3.21
Danh sách đơn hàng
73
Hình 3.22
Nhu cầu mua hàng của khách trên Fanpage Facebook
74
Hình 3.23
Số người truy cập website
DANH MỤC TỪ VIẾT TẮT
STT
Từ viết tắt
Giải thích
1
SEO
Search Engine Optimization
2
SEM
Search Engine Marketing
3
ROI
Return On Investment
4
SERP
Search Engine Results Page
5
PR
Page Rank
6
URL
Uniform Resource Locator
7
ESEO
Ecommerce Search Engine Optimization
DANH MỤC BẢNG
STT
Tên Bảng
Mô tả
1
Bảng 1.1
Phân loại SEO
2
Bảng 1.2
Bảng tóm tắt các thuật toán thông dụng của Google.
3
Bảng 2.1
Bảng so sánh hai quy trình SEO
1
PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Công nghệ ngày càng phát triển, Google ngày càng lớn mạnh và đóng vai trò
quan trọng trong hoạt động kinh doanh của các doanh nghiệp trên Internet. Điều này
mở ra một thị trường tiềm năng rất lớn, tạo cơ hội kinh doanh thương mại điện tử phát
triển đồng thời cũng là thách thức cho các doanh nghiệp. Thách thức lớn nhất là sự
cạnh tranh giữa hàng ngàn website trên Internet, làm sao để quảng bá thương hiệu,
website của doanh nghiệp đến nhiều người. Các hình thức marketing trước đây không
còn hiệu quả, hình thức quảng cáo để tiếp cận với khách hàng tiềm năng có chi phí khá
cao, ngân sách của doanh nghiệp bị hạn chế về lâu dài sẽ bị thu hẹp, doanh nghiệp bắt
buộc phải thắt chặt chi tiêu. Trong khi đó, doanh nghiệp cần có khách hàng để vượt
qua giai đoạn khó khăn và quảng bá thương hiệu doanh nghiệp trong kinh doanh trực
tuyến.
Hiểu được tầm quan trọng của vấn đề, hình thức tối ưu hóa website (SEO) trên
công cụ tìm kiếm Google có chi phí thấp hơn các hình thức quảng cáo được cho là phù
hợp và mang lại hiệu quả cho doanh nghiệp. Tại Việt Nam, Google là công cụ tìm
kiếm phổ biến nhất của mọi người; do đó tối ưu hóa website để đạt thứ hạng cao trên
trang một Google là phần không thể thiếu trong chiến lược kinh doanh của doanh
nghiệp.
Các quy trình SEO website hiện nay đa số áp dụng chung cho website tin tức,
blog cá nhân có nội dung bài viết cập nhật hằng ngày - một trong những yếu tố giúp
tăng vị trí thứ hạng website trên bộ máy tìm kiếm Google; chưa có một quy trình cụ
thể đối với những website thương mại điện tử, nội dung sản phẩm không thường
xuyên cập nhật, xóa, thêm bớt sản phẩm, nội dung bị hạn chế. Vì vậy, trong luận văn
này tôi sẽ trình bày chi tiết các bước xây dựng quy trình SEO cho website thương mại
điện tử.
2. Tình hình nghiên cứu trong và ngoài nước
Ngoài nước:
Một số bài báo nghiên cứu về SEO:
-
Bài báo “Search engine optimization with Google”: Search engine
optimization (SEO) là một kỹ thuật chiến lược để đưa một trang web xuất hiện trong
các kết quả tìm kiếm hàng đầu của bộ máy tìm kiếm. Sự hiện diện của một tổ chức
2
không chỉ là một cách dễ dàng để tiếp cận được khách hàng mục tiêu mà còn mang lại
nhiều lợi ích cho doanh nghiệp nếu tối ưu hóa website đúng thời điểm người sử dụng
tìm kiếm. Tuy nhiên, bài báo chỉ đề xuất các phương pháp mới hoặc các yếu tố liên
quan tối ưu hóa công cụ tìm kiếm để thúc đẩy có nhiều người dùng đến trang web ở
mức độ khái quát, không chi tiết cho website nào.[8]
-
Bài báo “Search Engine Optimization in 2013” by Michael David: Thảo
luận về lý do tại sao SEO di động ngày càng trở nên quan trọng. Người dùng đang dần
dần sử dụng điện thoại di động để truy cập vào web và dự kiến sẽ vượt xa khả năng
truy cập web từ cá nhân. Về cơ bản, SEO luôn đổi mới theo cách này hay cách khác
nhưng chủ yếu gồm hai phần: SEO Onpage và SEO Offpage.[7]
-
Bài báo “The Role and Importance of Search Engine and Search Engine
Optimization” by Ayush Jain: Bài báo cung cấp cho độc giả những thông tin cập nhật
phù hợp liên quan đến những thay đổi liên tục của công cụ tìm kiếm tối ưu hóa SEO
vào năm 2013, miêu tả vai trò và tầm quan trọng của công cụ tìm kiếm trong công
việc. SEO là tập hợp các kỹ thuật giúp trang web có thể tăng vị trí xếp hạng trong công
cụ tìm Google. SEO được chia thành hai phần: SEO Onpage và Offpage.[1]
Tóm lại, những bài báo chỉ đề cập SEO ở mức độ khái quát các yếu tố liên quan
để tăng thứ hạng website và tầm quan trọng của SEO trong công cụ tìm kiếm, không
trình bày chi tiết làm như thế nào cho từng loại website cụ thể.
Trong nước:
Ở Việt Nam chưa có một nghiên cứu nào cụ thể về SEO mà đa phần áp dụng từ
những kiến thức website, diễn đàn hay blog cá nhân. Các công ty đào tạo SEO nổi
tiếng hiện nay: VietMoz, Vinalink, … chủ yếu đào tạo quy trình SEO chung cho các
website, chưa cụ thể hóa việc tối ưu cho website thương mại điện tử, nội dung bài viết
không nhiều.
3. Mục tiêu nghiên cứu
-
Xây dựng quy trình ESEO (Ecommerce SEO - SEO website thương mại
điện tử).
-
Tăng thứ hạng website bằng việc đưa nhiều từ khóa đạt thứ hạng trên
trang một bộ máy tìm kiếm Google (thời gian 3 đến 5 tháng).
4. Đối tượng và phạm vi nghiên cứu
4.1. Đối tượng nghiên cứu
3
Các kỹ thuật SEO từ khóa hiện nay sau khi đưa ra nhận xét, đánh giá các tiêu
chí như (tốc độ, độ ổn định, mức độ quản lý, bảo mật…), cấu trúc website, các yếu tố
xếp hạng của Google.
4.2. Phạm vi nghiên cứu
Những website thương mại điện tử Tiếng Việt có sản phẩm chứa từ khóa nằm
trang một Google.
5. Phương pháp nghiên cứu
-
Nghiên cứu, học hỏi cách SEO của đối thủ đang có thứ hạng cao trên
Google.
-
Phân tích số liệu, thị trường, nhu cầu của khách hàng đối với sản phẩm,
dịch vụ cần SEO của doanh nghiệp để tăng thứ hạng của website trên Google.
-
Nghiên cứu sản phẩm của doanh nghiệp để am hiểu về sản phẩm, thiết
kế, quy cách, mẫu mã viết bài mô tả sản phẩm đáp ứng nhu cầu khách hàng.
-
Theo dõi, giám sát hoạt động website tiến hành xây dựng lại quy trình
SEO.
-
Triển khai, thử nghiệm trên website thương mại điện tử có domain mới
thành lập.
-
Đánh giá, đo lường và bổ sung.
-
Kết luận và hướng phát triển của đề tài trong tương lai.
6. Những vấn đề chưa thực hiện được
Đề tài đang giai đoạn nghiên cứu và triển khai thử nghiệm để tìm ra kỹ thuật
SEO bền vững đưa từ khóa nhanh đạt thứ hạng cao trong kết quả tìm kiếm tự nhiên
của Google (3 đến 5 tháng) đối với những website có domain (tên miền) mới thành
lập. Tuy nhiên do thời gian và kiến thức có hạn nên tôi chỉ mới thử nghiệm ở dự án
website nội thất Sơn Kim, còn nhiều vấn đề, lĩnh vực khác cần tiếp tục học hỏi.
7. Kết cấu của đề tài
Luận văn được chia làm ba phần: phần mở đầu, phần nội dung và phần kết luận.
Phần mở đầu
Giới thiệu sơ lược, tổng quan về lý do chọn đề tài, lịch sử nghiên cứu, mục tiêu
nghiên cứu, đối tượng và phạm vi nghiên cứu, phương pháp nghiên cứu, những vấn đề
tồn đọng, hướng phát triển của đề tài để có cái nhìn khái quát.
Phần nội dung chính: gồm 3 chương
4
Chương 1: Tổng quan về SEO
Giới thiệu lý thuyết, lịch sử ra đời và phát triển của SEO, các thuật ngữ, thuật
toán SEO, cơ chế làm việc, cách index của Google để mọi người có cái nhìn tổng quát
nhất về SEO.
Chương 2: Xây dựng quy trình SEO website thương mại điện tử
Nêu chi tiết các bước thực hiện hai quy trình SEO truyền thống và ESEO, sau
đó so sánh hai quy trình.
Chương 3: Thử nghiệm và đánh giá kết quả
Triển khai đẩy từ khóa SEO lên trang một Google và đo lường, đánh giá kết
quả đạt được.
Phần kết luận
Kết luận chung cho toàn bộ đề tài.
Đánh giá, nhận xét tổng quan, hướng phát triển của đề tài trong tương lai.
5
CHƯƠNG 1: TỔNG QUAN VỀ SEO
1.1.
Tổng quan về SEO
1.1.1.
Giới thiệu
Trong những năm gần đây, SEO đã và đang trở nên gần gũi với tất cả mọi
người. Mười năm trước, BillGate đã từng nói: “Trong vòng 5-10 năm nữa nếu không
kinh doanh trên mạng thì tốt nhất đừng bao giờ kinh doanh nữa”. Điều đó đúng đến
tận ngày nay, hơn 90% người kinh doanh trên mạng chọn chiến lược tìm khách hàng
tiềm năng qua kênh tìm kiếm Google. Có rất nhiều bộ máy tìm kiếm hiện nay như
Google, Bing, Yahoo, Baidu, Ask,… nhưng Google chiếm đến gần 80% lượng người
sử dụng. Do đó, được xuất hiện ở trang đầu trong bộ máy tìm kiếm Google là mục
tiêu tối thượng của các nhà kinh doanh trên mạng. Những website đứng đầu trang nhất
Google chiếm tỷ lệ click đến 67%, thậm chí được xuất hiện ở trang đầu và không
được xuất hiện được xem là ranh giới giữa thịnh vượng và phá sản. Chính vì lẽ đó,
ngày càng nhiều dịch vụ đào tạo SEO ra đời, được xây dựng và phát triển nhằm phục
vụ cho công việc kinh doanh của doanh nghiệp.
-
SEO là gì?
SEO là từ viết tắt của Search Engine Optimizer (tối ưu hóa bộ máy tìm kiếm),
là kỹ thuật chiến lược để đưa website xuất hiện trên trang đầu của bộ máy tìm kiếm
Google.
Theo định nghĩa của Wikipedia:
“SEO là tập hợp những phương pháp tối ưu hóa để website trở nên thân thiện
máy chủ tìm kiếm (Search Engine) từ đó nâng cao thứ hạng Website khi người dùng
tìm kiếm với các từ khóa liên quan”.
-
Phân loại:
Có 2 trường phái SEO tồn tại song song: White Hat SEO và Black Hat SEO.
6
Bảng 1.1. Phân loại SEO.
Phân loại SEO
Mục đích
Tập trung truyền tải nội dung có giá trị và liên
quan đến người tìm kiếm.
White Hat SEO
Tập trung vào các chỉ tiêu đánh giá của Google,
làm một cách tự nhiên với người đọc, tự nhiên
với bộ máy tìm kiếm SEO bền vững.
Tập trung tối ưu nội dung để cho bộ máy tìm
kiếm chấm điểm, không truyền tải nội dung giá
trị cho người đọc.
Black Hat SEO
Sử dụng những thủ thuật để lách luật chấm
điểm của Google, nội dung thường nghèo nàn,
không giá trị, nhồi nhét từ khóa, đi spam link.
1.1.2.
-
Lịch sử ra đời, phát triển của SEO
Thời kỳ hình thành và bắt đầu:
SEO vẫn luôn luôn có sự ảnh hưởng đến kết quả của các công cụ tìm kiếm
(Search Engines). Trước khi có sự ra đời của các công cụ tìm kiếm hiện đại, đã có rất
nhiều công cụ tìm kiếm giúp cho việc tổ chức và lưu trữ thông tin từ các website trên
Internet.
Một số công cụ tìm kiếm được cho là ra đời sớm nhất đã xuất hiện vào những
năm đầu của thập niên 90s. Trong đó bao gồm cả phiên bản đầu tiên của Yahoo (công
cụ tìm kiếm giống một trang danh bạ lưu trữ thông tin website hơn là những gì mà bây
giờ chúng ta có thể thấy ở các công cụ tìm kiếm hiện tại).
7
Hình 1.1: Archie – Search Engine đầu tiên trên thế giới.
Có phần chịu ảnh hưởng từ cách sắp xếp dữ liệu của những trang danh bạ
(Yellow Page), những người làm SEO (SEOers) giai đoạn này thường lợi dụng vào
cách thức sắp xếp theo thứ tự Alphabet để giúp trang web có những vị trí đầu tiên trên
các công cụ tìm kiếm. Đó là lí do vì sao thời điểm đó có nhiều trang web có title như
“AAA”, “1ForU”.
Thêm vào đó các SEOer lúc này đã tìm ra quy luật và vận dụng triệt để cách
thức xếp hạng của công cụ tìm kiếm. Bằng cách lợi dụng trình tự thời gian để submit
trang web vào một số thời điểm nhất định, đó là lúc mà các công cụ tìm kiếm thực
hiện việc sắp xếp dữ liệu (thường là nửa đêm). Và tất nhiên trang web của họ sẽ trở
thành những kết quả đầu tiên xuất hiện cho các truy vấn của người dùng.
Những năm sau đó, các công cụ tìm kiếm mới hơn lần lượt xuất hiện (Alta
Vista, AOL, Inktomi …) với việc áp dụng các thuật toán phức tạp hơn trong việc sắp
xếp dữ liệu tìm kiếm. Những thuật toán được phát triển đã sử dụng những yếu tố liên
quan đến mật độ từ khóa (keyword density) và những thẻ meta như “meta keywords”
để giúp các công cụ tìm kiếm tăng thêm khả năng nhận biết nội dung các trang web.
Những SEOer lúc đó lại tận dụng những yếu tố này để tối ưu các trang web với “nhiều
từ khóa lặp đi lặp lại nhiều lần” trong nội dung và thẻ meta keywords (còn gọi là
keyword stufffing) để làm tăng mức độ liên quan của trang web.
Những năm đầu của thập niên 90s, một số hội nhóm chính thức đã được thành
lập để thảo luận về SEO (lúc đó SEO chưa được gọi bằng cái tên này). Cụm từ
“Search Engine Optimization” hay còn gọi tắt là SEO được đặt ra khoảng năm 1997
bởi một người không rõ danh tính. Danny Sullivan (một trong những chuyên gia hàng
đầu về Search Engines) đã chú thích rằng lần đầu tiên ông tìm thấy cụm từ này được
sử dụng vào khoảng tháng 5 năm 1997 trên một thẻ meta tag tại website của Danny
8
Sullivan lúc bấy giờ - Seachenginewatch.com. Và Danny cũng thừa nhận rằng có thể
thuật ngữ này đã từng được sử dụng trước đây nhưng không tìm thấy được những bằng
chứng lưu trữ.
Vào khoảng cuối những năm thập niên 90, các công cụ tìm kiếm lớn và hiện đại
bắt đầu sử dụng những yếu tố dựa trên liên kết để xếp hạng kết quả tìm kiếm (Offpage). Và Alta Vista là một trong số đó, họ tuyên bố chính thức sẽ sử dụng yếu tố phổ
biến liên kết trong xếp hạng trang web. Về phía Google họ muốn tạo ra sự khác biệt
của chính mình bằng việc ra đời thuật toán Pagerank. Bằng cách này Google có thể lọc
ra những trang web kém chất lượng và ảnh hưởng đến kết quả tìm kiếm của người
dùng.
Hình 1.2: Google Beta Version
Như một sự thành công của các công cụ tìm kiếm, SEO trở thành một môi
trường tiềm năng có khả năng đem đến lợi ích kinh doanh. Và như một tất yếu của sự
phát triển, các kỹ thuật SEO ở những giai đoạn tiếp theo trở nên ngày càng đa dạng và
phức tạp hơn (Link network, paid links, content optimiztion …) và các công cụ tìm
kiếm (chủ yếu là Google) bắt đầu tìm cách tích hợp các nguồn tài nguyên để chống lại
yếu tố spam. Đó là tình trạng của ngành công nghiệp SEO tồn tại cho đến ngày hôm
nay.
-
Giai đoạn chuyển sang kỷ nguyên mới:
Khi việc thực hiện tìm thông tin trên web đã trở nên quen thuộc. Ngành công
nghiệp SEO đã hình thành và phát triển một cách chuyên nghiệp hơn, bắt đầu xuất
hiện các buổi hội thảo lớn và rất nhiều các tổ chức chuyên nghiệp lớn lần lượt ra đời.
Những buổi hội nghị về SEO mà tiêu biểu là Search Marketing Expo (SMX) và Search
9
Engine Strategies (SES), đã được tổ chức trên năm châu lục và thu hút hàng ngàn
người đến tham dự.
Vào năm 2009, Search Engine Marketing Professional Organization (SEMPO)
đã ước lượng được rằng khoảng hai tỷ USD được đầu tư cho các dịch vụ SEO trong
một năm. Và trong cùng khoảng thời gian đó tạp chí Forbes đã tiến hành một cuộc
khảo sát với tiêu đề “Khảo sát hiệu quả các chiến dịch quảng cáo năm 2009” và kết
quả cho thấy rằng 53% các giám đốc marketing cao cấp của doanh nghiệp đã lên kế
hoạch chi tiêu hơn một triệu USD cho các dịch vụ SEO (nhiều hơn bất cứ hình thức
tiếp thị nào trên thị trường Internet Marketing).
Các doanh nghiệp lớn đã bắt đầu quan tâm đến vấn đề và phổ biến nhất là việc
các công ty nằm trong danh sách Fortune 500 (Là bảng xếp hạng danh sách 500 công
ty lớn nhất Hoa Kỳ theo tổng thu nhập mỗi công ty và là một chuyên trang của CNN)
đã thuê các team SEO để phục vụ trong chính doanh nghiệp của họ (In-house SEO).
Sau đó, các doanh nghiệp vừa và nhỏ cũng bắt đầu thuê những team làm SEO trong
chính doanh nghiệp của mình. Tại thời điểm đó, trên các trang tìm việc lớn hàng đầu
nước Mỹ như monter.com, khi tìm kiếm từ khóa SEO sẽ có hàng trăm kết quả tìm
kiếm các vị trí các ứng viên trên toàn nước Mỹ.
-
Góc nhìn về SEO: Black Hat, White Hat, Gray Hat
Con người chúng ta có rất nhiều tính cách khác nhau. Khi dấn thân vào một môi
trường làm việc cụ thể, chính những tính cách đó sẽ chi phối chúng ta đến những
hướng đi rất khác nhau. Bất kỳ lĩnh vực nào nói chung hay chính SEO cũng không có
sự ngoại lệ. Trải qua những giai đoạn hình thành và phát triển nhiều thập kỷ qua,
chúng ta nhận thấy có rất nhiều nhóm người triển khai SEO với nhiều phương pháp
tiếp cận và suy nghĩ khác nhau với mục đích chung là đạt được những thứ hạng tốt
nhất trên các công cụ tìm kiếm.
Black Hat SEO: thường chỉ những đội, nhóm người sử dụng các thủ thuật nhằm
qua mặt các quy định của công cụ tìm kiếm. White Hat SEO: những người luôn tuân
thủ triệt để các quy định mà các công cụ tìm kiếm đặt ra. Hầu hết các SEOer hiện nay
đều nằm giữa ranh giới của hai nhóm trên và được gọi là Gray Hat SEO.
10
Hình 1.3: Black Hat – White Hat – Gray Hat.
White Hat SEO là những người thực hiện các chiến dịch SEO luôn tuân thủ
tuyệt đối các quy định mà các công cụ tìm kiếm đưa ra, cụ thể là Google – công cụ tìm
kiếm có lượng người dùng lớn nhất thế giới hiện nay (Google Webmaster Guidelines).
Và các chiến dịch SEO thường diễn ra trong khoảng thời gian dài hạn.
Theo một nhận định khách quan của Dany Dover – một chuyên gia lâu năm và
có kinh nghiệm hàng đầu về SEO trên thế giới “Theo kinh nghiệm của tôi, tôi chưa
từng gặp một người nào trong ngành công nghiệp SEO này tuân thủ 100% các quy
định của các công cụ tìm kiếm”. Hầu hết SEOers thường vi phạm một phần nào đó các
quy định mà các công cụ tìm kiếm đưa ra thông qua việc mua bán liên kết hay thu thập
dữ liệu tìm kiếm để phân tích (scrape search engine results). Tuy nhiên White Hat
SEO là những người thường hoạt động rất tích cực trong cộng đồng và là một trong
những sự lựa chọn hàng đầu của các tập đoàn, các công ty lớn đang tìm kiếm một
chuyên gia tư vấn chiến lược Online Marketing dài hạn và bền vững.[6]
1.1.3.
-
Cơ chế hoạt động của Google
Các công cụ tìm kiếm hoạt động dựa trên ba bộ phận chính:
+ Robot (Spider): phần mềm tự động dò tìm và đọc nội dung trên Internet.
+ Index (đánh chỉ mục): công đoạn phân loại, xếp hạng nội dung ứng với mỗi
từ khóa lưu trữ nội dung đó trong cơ sở dữ liệu.
+ Algorithms: các thuật toán phân loại, sắp xếp nội dung: Panda, Penguin, …
11
Hình 1.4. Quy trình hoạt động của Google.
-
Quy trình vận hành của công cụ tìm kiếm Google:
Google kích hoạt phần mềm tự động có tên là Spider.
Spider bò vào các website trên Internet đã biết địa chỉ.
Spider tìm và đọc nội dung trên website đó và đưa về máy chủ Google.
Google thực hiện phân tích:
+ Số từ trong bài viết, mỗi từ xuất hiện trong bài viết bao nhiêu lần và mật
độ từ đó ra sao?
+ Đếm tổng số link vào và link ra khỏi trang web.
+ Và các yếu tố khác trên trang (như tối ưu On-page như thế nào…)
Google kiểm tra nội dung bài viết có bị trùng lặp với trang web khác đã
từng thu thập hay không? Nếu nội dung tươi mới, Google bắt đầu index
(phân loại + xếp hạng + lưu trữ) thông tin trên website đó.
Người dùng sử dụng từ khóa để tìm kiếm trên công cụ tìm kiếm Google.
Google sẽ tìm trong cơ sở dữ liệu đã có sẵn và trả về kết quả cho người
dùng, kết quả trả lại cho người dùng đã được sắp xếp từ trước ứng với từ
khóa người dùng đang tìm kiếm.
12
-
Cơ chế hoạt động của Google Spider:
Index (đánh chỉ mục): Đầu tiên Google Spider sẽ lấy danh sách các máy chủ và
trang web phổ biến. Sau đó nó sẽ bắt đầu tìm kiếm với một website bất kỳ, nó đánh chỉ
mục các từ khóa trên trang và theo các liên kết (link) tìm thấy bên trong trang web này.
Khi Spider xem xét các trang web (định dạng HTML), nó lưu ý: Các từ bên trong
trang web và nơi Google Spider tìm thấy các từ đó.
VD: các từ xuất hiện trong các thẻ tiêu đề, thẻ miêu tả,… Spider nhận định đây
là phần quan trọng có liên quan đến sự tìm kiếm của người dùng sau này.
Vì thế đối với mỗi website, Google sẽ có nhiều phương pháp để index lập chỉ
mục, liệt kê lại các từ khóa chính. Nhưng dù dùng cách nào thì Google cũng luôn cố
gắng làm cho hệ thống tìm kiếm diễn ra nhanh hơn để người dùng có thể tìm kiếm
hiệu quả hơn hoặc cả hai.
Xây dựng chỉ mục: việc xây dựng chỉ mục sẽ giúp cho các thông tin được tìm
thấy một cách nhanh chóng. Sau khi tìm thông tin trên trang web, Google Spider nhận
ra rằng việc tìm kiếm thông tin trên website là một quá trình không bao giờ kết thúc…
bởi vì các quản trị trang web luôn thay đổi thông tin, cập nhật thông tin trên website và
điều đó có nghĩa rằng Spider sẽ luôn phải thực hiện nhiệm vụ thu thập dữ liệu.
VD: SEO về bàn ghế café, bàn ghế quán ăn, … thì Google sẽ lưu các chỉ mục
trên website vào ngành nội thất hay cụ thể hơn là bàn ghế café, bàn ghế quán ăn.
Xử lý và tính toán: Sau khi lập chỉ mục Google sẽ xử lý, tính toán và mã hóa
thông tin để lưu trữ trong cơ sở dữ liệu. Và khi có một truy vấn tìm kiếm thì hệ thống
sẽ trả về các kết quả có chứa nội dung hữu ích tương ứng với các truy vấn của người
dùng.
-
Sự khác nhau giữa các công cụ tìm kiếm:
Mặc dù nguyên tắc hoạt động cơ bản của tất cả các công cụ tìm kiếm là như
nhau, sự khác biệt nhỏ giữa chúng dẫn đến những thay đổi lớn trong các kết quả liên
quan. Đối với các công cụ tìm kiếm khác nhau, các yếu tố khác nhau rất quan trọng.
Có rất nhiều ví dụ về sự khác biệt giữa các công cụ tìm kiếm. Ví dụ, đối với Yahoo và
Bing, các yếu tố từ khóa trên trang quan trọng hàng đầu, trong khi đó đối với Google
thì các liên kết và nội dung lại rất quan trọng. Ngoài ra có một sự khác biệt rất lớn giữa
các công cụ tìm kiếm đó là về khả năng lập chỉ mục, đối với Yahoo hoặc Bing sẽ cần
rất nhiều thời gian để một trang web được lập chỉ mục trong kết quả tìm kiếm, tuy
13
nhiên đối với Google chỉ cần vài tiếng. Điều này chứng tỏ khả năng lập của Google
nhanh hơn rất nhiều lần so với Yahoo và các công cụ khác.[3]
-
Các thuật toán của Google:
Lịch sử các thuật toán của Google:
Google là một công ty Internet có trụ sở tại Mỹ, hoạt động từ năm 1998 tới nay.
Google nổi tiếng với bộ máy tìm kiếm thông tin đỉnh cao, được người dùng đánh giá là
công cụ tìm kiếm hữu ích và mạnh mẽ nhất hiện nay. Trải qua hơn mười năm hoạt
động, với nhiều lần cập nhật để cải thiện bộ máy tìm kiếm được tốt hơn. Sau đây là các
lần thay đổi thuật toán chính của Google.
Cập nhật năm 2000:
+ Google Toolbar – Tháng 12 năm 2000: Như nhìn trước được tương lai SEO
sẽ phát triển trong nhiều năm tới. Google cho ra mắt thanh công cụ Google Toolbar và
cùng với thanh công cụ Google Pagerank được cập nhật.
Cập nhật năm 2003:
+ Thuật toán Boston – Tháng 2 năm 2003:
Được công bố tại SES Boston. Ban đầu Google dự định sẽ tung bản cập nhật
hàng tháng cho các bộ phận chính tuy nhiên ý tưởng này nhanh chóng bị lãng quên.
Boston là bản cập nhật kết hợp giữa kỹ thuật và sự đổi mới về chỉ số chính (lúc bấy
giờ các chỉ số này có tên gọi là Google dance).
+ Thuật toán Cassandra – Tháng 4 năm 2003:
Google đã phát hiện ra một vài vấn đề liên quan đến chất lượng liên kết, chẳng
hạn như liên kết từ những website sở hữu bởi một người. Cassandra sẽ phạt nặng các
trang sử dụng text ẩn hay link ẩn.
+ Thuật toán Dominic – Tháng 5 năm 2003:
Vào tháng 5 thuật toán Dominic rất khó quan sát khi Google công bố cải thiện
quá trình của các Google bot và độ sâu khi tìm kiếm những thông tin. Cũng ở thuật
toán Dominic này, cách thức tính Backlink dường như cũng thay đổi đáng kể.
+ Thuật toán Esmerelda – Tháng 6 năm 2003:
Tháng 6 là tháng chuẩn bị lần cuối cùng Google ra bản cập nhật hàng tháng.
Sau đó các lần cập nhật thường xuyên hơn, “Google dance” được thay thế bằng
“Everflux”. Thuật toán này cũng báo trước sự thay đổi cơ sở hạ tầng lớn tại Google.
+ Thuật toán Fritz – Tháng 7 năm 2003:
14
Đây là tháng cuối cùng Google ra bản cập nhật hàng tháng với tên gọi Fritz.
Thay vì chỉnh sửa và thay đổi các chỉ số hàng tháng. Google chuyển qua cách tiếp cận
mới với chiều hướng tăng cao. Chỉ số thay đổi theo ngày.
+ Tăng hiệu suất Index – Tháng 9 năm 2003:
Google cải thiện khả năng thu thập thông tin và khả năng Index website trong
thời gian ngắn hơn nhưng hiệu suất không đổi.
+ Thuật toán Florida – Tháng 11 năm 2003:
Thuật toán này đặt nền móng cho SEO, khi thuật toán này cập nhật rất nhiều
website đã bị mất thứ hạng. Florida là hồi chuông báo tử cuối những năm 90 khi các
chiến thuật SEO chỉ chăm chăm nhồi nhét từ khóa.
Cập nhật năm 2004:
+ Thuật toán Austin – Tháng 1 năm 2004:
Austin là bản cập nhật của Florida đẩy mạnh việc ngăn chặn các vấn đề nhồi
nhét từ khóa.
+ Thuật toán Brandy – Tháng 2 năm 2004:
Google tung ra một loạt các thay đổi lớn như tăng mức độ index, tăng tầm quan
trọng của anchor text, và liên kết từ các website cùng ngành nghề.
Cập nhật năm 2005:
+ Nofollow – Tháng 1 năm 2005:
Nofollow là yếu tố khảo sát chất lượng liên kết. Nofollow ngăn chặn chất lượng
liên kết tới các trang có chất lượng không tốt. Thuật toán này không như thuật toán
xếp hạng thông thường.
+ Thuật toán Allegra – Tháng 2 năm 2005:
SEOers bắt đầu thấy sự thay đổi thứ hạng của các website. Chi tiết của bản cập
nhật không được công bố cụ thể nhưng cộng đồng SEOer tin rằng đó là ảnh hưởng bởi
Google Sandbox, ngoài ra cũng có một vài ý kiến cho rằng Google đã bắt đầu phạt các
website spam link.
+ Thuật toán Bourbon – Tháng 5 năm 2005:
Matt Cutts tuyên bố rằng Google ra phiên bản công cụ tìm kiếm 3.5 thay đổi về
chất lượng tìm kiếm và khắc phục các lỗi trùng lặp nội dung và đưa ra giải pháp www
và non-www.
+ XML-Sitemap – Tháng 6 năm 2005: