Tải bản đầy đủ (.doc) (56 trang)

Tìm hiểu phương pháp tối ưu hóa công cụ tìm kiếm cho một số ứng dụng cms

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (585.5 KB, 56 trang )

ĐẠI HỌC HUẾ
KHOA DU LỊCH
............…………

CHUYÊN ĐỀ TỐT NGHIỆP
Đề Tài:
Tìm hiểu phương pháp tối ưu hóa công cụ tìm kiếm cho một số ứng dụng
cms

Giảng viên hướng dẫn: Ts.Võ Viết Minh Nhật
Sinh viên thực hiện: Đào Thủy Tiên
K46_TMĐT

Huế, tháng 05 năm 2016


LỜI CAM ĐOAN

Tôi xin cam đoan Chuyên đề được thực hiện bằng công sức của mình, không
sao chép từ công trình khác. Mọi thông tin tham khảo đều được trích dẫn đầy đủ. Nếu
có gì gian dối tôi xin chịu hoàn toàn trách nhiệm.

Huế, tháng 05 năm 2016
Sinh viên

Đào Thủy Tiên


LỜI CẢM ƠN

Tôi xin chân thành cảm ơn các thầy cô giáo Khoa Du Lịch – Đại Học Huế đã hỗ


trợ mọi điều kiện giúp tôi có được một môi trường học tập tốt nhất. Cảm ơn tất cả các
quý thầy cô đã hết lòng quan tâm và dạy dỗ, trang bị cho tôi những kiến thức và hành
trang quý báu.
Đặc biệt tôi xin chân thành cảm ơn thầy giáo Ts.Võ Viết Minh Nhật – người đã
trực tiếp hướng dẫn tôi trong quá trình triển trai và thực hiện đề tài này. Cảm ơn thầy
đã tận tình hướng dẫn, động viên và giúp đỡ tôi trong suốt thời gian thực hiện đề tài.

Huế, tháng 05 năm 2016
Sinh viên

Đào Thủy Tiên


DANH MỤC TỪ VIẾT TẮT
Từ viết tắt
CMS
CSDL
HTML

PR

SE

SEO

Nguyên nghĩa
Content management system)
Hệ thống quản lý nội dung
Cơ sở dữ liệu
HyperText Markup Language

Ngôn ngữ Đánh dấu Siêu văn bản
Page Rank
Hệ thống xếp hạng
Search Engine
Công cụ tìm kiếm
Search Engine Optimization
Tối ưu hóa công cụ tìm kiếm.

SEOer

Người thực hiện công việc tối ưu hóa Website

Traffic

Lượng người truy cập vào website

ROI

URL

Web

Webmaster

RSS

Return on Investment
Hiệu quả trên ngân sách đầu tƣ.
Uniform Resource Locator
Tham chiếu tới tài nguyên trên Internet

Website
Trang web
Website administrator
Quản trị viên quản lý Website
Really Simple Syndication
Là một định dạng tập tin thuộc họ XML


ĐỀ TÀI: TÌM HIỂU PHƯƠNG PHÁP TỐI ƯU HÓA CÔNG CỤ TÌM
KIẾM CHO MỘT SỐ ỨNG DỤNG CMS


PHẦN I: ĐẶT VẤN ĐỀ
1. Lý do chọn đề tài
Trong thời đại công nghệ thông tin, kinh doanh trực tuyến, tiếp thị và quảng cáo
trên Internet đã tạo ra một tác động đáng kể. Những doanh thu rất lớn đã được tạo ra
bằng cách tạo và quảng cáo các websites tốt. Tuy nhiên, có hàng tỷ websites với một
phạm vi rộng các thể loại và chủ đề trên toàn thế giới, với các loại ngôn ngữ khác
nhau, trong các lĩnh vực và nội dung khác nhau. Để tìm được thông tin hoặc website
về một chủ đề cụ thể, người dùng thường sử dụng một công cụ tìm kiếm và truy vấn
tìm kiếm với các từ, từ khoá hoặc cụm từ. Các công cụ tìm kiếm phổ biến hiện nay bao
gồm Google, Yahoo, Bing MSN, AOL … Hiện đang có rất nhiều công trình nghiên
cứu và phát triển trong suốt thập kỷ qua để làm cho công cụ tìm kiếm ngày càng hoàn
hảo đối với người dùng về tính tiện dụng, độ tin cậy và tìm đúng thông tin theo các
yêu cầu tìm kiếm. Hơn nữa, công cụ tìm kiếm đã trở thành một nhu cầu quan trọng và
là công cụ hàng ngày cho người dùng Internet và phương tiện quảng cáo trực tuyến.
Công cụ tìm kiếm đang mang lại lợi nhuận từ quảng cáo, giải trí, mạng truyền thông
xã hội, các ứng dụng sử dụng hàng ngày và bán hàng và dịch vụ trực tuyến. Kinh
doanh trên Internet đang phát triển từng ngày với một sự tăng trưởng lớn trong lĩnh
vực tiếp thị trên Internet và phát triển web.

Có hàng tỷ website sống trên Internet. Hầu hết chúng đều cho phép quản lý, bổ
sung và sửa đổi nội dung. Một hệ thống quản lý nội dung (content management
system, CMS) cho phép người dùng chia sẻ, kiểm soát truy cập, cập nhật dữ liệu và
tăng cường giao tiếp giữa người dùng trong một môi trường cộng tác. Joomla, Drupal,
WordPress là những ví dụ về các ứng dụng CMS phổ biến nhất hiện nay. Hầu hết các
hệ thống CMS không được thiết kế và phát triển theo tất cả các tiêu chuẩn SEO. Do
vậy, có một số vấn đề cụ thể đối với nội dung được tạo ra bởi các CMS này.
Quá trình chỉ mục công cụ tìm kiếm (search engine indexing, SEI) đề cập đến các
phương pháp và kỹ thuật được sử dụng bởi công cụ tìm kiếm để đọc và bao gồm nội
dung và dữ liệu trong của một website vào kho dữ liệu của chúng. Khám phá nội dung
các website cho việc chỉ mục tự động có một tầm quan trọng then chốt đối với thương


mại điện tử hiệu quả và các ứng dụng khác của Web. Nó cho phép người dùng, bao
gồm khách hàng và doanh nghiệp, xác định vị trí các nguồn tốt nhất cho việc sử dụng
của họ. Điều quan trọng là giữ chỉ số để tất cả các website có được thứ hạng tối đa trên
công cụ tìm kiếm. Nếu website không được lập chỉ mục bởi công cụ tìm kiếm, điều
này cũng giống như một cửa hàng lớn không có bảng chỉ dẫn.
Nhận thấy vấn đề cần thiết như vậy nên tôi đã đề ra vấn đề đó là : đánh giá và
nghiên cứu chi tiết về các phương pháp tối ưu hóa công cụ tìm kiếm cho các ứng dụng
hệ thống quản lý nội dung và Web2.0. Nó cũng cung cấp một cái nhìn tổng quan của
chỉ mục tìm kiếm và làm thế nào để cải thiện công cụ tìm kiếm lập chỉ mục cho các
ứng dụng CMS.
2. Mục đích của đề tài
- Tìm kiếm, nghiên cứu và tổng hợp các tài liệu về chủ đề SEO, về các ứng
dụng CMS và về lập chỉ mục công cụ tìm kiếm.
- Nghiên cứu và phân tích các kỹ thuật SEO hiện có và ảnh hưởng của chúng
lên các ứng dụng CMS và web 2.0.
- Tìm hiểu các công cụ SEO tốt nhất hiện có mà đang được người dùng (khách
hàng và doanh nghiệp) sử dụng để tối ưu hóa website của mình.

- So sánh các hệ thống quản lý nội dung phổ biến hiện nay, chẳng hạn Drupal,
Joomla, WordPress, trên quan điểm SEO và phân tích hiệu quả của chúng về tối ưu
hóa trên các công cụ tìm kiếm hàng đầu.
- Nghiên cứu và phân tích hành vi tìm kiếm của Google và các chuẩn tối ưu hóa
đối với các webmaster.
- Đề xuất và kiến nghị các giải pháp cho các phân bố (layouts) hiện có của các
websites khác nhau dựa trên CMS theo các chuẩn Web 2.0 và SEO.
3. Đối tượng và phạm vi nghiên cứu
a. Đối tượng nghiên cứu
Các thành phần tối ưu hóa công cụ tìm kiếm bộ lập chỉ mục cho các ứng dụng
CMS gồm các ứng dụng quản lý nội dung, web 2.0, WordPress, Joomla, Drupal.


b. Phạm vi nghiên cứu
- Về nội dung: Đề tài tập trung nghiên cứu lý thuyết về phương pháp tối ưu hóa
công cụ tìm kiếm và công cụ tìm kiếm bộ lập chỉ mục cho các ứng dụng CMS
- Về không gian: Đề tài nghiên cứu trên các ứng dụng quản lý nội dung, web
2.0, WordPress, Joomla, Drupal.
- Thời gian nghiên cứu: từ ngày 01/02/2016 đến ngày 01/04/2016
4. Phương pháp nghiên cứu
Phương pháp thống kê, phân tích tổng hợp và phương pháp so sánh: các phương
pháp này được sử dụng nhiều nhất trong quá trình nghiên cứu cách thức hoạt động của
công cụ tìm kiếm bộ lập chỉ mục cho các ứng dụng CMS.
5. Kết cấu của đề tài
Phần 1: Đặt vấn đề
Phần 2: Nội dung và kết quả nghiên cứu
Bố cục của đề tài ngoài phần mở đầu, phần kết luận, tài liệu tham khảo, nội dung
gồm 3 chương:
Chương I: Cơ sở lý luận về tối ưu hoá công cụ tìm kiếm.
Chương II: Phương pháp tối ưu hoá công cụ tìm kiếm cho một số ứng dụng cms

Chương III: Một số kiến nghị ứng dụng SEO cho CMS
Phần 3: Kết luận


PHẦN II: NỘI DUNG VÀ KẾT QUẢ NGHIÊN CỨU
CHƯƠNG I: CƠ SỞ LÝ LUẬN VỀ TỐI ƯU HOÁ CÔNG CỤ TÌM KIẾM
0.1 Tối ưu hóa công cụ tìm kiếm
Chương này sẽ trình bày một cái nhìn tổng quan chi tiết của chuyên đề của tôi về
các chủ đề như phương pháp, công cụ, kỹ thuật tối ưu hóa công cụ tìm kiếm, cơ bản
quản lý nội dung và sẽ so sánh hiệu suất của chúng về tối ưu hóa công cụ tìm kiếm và
cũng sẽ xem xét các kỹ thuật lập chỉ mục và làm việc trên công cụ tìm kiếm. Công cụ
tìm kiếm chính mà tôi tập trung là Google bởi vì bây giờ nó trở thành vua của các
doanh nghiệp tìm kiếm và công cụ tìm kiếm được sử dụng nhiều nhất hàng này ngày
cũng như các công cụ tìm kiếm phổ biến khác như Yahoo, Bing và AltaVista.
Mỗi người trong chúng ta sử dụng Internet mở ra Google hay công cụ tìm kiếm
khác khi tìm kiếm thông tin trên internet. Những người sử dụng Internet hoặc để tìm
kiếm truyền thông, thông tin, giải trí hay một sản phẩm dịch vụ như mua và bán. Tìm
kiếm đã trở nên tích hợp vào trong cơ cấu xã hội và thời đại chúng ta. Theo
comSource, hơn 12 tỉ lượt tìm kiếm được thực hiện mỗi tháng từ tháng 1/2009, khoảng
400 triệu tìm kiếm web thực hiện mỗi ngày. Tối ưu hóa công cụ tìm kiếm là một thuật
ngữ rộng lớn bao gồm một khu vực rộng lớn trên internet. Tìm kiếm có hệ thống là
niêm yết trên công cụ tìm kiếm mà là các kết quả của các truy vấn tìm kiếm khi người
dùng viết các từ khóa trong công cụ tìm kiếm khi tìm kiếm. Và những danh sách này
không bao gồm các liên kết quảng cáo tài trợ (quảng cáo pay-per-click). Một website
chỉ có thể được tối ưu hóa và có thể nhìn thấy khi nó được xếp hạng tốt và được đặt
trên trang đầu tiên trong kết quả công cụ tìm kiếm. Tối ưu hóa công cụ tìm kiếm là
một quá trình và tập các lý thuyết, các công cụ và kỹ thuật áp dụng để làm cho website
được xếp hạng và được đặt trên trang đầu tiên của tìm kiếm có hệ thống. Có nghĩa là
nếu bất kỳ người dùng đang tìm kiếm một website có liên quan đến từ khóa / thuật ngữ
tìm kiếm của bạn để website của bạn có thể hiện trên trang đầu tiên (nhiều khả năng

trong ba vị trí đầu tiên) của danh sách tìm kiếm cho phép có cơ hội tối đa để có một
nhấp chuột trên website.


Cách hoàn hảo để website của bạn được tối ưu hóa là phải được hiển thị trên
trang đầu tiên với vị trí hàng đầu của kết quả/ danh sách tìm kiếm. Điều đã được
nghiên cứu và khảo sát là hầu hết mọi người nhấp chuột vào năm kết quả danh sách
tìm kiếm đầu tiên và không bỏ qua trang thứ ba nếu họ đến kết quả tìm kiếm tối đa. Đó
là lý do tại sao những website đã chiếm năm vị trí đầu tiên có lượng truy cập tối đa và
chúng tạo ra nhiều lợi nhuận hơn. Có một số cách và thực tiễn để đạt được tối ưu hóa
công cụ tìm kiếm và hầu hết những người áp dụng chúng theo những cách phương
pháp và trình tự, khác nhau, nhưng các thông lệ và nguyên tắc của SEO là như nhau
cho tất cả các loại chiến dịch website.
0.1.1 Tại sao cần SEO?
Tối ưu hóa và tiếp thị công cụ tìm kiếm hiện đang trở thành nhu cầu quan trọng
của mỗi doanh nghiệp, sản phẩm và dịch vụ trực tuyến. Nhiều doanh nghiệp trực tuyến
không thành công vì họ không được tối ưu hóa tốt trên các công cụ tìm kiếm. Sử dụng
quảng cáo trả tiền như Google Adwords vẫn cần kỹ năng SEO để viết quảng cáo tối ưu
hóa. Người ưu hóa / thực hành công cụ tìm kiếm tối nhấn mạnh không chỉ cấu trúc ,
nội dung, thiết kế và mã website mà còn chú ý đến việc xây dựng các liên kết bên
ngoài trên cơ sở thông thường. Mục tiêu của công cụ tìm kiếm là để cung cấp nội dung
có chất lượng, kết quả tìm kiếm nhanh và các cơ hội quảng cáo dễ dàng đến những
người tìm kiếm trên internet. Càng nhiều lần kết quả tìm kiếm dẫn đến nội dung mong
muốn, càng có nhiều khả năng người dùng sử dụng công cụ tìm kiếm một lần nữa. Nói
chung, một website tối ưu hóa tốt phải thân thiện với người dùng, các cấu trúc tốt và
hiển thị trên trang đầu tiên với các từ khóa chính của nó. Với toàn bộ những đặc điểm
này, website sẽ có nhiều lưu lượng mà nó tăng ROI tối ưu.
Tối ưu hóa công cụ tìm kiếm phụ thuộc rất nhiều vào các yếu tố phát triển
website bởi vì nếu website không phát triển đủ tốt theo hướng dẫn công cụ không thể
được tối ưu hóa tốt cho công cụ tìm kiếm. Ngày nay sáng chế của hệ thống quản lý nội

dung (CMS) lấy phần lớn sự phát triển web như hầu hết các doanh nghiệp trực tuyến
và website công ty dựa trên hệ thống quản lý nội dung. Web2.0 là một nền tảng tiêu
chuẩn thế hệ thứ hai cho việc thiết kế và phát triển. Các ứng dụng Web làm cho việc
giao tiếp, khả năng tương tác, chia sẻ thông tin dễ dàng, phối hợp với người dùng làm


trung tâm và tích hợp trên World Wide Web. Hầu hết mạng xã hội và các website lưu
lượng web cao dựa trên Web 2.0.
Các công cụ tìm kiếm được thiết kế cho những người tìm kiếm thông tin và tìm
kiếm trên internet. Công cụ tìm kiếm cung cấp một loạt các ứng dụng và các công cụ
cho các mục đích khác nhau như quảng cáo, tối ưu hóa công cụ tìm kiếm và cung cấp
thông tin. Mỗi công cụ tìm kiếm có ba phần. Đó là crawler, indexer và giao diện tìm
kiếm. Điều quan trọng để nghiên cứu làm thế nào một công cụ tìm kiếm làm việc và
các kỹ thuật chỉ mục chính nào được sử dụng bởi các công cụ tìm kiếm lớn như
Google, Yahoo và Bing. Có những kỹ thuật khác nhau và các công cụ để tối ưu hóa
một website. Điều cần thiết để tìm được các kỹ thuật và các công cụ SEO nào là quan
trọng cho mỗi chiến dịch SEO và những tiêu chuẩn và hướng dẫn nào nên được theo
trong khi phát triển một website dựa trên CMS. Có phạm vi riêng biệt của các công cụ
CMS có sẵn trên thị trường nguồn mở internet. Từ đó, Drupal, Joomla và WordPress
đang dẫn đầu các cổ đông.
0.1.2 Chiến lược SEO
Điều tốt hơn để thực hiện một chiến lược SEO ngắn gọn, làm việc cho phù hợp
và theo thứ tự, kịp thời và mục tiêu định hướng. Nó cũng quan trọng để giữ cập nhật
bản thân về các chiến lược xếp hạng mới nhất và cập nhật các công cụ tìm kiếm. Ảnh
hưởng đến chiến lược SEO đòi hỏi thử nghiệm lặp đi lặp lại để tinh chỉnh nó. Giống
như quảng cáo, SEO cần sự cống hiến lâu dài để nhìn thấy kết quả mong muốn nhất.
Có bốn bước chung để một nỗ lực SEO tinh chế:
1. Chiến thuật
2. Thực hiện
3. Phân tích

4. Tối ưu hóa
Trong bước đầu tiên bạn thực hiện một chiến lược SEO cụ thể đó là một phần
của quá trình lập kế hoạch SEO. Trong bước thứ hai bạn thực hiện các bước cần thiết
được xác định trước trong chiến lược. Sau đó, bạn phân tích quá trình SEO và cuối
cùng bạn nhận được trong quá trình tối ưu và xem kết quả. Chiến lược SEO không


phải là duy nhất cho tất cả các loại website, cho loại website khác nhau chiến lược
SEO sẽ khác nhau và cũng có khung thời gian của chiến dịch SEO để hiển thị các kết
quả mong muốn. Chiến lược SEO được chia thành các giai đoạn đối với các thành
phần SEO. Tất cả những chiến lược có thể được cuộn lại để tạo vũ khí duy nhất là kế
hoạch SEO. Đây có thể là chiến lược nội dung, chiến lược xây dựng liên kết, chiến
lược tiếp thị công cụ tìm kiếm, chiến lược truyền thông xã hội, chiến lược mục tiêu
công cụ tìm kiếm, chiến lược kỹ thuật…
0.1.3 Tên miền & Hosting
Để bắt đầu kinh doanh trực tuyến điều đầu tiên bạn cần làm là đăng ký một tên
miền. Sau khi biết bạn nhắm khu vực mục tiêu và từ khóa mục tiêu, cố gắng đăng ký
tên miền bao gồm từ khóa chính của bạn. Ví dụ, nếu doanh nghiệp của bạn bán máy
tính xách tay thì tên miền với từ khóa máy tính xách tay (ví dụ: buylaptops.com) sẽ là
một tên miền tốt. Lựa chọn webhost cũng là một vấn đề quan trọng vì trong khi chỉnh
sửa website của bạn cho các yêu cầu SEO, webhost sẽ cung cấp sửa đổi tập tin
.htaccess, SEO add-ons (tích hợp SEO plugin) và cơ sở để mua một IP dành riêng cho
tên miền của bạn.
Sau đây là các yếu tố quan trọng khi đăng ký một tên miền:
- Tránh dấu gạch nối: Trong tên miền, dấu gạch nối làm giảm đi tín nhiệm và
được xem như một chỉ số thư rác.
- Tránh chung chung, tên miền cấp cao hiếm gặp (TLD): Giống như dấu gạch
nối, tên miền cấp cao như .info, .cc, .ws và .name là các chỉ số thư rác.
- Tên miền dài: Tránh tên miền dài hơn 15 ký tự
- Hãy coi chừng các hoán vị: Chủ sở hữu ExpertsEchange.com xây dựng được

một thương hiệu khá lớn và họ nhận ra tên miền của họ có thể bị hiểu sai như
Expertsexchange.com (Danny, 2011) thì có nghĩa là expertsexchange.com cũng có thể
bị hiểu lầm bởi "chuyên gia thay đổi sex" mà có thể tham chiếu đến nội dung người
lớn hoặc một số ngành công nghiệp khác có thể gây nhầm lẫn cho sự tương tác của
người dùng. Đó là lý do tại sao các chuyên gia trao đổi một công ty CNTT hàng đầu
trợ giúp có tên miền "experts-exchange.com"


Độ tuổi của tên miền có thể đóng một vai trò quan trọng trong việc phân bổ của
Google PageRank. Tên miền trẻ thường được xếp hạng thấp; kết quả là tên miền lớn
tuổi luôn xếp hạng cao hơn. Tuy nhiên, nếu bạn mua một tên miền hết hạn thời gian
gần đây có một PageRank cao vì tuổi tác và danh tiếng tích lũy, PageRank không
chuyển giao cho chủ sở hữu mới. Công cụ tìm kiếm có thể nhìn thấy khi tên miền thay
đổi quyền sở hữu và sẽ thiết lập lại thứ hạng của họ trong tình huống như vậy.
0.1.4 Nghiên cứu từ khóa
Trong quá trình nghiên cứu từ khóa cần phải đi qua các bước sau.:
- Thị trường mục tiêu và ghi chú thị trường đang nhắm đến.
- Tạo một danh sách chung các từ khóa và cụm từ khóa.
- Chiết xuất các từ khóa từ các website của đối thủ cạnh tranh và thị trường mục
tiêu quan trọng theo quan điểm của bạn
- Sử dụng các công cụ nghiên cứu từ khóa thích hợp có sẵn trên internet như
Google, Keyword Discovery, SEOBook và WordTracker có KEIs và KOIs tốt nhất
- Đánh giá sự phổ biến của sự lựa chọn từ khóa. Có bao nhiêu website phù hợp
với từ khóa tìm kiếm? Từ 30 danh sách tìm kiếm hàng đầu, có bao nhiêu đã được tối
ưu hóa website của họ? Vậy làm thế nào để có thể làm tốt hơn?
-

Đối với mỗi trang của website sử dụng các từ khóa độc đáo theo nội dung

trang.

- Nghiên cứu từ khóa là rất quan trọng và giai đoạn đầu tiên trong một chiến
dịch SEO
0.1.4.1 Chỉ mục hiệu lực của từ khoá (K.E.I)
Chỉ mục hiệu lực của từ khoá (K.E.I), trước tiên được tạo ra bởi Sumantra Roy.
Đây là tỷ lệ số tìm kiếm (số lượng tìm kiếm được thực hiện bởi người sử dụng) trên
tổng số lượng kết quả tìm kiếm trong khi tìm kiếm từ khóa đó. Theo cách đơn giản
KEI so sánh số lượng tìm kiếm và số lượng các kết quả website tương ứng. Khối
lượng tìm kiếm có thể được biết đến bằng cách sử dụng các công cụ từ khóa như
WordTracker, Google Keyword Tool, SEOBOOK và nhiều công cụ khác trên internet.


Những công cụ này cung cấp cho con số ước tính của tìm kiếm được thực hiện bởi
người sử dụng trong một thời gian nhất định trên công cụ tìm kiếm.

Hình 1.1: Công cụ nghiên cứu từ khoá SEOBook cho thấy tìm kiếm ước tính
hàng ngày trên từ khóa "web hosting" ( www.seobook.com )
Công thức tổng quát để tính toán KEI là:
KEI = (tìm kiếm hàng tháng) * 2 / cạnh tranh thô
Trong đó "tìm kiếm hàng tháng" đề cập đến số ước tính các truy vấn tìm kiếm
được thực hiện bởi mọi người trong một tháng. Ví dụ, theo hình 2, tìm kiếm ước tính
hàng tháng cho từ khóa "web hosting" là khoảng 14.472. cạnh tranh thô là tổng số
SERPs cho một truy vấn tìm kiếm tương ứng. Ví dụ, tổng SERPs cho từ khóa "web
hosting" trên công cụ tìm kiếm của Google là 455 triệu website.
0.1.4.2 . Chỉ mục cơ hội của từ khóa (K.O.I )
Chỉ mục cơ hội của từ khóa (KOI) đề cập đến việc tìm ra những từ khóa có khả
năng thành công và đo sự hấp dẫn của từ khóa trên các website cạnh tranh trực tiếp.
Để có được các website cạnh tranh trực tiếp, truy vấn cho công cụ tìm kiếm Google là
"allinanchor: từ khóa" trong đó anchor (neo) đại diện cho các website với các liên kết
neo văn bản có chứa từ khóa nhắm đến bạn. Ví dụ cho từ khóa “web hosting” các
website cạnh tranh trực tiếp là 193.000.000. Công thức của KOI là:

KOI = (Tìm kiếm hàng tháng) * 2 / Cạnh tranh trực tiếp (Keil, 2011)


0.1.4.3 . Mật độ từ khoá
Mật độ từ khóa là các số liệu được sử dụng trong phân tích từ khoá mà xác định
tỷ lệ số lần xuất hiện của một từ khóa hoặc cụm từ trên tổng số tất cả các từ trên một
website nhất định. Nếu một từ khóa hoặc cụm từ khóa xuất hiện nhiều lần trong một
trang duy nhất (vd có mật độ từ khóa cao) thì công cụ tìm kiếm sẽ xem xét nó là thư
rác. Cách lý tưởng để sử dụng mật độ từ khóa là từ 4% đến 6%, đôi khi được cho là
cao tới 10%, nhưng không được khuyến khích.
0.1.5 Phân tích đối thủ cạnh tranh
Các yếu tố quan trọng trong việc phân tích đối thủ cạnh tranh là:
- lập chỉ mục website đối thủ cạnh tranh: Phân tích bao nhiêu trang trên website
của đối thủ cạnh tranh của bạn được lập chỉ mục bởi Google và các bộ máy tìm kiếm
khác?
- Tính phổ biến liên kết và Pagerank: Các liên kết trở lại và xếp hạng trang của
website của đối thủ cạnh tranh
- Từ khóa mục tiêu: từ khóa chính và tiêu đề trang chính và Meta tag của họ là
gì?
- Lưu lượng Web ước tính: Phân tích lưu lượng web mà họ đang nhận được. Để
có được dữ liệu lưu lượng có một số công cụ có sẵn trên internet. Phổ biến nhất là
Alexa.com và doubleclick.com.
0.1.6 Khảo sát công cụ tìm kiếm và bộ lập chỉ mục
Thu thập dữ liệu được thực hiện bằng robot mà còn được gọi là nhện công cụ tìm
kiếm. Các chức năng chính của việc thu thập là để phân loại các trang có liên quan đến
chỉ mục và đánh giá xem chúng đã thay đổi. Bộ thu thập và nhện công cụ tìm kiếm
truy cập vào các website và lấy một tham chiếu URL của trang để phân tích và lập chỉ
mục mục đích. Các dữ liệu được thu thập bởi nhện và bộ thu thập được sử dụng để
hiển thị kết quả tìm kiếm và xếp hạng công cụ tìm kiếm của công cụ tìm kiếm. Công
cụ tìm kiếm thu thập dữ liệu website trên cơ sở thường xuyên phụ thuộc vào sự tiến

bộ, chất lượng và xếp hạng của website. Các Website mà thường xuyên cập nhật các
trang với nội dung được cập nhật trên cơ sở hàng ngày được thu thập và ghi nhiều hơn


một nội dung không được cập nhật. Web crawler sử dụng để lưu trữ một bản sao các
website được thu thập. Nó có thể được nhìn thấy bằng cách ghi cache: với địa chỉ URL
sau cần được kiểm tra trong hộp tìm kiếm của Google, ví dụ: viết truy vấn sau trong
hộp tìm kiếm của Google:
cache: www.yoururl.com

Hình 1.2: Quá trình thu thập dữ liệu trên Google
Một website khi được lưu trữ bởi công cụ tìm kiếm (ví dụ Google) được gọi là
được lập chỉ mục. Indexer được thiết kế đặc biệt và tối ưu hóa cho các tập tin chỉ mục.
Sử dụng chỉ số được xây dựng bởi indexer, công cụ tìm kiếm có thể truy cập gần như
trực tiếp đến các phần của cơ sở dữ liệu chứa thông tin mà người dùng đang tìm kiếm.
Xếp hạng công cụ tìm kiếm phụ thuộc rất nhiều vào lập chỉ mục website. Càng nhiều
trang của website bao gồm (lập chỉ mục) bởi công cụ tìm kiếm thì nó sẽ có thứ hạng
công cụ tìm kiếm cao. Một trong những mục đích chính của những người thực hành
công cụ tìm kiếm là lập chỉ mục website sao cho mọi trang web mong muốn có chỉ số.
Chi tiết về chỉ mục công cụ tìm kiếm được thảo luận trong phần chỉ mục công cụ tìm
kiếm.
0.1.7 PageRank và tầm quan trọng của nó
PageRank là một thuật toán phân tích liên kết được sử dụng bởi công cụ tìm kiếm
Google ban đầu được xây dựng bởi Larry Page và Sergey Brin. Các giá trị PageRank
được tiền tính toán và lưu trữ đối với tất cả các trang được biết đến với hệ thống IR.
Điều này có nghĩa là tất cả các trang trong các website có một số điểm PageRank là


hoàn toàn độc lập với thuật ngữ truy vấn. Một tìm kiếm trả về điểm số PageRank là
báo cáo thứ bậc quan trọng của các trang có chứa các thuật ngữ truy vấn. Đây là một

giá trị trong thang mười (10) mà Google toolbar cho trên cơ sở của rất nhiều yếu tố và
có thể được nhìn thấy bằng cách sử dụng Google toolbar hoặc công cụ SEO.
PageRank là một cách đặc biệt để ưu tiên các kết quả của tìm kiếm từ khóa web
theo thứ tự. Đối với các chủ đề được ngưỡng mộ nhất, một tìm kiếm phù hợp văn bản
đơn giản được giới hạn đến tiêu đề của website khi PageRank ưu tiên các kết quả. Yếu
tố lớn PageRank phụ thuộc là các liên kết trở lại một website. PageRank mở rộng ý
tưởng này bằng cách không đếm các liên kết từ tất cả các trang như nhau và bằng cách
chuẩn hóa bởi số lượng của các liên kết trên một trang. PageRank được định nghĩa như
sau:
Hãy giả định rằng trang A có các trang T1 ... Tn tham chiếu đến nó (tức là trích
dẫn / liên kết trở lại). Tham số d là một yếu tố giảm xóc có thể dao động giữa 0 và 1.
Nói chung, giá trị giả định của d được thiết lập 0,85. Ngoài ra C(A) được định nghĩa là
số lượng các liên kết đi ra khỏi trang A. PageRank của trang A được cho như sau:
(Page, 2001)
PR(A) = (1-d) + d(PR(T1 )/C(T1) + ... + PR(Tn)/C(Tn))
Điều quan trọng phải xem xét rằng thứ hạng cao tạo thành một phân bố xác suất
trên các trang web, do đó tổng của tất cả PageRanks các trang web sẽ là một.
Thanh công cụ Google không phải là rất đúng khi nói với bạn PageRank của một
website, nhưng đó là điều duy nhất bây giờ mà thực sự có thể cung cấp cho bạn ý
tưởng nào đó. Có hai hạn chế đối với thanh công cụ Google:
1. Nếu vào một trang, mà không có trong chỉ mục của nó, nhưng có một trang
mà rất gần với nó trong chỉ mục của Google, thì nó sẽ cung cấp một ước tính
PageRank. Phỏng đoán này là vô giá trị đối với các mục đích của chúng ta bởi
vì nó không được đặc trưng trong bất kỳ tính toán PageRank. Cách duy nhất
để biết nếu thanh công cụ đang sử dụng một phỏng đoán là nhập URL vào
hộp tìm kiếm của Google.


2. PageRank thực sự có thể được nhìn thấy bằng cách cài đặt Google toolbar (từ
toolbar.google.com) trong trình duyệt web. PageRank là tuyến tính, do đó,

Google sử dụng một đồ thị phi tuyến tính để hiển thị nó. Để nhận được từ một
PageRank 2 đến một PageRank 3 cần ít hơn của một gia tăng để di chuyển từ
một PageRank 3 đến một PageRank 4. Các số liệu thực tế của PageRank được
giữ bí mật tuy nhiên theo hình 7 là con số thực tế ước tính tương ứng với
thanh công cụ Google PageRank
Yếu tố PageRank có tầm quan trọng cao trong các liên kết mua / bán. Các
website với PageRank cao yêu cầu tiền tốt để cung cấp các liên kết bên trong, ví dụ
Apple.com có PR 9 nên có back link từ apple.com giá trị rất nhiều cho công cụ tìm
kiếm. Tuy nhiên, không cần thiết nếu một website có PageRank cao có thể có xếp
hạng tìm kiếm tốt hơn và lưu lượng web cao so sánh một website có PageRank thấp.
Google không bao giờ tiết lộ những tính toán thuật toán PageRank thực tế mà
quyết định bởi thanh công cụ Google PageRank tuy nhiên phụ thuộc vào các yếu tố
sau đây
- Số lượng liên kết trở lại website, chất lượng và nội dung liên quan.
- PageRank của các website được liên kết đến website của bạn.
- Số lượng các liên kết ra trên trang được liên kết đến website của bạn. Ví dụ,
một website có 10 liên kết ra và có PageRank 4. Google chia PageRank cho tất cả
mười website theo sự liên quan và các yếu tố uy tín của chúng.
- Tuổi của tên miền.
- Số lượng nhấp chuột thông qua tỷ lệ trên một website trong tìm kiếm truy vấn.
0.2 Tối ưu hóa On-Page
Tối ưu hóa On-Page hay tối ưu hóa website là về việc làm thay đổi và những gì
bạn làm trên website trong quá trình thiết kế và phát triển của mình để cải thiện và thử
nghiệm trên SERPs. Nó cũng bao gồm trong các bước lập kế hoạch quan trọng như sự
hiểu biết thích hợp của bạn, nghiên cứu từ khóa và chiến lược web SEO. Quá trình tối
ưu hóa on-page bao gồm những thành phần liên quan trực tiếp đến website :


- Mã tối ưu hóa: Nó đề cập về việc sửa đổi và bổ sung mã trang, tiêu đề và siêu
dữ liệu, alt, tiêu đề và thẻ linh tinh.

- Nội dung: Đó là về nội dung website sẽ được hiển thị như thế nào? Bao gồm
nội dung giàu từ khóa, tinh chỉnh và các yếu tố mật độ từ khóa
- Cấu trúc thư mục / liên kết: Nó bao gồm các cấu trúc thư mục / URL,
breadcrumb trail, các yếu tố viết lại URL
0.2.1 Tối ưu hóa mã
0.2.1.1 . Trang tiêu đề
Đối với xếp hạng công cụ tìm kiếm, thẻ tiêu đề là yếu tố quan trọng nhất cho sự
phù hợp công cụ tìm kiếm. Thẻ tiêu đề là trong phần <head> của tài liệu HTML và
điều này chỉ một phần của "siêu" thông tin về một trang có ảnh hưởng đến sự liên quan
và xếp hạng nhất. Nó đại diện cho chủ đề và từ các từ khóa chính của website cụ thể.
Nó là sự kết hợp hoặc chuỗi các từ/văn bản định nghĩa bởi thẻ <title> trong tài liệu
HTML. Sau đây là cú pháp của thẻ tiêu đề trong HTML
<Title> Trang tiêu đề của Website </ title>
Tiêu đề của trang có thể nhìn thấy cả trong thanh tiêu đề trong trình duyệt web và
trong tiêu đề của kết quả tìm kiếm. Điều đó khuyến cáo rằng tiêu đề website phải ở
trong phạm vi tối đa 50-80 ký tự kể cả khoảng trắng. Google cho thấy trung bình
khoảng 55-70 ký tự trong kết quả tìm kiếm hữu cơ. Trong tiếp thị công cụ tìm kiếm
tiêu đề trang web hoặc trang đích đóng một vai trò rất quan trọng để tăng CTR (tỷ lệ
nhấp) của website hoặc một quảng cáo cụ thể. CTR của website được tính bằng cách
chia số lần nhấp chuột mà quảng cáo/trang có được cho tổng ấn tượng mua.
0.2.1.2 . Mô tả Tag
Thẻ mô tả Meta website chứa thông tin ngắn gọn về nội dung trang. Thông
thường nó được hiển thị sau tiêu đề trong trang kết quả công cụ tìm kiếm (SERP). thẻ
mô tả Meta là quan trọng bởi vì bạn có thể sử dụng nó như là một phương pháp để
chuyển tải thông điệp tiếp thị của bạn và toàn bộ khách công cụ tìm kiếm nhấp chuột


vào danh sách của bạn so với đối thủ cạnh tranh nhấn. Mô tả thẻ Meta là trong phần
<head> sau thẻ tiêu đề. Cú pháp như sau:
<meta NAME = "description" CONTENT "mô tả website của bạn.">

Trong thẻ Meta mô tả, bạn có thể sử dụng các từ khóa nhắm mục tiêu của bạn là
quan trọng để tăng CTR và SEO tốt hơn. Nói chung, Google cho thấy khoảng 155 ký
tự trong SERPs. thẻ mô tả Meta là lý tưởng cho các công cụ tìm kiếm khi nó có độ dài
150-200 ký tự.
0.2.1.3 . Meta Keywords Tag
Thẻ meta từ khoá cung cấp cho bạn để trình bày các từ khóa hoặc văn bản bổ
sung cho công cụ tìm kiếm dựa để chỉ mục cùng với bản sao nội dung của bạn. Khi
viết thẻ từ khóa Meta, luôn viết các từ khóa quan trọng nhất đầu tiên, bởi vì chúng giữ
liên quan nhất cho công cụ tìm kiếm. Nghiên cứu mới nhất cho biết thẻ từ khóa meta
có không nhiều tầm quan trọng đối với công cụ tìm kiếm lớn như Google, nhưng vẫn
còn tình cảm đối với nhiều công cụ tìm kiếm thương mại và nhỏ khác như AltaVista,
AOL, vv Đây là lý tưởng để bạn sử dụng 4-5 từ khóa trong thẻ từ khoá meta. Cú pháp
như sau:

0.2.1.4 . Meta Robots Tag
Thẻ robot đặc biệt sử dụng để kiểm soát quá trình lập chỉ mục công cụ tìm kiếm
cho một trang cụ thể. Nó xác định xem một trang web của website nên hay không nên
được lập chỉ mục công cụ tìm kiếm và cũng kiểm soát các liên kết (liên kết văn bản)
trong website cho dù chúng nên chỉ mục bởi nhện công cụ tìm kiếm và thu thập.
Thông thường, trong thẻ Robot có hai tham số và cú pháp như sau:

default = empty = "ALL"
"NONE" = "NOINDEX, NOFOLLOW"


Trong đó:
- Index: cho phép GoogleBot chỉ mục trang đó.
- noindex: bảo GoogleBot không chỉ mục trang đó.

- follow: cho phép GoogleBot theo các liên kết neo văn bản từ các trang đích và
các trang khác (liên kết bên ngoài đến các website khác)
- nofollow: cho phép nhện công cụ tìm kiếm không theo các liên kết từ trang đó
cho chỉ mục.
- Noodp: Tránh các tìm kiếm từ việc sử dụng mô tả của trang.
0.2.1.5 . Nhóm khóa
Thẻ tiêu đề là rất quan trọng vì đây là những tiêu đề của các chủ đề của website.
thẻ tiêu đề được cho giá trị bằng công cụ tìm kiếm hơn một copywriting thường xuyên.
Việc sử dụng các từ khóa nhắm mục tiêu là rất quan trọng trong tiêu đề và thẻ tiêu đề
con. Thông thường, các thẻ tiêu đề được viết từ H1 đến H6. thẻ tiêu đề nói với các
robot công cụ tìm kiếm về chủ đề của website. Thẻ H1 là quan trọng nhất và H6 là ít
nhất. Giữ mã từ H1 đến H3 là một phương pháp lý tưởng. Cú pháp của nhóm thẻ như
sau:
<H1> thẻ tiêu đề </ h1>
<H2> thẻ tiêu đề con đầu tiên </ h2> và ...
0.2.1.6 . Khóa ALT
Công cụ tìm kiếm khi lập chỉ mục không đọc những hình ảnh và đồ họa như
flash được sử dụng trong các website. Điều rất cần thiết sử dụng xếp hạng website của
bạn trong trong các kết quả tìm kiếm hình ảnh. công cụ tìm kiếm Bing (MSN) cho
thấy hình ảnh trong các kết quả tìm kiếm thông thường và tìm kiếm hình ảnh và dựa
đáng kể vào các thẻ alt trong thuật toán của nó. Google cũng cung cấp cho chuỗi quan
trọng đến các thẻ alt. Điều tốt hơn là sử dụng các từ khóa và cụm từ trong các thẻ alt
có liên quan đến hình ảnh và trang nội dung mà nó sẽ xuất hiện trong tìm kiếm hình
ảnh và thường xuyên. Cú pháp của thẻ Alt là như sau:


<img src=”pic.jpg” width="100" height="78" alt=”keyword text”/>
Ví dụ, ”SEO<brservices”/>
0.2.1.7 . Cấu trúc thư mục / URL

Một trong những chủ đề thảo luận nhất trong ngành công nghiệp tìm kiếm là tầm
quan trọng và sử dụng cấu trúc URL của các trang web cho thứ hạng công cụ tìm
kiếm. Phương pháp tốt nhất là để phát triển các trang web là URL đơn giản và tĩnh.
Nếu URL có chứa từ khóa liên quan đến nội dung trang của nó và điều đó có thể dễ
dàng được thu thập, sau đó sẽ tốt hơn để có được đầu xếp hạng công cụ tìm kiếm.
Cấu trúc URL của website nên càng đơn giản càng tốt. Suy nghĩ về tổ chức nội
dung sao cho các URLs được phát triển một cách hợp lý và theo cách rõ ràng nhất đối
với con người (khi có thể, từ có thể đọc hơn là những số ID dài). Một URL như
/>id_sezione=260&sid=4a6ebc123f22ada7gf49f521f1 là ít hấp dẫn đối với người sử
dụng. Thứ hai sử dụng dấu chấm trong URL.
Ví dụ, URL

/>
là hữu dụng hơn

. Sử dụng (-) là tốt hơn so với gạch dưới (_)
cũng như Google xem fordcars một từ duy nhất.
Các yếu tố quan trọng cần xem xét khi phát triển một website như sau:
- Trang chủ liên kết đến tất cả các trang trên website
- Sự hiện diện của các liên kết xuất hiện trong các trang chuyên mục đến tất cả
các tiểu thể loại có liên quan không vượt quá giới hạn chuẩn của liên kết nội bộ.
- Sự hiện diện của các liên kết trên các trang tiểu thể loại đến tất cả các trang
nội dung liên quan.
- Khả năng của cấu trúc URL để khớp với hệ thống phân cấp và bổ sung phù
hợp
- Tránh các URLs động có chứa các biểu tượng (ví dụ, ID phiên,? =,%, &, * và
các ký tự).


- Làm cho URL website đơn giản, tĩnh và theo hướng dẫn của W3C.

- Điều được khuyến cáo rằng cấu trúc thư mục của website không nên nhiều
hơn 3 mức, có nghĩa là URL của website không nên vượt quá hơn ba dấu gạch chéo (/)
nếu không sẽ khó khăn cho công cụ tìm kiếm đọc URL.
- Điều lý tưởng là cho phương pháp truy cập click về trang chủ từ các trang web
sâu hơn. Trang chủ của website có giá trị tìm kiếm tối đa cho công cụ tìm kiếm. Giữ
yếu tố này sẽ thúc đẩy quá trình chỉ mục của website.
0.3 Tối ưu hóa off-page
Tối ưu hóa off-page hay tối ưu hóa off-site là đề cập đến những yếu tố có một kết
quả trên website của bạn xếp hạng trong kết quả tìm kiếm tự nhiên liên quan trực tiếp
với hoàn cảnh bên ngoài (bao gồm các yếu tố xếp hạng tìm kiếm không nằm trên
website của bạn). Nó được chia thành hai phần chính. Đó là lịch sử website và liên kết
trở lại (outbound link) website. Các yếu tố quan trọng nhất của tối ưu hóa off-page bao
gồm những điều sau đây:
- Số lượng các website mà liên kết đến website của bạn, vd. liên kết ngoài.
- PageRank và tính phổ biến liên kết của website liên kết đến website của bạn
- Liên quan tiêu biểu và nội dung của website liên kết đến website của bạn.
- Neo văn bản được sử dụng trong các liên kết trở lại (outbound links)
- Chất lượng của các trang web liên kết đến website của bạn bao gồm tổng số
liên kết trên website, tiêu đề trang và nội dung.
- Địa chỉ IP của website liên kết đến website của bạn.
- Thư mục và các đệ trình công cụ tìm kiếm
- Có một tập tin robot.txt phù hợp
- Định dạng và đệ trình của Google Sitemap qua Google webmaster.
- RSS Syndications và nhiều yếu tố khác.


0.4 Google SEO Tools
Công cụ tìm kiếm Google giữ 65% thị trường tìm kiếm trên thế giới. Có một số
công cụ tìm kiếm hiệu quả được giới thiệu bởi Google. Mỗi người thực hành công cụ
tìm kiếm phải hoạt động trên Google webmaster, Google analytics, Google trend,

Google keyword tool trong quá trình tối ưu hóa công cụ tìm kiếm.
0.4.1 Google Webmaster Tool
Tất cả các công cụ tìm kiếm lớn như Google cung cấp công cụ miễn phí cho các
webmaster và người thực hành SEO. công cụ quản trị website của Google cơ bản là để
quản lý các website on-site và hiệu suất SEO off-site.
Google webmaster có thể giúp hiệu suất website của bạn tốt hơn trong kết quả
tìm kiếm cũng như cung cấp cho các thiết bị để cập nhật chỉ mục website của bạn và
cập nhật tiến trình liên quan đến URL của website. Các chức năng chính được cung
cấp bởi công cụ quản trị website của Google:
- Tải lên Sơ đồ website ở định dạng XML và xác minh website bỏi Google với
một ID duy nhất.
- Các đệ trình của tập tin robot.txt cho phép chặn các URL mà bạn không muốn
lập chỉ mục bởi Google.
- Loại bỏ các URL đã được thu thập bởi Google.
- Chỉ ra các miền lựa chọn / ưa thích
- Xác định các vấn đề với tiêu đề và thẻ meta.
- Báo cáo chi tiết chứa dữ liệu về hiển thị, từ khóa và CTR tương ứng.
- Dữ liệu của tất cả các trang web được lập chỉ mục bởi Google hàng ngày.
- liên kết trở lại (link inbound) đến website của bạn với thu thập hàng ngày của
Google
- Thu được thông báo về những vi phạm hướng dẫn chất lượng và tập tin cho
một xem xét lại website.


0.4.2 Google Analytics
Analytics là những chương trình phần mềm tạo ra số liệu. Số liệu là các đo lường
mà có thể giúp bạn điểm chuẩn kết quả mong muốn. Google analytics lấy dữ liệu thô
(được thu thập bằng cách sử dụng một đoạn mã nhỏ của JavaScript) và sản xuất thông
tin từ dữ liệu đó mà dễ hiểu và có thể được sử dụng để cải thiện hiệu suất của một
website. Do đó công cụ phân tích của Google được sử dụng để theo dõi lưu lượng web

và để đo lường hiệu suất website trực tuyến. Bằng cách cài đặt công cụ Google
analytics các chức năng sau có thể đạt được:
- Danh sách các từ khóa / truy vấn tìm kiếm được sử dụng bởi khách truy cập để
tiếp cận website của bạn với thông tin địa lý, internet và xem trang.
- Nó giúp tìm ra các nội dung truy cập nhiều nhất của website và các trang web
của bạn.
- Nó cho thấy một tỷ lệ trả lại giới hạn trong đó mô tả thời gian và liên kết sâu
của website bạn được truy cập bởi người sử dụng.
- Nó cho phép người sử dụng thiết lập mục tiêu trên trang cụ thể mà chủ sở hữu
của website muốn.
- Nó cung cấp để phân tích xu hướng khách truy cập, lòng trung thành, khả
năng trình duyệt và các thuộc tính mạng.


×