Tải bản đầy đủ (.doc) (73 trang)

Nghiên cứu và ứng dụng công cụ SEO vào website vietair tv tại công ty cổ phần thương mại dịch vụ và du lịch Tam Vương

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.5 MB, 73 trang )

Mục lục
Mục lục.........................................................................................................................................1
LỜI NÓI ĐẦU.................................................................................................................................1
CHƯƠNG 1...................................................................................................................................3
TỔNG QUAN VỀ CƠ SỞ THỰC TẬP VÀ ĐỀ TÀI NGHIÊN CỨU.........................................................3
I.1.Tổng quan về cơ sở thực tập...............................................................................................3
I.1.1.Giới thiệu chung...........................................................................................................3
I.1.2.Lịch sử hình thành và phát triển...................................................................................5
I.1.3.Lĩnh vực hoạt động.......................................................................................................5
I.1.4.Mục tiêu của công ty....................................................................................................6
I.1.5.Tổ chức công ty............................................................................................................7
I.1.6.Các đối tác của công ty.................................................................................................9
I.2.Tổng quan về đề tài nghiên cứu........................................................................................10
I.2.1.Thực trạng ứng dụng tin học của công ty...................................................................10
I.2.2.Tính cấp thiết của đề tài nghiên cứu..........................................................................10
CHƯƠNG 2. CƠ SỞ PHƯƠNG PHÁP LUẬN VỀ TỐI ƯU HÓA WEBSITE.........................................11
2.1.Tổng quan về World Wide Web........................................................................................11
2.1.1.Khái niệm về World Wide Web..................................................................................11
2.1.2.Lịch sử hình thành.....................................................................................................11
2.1.3.Đặc điểm và nguyên lý hoạt động..............................................................................12
2.1.4.Một số trình duyệt Web............................................................................................12
2.2.Tổng quan bộ máy tìm kiếm.............................................................................................14
2.2.1.Lịch sử hình thành.....................................................................................................14
2.2.2.Cách thức hoạt động.................................................................................................15
2.2.3.Một số Search Engine thông dụng.............................................................................18
2.3.Cấu tạo chung của bộ máy tìm kiếm.................................................................................19
2.3.1.Robot – bộ thu thập thông tin...................................................................................20
2.3.2.Index – bộ lập chỉ mục...............................................................................................23
2.3.3.Search Engine – Bộ tìm kiếm thông tin......................................................................23
2.4.Hệ thống PageRank (PR)...................................................................................................24
2.4.1.Khái niệm PageRank..................................................................................................24


2.4.2.Bản chất của PageRank..............................................................................................25
2.4.3.Công thức tính PageRank..........................................................................................25
2.4.4.Vai trò của PageRank.................................................................................................26
2.4.5.Tối ưu PageRank........................................................................................................26


Chuyên đề thực tập tốt nghiệp
Hải

GVHD: Th.S Trần Thanh

2.5.Tổng quan về SEO.............................................................................................................27
2.5.1.Lịch sử hình thành.....................................................................................................27
2.5.2.SEO là gì?...................................................................................................................29
2.5.3.Tại sao cần SEO?........................................................................................................30
2.5.4.Các công việc của người làm SEO..............................................................................30
2.5.5.Các kỹ thuật SEO cơ bản............................................................................................32
CHƯƠNG 3. TỐI ƯU HÓA WEBSITE VIETAIR.TV..........................................................................34
3.1.Kiến trúc của website ......................................................................................................34
3.2.Các công cụ SEO cần thiết cho việc quản trị website........................................................35
3.3.Tối ưu hóa bên trong website..........................................................................................37
3.3.1.Tối ưu tiêu đề của website (Title)..............................................................................37
3.3.2.Tối ưu mô tả cho website (Meta Description)...........................................................40
3.3.3.Tối ưu URL cho website.............................................................................................41
3.3.4.Tối ưu trong điều hướng website..............................................................................42
3.3.5.Tối ưu hình ảnh trong website...................................................................................44
3.3.6.Tối ưu các thẻ Heading trong website.......................................................................45
3.3.7.Sử dụng các liên kết trong website............................................................................46
3.3.8.Bài viết chuẩn Seo trong website..............................................................................47
3.3.9.Tối ưu tốc độ website................................................................................................49

3.3.10.Robot.......................................................................................................................50
3.4.Tối ưu hóa bên ngoài website..........................................................................................51
3.4.1.Phương pháp xây dựng backlink................................................................................51
3.4.2.Phương pháp xây dựng backlink tại website vietair.tv..............................................54
3.5.Nghiên cứu từ khóa..........................................................................................................58
3.5.1.Mục đích của nghiên cứu từ khóa.............................................................................58
3.5.2.Phân loại từ khóa.......................................................................................................59
3.5.3.Danh sách từ khóa của website vietair.tv..................................................................60
3.6.Kết quả đạt được..............................................................................................................62
KẾT LUẬN....................................................................................................................................66
Các kết quả đạt được.............................................................................................................66
Đề xuất hướng phát triển cho SEO trong năm 2015...............................................................66
TÀI LIỆU THAM KHẢO.................................................................................................................68

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

GVHD: Th.S Trần Thanh

DANH MỤC CHỮ VIẾT TẮT

Kí hiệu
SEO
SE
TMDV

IATA
WWW
UUCP
HTML
PR
SERP

Tên viết tắt
Search Engine Optimization
Search Engine
Thương mại dịch vụ
International Air Transport - Association
World Wide Web
Unix to Unix Copy
Hyper Text Markup Language
PageRank
Search Engine Result Page

DANH MỤC SƠ ĐỒ - BẢNG BIỂU

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

GVHD: Th.S Trần Thanh


Mục lục.........................................................................................................................................1
LỜI NÓI ĐẦU.................................................................................................................................1
CHƯƠNG 1...................................................................................................................................3
TỔNG QUAN VỀ CƠ SỞ THỰC TẬP VÀ ĐỀ TÀI NGHIÊN CỨU.........................................................3
I.1.Tổng quan về cơ sở thực tập...............................................................................................3
I.1.1.Giới thiệu chung...........................................................................................................3
I.1.2.Lịch sử hình thành và phát triển...................................................................................5
I.1.3.Lĩnh vực hoạt động.......................................................................................................5
I.1.4.Mục tiêu của công ty....................................................................................................6
I.1.5.Tổ chức công ty............................................................................................................7
I.1.6.Các đối tác của công ty.................................................................................................9
I.2.Tổng quan về đề tài nghiên cứu........................................................................................10
I.2.1.Thực trạng ứng dụng tin học của công ty...................................................................10
I.2.2.Tính cấp thiết của đề tài nghiên cứu..........................................................................10
CHƯƠNG 2. CƠ SỞ PHƯƠNG PHÁP LUẬN VỀ TỐI ƯU HÓA WEBSITE.........................................11
2.1.Tổng quan về World Wide Web........................................................................................11
2.1.1.Khái niệm về World Wide Web..................................................................................11
2.1.2.Lịch sử hình thành.....................................................................................................11
2.1.3.Đặc điểm và nguyên lý hoạt động..............................................................................12
2.1.4.Một số trình duyệt Web............................................................................................12
2.2.Tổng quan bộ máy tìm kiếm.............................................................................................14
2.2.1.Lịch sử hình thành.....................................................................................................14
2.2.2.Cách thức hoạt động.................................................................................................15
2.2.3.Một số Search Engine thông dụng.............................................................................18
2.3.Cấu tạo chung của bộ máy tìm kiếm.................................................................................19
2.3.1.Robot – bộ thu thập thông tin...................................................................................20
2.3.2.Index – bộ lập chỉ mục...............................................................................................23
2.3.3.Search Engine – Bộ tìm kiếm thông tin......................................................................23
2.4.Hệ thống PageRank (PR)...................................................................................................24
2.4.1.Khái niệm PageRank..................................................................................................24

2.4.2.Bản chất của PageRank..............................................................................................25
2.4.3.Công thức tính PageRank..........................................................................................25
2.4.4.Vai trò của PageRank.................................................................................................26
2.4.5.Tối ưu PageRank........................................................................................................26
2.5.Tổng quan về SEO.............................................................................................................27
2.5.1.Lịch sử hình thành.....................................................................................................27
2.5.2.SEO là gì?...................................................................................................................29
2.5.3.Tại sao cần SEO?........................................................................................................30

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

GVHD: Th.S Trần Thanh

2.5.4.Các công việc của người làm SEO..............................................................................30
2.5.5.Các kỹ thuật SEO cơ bản............................................................................................32
CHƯƠNG 3. TỐI ƯU HÓA WEBSITE VIETAIR.TV..........................................................................34
3.1.Kiến trúc của website ......................................................................................................34
3.2.Các công cụ SEO cần thiết cho việc quản trị website........................................................35
3.3.Tối ưu hóa bên trong website..........................................................................................37
3.3.1.Tối ưu tiêu đề của website (Title)..............................................................................37
3.3.2.Tối ưu mô tả cho website (Meta Description)...........................................................40
3.3.3.Tối ưu URL cho website.............................................................................................41
3.3.4.Tối ưu trong điều hướng website..............................................................................42
3.3.5.Tối ưu hình ảnh trong website...................................................................................44

3.3.6.Tối ưu các thẻ Heading trong website.......................................................................45
3.3.7.Sử dụng các liên kết trong website............................................................................46
3.3.8.Bài viết chuẩn Seo trong website..............................................................................47
3.3.9.Tối ưu tốc độ website................................................................................................49
3.3.10.Robot.......................................................................................................................50
3.4.Tối ưu hóa bên ngoài website..........................................................................................51
3.4.1.Phương pháp xây dựng backlink................................................................................51
3.4.2.Phương pháp xây dựng backlink tại website vietair.tv..............................................54
3.5.Nghiên cứu từ khóa..........................................................................................................58
3.5.1.Mục đích của nghiên cứu từ khóa.............................................................................58
3.5.2.Phân loại từ khóa.......................................................................................................59
3.5.3.Danh sách từ khóa của website vietair.tv..................................................................60
3.6.Kết quả đạt được..............................................................................................................62
KẾT LUẬN....................................................................................................................................66
Các kết quả đạt được.............................................................................................................66
Đề xuất hướng phát triển cho SEO trong năm 2015...............................................................66
TÀI LIỆU THAM KHẢO.................................................................................................................68

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

1

GVHD: Th.S Trần Thanh


LỜI NÓI ĐẦU
Trong những năm gần đây, Internet ngày càng phát triển mạnh mẽ, chúng ta
không chỉ dùng internet để giải trí, kết bạn hay truyền các thư điện tử mà còn
kinh doanh qua internet. Thương mại điện tử tại Việt Nam trong vài năm gần đây
cũng phát triển mạnh. Chính vì vậy mà ngày càng có nhiều website kinh doanh
sản phẩm, dịch vụ được mở ra, từ những cá nhân nhỏ lẻ đến các công ty. Họ chỉ
cần một chiếc máy tính có kết nối internet và một website để trưng bày sản phẩm
cùng thông tin liện hệ là hoàn toàn có thể tham gia kinh doanh trên mạng.
Để đạt được vị trí tốt trên các công cụ tìm kiếm chúng ta sẽ có hai cách:
Thứ nhất là quảng cáo Google Adwards hiệu quả nhanh nhưng chi phí cực lớn
theo thời gian và cách thứ hai chính là "Tối Ưu Hóa Công Cụ Tìm Kiếm" hay
còn gọi là SEO, viết tắt của Search Engine Optimization,với hiệu quả lâu dài và
chi phí thấp hơn nhiều. Đối với các doanh nghiệp có mục đích lâu dài thì đều lựa
chọn phương thức thứ hai để tăng hạng website của mình.
Vậy làm thế nào để có thể thu được hiệu quả tốt và nhanh nhất cho việc tối
ưu hóa website? Như ta đã biết, quy trình tối ưu hóa đã được thực hiện thông qua
hệ thống quản trị nội dung. Tuy nhiên, trong thực tế, công việc này cần có kinh
nghiệm và một quy trình phân tích kỹ lưỡng về tính hiệu quả để có một hướng tối
ưu cho website của bạn. Vì vậy, em đã chọn đề tài "Nghiên cứu và ứng dụng
công cụ SEO vào website vietair.tv tại Công ty cổ phần thương mại dịch vụ và
du lịch Tam Vương" trong chuyên đề thực tập của mình.
Tính cấp thiết của đề tài
Website là đại diện thay thế cho bất kì doanh nghiệp nào trên Internet, là
nơi khách hàng tìm kiếm thông tin về doanh nghiệp và các dịch vụ cũng như sản
phẩm của doanh nghiệp đó. Ngoài ra, website còn tạo ra nhiều lợi thế khác như:
- Đưa hoạt động của doanh nghiệp từ nội địa ra quy mô toàn cầu.
- Là nơi trưng bày, giới thiệu sản phẩm, hàng hóa, dịch vụ của Doanh
nghiệp, hoạt động liên tục 24h/7 ngày, không bị giới hạn thời gian và không gian.
- Là kênh thông tin giới thiệu sản phẩm, dịch vụ hoàn hảo nhất và hữu dụng
nhất với hình ảnh, media, …

- Là một kho hàng khổng lồ, không giới hạn sức chứa.
- Là kênh bán hàng tốn ít chi phí nhất.
Theo Tổng cục Thống kê, tổng số người sử dụng Internet tại Việt Nam tính
đến tháng 11/2012 là 31,3 triệu người, chiếm 35,58% dân số Việt Nam. Như vậy,
SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

2

GVHD: Th.S Trần Thanh

kể từ ngày Việt Nam gia nhập cộng đồng Internet toàn cầu (1/12/1997), lượng
người sử dụng Internet trong nước đã tăng nhanh một cách đáng kể.
Nhìn chung, Internet là một món ăn tinh thần không thể thiếu với cuộc sống
của mọi người, với thói quen sử dụng các công cụ tìm kiếm như Google, Yahoo,
MSN... để tìm kiếm thông tin về doanh nghiệp, tài liệu học tập, mua sắm trực
tuyến hay thanh toán hóa đơn…
Hiện nay, có đến hơn 86% lượng truy cập vào website đều đến từ các kênh
tìm kiếm lớn như Google, Yahoo, MSN… Trong hàng trăm, hàng triệu kết quả
trả về khi khách hàng truy vấn tìm kiếm, liệu website của bạn đang ở vị trí nào để
khách hàng có thể tìm đến nhanh nhất? Hầu hết, những người sử dụng bộ máy
tìm kiếm đều không kiên nhẫn, họ thường chỉ tập trung vào các kết quả tìm được
tại “Trang nhất”.
Câu hỏi đặt ra là: “Làm sao để website có thể hiển thị ở trang đầu tiên khi
người dùng truy vấn?” SEO – Search Enginee Optimization: tối ưu hóa công cụ

tìm kiếm được đề xuất như là một phương pháp hữu hiệu giúp website có vị trí
cao tại trang kết quả đầu tiên, giúp cho người dùng dễ dàng tìm được website có
thông tin mình đang cần.
Thực tế, công ty cổ phần TMDV và du lịch Tam Vương tuy đã được thành
lập từ lâu nhưng mua bán qua website cũng mới chỉ thực sự được chú trọng
những năm gần đây. Bên cạnh đó, nguồn khách hàng mới tìm đến website qua
các kênh thông tin tìm kiếm là rất lớn. Mặt khác, hiện nay với các từ khóa chính
được tìm kiếm trên Google, website vietair.tv vẫn chưa có được thứ hạng như
doanh nghiệp mong muốn. Chính vì vậy, đề tài “Nghiên cứu và ứng dụng công
cụ SEO vào website vietair.tv tại công ty cổ phần TMDV và du lịch Tam
Vương” là thực sự cần thiết.
Đối tượng và phạm vi nghiên cứu
-

-

Đối tượng nghiên cứu:
• Bộ máy tìm kiếm Google
• SEO và Công cụ SEO
• Ứng dụng công cụ SEO vào website vietair.tv tại công ty cổ phần
TMDV và du lịch Tam Vương.
Phạm vi nghiên cứu:
Website vietair.tv tại công ty cổ phần TMDV và du lịch Tam Vương.

Mục tiêu của đề tài
-

Tìm hiểu về bộ máy tìm kiếm của Google.
Hiểu thế nào là SEO, các công cụ SEO và các biện pháp để tiến hành SEO
một website.


SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

3

GVHD: Th.S Trần Thanh

-

Đưa website vào top 10 của bộ máy tìm kiếm với từ khóa “vé máy bay giá

-

rẻ”.
Phương pháp duy trì top 10 khi SEO đã thành công.
Website có lượng truy cập và backlink tương đối lớn.

Phương pháp nghiên cứu
Trong đề tài nghiên cứu này, em sử dụng các phương pháp nghiên cứu sau đây:
-

Phương pháp tiếp cận hệ thống làm nền tảng để xem xét và phân tích rồi

-


đưa ra phương hướng tối ưu hóa website vietair.tv tại công ty cổ phần
TMDV và du lịch Tam Vương.
Phương pháp nghiên cứu và tổng hợp tài liệu liên quan đến các vấn đề
quản lý tối ưu hóa trang web.
• Bước 1: Xây dựng ý tưởng, lựa chọn mã nguồn, xây dựng website
có nội dung riêng biệt, hỗ trợ người dùng tối đa.
• Bước 2: Bắt đầu phát triển website, song song với việc phát triển
cả về nội dung lẫn mã nguồn, bắt đầu áp dụng các biện pháp để tối
ưu hóa website.
• Bước 3: Thống kê, theo dõi các từ khóa, lượng người truy cập.
• Bước 4: Theo dõi báo cáo cụ thể, duy trì công việc hiện tại nếu
SEO thành công hoặc sửa chữa khi SEO chưa thành công.
Kết cấu của đề tài
Đề tài “Nghiên cứu và ứng dụng công cụ SEO vào website vietair.tv tại
công ty cổ phần TMDV và du lịch Tam Vương” gồm có 3 phần chính như
sau:
Chương 1: Tổng quan về cơ sở thực tập và đề tài nghiên cứu
Chương 2: Cơ sở phương pháp luận về tối ưu hóa website
Chương 3: Ứng dụng SEO để tối ưu hóa website vietair.tv.

CHƯƠNG 1
TỔNG QUAN VỀ CƠ SỞ THỰC TẬP VÀ ĐỀ TÀI NGHIÊN CỨU
I.1.

Tổng quan về cơ sở thực tập

I.1.1. Giới thiệu chung
-


Tên công ty viết bằng tiếng Việt: Công ty cổ phần TMDV và du lịch Tam
Vương.

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải
-

-

-

-

-

-

4

GVHD: Th.S Trần Thanh

Tên công ty viết bằng tiếng nước ngoài: TAM VUONG TRADING
SERVICE & TOURISM.,JSC.
Tên phòng vé: Tam Vương.
Điện thoại dịch vụ hotline: 19001796.

Tổng Giám đốc công ty: Ông Phạm Đình Ba.
Địa chỉ công ty:
a. Trụ sở chính:
Số 16, ngõ 204, Trần Duy Hưng, Cầu Giấy, Hà Nội
Điện thoại: (04) 3783 6888 - Fax: (04) 3 782 4188
Email:
b. Chi nhánh:
• CN Hà Nội:
Số 09 Giảng Võ, Đống Đa, Hà Nội
Điện thoại: (04) 3736 6533 - Fax: (04) 3736 6534
Email:
• CN Hải Phòng:
Số 154 - Quang Trung - Hồng Bàng - Hải Phòng
Điện thoại: (0313) 521 228 – Fax: (0313) 521 229
Email:
• CN Hồ Chí Minh
Lầu trệt Tòa nhà Tuấn Minh, Số 21 Huỳnh Tịnh Của P.8, Q.3,
Tp.HCM
Điện thoại: (08) 38209528 – Fax: (08) 38209530
Email:
Cơ sở pháp lý của công ty:
• Công ty cổ phần Thương mại dịch vụ và du lịch Tam Vương được
thành lập vào ngày 29 tháng 8 năm 2005 tại Sở Kế Hoạch và Đầu
Tư thành phố Hà Nội.
• Mã số thuế: 0101767563
• Đăng ký lần đầu: ngày 29 tháng 8 năm 2005
• Giấy phép kinh doanh: 0101767563 – ngày cấp 29/08/2005
• Ngày hoạt động: 29/08/2005
• Vốn điều lệ: 10.000.000.000 VNĐ
Loại hình doanh nghiệp:

Công ty cổ phần TMDV và du lịch Tam Vương thuộc loại hình doanh
nghiệp công ty cổ phần.
Người đại diện theo pháp luật của công ty:
• Tên: Ông Phạm Đình Ba
• Chức vụ: Tổng Giám đốc công ty cổ phần TMDV và du lịch Tam
Vương
Số lượng nhân viên: 150 người

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

5

GVHD: Th.S Trần Thanh

I.1.2. Lịch sử hình thành và phát triển
Công ty được thành lập vào ngày 29 tháng 8 năm 2005 với tên gọi Công ty
cổ phần TMDV và du lịch Tam Vương, đặt trụ sở chính tại Số 16, ngõ 204 Trần
Duy Hưng, Thành phố Hà Nội; do ông Phạm Đình Ba làm Tổng Giám đốc.
Công ty cổ phần TMDV và du lịch Tam Vương được hình thành dựa trên
nhu cầu cần thiết của xã hội về vấn đề đặt vé máy, đặt các tour du lịch, tìm hiểu
thông tin về các hãng hàng không trong và ngoài nước…
Hiện nay công ty Tam Vương xây dựng 2 website Vietair.tv và Onetour.vn
với mục tiêu trở thành 2 thương hiệu du lịch và đặt vé máy bay hàng đầu thị
trường .

Onetour tại Việt Nam đang là đối tác của nhiều công ty chuyên cung cấp
dịch vụ Landtour tại các quốc gia trên thế giới, đặc biệt là Hàn Quốc, Nhật Bản,
Châu Âu và Châu Úc. Công ty luôn đáp ứng cho du khách mọi nhu cầu về du
lịch, nhận được sự hài lòng của khách hàng.
Với những hoạt động tích cực không ngừng nghỉ, Công ty Tam Vương còn
là Đại lý được bổ nhiệm của Hiệp hội hàng không quốc tế - IATA (International
Air Transport - Association) cùng các đối tác là các Airline nổi tiếng và uy tín
trên thế giới.
Trải qua một quá trình phát triển, công ty đã phát triển và đứng vững trong
điều kiện cạnh tranh ngày càng khốc liệt, luôn hoàn thành nghĩa vụ với các Nhà
nước. Công ty đã trở thành một trong những công ty có uy tín trên thị trường về
lĩnh vực cung cấp dịch vụ hàng không, tổ chức các chương trình du lịch nội địa
và quốc tế. Cho đến nay, qua 10 năm thành lập và phát triển, phòng vé Tam
Vương luôn là một trong những Công ty có doanh thu cao và ổn định tại Hà Nội,
doanh thu tăng, lợi nhuận tăng, đảm bảo về chất lượng, giá cả cũng như sự phục
vụ trong mọi mặt kinh doanh. Đặc biệt, Tam Vương hân hạnh được trao giải
thưởng “Sản phẩm – Dịch vụ hàng đầu Việt Nam năm 2014” do người tiêu dùng
bình chọn suốt 4 năm liền gần đây.
I.1.3. Lĩnh vực hoạt động
Công ty cổ phần TMDV và du lịch Tam Vương là một công ty hoạt động
độc lập, tự chịu trách nhiệm về các nghĩa vụ của mình. Chính vì vậy, công ty
hướng tới mục tiêu phát triển bền vững và trở thành thương hiệu du lịch và đặt vé
máy bay hàng đầu trên thị trường Việt Nam. Ban giám đốc và nhân viên trong
công ty luôn nỗ lực để tạo uy tín, thu hút được lượng khách hàng lớn, mở rộng
thị trường và đem lại hiệu quả kinh doanh cao nhất cho công ty.

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B



Chuyên đề thực tập tốt nghiệp
Hải

6

GVHD: Th.S Trần Thanh

Các phòng ban luôn phối hợp hoạt động, đặc biệt là phòng kinh doanh và phòng
Marketing luôn điều tra, tìm hiểu, nắm bắt nhu cầu của thị trường.
Công ty cổ phần TMDV và du lịch Tam Vương hoạt động bao gồm các lĩnh vực
chuyên môn sau đây:
-

-

-

-

Cung cấp dịch vụ vé máy bay:
• Tất cả các đường bay của các hãng hàng không trong nước và
quốc tế có mặt tại thị trường Việt Nam.
• Giao vé và các chứng từ hóa đơn tận nơi cho khách hàng.
• Hỗ trợ đưa đón tại sân bay, làm các thủ tục check-in.
• Hỗ trợ lấy chỗ cho khách những trường hợp căng chỗ, mùa cao
điểm.
Cung cấp các Tour Du lịch trong và ngoài nước:
• Chuyên cung cấp landtours trọn gói tại Hàn Quốc.
• Dịch vụ khách sạn tại Hàn Quốc.

• Cung cấp dịch vụ vận chuyển (Airlines, KTX, Limousine,
Pickup...).
• Tổ chức hợp tác trao đổi quan hệ, thương mại 2 nước.
• Dịch vụ hướng dẫn viên, phiên dịch.
Cung cấp dịch vụ bảo hiểm của Công ty Bảo hiểm hàng đầu thế giới AIG:
• Bảo hiểm du lịch.
• Bảo hiểm du học.
• Bảo hiểm khác.
Đặt phòng khách sạn, resort ở trong nước và quốc tế.
Cho thuê xe du lịch:

Với đội ngũ lái xe không chỉ được đào tạo kĩ năng chuyên nghành lái xe
tốt, chuyên nghiệp mà còn rất thân thiện và nhiệt tình trong công việc.
-

Dịch vụ làm visa:
• Dịch vụ Visa Anh.
• Dịch vụ Visa Pháp.
• Dịch vụ Visa Đức.
….

I.1.4. Mục tiêu của công ty
- Tầm nhìn:
Xây dựng Công ty Cổ Phần TMDV & Du Lịch Tam Vương trở thành
Công ty chuyên cung ứng dịch vụ và du lịch chuyên nghiệp, trở thành
-

Công ty hàng đầu trong lĩnh vực dịch vụ và du lịch.
Mục tiêu:


SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

7

GVHD: Th.S Trần Thanh

• Hoàn thiện chất lượng dịch vụ, nâng cao kỹ năng trình độ của đội
ngũ nhân viên, quản lý để đem lại những dịch vụ tốt nhất cho
khách hàng.
• Luôn hướng tới lợi ích khách hàng:
 Nỗ lực hết mình để đáp ứng nhu cầu của khách hàng trong
khoảng thời gian nhanh nhất với những thông tin chính xác và
hiệu quả nhất.
 Đáp ứng đa dạng nhu cầu của khách hàng.
 Lắng nghe, thấu hiểu, chăm sóc, thiết lập mối quan hệ bền
vững và thân thiết với khách hàng.
• Năng động sáng tạo:
 Đây là mục tiêu được chú trọng và phát huy tại Công ty Cổ
Phần TMDV & Du Lịch Tam Vương bởi nó là yếu tố tiên
quyết để Tam Vương trở thành nhà cung cấp dịch vụ và du


lịch hàng đầu.
Tạo ra được nhiều giá trị thiết thực và đem tới sự hài lòng cho

khách hàng khi hợp tác với Công ty Cổ Phần TMDV & Du

Lịch Tam Vương.
• Giá trị cốt lõi:

Định hướng khách hàng là nền tảng hoạt động.

Tạo dựng uy tín và hợp tác chặt chẽ bền vững với khách hàng.

Đội ngũ nhân viên nhiệt tình, sáng tạo, có tinh thần trách


nhiệm và chuyên nghiệp.
Xây dựng văn hóa Công ty với phương châm đoàn kết, tương
trợ, văn minh, không ngừng học hỏi và hoàn thiện.

I.1.5. Tổ chức công ty
a. Sơ đồ tổ chức công ty

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

8

GVHD: Th.S Trần Thanh


Hình 1.1. Sơ đồ tổ chức công ty

-

-

-

-

b. Nhiệm vụ các phòng ban
Ban lãnh đạo: Ban lãnh đạo chính là Tổng Giám đốc, là người đại diện
pháp nhân cho công ty, chịu trách nhiệm điều hành hoạt động kinh doanh
của công ty, có quyền và nghĩa vụ cao nhất trong công ty, là người chịu
trách nhiệm trước cơ quan Nhà nước, quyết định mọi thủ tục hay định
hướng phát triển tại công ty.
Phòng Bán Vé:
• Thực hiện các giao dịch đặt vé máy bay cho khách hàng lẻ khi
khách hàng đặt vé trên website.
• Đặt vé cho các đoàn mà bộ phận tour gửi.
• Giao dịch với các hãng hàng không trong nước và quốc tế.
Phòng Tour:
• Thực hiện xây dựng các tour du lịch trong nước và nước.
• Liên hệ và tư vấn cho khách hàng về các dịch vụ của công ty như
tổ chức tour du lịch, làm visa du lịch cho du khách.
Phòng Kinh Doanh: Tìm kiếm các khách hàng mới, nguồn khách hàng
tiềm năng, liên hệ với khách hàng.

SV: Trần Thị Dung


Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải
-

-

9

GVHD: Th.S Trần Thanh

Phòng Kế toán:
• Thực hiện thanh toán hợp đồng, các chi phí.
• Kiểm tra số liệu kế toán tổng hợp hàng ngày.
• Giám sát nghiệp vụ kế toán các chi nhánh từ xa và tại chỗ.
• Kế toán thuế, trích lập và sử dụng các quỹ ngân hàng.
• Thực hiện các báo cáo nghiệp vụ có liên quan.
Phòng IT:
• Triển khai, quản lý, vận hành hệ thống máy chủ, hệ thống lưu trữ.
• Quản lý website và nghiên cứu để website của công ty ngày càng
được nâng cấp hơn nữa.

I.1.6. Các đối tác của công ty
STT
1

Tên đối tác

Hãng hàng không Việt Nam

2

Hãng hàng không nội địa
khác

3

Các hãng hàng không quốc
tế khác

SV: Trần Thị Dung

Thông tin
Cung cấp dịch vụ vé máy bay trong nước
và quốc tế
Cung cấp dịch vụ vé máy bay trong nước
và quốc tế
• Jetstar Pacific
• VietJet Air
• Vietnam Airlines
Cung cấp dịch vụ vé máy bay đi quốc tế

All Nippon Airways

Asiana Airlines

Korean Air


Japan Airlines

China Southern Airlines

Delta Airlines

Thai Airway

Singapore Airlines

Cathay Pacific

Malaysia Airlines

Qatar Airway
...

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải
4
5

Bảo hiểm du lịch toàn cầu
AIG
Công ty Galileo Vietnam

6


Công ty Amadeus Vietnam

7

Công ty cổ phần tích hợp
công nghệ VNISC
I.2.

10

GVHD: Th.S Trần Thanh

Cung cấp dịch vụ bảo hiểm cho khách
hàng khi đi ra nước ngoài
Cung cấp hệ thống đặt giữ chỗ Galileo của
các airlines
Cung cấp hệ thống đặt giữ chỗ Amadeus
của các airlines
Cung cấp phần mềm kế toán chuyên dụng
cho các đại lý vé máy bay

Tổng quan về đề tài nghiên cứu

I.2.1. Thực trạng ứng dụng tin học của công ty
a. Thực trạng phần cứng
- Máy chủ:

DC: máy chủ lưu trữ website của công ty và các website vệ tinh.


Mailsrv: máy chủ Mail server quản lý toàn bộ hệ thống Email của công
ty. Mỗi cán bộ nhân viên trong công ty được cấp một Account Email miễn
phí, dung lượng không giới hạn.

Máy chủ Proxy server: máy chủ kết nối truy cập Internet cho tất cả các
máy tính trong công ty.
- Modem: 2 Model ADSL
- Máy tính:

Phòng bán vé: 15 máy

Phòng kế toán: 10 máy

Phòng Ban giám đốc: 2 máy
- Laptop:

Phòng IT: 10 máy

Phòng kinh doanh: 13máy
-

b. Thực trạng phần mềm
Windows
Microsoft Office
Skype
Phần mềm kế toán Fast

I.2.2. Tính cấp thiết của đề tài nghiên cứu
Công nghệ thông tin là tập hợp các phương pháp khoa học, các phương tiện
và công cụ kĩ thuật hiện đại, chủ yếu là kĩ thuật máy tính và viễn thông nhằm tổ

chức khai thác và sử dụng có hiệu quả các nguồn tài nguyên thông tin rất phong
phú và tiềm năng trong mọi lĩnh vực hoạt động của con người và xã hội. Dựa vào
nhu cầu thực tế của xã hội đòi hỏi con người luôn phải năng động và sáng tạo để
tạo ra những sản phẩm cho xã hội.
SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

11

GVHD: Th.S Trần Thanh

Một ứng dụng quan trọng của công nghệ thông tin ngày nay đối với hầu hết
các doanh nghiệp là website. Website chính là ngôi nhà của bất kì doanh nghiệp
nào trên Internet, là nơi khách hàng tìm kiếm thông tin về doanh nghiệp và các
dịch vụ cũng như sản phẩm của doanh nghiệp đó.
Đối với Công ty cổ phần TMDV và du lịch Tam Vương, việc giới thiệu đến
khách hàng sản phẩm, dịch vụ chủ yếu thông qua website nên đội ngũ nhân viên
thuộc bộ phận IT đang cố gắng để cải thiện website vietair.tv sao cho nội dung
thêm phong phú, hấp dẫn; tốc độ xử lý nhanh chóng hơn và đặc biệt là tối ưu hóa
website sao cho website được giới thiệu đến nhiều khách hàng hơn thông qua các
công cụ tìm kiếm trên internet.
Trước đây, do chưa nhận thức được tầm quan trọng của vị trí website xuất
hiện trên các kênh thông tin tìm kiếm mà website của công ty vẫn chưa được xử
lý tốt nhất. Vì vậy, làm thế nào để đưa website lên vị trí top đầu khi tìm kiếm qua
Google với các từ khóa nhất định đang là một vấn đề cấp thiết đối với các nhân

viên của bộ phận IT.
CHƯƠNG 2. CƠ SỞ PHƯƠNG PHÁP LUẬN VỀ TỐI ƯU HÓA WEBSITE
2.1. Tổng quan về World Wide Web
2.1.1. Khái niệm về World Wide Web
- World Wide Web được gọi tắt là Web hay WWW, là mạng lưới nguồn
thông tin cho phép mọi người khai thác thông tin qua một số công cụ hoặc
là chương trình hoạt động dưới các giao thức mạng.
- Web có khả năng liên kết với những Web khác, thông qua các “siêu liên
kết” (hyperlink), mà thực chất là địa chỉ trỏ tới nguồn thông tin nằm đâu
đó trên Internet. Bằng những siêu liên kết này, các trang web có thể liên
kết với nhau thành một mạng chằng chịt, trang này trỏ tới trang khác, cho
phép mọi người có thể tìm thấy bất cứ thông tin gì có trên Internet.
2.1.2. Lịch sử hình thành
- Năm 1991, Tim Berners Lee trong quá trình nghiên cứu Internet đã hình
dung ra một khái niệm về phương thức truyền các tập tin qua lại giữa kết
nối UUCP (Unix to Unix Copy) và FTP. Theo phương cách này, một máy
tính ở trên mạng có thể xem được các tập tin của máy tính khác và ngược
lại. Khái niệm này sau đó được phát triển mạnh mẽ và trở thành World
Wide Web.
- Các file truyền trên WWW hoặc Web lúc ban đầu là những văn bản định
dạng text (chỉ gồm các ký tự) phải được đánh dấu định dạng (Marked up)
bởi một ngôn ngữ có tên Hyper Text Markup Language (HTML). Chương

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải


-

-

-

12

GVHD: Th.S Trần Thanh

trình duyệt Web còn gọi là Web Browser sẽ căn cứ vào các dấu định dạng
này để tái hiện nội dung văn bản lên màn hình.
Ngày nay, các file trên Web có thể có những định dạng sau: hình ảnh,
videos, file pdf, video flash, file javascript. Với nhiều định dạng file khác
nhau, nội dung trang web trở nên hấp dẫn hơn, thay vì thuần túy là văn
bản. Việc này gây khó khăn cho máy tìm kiếm, đặc biệt vào thời điểm nó
mới ra đời.
2.1.3. Đặc điểm và nguyên lý hoạt động
WWW được xây dựng dựa trên một kỹ thuật có tên gọi là hypertext.
Hypertext là kỹ thuật trình bày thông tin trên một trang không theo tuần
tự. Người đọc tự do đuổi theo các dấu vết liên quan qua tài liệu đó bằng
các mối liên kết xác định sẵn. Trong môi trường ứng dụng hypertext, có
thể trỏ vào bất kỳ từ liên kết nào của tài liệu và sẽ tức khắc nhảy đến các
tài liệu khác có văn bản liên quan đến nó.
Người dùng sử dụng một phần mềm Web Browser để xem thông tin trên
các máy chủ WWW. Tại sever phải có một phần mềm Web server. Phần
mềm này thực hiện nhận các yêu cầu từ Web Brower gửi lên và thực hiện
yêu cầu đó.


Hình 2.1. Quy trình truy cập Web Browser
2.1.4. Một số trình duyệt Web
a. Internet Explorer
Viết tắt là IE, là trình duyệt Web thông dụng nhất hiện nay được đi kèm
với hệ điều hành Windows của hãng Microsoft. Phiên bản hiện tại là
Internet Explorer 8.
b. Mozilla FireFox

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải
-

-

-

-

-

-

-

-


13

GVHD: Th.S Trần Thanh

Là một trình duyệt tự do, mã nguồn mở, có khả năng chạy trên nhiều hệ
điều hành khác nhau, có giao diện đồ họa và được phát triển bởi công ty
Mozilla Corporation và hàng trăm tình nguyện viên ở khắp nơi trên thế
giới.
FireFox là trình duyệt đầu tiên có tất cả tính năng như ngăn chặn cửa sổ
quảng cáo kiểu pop-up, duyệt tab, đánh dấu trang động (live bookmarks),
hỗ trợ chuẩn mở và cơ cấu mở rộng để thêm chức năng cho chương trình.
Phiên bản hiện tại là 3.6.
c. Opera
Là một bộ phần mềm Internet điều khiển các tác vụ liên quan đến Internet
bao gồm duyệt web, gửi và nhận thư điện tử, tin nhắn, quản lý danh sách
liên hệ và trò chuyện trực tuyến.
Opera được phát triển bởi công ty phần mềm Opera Software tại Oslo (Na
Uy). Có thể chạy trên nhiều hệ điều hành khác nhau: Windows, MacOS,
Solaris và Linux. Nó cũng được sử dụng trong điện thoại di động,
smartphone, PDA (Personal Digital Assistant), thiết bị trò chơi cầm tay và
tivi tương tác.
d. Google Chrome
Là trình duyệt web của hãng Google, một gã khổng lồ trong lĩnh vực
Internet và truyền thông, hỗ trợ tới 42 ngôn ngữ khác nhau, có khả năng
chạy trên nhiều hệ điều hành khác nhau, giao diện đơn giản, dễ sử dụng và
có tốc độ duyệt web cực nhanh.
Tuy sinh sau đẻ muộn nhưng Google Chrome đã nhanh chóng vươn lên
thành trình duyệt được nhiều người sử dụng nhất.
Google đã phát hành bản Chrome 2.0 chính thức vào giữa tháng 2/2009.

Phiên bản hiện tại là ver 4.
Các thuật toán của Google luôn được thay đổi theo hướng tích cực hơn
trong việc giúp người dùng tìm kiếm được các thông tin thực sự cần thiết.
Mới nhất, ngày 21/4/2015, Google đã công bố dùng các website mobilefriendly để nâng hạng tốt hơn trong công nghệ tìm kiếm di động, ảnh
hưởng đến tất cả các ngôn ngữ trên thế giới.
e. Cốc Cốc
Tuy mới chỉ ra đời 2 năm từ năm 2012 nhưng Cốc Cốc thực sự đã được
khá nhiều người biết tới và sử dụng, đặc biệt là ở Việt Nam. Việc Cốc Cốc
thu hút người sử dụng bởi nó mang trong mình nhiều tính năng của người
anh em Chrome, nhưng nó có khả năng tải file mạnh mẽ mà không cần sử
dụng tới các phần mềm download như IDM.
Ngoài ra, trình duyệt này còn tích hợp sẵn từ điển Anh – Việt. Vì thế, việc
bạn dịch một đoạn văn hay một từ tiếng Anh cũng đơn giản hơn rất nhiều.

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

14

GVHD: Th.S Trần Thanh

Hình 2.2. Biểu đồ thị phần của các trình duyệt web
2.2. Tổng quan bộ máy tìm kiếm
2.2.1. Lịch sử hình thành
Máy truy tìm dữ liệu trực tuyến hay SE (Search Engine), còn được gọi với

nghĩa rộng hơn là công cụ tìm kiếm (search tool), nguyên thủy là một phần mềm
(thường được tích hợp vào một trang web trực tuyến) nhằm tìm ra các trang trên
mạng Internet có nội dung theo yêu cầu người dùng dựa vào các thông tin mà
chúng có. Trữ lượng thông tin này của công cụ tìm kiếm thực chất là một loại cơ
sở dữ liệu (database) cực lớn. Việc tìm các tài liệu sẽ dựa trên các từ khóa
(keyword) được người dùng gõ vào và trả về một danh mục của các trang Web
có chứa từ khóa mà nó tìm được. Từ khóa được hiểu như là một tổ hợp các từ
của một ngôn ngữ nhất định được sắp xếp hay quan hệ với nhau thông qua các
biểu thức logic mà công cụ tìm kiếm hỗ trợ. Trong trường hợp một từ khoá bao
gồm nhiều hơn một chữ (hay từ) thì có thể gọi tập họp tất cả các chữ đó là bộ từ
khoá (set of keywords). Cơ sở dữ liệu mà máy truy tìm sử dụng thường được bổ
sung cập nhật định kì bằng cách quét (scan), điều chỉnh, thêm bớt nội dung và chỉ
số hoá lại tất cả các trang mà nó có thể tìm gặp trên Internet.
Ngày nay, với số lượng các trang Web lên đến hàng tỉ, việc tìm ra các trang
có chứa nội dụng đúng yêu cầu của người tìm kiếm với một từ khoá có thể hiện
ra kết quả trả về lên đến hàng triệu trang. Do đó, việc hiển thị các trang tìm thấy
theo đúng thứ tự quan trọng của các trang và theo mong muốn của người dùng

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

15

GVHD: Th.S Trần Thanh


cũng là một trở ngại lớn đòi hỏi sự chắt lọc từ máy truy tìm và sự khéo léo về
cách thức đặt ra từ khoá từ người dùng máy.
Một bộ máy tìm kiếm dữ liệu là một hệ thống phần mềm máy tính giúp con
người tìm kiếm thông tin được lưu trữ trên hệ thống máy tính như mạng Internet,
hoặc máy tính cá nhân. Máy tìm kiếm cho phép người dùng yêu cầu các thông tin
với những hạn chế nhất định (thường được miêu tả bởi từ hoặc cụm từ) và nhận
về một danh sách các liên kết siêu văn bản thỏa mãn các hạn chế. Máy tìm kiếm
sử dụng hệ thống chỉ mục để có thể tìm kiếm nhanh chóng và hiệu quả. Máy
tìm kiếm thường được hiểu là máy tìm những thông tin công khai trên mạng, nếu
không có những khả năng cao hơn. Ngoài ra còn có các loại máy tìm kiếm khác
như máy tìm kiếm doanh nghiệp để tìm thông tin trên mạng nội bộ, máy tìm
kiếm cá nhân để tìm thông tin trên máy tính cá nhân và máy tìm kiếm di động.
Một số máy tìm kiếm còn khai thác thông tin trong các nhóm tin, các cơ sở
dữ liệu lớn, hay trong các hệ thống thư mục mở. Khác với hệ thống thư mục
mạng được duy trì bởi con người, máy tìm kiếm hoạt động dựa vào các thuật
toán. Những trang web được gọi là máy tìm kiếm thực chất là giao diện người
dùng của các máy tìm kiếm sở hữu bởi các công ty khác nhau.
2.2.2. Cách thức hoạt động
Người dùng có thể tìm kiếm thông tin theo từ khoá, hình ảnh, địa điểm…
trên search engine. Khi nhận được câu lệnh yêu cầu tìm kiếm, search engine sẽ
phân tích yêu cầu đó, đánh giá, xếp hạng và trả về kết quả liên quan nhất. Search
engine hoạt động theo quy trình như sau :

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải


16

GVHD: Th.S Trần Thanh

Hình 2.3. Bộ máy tìm kiếm Search Engine
Ban đầu, Search Engine sẽ gửi các Spider (hay còn gọi là con bọ, Crawler)
để tiến hành khảo sát một website khi nó được upload lên. Các Spider này được
lập trình để có thể tự động lần theo liên kết để đi đến các website khác nhau, sau
khi dừng lại ở một website nào đó, Spider này sẽ thu thập, đánh giá các thông tin
trên website đó trước khi tự động lần theo các liên kết đến các website khác…
Sau khi nhận được các thông tin từ Spider, Seach Engine có nhiệm vụ lưu
trữ lại trước khi phân tích chúng bằng các thuật toán riêng biệt để trả về các kết
quả khi người dùng truy vấn đúng vào nội dung.
Ta cũng có thể tham khảo cách thức làm việc chung của các SE tại hình
dưới đây:

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

17

GVHD: Th.S Trần Thanh

Hình 2.4. Cách thức hoạt động của bộ máy tìm kiếm

Trong đó:
Khảo sát – Crawl: là một giai đoạn rất quan trọng để search engine tham
quan, thu thập thông tin trên website của bạn. Search engine có những con bọ
(spider hay crawler) được lập trình để có thể tự động theo các liên kết (link) để
mò đến các website khác nhau, thu thập và đánh giá các thông tin trên website
đó.
Lưu trữ - Index: là giai đoạn search engine lưu lại thông tin sau khi đã
crawl. Với khối lượng lưu trữ vô hạn, các search engine có thể chứa hàng tỉ kết
quả liên quan. Một trang web có thể được index nhanh hoặc chậm tuỳ thuộc vào
tốc độ crawl, độ trust của website và nhiều yếu tố khác.
Phân tích – Analysis: giai đoạn này search engine sẽ làm việc trên các dữ
liệu mà nó thu thập được. Sau đó tính toán độ liên quan của dữ liệu so với yêu
cầu của người dùng. Các search engine khác nhau có những thuật toán phân tích
khác nhau từ đây tạo ra sự khác biệt giữa các search engine. Giai đoạn phân tích
sẽ tạo tiền đề cho giai đoạn phía sau – Trả về kết quả.
Kết quả - Results: Các kết quả liên quan sẽ được hiển thị trong giai đoạn
này. Những kết quả liên quan thường được sắp ở phía trên, cao hơn những kết
quả ít liên quan, mặc dù không phải lúc nào các kết quả cũng thoả mãn được yêu
cầu của người tìm kiếm. Nhưng cho đến hiện nay, người dùng khá hài lòng với
những gì mà Search Engine trả về.

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

18


GVHD: Th.S Trần Thanh

Tuy bức tranh hoạt động của Search Engine bên ngoài nhìn chung khá
đơn giản nhưng bên trong là tập hợp rất nhiều thuật toán phức tạp. Search Engine
nào thoả mãn nhiều nhất nhu cầu tìm kiếm người sử dụng sẽ được sử dụng rộng
rãi và phát triển mạnh mẽ trong tương lai.
2.2.3. Một số Search Engine thông dụng
Hiện nay tính chung trên toàn thế giới thì có 5 công cụ tìm kiếm lớn nhất là:
Google, Bing, Yahoo, Ask và AOL.
Và đây là biểu đồ thống kê thị phần của 5 công cụ trong tháng quý I năm
2014 do Search Engine Watch công bố:

Hình 2.5. Tỷ lệ tìm kiếm trên các kênh Search Engine quý I năm 2014

Còn theo weidert đến năm 2013 thì thị phần tìm kiếm như sau:

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

19

GVHD: Th.S Trần Thanh

Hình 2.6. Tỷ lệ tìm kiếm trên các kênh Search Engine năm 2013

Trong một tháng, tại một vùng lãnh thổ hay một quốc gia, lượt tìm kiếm
có thể lên đến hàng chục tỷ lần. Nên nhìn vào biểu đồ này, ta có thể thấy rõ sự
khác biệt về thị phần của các công cụ tìm kiếm. Vì thế với thị phần như biểu đồ
ta có thể thấy được Google đã và đang thống trị lĩnh vực tìm kiếm trên internet.
2.3. Cấu tạo chung của bộ máy tìm kiếm
Bộ máy tìm kiếm thường cấu tạo bởi 3 bộ phận đó là: Bộ thu thập thông tin,
bộ lập chỉ mục và bộ tìm kiếm thông tin, được hoạt động theo mô hình sau:

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


Chuyên đề thực tập tốt nghiệp
Hải

20

GVHD: Th.S Trần Thanh

Hình 2.7. Cấu tạo Search Engine
-

-

-

Robot – bộ thu thập thông tin:
Robot được biết đến dưới nhiều tên gọi khác nhau: spider, bot, crawler,
hoặc web worm…Về bản chất robot chỉ là một chương trình duyệt và thu

thập thông tin từ các website trên mạng, nó tự động duyệt qua các cấu trúc
siêu liên kết và trả về các danh mục kết quả của công cụ tìm kiếm. Những
trình duyệt thông thường không được xem là robot do thiếu tính chủ động,
chúng chỉ duyệt web khi có sự tác động của con người.
Index – bộ lập chỉ mục:
Các trang web sau khi thu thập về sẽ được phân tích, trích chọn những
thông tin cần thiết (thường là các từ đơn, từ ghép, cụm từ quan trọng) để
lưu trữ trong cơ sở dữ liệu nhằm phục vụ cho nhu cầu tìm kiếm sau này.
Search Engine – Bộ tìm kiếm thông tin:
Tưởng tượng ta muốn tìm vài quyển sách trong một thư viện rất lớn. Với
sức lực cá nhân ta không thể xem qua hết tất cả sách, vì vậy ta cần một
danh mục sách. Tương tự, tồn tại hàng triệu trang web trên thế giới và mỗi
phút trôi qua số lượng được đẩy lên càng nhiều hơn, cho dù ta có trong tay
một công cụ lướt web tuyệt vời đến đâu cũng không thể duyệt hết. Tuy
nhiên, với sự trợ giúp của SE, ta có thể thậm chí xác định được vị trí của
những từ cần tìm trong các trang web khắp nơi trên thế giới.
2.3.1.

Robot – bộ thu thập thông tin

Robot được chia làm 2 loại đó là: Robot thu thập thông tin, và robot chỉ mục.

SV: Trần Thị Dung

Lớp: Tin học kinh tế 53B


×